Чому Leadmlyn бере 10-15% на токени і що в це входить

Чесне пояснення маркупу 10-15% на токени у Leadmlyn: що в нього входить, чому ми не ховаємо це у «кредити» і як розрахувати реальну вартість для свого бізнесу.

Павло Полюхович9 квітня 2026 р.5 хв читання

Продукт

Більшість SaaS що працюють поверх LLM-провайдерів, ніколи не скажуть вам скільки вони беруть маркупу на токени. Бо вони беруть його. Просто це зашито в «кредити» де 1 кредит = щось незрозуміле у токенах, або у «повідомлення» де незрозуміло що рахується повідомленням.

Leadmlyn бере 10-15% маркупу і каже про це прямо. Ось чому така цифра і що в неї входить.

Звідки береться маркуп і що в нього входить

Маркуп — це не просто «прибуток на токенах». Це покриття реальних витрат, пов'язаних з обробкою кожного запиту.

Інфраструктура обробки. Кожен виклик до OpenAI або Anthropic проходить через серверний шар Leadmlyn: прийом повідомлення від Telegram, збір контексту розмови, підтягування релевантних чанків з KB (RAG-пошук), формування промпту, відправка запиту до LLM, обробка відповіді, збереження в БД. Всі ці кроки — не безкоштовні. Є сервери, є мережевий трафік, є запити до векторної бази для RAG.

Буфер на курсові коливання. OpenAI виставляє рахунки в доларах. Wallet поповнюється в гривнях (за конвертацією). Між поповненням і фактичним використанням курс може змінитись на 2-5% у несприятливий бік. Маркуп частково покриває цей валютний буфер, щоб не перекладати курсовий ризик повністю на користувача.

Резерв на API-помилки і ретраї. Якщо OpenAI повертає 429 або 503 і Leadmlyn робить повторний запит — цей повторний запит теж споживає токени, але вже не рахується користувачу. Ретраї коштують грошей. Маркуп покриває частину цих прихованих витрат.

Підтримка і операційні витрати. Коли щось іде не так — хтось має діагностувати і виправляти. Навіть у solo-продукті це час. Розробка нових функцій, оновлення під нові версії моделей, моніторинг — все це теж частина вартості кожного запиту.

Сума цих витрат не є лінійною від токенів, але вона реальна. І вона має бути десь у ціноутворенні.

Чому 10-15% а не менше чи більше

Чому не 5%? Бо тоді маркуп не покриває навіть інфраструктурних витрат при малому обсязі. Solo SaaS не має economy of scale великих платформ — не можна купувати API-capacity оптом на мільйони запитів і перепродавати з мізерною маржею. Навіть 10% при $0.85 витрат на токени на місяць (500 розмов на mini) дає $0.085 маркупу. Це менше 4 гривень. Якщо знизити до 5% — це 2 гривні. Не покриває нічого.

Чому не нуль? «Безкоштовний маркуп» — це або VC-субсидована модель де ви коштуєте дорожче потім, або бізнес що не виживе. Обидва варіанти гірші для користувача ніж прозора і невелика маржа.

Чому не 30%? Бо це вже несправедливо. При $0.85 місячних витратах 30% маркуп — це $0.26 зверху. Чого? Нічого що виправдовує. У Leadmlyn ціль — покрити витрати і лишити мінімальну операційну маржу. Не максимізувати маржу на кожному токені.

Чому «10-15%» а не фіксована цифра? Маркуп застосовується диференційовано: вища вартість токенів (Sonnet, GPT-4o) — нижче відсоток маркупу в абсолютному сенсі навантаження. Дешевші моделі (mini) — вище відсоткове, бо абсолютні суми малі. В результаті виходить 10-15% залежно від mix моделей у вашому боті.

Як маркуп рахується на практиці

Конкретний приклад. Розмова на GPT-4o-mini: 4100 input + 1800 output токенів.

Вартість за цінами OpenAI:

Input: 4100 / 1 000 000 × $0.15 = $0.000615
Output: 1800 / 1 000 000 × $0.60 = $0.001080
Разом: $0.001695

З маркупом 12%:

$0.001695 × 1.12 = $0.001898

Різниця: $0.0002 — менше двох центів на сотню розмов. Але за місяць при 500 розмовах це $0.10 маркупу. Не багатство, але й не безкоштовно.

У wallet ви бачите обидва числа: скільки пішло провайдеру і скільки маркупу Leadmlyn. Не приховано в одній сумі. Ця прозорість — навмисна. Детальніше про те як влаштована wallet-модель читайте в статті про ціноутворення AI-менеджера.

Спробуй описане в дії.

Усі фічі з цього посту доступні в trial-плані.

Спробувати

Порівняння з конкурентами — без назв, але чесно

На ринку є кілька підходів до монетизації через LLM:

«Кредити» з непрозорим курсом. Купуєте 1000 кредитів за $10. Скільки токенів у кредиті? Або не вказано, або вказано десь у FAQ яке ніхто не читає. Фактичний маркуп — від 50% до 300%. Довести неможливо, бо ви не знаєте справжньої вартості.

«Повідомлення» як одиниця тарифікації. Тариф: 500 повідомлень на місяць. Повідомлення = одна відправка бота, незалежно від складності. Коротка відповідь «Ок, бронюємо!» і довге роз'яснення умов скасування — одне «повідомлення». Маркуп за рахунок усереднення може бути значним при довгих розмовах.

Включено в тариф без деталізації. «За ваш тариф ми відповідаємо скільки завгодно». Звучить добре, але: є ліміти (прочитайте дрібний шрифт), і маркуп зашитий у тариф. Якщо у вас мало розмов — ви переплачуєте. Якщо багато — отримуєте throttling.

Leadmlyn: реальна вартість + відкритий маркуп. Ви бачите що OpenAI взяв за ваші запити і скільки додав Leadmlyn. Якщо вам не подобається цифра маркупу — можете порахувати і порівняти. Ми приймаємо цей ризик, бо вважаємо що довіра дорожча за приховану маржу.

Чому ми вибрали прозорість замість «кредитів»

Особисте рішення, яке ухвалив при проектуванні моделі.

Перша причина — практична: я сам ненавиджу кредитні системи де незрозуміло за що платиш. Коли я як розробник сплачую за API сервіс, мені важливо розуміти структуру вартості. Якщо мені важливо — то власнику бізнесу теж важливо, просто в інших термінах.

Друга причина — операційна: прозора модель легша в підтримці. Коли клієнт запитує «чому у мене витратилось більше ніж я думав» — я можу показати конкретні рядки: ось ці розмови, ось їхня вартість, ось маркуп. Немає «магії кредитів» яку треба пояснювати.

Третя причина — стратегічна: якщо базова вартість токенів падає (а вона падає — GPT-4o-mini зараз дешевший ніж GPT-3.5 Turbo був два роки тому), я можу передати це зниження клієнтам. Із прозорою системою це очевидно і автоматично. З кредитною системою — вам треба вірити вендору на слово.

Маркуп 10-15% — це не ідеальна цифра. Це чесна цифра для поточного масштабу. Коли Leadmlyn виросте до рівня де можна переговорювати кращі умови з OpenAI або оптимізувати інфраструктуру під навантаження — маркуп може знизитись. Але це буде публічно, не тихо.

Якщо хочете порахувати реальну вартість для вашого конкретного обсягу — формула проста: середня кількість розмов на місяць × $0.0017 (для mini) × 1.12 = місячна вартість токенів з маркупом. Підставте свої цифри. Більшість leisure-бізнесів отримують суму менше 50 гривень на місяць. Це і є реальна ціна питання.

#pricing #markup #tokens #wallet-model #transparency #llm-costs #saas-pricing #infrastructure

Поділитися:Telegram X

Павло Полюхович

Засновник Leadmlyn. Будую AI-менеджерів для leisure-бізнесу в Україні.

Чому Leadmlyn бере 10-15% на токени і що в це входить

Павло Полюхович9 квітня 2026 р.5 хв читання

Продукт

Чому Leadmlyn бере 10-15% на токени і що в це входить

Leadmlyn бере 10-15% маркупу і каже про це прямо. Ось чому така цифра і що в неї входить.

Звідки береться маркуп і що в нього входить

Сума цих витрат не є лінійною від токенів, але вона реальна. І вона має бути десь у ціноутворенні.

Чому 10-15% а не менше чи більше

Як маркуп рахується на практиці

Конкретний приклад. Розмова на GPT-4o-mini: 4100 input + 1800 output токенів.

Вартість за цінами OpenAI:

Input: 4100 / 1 000 000 × $0.15 = $0.000615
Output: 1800 / 1 000 000 × $0.60 = $0.001080
Разом: $0.001695

З маркупом 12%:

$0.001695 × 1.12 = $0.001898

Спробуй описане в дії.

Усі фічі з цього посту доступні в trial-плані.

Спробувати

Порівняння з конкурентами — без назв, але чесно

На ринку є кілька підходів до монетизації через LLM:

Чому ми вибрали прозорість замість «кредитів»

Особисте рішення, яке ухвалив при проектуванні моделі.

#pricing #markup #tokens #wallet-model #transparency #llm-costs #saas-pricing #infrastructure

Поділитися:Telegram X

Павло Полюхович

Засновник Leadmlyn. Будую AI-менеджерів для leisure-бізнесу в Україні.

Чому Leadmlyn бере 10-15% на токени і що в це входить

Звідки береться маркуп і що в нього входить

Чому 10-15% а не менше чи більше

Як маркуп рахується на практиці

Порівняння з конкурентами — без назв, але чесно

Чому ми вибрали прозорість замість «кредитів»

Схожі статті

Roadmap Leadmlyn на 6 місяців — що будуємо і чому саме це

Wallet-модель Leadmlyn — чому передоплата, а не рахунок наприкінці місяця

Admin dashboard за 2 тижні — що будували, що переробили, що залишилось

Чому Leadmlyn бере 10-15% на токени і що в це входить

Звідки береться маркуп і що в нього входить

Чому 10-15% а не менше чи більше

Як маркуп рахується на практиці

Порівняння з конкурентами — без назв, але чесно

Чому ми вибрали прозорість замість «кредитів»

Схожі статті

Roadmap Leadmlyn на 6 місяців — що будуємо і чому саме це

Wallet-модель Leadmlyn — чому передоплата, а не рахунок наприкінці місяця

Admin dashboard за 2 тижні — що будували, що переробили, що залишилось