Чому Leadmlyn бере 10-15% на токени і що в це входить
Чесне пояснення маркупу 10-15% на токени у Leadmlyn: що в нього входить, чому ми не ховаємо це у «кредити» і як розрахувати реальну вартість для свого бізнесу.
Продукт
Чому Leadmlyn бере 10-15% на токени і що в це входить
Більшість SaaS що працюють поверх LLM-провайдерів, ніколи не скажуть вам скільки вони беруть маркупу на токени. Бо вони беруть його. Просто це зашито в «кредити» де 1 кредит = щось незрозуміле у токенах, або у «повідомлення» де незрозуміло що рахується повідомленням.
Leadmlyn бере 10-15% маркупу і каже про це прямо. Ось чому така цифра і що в неї входить.
Звідки береться маркуп і що в нього входить
Маркуп — це не просто «прибуток на токенах». Це покриття реальних витрат, пов'язаних з обробкою кожного запиту.
Інфраструктура обробки. Кожен виклик до OpenAI або Anthropic проходить через серверний шар Leadmlyn: прийом повідомлення від Telegram, збір контексту розмови, підтягування релевантних чанків з KB (RAG-пошук), формування промпту, відправка запиту до LLM, обробка відповіді, збереження в БД. Всі ці кроки — не безкоштовні. Є сервери, є мережевий трафік, є запити до векторної бази для RAG.
Буфер на курсові коливання. OpenAI виставляє рахунки в доларах. Wallet поповнюється в гривнях (за конвертацією). Між поповненням і фактичним використанням курс може змінитись на 2-5% у несприятливий бік. Маркуп частково покриває цей валютний буфер, щоб не перекладати курсовий ризик повністю на користувача.
Резерв на API-помилки і ретраї. Якщо OpenAI повертає 429 або 503 і Leadmlyn робить повторний запит — цей повторний запит теж споживає токени, але вже не рахується користувачу. Ретраї коштують грошей. Маркуп покриває частину цих прихованих витрат.
Підтримка і операційні витрати. Коли щось іде не так — хтось має діагностувати і виправляти. Навіть у solo-продукті це час. Розробка нових функцій, оновлення під нові версії моделей, моніторинг — все це теж частина вартості кожного запиту.
Сума цих витрат не є лінійною від токенів, але вона реальна. І вона має бути десь у ціноутворенні.
Чому 10-15% а не менше чи більше
Чому не 5%? Бо тоді маркуп не покриває навіть інфраструктурних витрат при малому обсязі. Solo SaaS не має economy of scale великих платформ — не можна купувати API-capacity оптом на мільйони запитів і перепродавати з мізерною маржею. Навіть 10% при $0.85 витрат на токени на місяць (500 розмов на mini) дає $0.085 маркупу. Це менше 4 гривень. Якщо знизити до 5% — це 2 гривні. Не покриває нічого.
Чому не нуль? «Безкоштовний маркуп» — це або VC-субсидована модель де ви коштуєте дорожче потім, або бізнес що не виживе. Обидва варіанти гірші для користувача ніж прозора і невелика маржа.
Чому не 30%? Бо це вже несправедливо. При $0.85 місячних витратах 30% маркуп — це $0.26 зверху. Чого? Нічого що виправдовує. У Leadmlyn ціль — покрити витрати і лишити мінімальну операційну маржу. Не максимізувати маржу на кожному токені.
Чому «10-15%» а не фіксована цифра? Маркуп застосовується диференційовано: вища вартість токенів (Sonnet, GPT-4o) — нижче відсоток маркупу в абсолютному сенсі навантаження. Дешевші моделі (mini) — вище відсоткове, бо абсолютні суми малі. В результаті виходить 10-15% залежно від mix моделей у вашому боті.
Порівняння з конкурентами — без назв, але чесно
На ринку є кілька підходів до монетизації через LLM:
«Кредити» з непрозорим курсом. Купуєте 1000 кредитів за $10. Скільки токенів у кредиті? Або не вказано, або вказано десь у FAQ яке ніхто не читає. Фактичний маркуп — від 50% до 300%. Довести неможливо, бо ви не знаєте справжньої вартості.
«Повідомлення» як одиниця тарифікації. Тариф: 500 повідомлень на місяць. Повідомлення = одна відправка бота, незалежно від складності. Коротка відповідь «Ок, бронюємо!» і довге роз'яснення умов скасування — одне «повідомлення». Маркуп за рахунок усереднення може бути значним при довгих розмовах.
Включено в тариф без деталізації. «За ваш тариф ми відповідаємо скільки завгодно». Звучить добре, але: є ліміти (прочитайте дрібний шрифт), і маркуп зашитий у тариф. Якщо у вас мало розмов — ви переплачуєте. Якщо багато — отримуєте throttling.
Leadmlyn: реальна вартість + відкритий маркуп. Ви бачите що OpenAI взяв за ваші запити і скільки додав Leadmlyn. Якщо вам не подобається цифра маркупу — можете порахувати і порівняти. Ми приймаємо цей ризик, бо вважаємо що довіра дорожча за приховану маржу.
Чому ми вибрали прозорість замість «кредитів»
Особисте рішення, яке ухвалив при проектуванні моделі.
Перша причина — практична: я сам ненавиджу кредитні системи де незрозуміло за що платиш. Коли я як розробник сплачую за API сервіс, мені важливо розуміти структуру вартості. Якщо мені важливо — то власнику бізнесу теж важливо, просто в інших термінах.
Друга причина — операційна: прозора модель легша в підтримці. Коли клієнт запитує «чому у мене витратилось більше ніж я думав» — я можу показати конкретні рядки: ось ці розмови, ось їхня вартість, ось маркуп. Немає «магії кредитів» яку треба пояснювати.
Третя причина — стратегічна: якщо базова вартість токенів падає (а вона падає — GPT-4o-mini зараз дешевший ніж GPT-3.5 Turbo був два роки тому), я можу передати це зниження клієнтам. Із прозорою системою це очевидно і автоматично. З кредитною системою — вам треба вірити вендору на слово.
Маркуп 10-15% — це не ідеальна цифра. Це чесна цифра для поточного масштабу. Коли Leadmlyn виросте до рівня де можна переговорювати кращі умови з OpenAI або оптимізувати інфраструктуру під навантаження — маркуп може знизитись. Але це буде публічно, не тихо.
Якщо хочете порахувати реальну вартість для вашого конкретного обсягу — формула проста: середня кількість розмов на місяць × $0.0017 (для mini) × 1.12 = місячна вартість токенів з маркупом. Підставте свої цифри. Більшість leisure-бізнесів отримують суму менше 50 гривень на місяць. Це і є реальна ціна питання.
Засновник Leadmlyn. Будую AI-менеджерів для leisure-бізнесу в Україні.