×

Что такое «токен»

Токены — это кусочки текста, с которыми работает модель. Это могут быть слова, части слов или даже знаки препинания. Например, фраза «Привет! Как я могу помочь?» состоит из 8 токенов.

Цены на токены «запроса» (то, что вы отправляете в модель) и «ответа» (то, что модель возвращает) отличаются.

×

Что такое «кэш»

Для некоторых моделей появилась возможность «кэшировать» токены запроса. Стоимость на такие токены намного ниже, чем на обычные. Пример: вам нужно регулярно анализировать содержание новостей для последующей категоризации. Вы посылаете один и тот же запрос: «В зависимости от содержания новости ответь, к какой категории она принадлежит: политика, экономика, спорт, и тд. Вот сама новость: ...». Первая часть запроса всегда одинаковая, отличается только сам текст новости. Именно его и будет кэшировать API.

При работе с моделями OpenAI кэширование происходит автоматически, если система может обнаружить одинаковые части запроса длиной не менее 1024 токенов. Модели Google Gemini 2.5+ также поддерживают автоматическое кэширование, аналогично OpenAI. При работе с моделями Anthropic работа с кэшем требует дополнительных настроек при отправке запроса. Рекомендуем обратиться к официальной документации. Запись в кэш не бесплатная (как у OpenAI и Google), зато использование кэша в 10 раз дешевле, чем обычные токены.

×

Batch Processing (Пакетная обработка)

Пакетная обработка (Batch Processing) — асинхронная обработка запросов по сниженной цене: вы отправляете пакет запросов одним вызовом, а результат получаете в течение 24 часов. Подходит для задач, которым не нужен мгновенный ответ.

Подробнее — в статье Пакетная обработка, там же есть инструкции по каждому провайдеру.

Новинки

Самые новые и передовые модели от ведущих компаний в сфере ИИ.

+

Для языковых моделей тарификация указана за 1 миллион токенов. Некоторые модели поддерживают кэширование и Batch API.

Модель Ввод Вывод Кэш чтение Кэш запись
claude-fable-5
anthropic
3150 batch 1575 ₽ 15750 batch 7875 ₽ 315 batch 157.5 ₽ 4200 batch 2100 ₽
claude-opus-4-8
anthropic
2274 batch 1137 ₽ 11368.5 batch 5684.3 ₽ 228 batch 114 ₽ 2842.5 batch 1421.3 ₽
gemini-3.5-flash
google
682.5 batch 341.3 ₽ 4095 batch 2047.5 ₽ 67.5 batch 33.8 ₽
gemini-3.1-flash-lite
google
114 batch 57 ₽228 Аудио (ввод)batch 114 ₽ 682.5 batch 341.3 ₽ 10.5 batch 5.3 ₽
gpt-5.5
openai
2280 batch 1140 ₽4560 272K+batch 2280 ₽ 13650 batch 6825 ₽20475 272K+batch 10237.5 ₽ 228 batch 114 ₽456 272K+batch 228 ₽
gpt-5.5-pro
openai
7110 batch 3555 ₽14250 272K+batch 7125 ₽ 42600 batch 21300 ₽63900 272K+batch 31950 ₽
gpt-image-2
openai

Генерирует изображения до 3840px, 3:1, кратность 16. Цена за млн токенов, расход от quality и разрешения:

  • Low 1024×1024px: ~200 токенов, ~1,82 ₽
  • Medium 1024×1024px: ~1 767 токенов, ~16,10 ₽
  • High 1024×1024px: ~7 033 токена, ~64,00 ₽
2280 13650 изображение (ввод) 3645
claude-opus-4-7
anthropic
2274 batch 1137 ₽ 11368.5 batch 5684.3 ₽ 228 batch 114 ₽ 2842.5 batch 1421.3 ₽
gpt-5.4-mini
openai
345 batch 172.5 ₽ 2055 batch 1027.5 ₽ 34.5 batch 17.3 ₽
gpt-5.4-nano
openai
91.5 batch 45.8 ₽ 570 batch 285 ₽ 9 batch 4.5 ₽
gpt-5.3-chat-latest
openai
795 6360 79.5
gpt-5.4
openai
1140 batch 570 ₽2280 272K+batch 1140 ₽ 6825 batch 3412.5 ₽10237.5 272K+batch 5118.8 ₽ 114 batch 57 ₽228 272K+batch 114 ₽

Языковые модели

Современные языковые модели с возможностью пошагового рассуждения. Справляются с задачами любой сложности: от написания текстов до программирования, математики и многоступенчатого анализа.

+

Для языковых моделей тарификация указана за 1 миллион токенов. Некоторые модели поддерживают кэширование и Batch API.

Модель Ввод Вывод Кэш чтение Кэш запись
gpt-5.5
openai
2280 batch 1140 ₽4560 272K+batch 2280 ₽ 13650 batch 6825 ₽20475 272K+batch 10237.5 ₽ 228 batch 114 ₽456 272K+batch 228 ₽
gpt-5.4-mini
openai
345 batch 172.5 ₽ 2055 batch 1027.5 ₽ 34.5 batch 17.3 ₽
gpt-5.4-nano
openai
91.5 batch 45.8 ₽ 570 batch 285 ₽ 9 batch 4.5 ₽
gemini-3.1-pro-preview
google

Тарификация разная в зависимости от длины контекста:

  • до 200 000 токенов — одна цена на запрос и ответ
  • от 200 000 токенов — другая цена
900 1800 200K+ 5460 8190 200K+ 87 172.5 200K+
gemini-3.1-flash-lite
google
114 batch 57 ₽228 Аудио (ввод)batch 114 ₽ 682.5 batch 341.3 ₽ 10.5 batch 5.3 ₽
gemini-3-flash-preview
google
228 456 Аудио (ввод) 1365 21
claude-fable-5
anthropic
3150 batch 1575 ₽ 15750 batch 7875 ₽ 315 batch 157.5 ₽ 4200 batch 2100 ₽
claude-opus-4-8
anthropic
2274 batch 1137 ₽ 11368.5 batch 5684.3 ₽ 228 batch 114 ₽ 2842.5 batch 1421.3 ₽
claude-sonnet-4-6
anthropic
1161 batch 580.5 ₽ 5799 batch 2899.5 ₽ 117 batch 58.5 ₽ 1450.5 batch 725.3 ₽
claude-haiku-4-5
anthropic
442.5 batch 221.3 ₽ 2211 batch 1105.5 ₽ 45 batch 22.5 ₽ 553.5 batch 276.8 ₽

Модели управления компьютером

Такие модели способны взаимодействовать с пользовательским интерфейсом компьютера для выполнения различных задач. Они могут имитировать действия пользователя, такие как перемещение курсора, нажатие клавиш и управление приложениями, что позволяет автоматизировать рутинные операции и повышать эффективность работы.

+

Для моделей управления компьютером тарификация указана за 1 миллион токенов.

Модель Ввод Вывод Кэш чтение
computer-use-preview
openai
805.5 1 933.5 403.5

Генерация изображений

Превращают текстовые описания в картинки. Используются в дизайне, иллюстрации, рекламе и творчестве.

+

Цена указана за одно сгенерированное изображение и отличается в зависимости от размера.

Модель Ввод Вывод Изображение (ввод)
gpt-image-2
openai

Генерирует изображения практически любого разрешения — до 3840px по длинной стороне, с соотношением сторон до 3:1 и кратностью 16. Цена указана за миллион токенов, расход зависит от параметра quality и разрешения:

  • Low, 1024×1024px: ~200 токенов, ~1,82 ₽
  • Medium, 1024×1024px: ~1 767 токенов, ~16,10 ₽
  • High, 1024×1024px: ~7 033 токена, ~64,00 ₽

При увеличении разрешения расход токенов растёт пропорционально количеству пикселей.

2280 13650 3645 за 1М токенов
gemini-3.1-flash-image-preview
google

Известная также под названием nano-banana 2. Цена указана за миллион токенов, расход зависит от размера:

  • 512px: 747 токенов, ~13,60 ₽
  • 1K (1024×1024px): 1 120 токенов, ~20,40 ₽
  • 2K (2048×2048px): 1 680 токенов, ~30,60 ₽
  • 4K (4096×4096px): 2 520 токенов, ~45,90 ₽
114 27300
gemini-3-pro-image-preview
google

Известная также под названием nano-banana pro. Цена указана за миллион токенов, расход на одно изображение зависит от разрешения:

  • 1024×1024px — 2048×2048px: 1 120 токенов, ~39,20 ₽
  • До 4096×4096px: 2 000 токенов, ~70,00 ₽
948 55264.5
gpt-image-1-mini
openai

Цена указана за миллион токенов, при этом количество токенов на одно изображение зависит от параметра quality и размера:

  • Low, 1024×1024px: ~625 токенов, ~1,52 ₽
  • Medium, 1024×1024px: ~1 375 токенов, ~3,34 ₽
  • High, 1024×1024px: ~4 500 токенов, ~10,95 ₽

Для форматов 1024×1536 и 1536×1024 расход токенов (и цена) примерно в 1,4 раза выше.

915 3645 1140 за 1М токенов

Генерация видео

Создают видеоролики на основе текстовых описаний. Применяются в маркетинге, обучении, развлечениях и кинопроизводстве.

+

Цена указана за одну секунду сгенерированного видео и отличается в зависимости от разрешения для некоторых моделей.

Модель Цена
sora-2
openai
40.5 за 1 секунду
sora-2-pro
openai
103.5 за 1 секунду
720x1280 или 1280x720

159 за 1 секунду
1024x1792 или 1792x1024
veo-3
google
142.5 за 1 секунду
veo-3-fast
google
64.5 за 1 секунду

Распознавание речи

Преобразуют устную речь в текст. Они слушают аудио и точно передают сказанное в письменной форме. Применяются в голосовых помощниках, транскрипции интервью, автоматизации звонков и создании субтитров.

+

Стоимость указана за минуту обработанного аудио. При расчете фактической стоимости запроса длительность аудио округляется до секунды.

Модель Цена
gpt-4o-transcribe
openai
2.325 ₽ / минута
gpt-4o-mini-transcribe
openai
1.155 ₽ / минута

Синтез речи

Преобразуют текст в натурально звучащий голос. Они озвучивают написанное, имитируя интонации, акценты и даже эмоции. Используются в озвучке, голосовых помощниках, аудиокнигах и интерфейсах без экрана.

+

Стоимость указана за 1 миллион символов входного текста.

Модель Цена
gpt-4o-mini-tts
openai
3 093 ₽ / 1М символов
tts-1
openai
3 866 ₽ / 1М символов
tts-1-hd
openai
7 731 ₽ / 1М символов

Модели для embedding

Превращают текст в числовое представление (вектор), которое отражает смысл и контекст. Эти векторы можно сравнивать, искать похожие, использовать для кластеризации или в качестве ввода в других моделях. Основа для семантического поиска, рекомендаций и многих задач ИИ.

+

Тарификация указана за 1 миллион токенов. Некоторые модели поддерживают Batch API.

Модель Цена
text-embedding-3-small
openai
7.74 ₽batch 3.87 ₽
text-embedding-3-large
openai
51 ₽batch 25.5 ₽