GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
Коммерческое использование
Функции
Цены
API
Версии
Цены для GPT-4o mini Realtime Preview
Изучите конкурентоспособные цены на GPT-4o mini Realtime Preview, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как GPT-4o mini Realtime Preview может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)
Официальная цена (USD / M Tokens)
Скидка
Ввод:$75/M
Вывод:$300/M
Ввод:$93.75/M
Вывод:$375/M
-20%
Пример кода и API для GPT-4o mini Realtime Preview
Получите доступ к исчерпывающим примерам кода и ресурсам API для GPT-4o mini Realtime Preview, чтобы упростить процесс интеграции. Наша подробная документация предоставляет пошаговые инструкции, помогая вам использовать весь потенциал GPT-4o mini Realtime Preview в ваших проектах.
Версии GPT-4o mini Realtime Preview
Причина наличия нескольких снимков GPT-4o mini Realtime Preview может включать такие потенциальные факторы, как: изменения в выходных данных после обновлений, требующие сохранения старых снимков для обеспечения согласованности; предоставление разработчикам переходного периода для адаптации и миграции; а также наличие разных снимков, соответствующих глобальным или региональным конечным точкам для оптимизации пользовательского опыта. Для получения подробной информации о различиях между версиями обратитесь к официальной документации.