GPT-4o mini Audio Preview

Wejście:$75/M

Wyjście:$300/M

GPT-4o mini Audio Preview is a compact multimodal model for building conversational audio applications. It supports speech input and output alongside text, enabling speech recognition, speech synthesis, and mixed text-audio dialogs with tool/function calling for structured actions. Typical uses include voice assistants, streaming transcription with summarization, IVR and call-bot workflows, and audio-enabled in-app helpers. Technical highlights include audio I/O, streaming responses, instruction following, and integration via chat and tools APIs.

Użycie komercyjne

Funkcje

Cennik

API

Wersje

Cennik dla GPT-4o mini Audio Preview

Poznaj konkurencyjne ceny dla GPT-4o mini Audio Preview, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak GPT-4o mini Audio Preview może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.

Cena Comet (USD / M Tokens)	Oficjalna cena (USD / M Tokens)	Zniżka
Wejście:$75/M Wyjście:$300/M	Wejście:$93.75/M Wyjście:$375/M	-20%

Wersje modelu GPT-4o mini Audio Preview

Powody, dla których GPT-4o mini Audio Preview posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17