GPT-4o mini Audio Preview is a compact multimodal model for building conversational audio applications. It supports speech input and output alongside text, enabling speech recognition, speech synthesis, and mixed text-audio dialogs with tool/function calling for structured actions. Typical uses include voice assistants, streaming transcription with summarization, IVR and call-bot workflows, and audio-enabled in-app helpers. Technical highlights include audio I/O, streaming responses, instruction following, and integration via chat and tools APIs.
Użycie komercyjne
Funkcje
Cennik
API
Wersje
Cennik dla GPT-4o mini Audio Preview
Poznaj konkurencyjne ceny dla GPT-4o mini Audio Preview, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak GPT-4o mini Audio Preview może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)
Oficjalna cena (USD / M Tokens)
Zniżka
Wejście:$75/M
Wyjście:$300/M
Wejście:$93.75/M
Wyjście:$375/M
-20%
Przykładowy kod i API dla GPT-4o mini Audio Preview
Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla GPT-4o mini Audio Preview, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał GPT-4o mini Audio Preview w Twoich projektach.
Wersje modelu GPT-4o mini Audio Preview
Powody, dla których GPT-4o mini Audio Preview posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.