GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
Użycie komercyjne
Funkcje
Cennik
API
Wersje
Cennik dla GPT-4o mini Realtime Preview
Poznaj konkurencyjne ceny dla GPT-4o mini Realtime Preview, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak GPT-4o mini Realtime Preview może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)
Oficjalna cena (USD / M Tokens)
Zniżka
Wejście:$75/M
Wyjście:$300/M
Wejście:$93.75/M
Wyjście:$375/M
-20%
Przykładowy kod i API dla GPT-4o mini Realtime Preview
Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla GPT-4o mini Realtime Preview, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał GPT-4o mini Realtime Preview w Twoich projektach.
Wersje modelu GPT-4o mini Realtime Preview
Powody, dla których GPT-4o mini Realtime Preview posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.