GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
Uso commerciale
Caratteristiche
Prezzi
API
Versioni
Prezzi per GPT-4o mini Realtime Preview
Esplora i prezzi competitivi per GPT-4o mini Realtime Preview, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come GPT-4o mini Realtime Preview può migliorare i tuoi progetti mantenendo i costi gestibili.
Prezzo Comet (USD / M Tokens)
Prezzo Ufficiale (USD / M Tokens)
Sconto
Ingresso:$75/M
Uscita:$300/M
Ingresso:$93.75/M
Uscita:$375/M
-20%
Codice di esempio e API per GPT-4o mini Realtime Preview
Accedi a codice di esempio completo e risorse API per GPT-4o mini Realtime Preview per semplificare il tuo processo di integrazione. La nostra documentazione dettagliata fornisce una guida passo dopo passo, aiutandoti a sfruttare appieno il potenziale di GPT-4o mini Realtime Preview nei tuoi progetti.
Versioni di GPT-4o mini Realtime Preview
Il motivo per cui GPT-4o mini Realtime Preview dispone di più snapshot può includere fattori potenziali come variazioni nell'output dopo aggiornamenti che richiedono snapshot precedenti per coerenza, offrire agli sviluppatori un periodo di transizione per l'adattamento e la migrazione, e diversi snapshot corrispondenti a endpoint globali o regionali per ottimizzare l'esperienza utente. Per le differenze dettagliate tra le versioni, si prega di fare riferimento alla documentazione ufficiale.