GPT-4o mini Audio is a multimodal model for speech and text interactions. It performs speech recognition, translation, and text-to-speech, follows instructions, and can call tools for structured actions with streaming responses. Typical uses include real-time voice assistants, live captioning and translation, call summarization, and voice-controlled applications. Technical highlights include audio input and output, streaming responses, function calling, and structured JSON output.
Uso commerciale
Caratteristiche
Prezzi
API
Versioni
Prezzi per GPT-4o mini Audio
Esplora i prezzi competitivi per GPT-4o mini Audio, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come GPT-4o mini Audio può migliorare i tuoi progetti mantenendo i costi gestibili.
Prezzo Comet (USD / M Tokens)
Prezzo Ufficiale (USD / M Tokens)
Sconto
Ingresso:$0.15/M
Uscita:$0.6/M
Ingresso:$0.1875/M
Uscita:$0.75/M
-20%
Codice di esempio e API per GPT-4o mini Audio
Accedi a codice di esempio completo e risorse API per GPT-4o mini Audio per semplificare il tuo processo di integrazione. La nostra documentazione dettagliata fornisce una guida passo dopo passo, aiutandoti a sfruttare appieno il potenziale di GPT-4o mini Audio nei tuoi progetti.
Versioni di GPT-4o mini Audio
Il motivo per cui GPT-4o mini Audio dispone di più snapshot può includere fattori potenziali come variazioni nell'output dopo aggiornamenti che richiedono snapshot precedenti per coerenza, offrire agli sviluppatori un periodo di transizione per l'adattamento e la migrazione, e diversi snapshot corrispondenti a endpoint globali o regionali per ottimizzare l'esperienza utente. Per le differenze dettagliate tra le versioni, si prega di fare riferimento alla documentazione ufficiale.