GPT-4o mini Audio Preview is a compact multimodal model for building conversational audio applications. It supports speech input and output alongside text, enabling speech recognition, speech synthesis, and mixed text-audio dialogs with tool/function calling for structured actions. Typical uses include voice assistants, streaming transcription with summarization, IVR and call-bot workflows, and audio-enabled in-app helpers. Technical highlights include audio I/O, streaming responses, instruction following, and integration via chat and tools APIs.
Penggunaan komersial
Ciri-ciri
Harga
API
Versi
Harga untuk GPT-4o mini Audio Preview
Terokai harga yang kompetitif untuk GPT-4o mini Audio Preview, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana GPT-4o mini Audio Preview boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)
Harga Rasmi (USD / M Tokens)
Diskaun
Masukan:$75/M
Keluaran:$300/M
Masukan:$93.75/M
Keluaran:$375/M
-20%
Kod contoh dan API untuk GPT-4o mini Audio Preview
Akses kod sampel yang komprehensif dan sumber API untuk GPT-4o mini Audio Preview bagi memperlancar proses integrasi anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu anda memanfaatkan potensi penuh GPT-4o mini Audio Preview dalam projek anda.
Versi GPT-4o mini Audio Preview
Sebab GPT-4o mini Audio Preview mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.