GPT-4o mini Audio Preview is a compact multimodal model for building conversational audio applications. It supports speech input and output alongside text, enabling speech recognition, speech synthesis, and mixed text-audio dialogs with tool/function calling for structured actions. Typical uses include voice assistants, streaming transcription with summarization, IVR and call-bot workflows, and audio-enabled in-app helpers. Technical highlights include audio I/O, streaming responses, instruction following, and integration via chat and tools APIs.
商業用途
功能
定價
API
版本
GPT-4o mini Audio Preview 的定價
探索 GPT-4o mini Audio Preview 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 GPT-4o mini Audio Preview 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)
官方價格 (USD / M Tokens)
折扣
輸入:$75/M
輸出:$300/M
輸入:$93.75/M
輸出:$375/M
-20%
GPT-4o mini Audio Preview 的範例程式碼和 API
存取完整的範例程式碼和 API 資源,以簡化您的 GPT-4o mini Audio Preview 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 GPT-4o mini Audio Preview 的潛力。
GPT-4o mini Audio Preview的版本
GPT-4o mini Audio Preview擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。