GPT-4o mini Audio Preview

輸入:$75/M

輸出:$300/M

GPT-4o mini Audio Preview is a compact multimodal model for building conversational audio applications. It supports speech input and output alongside text, enabling speech recognition, speech synthesis, and mixed text-audio dialogs with tool/function calling for structured actions. Typical uses include voice assistants, streaming transcription with summarization, IVR and call-bot workflows, and audio-enabled in-app helpers. Technical highlights include audio I/O, streaming responses, instruction following, and integration via chat and tools APIs.

商業用途

功能

定價

API

版本

GPT-4o mini Audio Preview 的定價

探索 GPT-4o mini Audio Preview 的競爭性定價，專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費，讓您能夠隨著需求增長輕鬆擴展。了解 GPT-4o mini Audio Preview 如何在保持成本可控的同時提升您的專案效果。

彗星價格 (USD / M Tokens)	官方價格 (USD / M Tokens)	折扣
輸入:$75/M 輸出:$300/M	輸入:$93.75/M 輸出:$375/M	-20%

GPT-4o mini Audio Preview的版本

GPT-4o mini Audio Preview擁有多個快照的原因可能包括：更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期，以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17