O

GPT-4o mini Audio Preview

入力:$75/M

出力:$300/M

GPT-4o mini Audio Preview is a compact multimodal model for building conversational audio applications. It supports speech input and output alongside text, enabling speech recognition, speech synthesis, and mixed text-audio dialogs with tool/function calling for structured actions. Typical uses include voice assistants, streaming transcription with summarization, IVR and call-bot workflows, and audio-enabled in-app helpers. Technical highlights include audio I/O, streaming responses, instruction following, and integration via chat and tools APIs.

商用利用

機能

料金プラン

API

バージョン

GPT-4o mini Audio Previewの料金

GPT-4o mini Audio Previewの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。GPT-4o mini Audio Previewがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。

コメット価格 (USD / M Tokens)	公式価格 (USD / M Tokens)	割引
入力:$75/M 出力:$300/M	入力:$93.75/M 出力:$375/M	-20%

GPT-4o mini Audio Previewのバージョン

GPT-4o mini Audio Previewに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17