GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
商業用途
功能
定價
API
版本
GPT-4o mini Realtime Preview 的定價
探索 GPT-4o mini Realtime Preview 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 GPT-4o mini Realtime Preview 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)
官方價格 (USD / M Tokens)
折扣
輸入:$75/M
輸出:$300/M
輸入:$93.75/M
輸出:$375/M
-20%
GPT-4o mini Realtime Preview 的範例程式碼和 API
存取完整的範例程式碼和 API 資源,以簡化您的 GPT-4o mini Realtime Preview 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 GPT-4o mini Realtime Preview 的潛力。
GPT-4o mini Realtime Preview的版本
GPT-4o mini Realtime Preview擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。