GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
ใช้งานเชิงพาณิชย์
คุณสมบัติ
ราคา
API
เวอร์ชัน
ราคาสำหรับ GPT-4o mini Realtime Preview
สำรวจราคาที่แข่งขันได้สำหรับ GPT-4o mini Realtime Preview ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า GPT-4o mini Realtime Preview สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)
ราคาทางการ (USD / M Tokens)
ส่วนลด
อินพุต:$75/M
เอาต์พุต:$300/M
อินพุต:$93.75/M
เอาต์พุต:$375/M
-20%
โค้ดตัวอย่างและ API สำหรับ GPT-4o mini Realtime Preview
เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ GPT-4o mini Realtime Preview เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ GPT-4o mini Realtime Preview ในโครงการของคุณ