GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
Uso comercial
Características
Precios
API
Versiones
Precios para GPT-4o mini Realtime Preview
Explora precios competitivos para GPT-4o mini Realtime Preview, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo GPT-4o mini Realtime Preview puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)
Precio Oficial (USD / M Tokens)
Descuento
Entrada:$75/M
Salida:$300/M
Entrada:$93.75/M
Salida:$375/M
-20%
Código de ejemplo y API para GPT-4o mini Realtime Preview
Accede a código de muestra completo y recursos de API para GPT-4o mini Realtime Preview para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de GPT-4o mini Realtime Preview en tus proyectos.
Versiones de GPT-4o mini Realtime Preview
La razón por la cual GPT-4o mini Realtime Preview tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.