GPT-4o mini Audio is a multimodal model for speech and text interactions. It performs speech recognition, translation, and text-to-speech, follows instructions, and can call tools for structured actions with streaming responses. Typical uses include real-time voice assistants, live captioning and translation, call summarization, and voice-controlled applications. Technical highlights include audio input and output, streaming responses, function calling, and structured JSON output.
Uso comercial
Características
Precios
API
Versiones
Precios para GPT-4o mini Audio
Explora precios competitivos para GPT-4o mini Audio, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo GPT-4o mini Audio puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)
Precio Oficial (USD / M Tokens)
Descuento
Entrada:$0.15/M
Salida:$0.6/M
Entrada:$0.1875/M
Salida:$0.75/M
-20%
Código de ejemplo y API para GPT-4o mini Audio
Accede a código de muestra completo y recursos de API para GPT-4o mini Audio para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de GPT-4o mini Audio en tus proyectos.
Versiones de GPT-4o mini Audio
La razón por la cual GPT-4o mini Audio tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.