GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
Uso comercial
Recursos
Preços
API
Versões
Preços para GPT-4o mini Realtime Preview
Explore preços competitivos para GPT-4o mini Realtime Preview, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como GPT-4o mini Realtime Preview pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)
Preço Oficial (USD / M Tokens)
Desconto
Entrada:$75/M
Saída:$300/M
Entrada:$93.75/M
Saída:$375/M
-20%
Código de exemplo e API para GPT-4o mini Realtime Preview
Acesse código de exemplo abrangente e recursos de API para GPT-4o mini Realtime Preview para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do GPT-4o mini Realtime Preview em seus projetos.
Versões do GPT-4o mini Realtime Preview
O motivo pelo qual GPT-4o mini Realtime Preview possui múltiplas versões instantâneas pode incluir fatores como variações na saída após atualizações que exigem versões antigas para consistência, fornecendo aos desenvolvedores um período de transição para adaptação e migração, e diferentes versões correspondentes a endpoints globais ou regionais para otimizar a experiência do usuário. Para diferenças detalhadas entre versões, consulte a documentação oficial.