GPT-4o mini Audio is a multimodal model for speech and text interactions. It performs speech recognition, translation, and text-to-speech, follows instructions, and can call tools for structured actions with streaming responses. Typical uses include real-time voice assistants, live captioning and translation, call summarization, and voice-controlled applications. Technical highlights include audio input and output, streaming responses, function calling, and structured JSON output.
Usage commercial
Fonctionnalités
Tarification
API
Versions
Tarification pour GPT-4o mini Audio
Découvrez des tarifs compétitifs pour GPT-4o mini Audio, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment GPT-4o mini Audio peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)
Prix officiel (USD / M Tokens)
Remise
Entrée:$0.15/M
Sortie:$0.6/M
Entrée:$0.1875/M
Sortie:$0.75/M
-20%
Exemple de code et API pour GPT-4o mini Audio
Accédez à des exemples de code complets et aux ressources API pour GPT-4o mini Audio afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de GPT-4o mini Audio dans vos projets.
Versions de GPT-4o mini Audio
La raison pour laquelle GPT-4o mini Audio dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.