GPT-4o Transcribe is an audio-to-text model for multilingual, low-latency speech recognition. It supports real-time streaming and batch transcription from common audio formats with punctuation and sentence segmentation. Typical uses include live captions, voice assistant input, meeting notes, and media or call recording transcription. Technical highlights include audio modality support, long-form processing, and APIs suited for interactive and server-side workflows.
Usage commercial
Fonctionnalités
Tarification
API
Versions
Tarification pour GPT-4o Transcribe
Découvrez des tarifs compétitifs pour GPT-4o Transcribe, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment GPT-4o Transcribe peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)
Prix officiel (USD / M Tokens)
Remise
Entrée:$75/M
Sortie:$300/M
Entrée:$93.75/M
Sortie:$375/M
-20%
Exemple de code et API pour GPT-4o Transcribe
Accédez à des exemples de code complets et aux ressources API pour GPT-4o Transcribe afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de GPT-4o Transcribe dans vos projets.
Versions de GPT-4o Transcribe
La raison pour laquelle GPT-4o Transcribe dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.