GPT-4o Transcribe is an audio-to-text model for multilingual, low-latency speech recognition. It supports real-time streaming and batch transcription from common audio formats with punctuation and sentence segmentation. Typical uses include live captions, voice assistant input, meeting notes, and media or call recording transcription. Technical highlights include audio modality support, long-form processing, and APIs suited for interactive and server-side workflows.
Sử dụng thương mại
Tính năng
Giá cả
API
Phiên bản
Giá cả cho GPT-4o Transcribe
Khám phá mức giá cạnh tranh cho GPT-4o Transcribe, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-4o Transcribe có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)
Giá Chính Thức (USD / M Tokens)
Giảm giá
Đầu vào:$75/M
Đầu ra:$300/M
Đầu vào:$93.75/M
Đầu ra:$375/M
-20%
Mã mẫu và API cho GPT-4o Transcribe
Truy cập mã mẫu toàn diện và tài nguyên API cho GPT-4o Transcribe để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của GPT-4o Transcribe trong các dự án của mình.
Các phiên bản của GPT-4o Transcribe
Lý do GPT-4o Transcribe có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.