GPT-4o mini Audio Preview is a compact multimodal model for building conversational audio applications. It supports speech input and output alongside text, enabling speech recognition, speech synthesis, and mixed text-audio dialogs with tool/function calling for structured actions. Typical uses include voice assistants, streaming transcription with summarization, IVR and call-bot workflows, and audio-enabled in-app helpers. Technical highlights include audio I/O, streaming responses, instruction following, and integration via chat and tools APIs.
Sử dụng thương mại
Tính năng
Giá cả
API
Phiên bản
Giá cả cho GPT-4o mini Audio Preview
Khám phá mức giá cạnh tranh cho GPT-4o mini Audio Preview, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-4o mini Audio Preview có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)
Giá Chính Thức (USD / M Tokens)
Giảm giá
Đầu vào:$75/M
Đầu ra:$300/M
Đầu vào:$93.75/M
Đầu ra:$375/M
-20%
Mã mẫu và API cho GPT-4o mini Audio Preview
Truy cập mã mẫu toàn diện và tài nguyên API cho GPT-4o mini Audio Preview để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của GPT-4o mini Audio Preview trong các dự án của mình.
Các phiên bản của GPT-4o mini Audio Preview
Lý do GPT-4o mini Audio Preview có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.