GPT-4o mini Realtime Preview is a real-time multimodal model for interactive voice and visual experiences. It handles speech, text, and images with streaming input and output, plus tool/function calling for grounded actions. Typical uses include voice assistants, live call handling, real-time captioning, and visual question answering over camera or screen content. Technical highlights include bidirectional audio, vision understanding, streaming responses, and structured outputs via functions.
Sử dụng thương mại
Tính năng
Giá cả
API
Phiên bản
Giá cả cho GPT-4o mini Realtime Preview
Khám phá mức giá cạnh tranh cho GPT-4o mini Realtime Preview, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách GPT-4o mini Realtime Preview có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)
Giá Chính Thức (USD / M Tokens)
Giảm giá
Đầu vào:$75/M
Đầu ra:$300/M
Đầu vào:$93.75/M
Đầu ra:$375/M
-20%
Mã mẫu và API cho GPT-4o mini Realtime Preview
Truy cập mã mẫu toàn diện và tài nguyên API cho GPT-4o mini Realtime Preview để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của GPT-4o mini Realtime Preview trong các dự án của mình.
Các phiên bản của GPT-4o mini Realtime Preview
Lý do GPT-4o mini Realtime Preview có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.