如何使用 Seedgream 4.5 API

CometAPI
j3efpkpg1Jan 23, 2026
如何使用 Seedgream 4.5 API

Seedream 4.5 是 Seedream 文生圖/圖像編輯模型家族的最新進化版本(由 Byte/BytePlus 研究開發)。它正逐步在官方 BytePlus 端點與多個第三方平台上線——包含透過如 CometAPI 等多模型網關的一體化接入——並帶來更佳的主體一致性、字體排印/文字渲染,以及多圖像編輯的保真度。

本文是一份面向實務的專業指南,手把手教你使用 Seedream 4.5 API。你將獲得可操作的環境配置步驟、認證與請求模式、提示詞與參數最佳實踐、編輯與多圖工作流程、錯誤處理、部署模式,以及法律/安全考量。

什麼是 Seedream 4.5?

Seedream 4.5 是 Seedream 家族的最新迭代——一個為高保真文本生成圖像與具情境理解的圖像編輯(以圖生圖、多參考編輯、塗抹修補/外延、字體排印與密集文字處理)而設計的多模態模型。與早期版本相比,4.5 專注於:在多圖工作流程中的主體一致性提升、更嚴格地保留參考細節、更高的字體排印保真度(圖中之文字),以及在「高品質」設定下可達 4K/超高清的更佳輸出品質。這些改進源於擴展的架構以及更新的提示詞調優/引擎端啟發式策略。

重要意義:4.5 明確針對專業創作任務而打造——例如批量產品變體、品牌一致的多圖編輯與高解析度印刷資產——同時能透過參考圖像與專門的編輯操作提供更精細的控制。

核心能力

  • 文生圖(單次與批量):每次 API 呼叫可生成 1–15 張圖像,提供可選品質模式(Basic 與 High)以在速度與解析度間取捨。
  • 圖像編輯(i2i / inpainting / outpainting):可使用一張或多張參考圖像;在多參考情境下保留細節與空間關係。
  • 多參考混合與元素移植:單次任務可使用約 10 張參考圖像,進行元素移植並保持光照/透視連貫。
  • 高等級字體排印/密集文字渲染:更好處理含文字或標識的圖像(適用於模型圖、產品標籤、UI 截圖)。
  • 串流/漸進式輸出:部分部署端點支援串流結果,客戶端可在生成過程中持續接收部分結果。

如何透過 CometAPI 使用 Seedream 4.5 API?

以下是透過 CometAPI 進行圖像生成的實用(可直接複製)流程。CometAPI 是一個聚合器,將 Seedream 4.5 模型以模型參數形式提供。當你希望用一把金鑰存取數十/數百個模型,並以穩定、易整合的 REST 介面接入時,選擇 CometAPI。CometAPI 文件展示了 doubao-seedream-4-5-251128 模型別名與標準的圖像生成端點。

高階步驟

  1. 註冊 CometAPI 並取得 API 金鑰。
  2. 使用圖像生成端點(POST https://api.cometapi.com/v1/images/generations),將 model 參數設為 Seedream 4.5 識別符(例如:doubao-seedream-4-5-251128)。
  3. 在請求中包含提示詞、可選參考圖像(依聚合器支援 URL 或 multipart 上傳)、輸出尺寸/品質與其他參數。
  4. 接收包含已生成圖像 URL(或 base64)與中繼資料的 JSON 回應。

請求類型與模式

Seedream 4.5 常見支援:

  • 文字 → 圖像(文字提示詞生成新圖像)
  • 圖像 → 圖像(參考圖像 + 提示詞進行風格化轉換)
  • 圖像編輯 / Inpainting(遮罩 + 編輯指令以進行定向修改)

託管 API 支援非同步任務模式(提交任務 → 使用 taskId 輪詢),適合長時間渲染與批量工作流程。生成的連結通常具有時效(例如某些網關有效期為 24 小時),請規劃好儲存/匯出。

curl 範例(文生圖,單一提示)

curl -X POST "https://api.cometapi.com/v1/images/generations" \
  -H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-5-251128",
    "prompt": "霓虹雨中賽博朋克狐狸的電影感人像,4k,精細光效,膠片顆粒",
    "n": 3,
    "width": 2048,
    "height": 2048,
    "quality": "high",     # 或 "basic"
    "seed": 12345,
    "style": "photorealistic"
  }'

注意事項

  • COMETAPI_KEY_GOES_HERE 替換為你的 CometAPI 金鑰。
  • n 參數可在一次呼叫中生成多個變體(節省開銷)。
  • quality: "high" 通常對應更高解析度/更高計算成本(常見為 4K 能力)。

Python requests 範例(文生圖 + 儲存結果)

import requests, base64, os

API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY")  # 為安全起見,從環境變數讀取

payload = {
  "model": "doubao-seedream-4-5-251128",
  "prompt": "一只陶瓷馬克杯置於木質桌面,棚拍場景,溫暖自然光,超細節,2k",
  "n": 2,
  "width": 1024,
  "height": 1024,
  "quality": "basic"
}

resp = requests.post(API_URL, json=payload, headers={
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()

# 範例:每個項目依供應商而定,可能有 'b64_json' 或 'url'
for i, item in enumerate(data.get("data", [])):
    img_b64 = item.get("b64_json")
    if img_b64:
        img_bytes = base64.b64decode(img_b64)
        with open(f"seedream_result_{i}.png", "wb") as f:
            f.write(img_bytes)
    else:
        print("Image URL:", item.get("url"))

為何採用此模式?聚合器通常返回 base64 負載或託管 URL;上述程式碼可同時處理兩種情況。端點通常會返回 task_id。透過 GET /tasks/{task_id} 輪詢直至狀態為 succeeded,然後下載結果。許多供應商提供具備此模式輔助的 SDK。

如何優化圖像品質並保持文字清晰可讀?

  1. 使用參考圖像來保持一致的情境與色彩匹配。
  2. 在提示詞中明確指出字體排印(字體家族、字重、對齊),並考慮在第二步以覆蓋的方式加入精確文字,確保可讀性。
  3. 採用兩步流程:(a)生成基礎構圖;(b)第二次以更高解析度針對近景或標籤區域再渲染或編輯。

如何為 Seedream 4.5 編寫提示詞?

提示詞工程原則

  • 明確具體:列出主體、動作、風格、鏡頭/相機、時間與期望的色彩方案。
  • 使用身份錨點:若需在多張圖中保持相同面孔/道具,加入持續性描述(例:「同一位留短微捲髮、穿綠色夾克、左眉有疤的女性」),並提供 1–3 張參考圖。Seedream 4.5 的多參考融合已有改進,但錨點仍有幫助。
  • 負面提示:明確指出要避免的內容(如「不要文字」「不要浮水印」「不要多餘肢體」)。
  • 簡短 + 詳述混合:先給出簡短的核心指令,再以數行細節與約束補充。

提示詞範本

  • 產品主視覺(寫實):"A clean product hero shot of a matte black wireless speaker placed on a white tabletop, softbox lighting, 50mm, shallow depth of field, studio background, photoreal, no text"
  • 奇幻插畫(風格化):"Epic fantasy landscape, towering glass castle on a cliff, golden hour, volumetric fog, painterly, highly detailed, concept art"
  • 圖像編輯(移除物件):"Remove the person on the left and extend the background to fill the space, keep lighting consistent, no artifacts"
  • 高文字比重模型圖:"Mobile app landing screen mockup on an iPhone 14, with the text 'Launch Now' in Gotham Bold, make the button green and keep shadows soft"
  • 角色肖像:"Heroic portrait of a female warrior, cinematic rim lighting, 85mm portrait lens, ultra-detailed skin texture, natural freckles, leather armor, neutral background, photorealistic."

多圖與參考提示

進行多圖編輯時,請指明各參考圖對應提示詞中的哪一部分。Seedream 4.5 在多參考場景中更擅長識別主要主體——但清晰指示(如「image_1 用於臉部、image_2 用於服裝材質」)會得到更佳結果。

輸出篩選與後處理

  • 生成 N 個變體後執行客觀過濾:人臉相似度分數、色彩直方圖比較、OCR 檢查文字正確性。
  • 自動化 QC 門檻:將未達標輸出導向人工修圖流程。
  • 若需像素級精準文字,將最終字體排印交給版面工具:先用模型生成背景/圖像,再於後製合成精準文字。可降低對模型文字保真的依賴,適合行銷素材。

如何進行圖像編輯、Inpainting 與多圖合成?

圖像編輯流程

  1. 將參考圖像上傳至供應商或在請求中內嵌傳送。
  2. 提供 Inpainting 所需的遮罩(二值圖)或針對性編輯的區域標註。
  3. 提交編輯提示詞,清楚說明要變更的區域與需保留的區域。

許多 API 同時支援單圖編輯與多圖合成模式;4.5 對於保留主體身份與提升多圖一致性有明確調校。

範例:Inpainting 載荷(JSON 偽代碼)

{
  "model": "seedream-4.5",
  "mode": "image_edit",
  "image_url": "https://.../original.png",
  "mask_url": "https://.../mask.png",
  "prompt": "將背景替換為日落海灘——保持主體不變,維持主體上的原始光效",
  "guidance": 9,
  "steps": 40
}

多圖編輯一致性技巧

  • 相關鏡頭使用相同的 seed,以保持跨幀一致性。
  • 在提示詞中保持相機描述一致(例:「85mm 人像、柔光箱、3/4 構圖」)以維持視角統一。
  • 編輯人臉時,加入細緻保留條款(「保留面部結構,只更改髮色」)以降低身份漂移。

使用 Seedream 4.5 的最佳實踐是什麼

如何排查常見問題?

以下是當結果偏差時的實用排查步驟:

臉部模糊/細節錯誤

提高臉部細節的提示詞具體性(年齡、表情、光照),提供更高品質的參考圖,或加入明確的「保留臉部」指令並降低編輯 strength 以保留更多原始資訊。Seedream 4.5 改善了面部寫實度,但輸入品質仍至關重要。

文字不可讀或出現亂碼

若需要像素級字體排印,請以向量或點陣的方式在後期覆蓋文字;否則提升解析度設定,並在風格指令中明確表達「渲染可讀文字:是」。相較於先前版本,4.5 提升了密集文字處理,但字體排印的完美度仍可能需透過後製合成達成。

批量輸出中的光照或構圖不一致

使用模板化提示詞並固定光照/相機描述,或在單一批次呼叫中生成以提升一致性。BytePlus 與 CometAPI 提供的批量推理模式即出於此考量。

最後說明與後續步驟

Seedream 4.5 是一款成熟、面向生產的圖像模型,針對真實創作工作流程提供明確改進:更好的一致性、更優的文字與面部渲染,以及多參考支援。當你需要快速試驗與多模型彈性時,可使用 CometAPI 或類似聚合器。

開發者可透過 CometAPI 存取 [Seedream 4.5](http://Seedream 4.5) API 等,最新模型版本 會與官網同步更新。開始之前,請先在 Playground 探索模型能力,並查閱 API 指南 以獲得詳細說明。訪問前,請確認你已登入 CometAPI 並取得 API 金鑰。CometAPI 提供遠低於官方的價格,助你更快整合。

準備好了嗎?→ 免費試用 Seedream 4.5

若想獲取更多 AI 技巧、指南與最新消息,歡迎追蹤我們的 VKXDiscord

準備好將 AI 開發成本降低 20% 了嗎?

幾分鐘內免費開始。包含免費試用點數。無需信用卡。

閱讀更多