Seedream 4.5 é a evolução mais recente da família Seedream de modelos de texto para imagem/edição de imagem (desenvolvido pela pesquisa da Byte/BytePlus). Ele está sendo distribuído nos endpoints oficiais da BytePlus e em várias plataformas de terceiros — incluindo acesso integrado via gateways multi-modelo como o CometAPI — e traz melhorias na consistência do assunto, tipografia/renderização de texto e fidelidade em edição multi-imagem.
Este artigo é um guia prático e profissional para usar a API do Seedream 4.5. Você verá etapas de configuração, padrões de autenticação e requisição, boas práticas de prompts e parâmetros, fluxos de edição e multi-imagem, tratamento de erros, padrões de implantação e considerações legais/de segurança.
O que é o Seedream 4.5?
Seedream 4.5 é a iteração mais recente da família Seedream — um modelo multimodal de geração e edição de imagens projetado para criação texto para imagem de alta fidelidade e edição de imagem contextual (imagem para imagem, edição com múltiplas referências, inpainting/outpainting, tipografia e tratamento de texto denso). Em comparação com versões anteriores do Seedream, a 4.5 foca em melhor consistência do assunto em fluxos de trabalho multi-imagem, preservação mais rigorosa de detalhes de referência, maior fidelidade tipográfica (texto em imagens) e melhor qualidade de saída até 4K/ultra-HD nas configurações de “alta qualidade”. Essas melhorias fazem parte de uma arquitetura escalada e ajustes de prompt/heurísticas do lado do engine atualizados.
Por que isso importa: a 4.5 foi intencionalmente construída para lidar com tarefas criativas profissionais — variações de produtos em lote, edições multi-imagem consistentes com a marca e materiais de impressão em alta resolução — ao mesmo tempo em que permite controle mais fino com imagens de referência e operações de edição especializadas.
Capacidades centrais
- Geração texto para imagem (única e em lote): gere 1–15 imagens por chamada de API, com modos de qualidade selecionáveis (Básico vs Alta) que equilibram velocidade e resolução.
- Edição de imagem (i2i/inpainting/outpainting): use uma ou mais imagens de referência; preserva detalhes e relações espaciais entre múltiplas referências.
- Mistura multi-referência e cópia de elementos: até ~10 imagens de referência podem ser usadas em um único job para transplantar elementos mantendo iluminação/perspectiva coerentes.
- Renderização de tipografia/texto denso de alta qualidade: melhor tratamento de imagens com texto ou sinalização (útil para mockups, rótulos de produtos, capturas de tela de UI).
- Streaming/saída progressiva: alguns endpoints de implantação suportam streaming de resultados para que os clientes recebam resultados parciais enquanto a geração continua.
Como usar a API do Seedream 4.5 via CometAPI?
Abaixo está um passo a passo prático, pronto para copiar/colar, para gerar imagens via CometAPI (um agregador que expõe o modelo Seedream 4.5 como um parâmetro de modelo). Use o CometAPI quando quiser uma única chave de API para acessar dezenas/centenas de modelos e uma camada REST estável e fácil de integrar. A documentação do CometAPI mostra o alias de modelo doubao-seedream-4-5-251128 e um endpoint padrão de geração de imagens.
Passos em alto nível
- Cadastre-se no CometAPI e obtenha uma chave de API.
- Use o endpoint de geração de imagens (
POST https://api.cometapi.com/v1/images/generations) com o parâmetro model definido para o identificador do Seedream 4.5 (exemplo:doubao-seedream-4-5-251128).- Inclua o prompt, imagens de referência opcionais (URLs ou uploads multipart, dependendo do agregador), tamanho/qualidade de saída e outros parâmetros.
- Receba uma resposta JSON com URLs de imagens geradas (ou base64) e metadados.
Tipos e modos de requisição
Seedream 4.5 normalmente oferece suporte a:
- Texto → Imagem (prompts de texto → imagens inéditas)
- Imagem → Imagem (imagens de referência + prompts para transformações estilizadas)
- Edição de imagem/Inpainting (máscara + instruções de edição para alterações direcionadas)
APIs hospedadas dão suporte a modos de tarefa assíncronos (enviar job → consultar com taskId), o que se encaixa em renderizações longas e fluxos em lote. Links gerados costumam ser com validade limitada (por exemplo, 24 horas em alguns gateways), então planeje armazenamento/exportação.
Exemplo de curl (texto para imagem, prompt único)
curl -X POST "https://api.cometapi.com/v1/images/generations" \
-H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
-H "Content-Type: application/json" \
-d '{
"model": "doubao-seedream-4-5-251128",
"prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
"n": 3,
"width": 2048,
"height": 2048,
"quality": "high", # or "basic"
"seed": 12345,
"style": "photorealistic"
}'
Observações
- Substitua
COMETAPI_KEY_GOES_HEREpela sua chave do CometAPI. - O parâmetro
ngera múltiplas variações em uma chamada (economiza overhead). quality: "high"geralmente corresponde a maior resolução/maior custo computacional (frequentemente compatível com 4K).
Exemplo em Python com requests (texto para imagem + salvando resultados)
import requests, base64, os
API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY") # set env var for safety
payload = {
"model": "doubao-seedream-4-5-251128",
"prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
"n": 2,
"width": 1024,
"height": 1024,
"quality": "basic"
}
resp = requests.post(API_URL, json=payload, headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()
# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
img_b64 = item.get("b64_json")
if img_b64:
img_bytes = base64.b64decode(img_b64)
with open(f"seedream_result_{i}.png", "wb") as f:
f.write(img_bytes)
else:
print("Image URL:", item.get("url"))
Por que esse padrão? Agregadores normalmente retornam payload base64 ou URLs hospedados; o código trata ambos. O endpoint normalmente retorna um task_id. Consulte o endpoint GET /tasks/{task_id} até o status ser succeeded e então faça o download do resultado. Muitos provedores incluem SDKs com auxiliares embutidos para esse padrão.
Como otimizar a qualidade da imagem e manter o texto legível?
- Use imagens de referência para contexto consistente e acompanhamento de cores.
- Mencione tipografia explicitamente no prompt (família de fonte, peso, alinhamento) e considere adicionar o texto exato como sobreposição em uma segunda etapa para garantir legibilidade.
- Execute um processo em duas etapas: (a) gere a composição base; (b) renderize novamente ou edite em um segundo passe focado em closes ou áreas de rótulo com resolução mais alta.
Como escrever prompts para o Seedream 4.5?
Princípios de engenharia de prompts
- Seja explícito: liste o assunto, ação, estilo, lente/câmera, horário do dia e a paleta de cores desejada.
- Use âncoras de identidade: se você precisa da mesma face/objeto em várias imagens, inclua descritores persistentes (ex.: “a mesma mulher com cabelo curto e ondulado, jaqueta verde, cicatriz na sobrancelha esquerda”) e forneça 1–3 imagens de referência. A fusão multi-referência do Seedream 4.5 melhorou, mas âncoras ajudam.
- Prompts negativos: declare explicitamente o que evitar (ex.: “sem texto”, “sem marcas d’água”, “sem membros extras”).
- Híbrido curto + longo: dê uma instrução canônica curta e depois amplie com algumas linhas de detalhes e restrições.
Modelos de prompts de exemplo
Foto hero de produto (fotorrealista): "Uma foto hero limpa de um alto-falante sem fio preto fosco sobre uma mesa branca, iluminação de softbox, 50mm, profundidade de campo rasa, fundo de estúdio, fotorrealista, sem texto"
Ilustração de fantasia (estilizada): "Paisagem de fantasia épica, um castelo de vidro imponente sobre um penhasco, hora dourada, neblina volumétrica, pictórico, altamente detalhado, concept art"
Edição de imagem (remover objeto): "Remover a pessoa à esquerda e estender o fundo para preencher o espaço, manter a iluminação consistente, sem artefatos"
Mockup com tipografia pesada: "Mockup de tela inicial de aplicativo móvel em um iPhone 14, com o texto 'Lançar agora' em Gotham Bold, deixe o botão verde e mantenha sombras suaves"
Retrato de personagem: "Retrato heroico de uma guerreira, iluminação de recorte cinematográfica, lente de retrato 85mm, textura de pele ultra detalhada, sardas naturais, armadura de couro, fundo neutro, fotorrealista."
Prompts multi-imagem e com referências
Ao usar edição multi-imagem, especifique qual imagem de referência corresponde a qual parte do prompt. O Seedream 4.5 melhora a identificação do assunto principal em várias referências — mas ser explícito (por exemplo, “use image_1 para o rosto, image_2 para a textura da roupa”) gera melhores resultados.
Seleção de saída e pós-processamento
- Gere N variantes e aplique filtros objetivos: pontuação de similaridade facial, comparação de histograma de cores, OCR de tipografia para checar a precisão do texto.
- Automatize limites de QC para encaminhar saídas abaixo do limiar para retoque manual.
- Delegue a tipografia final a ferramentas de layout se você precisa de texto pixel-perfect — use o modelo para fundo e imagens e depois componha o texto preciso no pós. Isso reduz a necessidade de depender da fidelidade tipográfica do modelo para assets de marketing.
Como realizar edição de imagem, inpainting e composição multi-imagem?
Fluxo de trabalho de edição de imagem
- Faça upload das imagens de referência para o provedor ou envie-as inline com a requisição.
- Forneça uma máscara (imagem binária) para inpainting ou uma anotação de contorno para edições direcionadas.
- Envie um prompt de edição esclarecendo quais regiões mudar e quais preservar.
Muitas APIs suportam modos de edição de imagem única e composição multi-imagem; a 4.5 é explicitamente ajustada para preservar a identidade do sujeito e melhorar a consistência multi-imagem.
Exemplo: payload de Inpainting (pseudocódigo JSON)
{
"model": "seedream-4.5",
"mode": "image_edit",
"image_url": "https://.../original.png",
"mask_url": "https://.../mask.png",
"prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
"guidance": 9,
"steps": 40
}
Dicas para edição multi-imagem consistente
- Use a mesma
seedpara renderizações relacionadas a fim de manter a consistência entre frames. - Mantenha descritores de câmera consistentes nos prompts (ex.: “retrato 85mm, softbox, 3/4”) para manter a coerência do ponto de vista.
- Ao editar rostos, peça cláusulas de preservação de alta granularidade (“preservar a estrutura facial, alterar apenas a cor do cabelo”) para reduzir deriva de identidade.
Quais são as melhores práticas ao usar o Seedream 4.5
Como solucionar problemas comuns?
Aqui estão etapas práticas de troubleshooting quando os resultados não ficam bons:
Rostos desfocados/detalhes incorretos
Aumente a especificidade do prompt para detalhes faciais (idade, expressão, iluminação), forneça imagens de referência de maior qualidade ou tente uma instrução explícita de “preservar o rosto” e reduza a strength da edição para manter mais do original. O Seedream 4.5 melhora o realismo facial, mas as entradas ainda importam.
Texto ilegível ou distorcido
Forneça texto vetorial ou raster como uma sobreposição separada se você precisar de tipografia pixel-perfect; caso contrário, use configurações de resolução mais alta e instruções de estilo explícitas como “renderizar texto legível: sim”. A 4.5 melhora o tratamento de texto denso em relação às versões anteriores, mas a perfeição tipográfica ainda pode exigir composição no pós.
Iluminação ou composição inconsistente no lote
Use um prompt padronizado com menções fixas de iluminação/câmera ou gere dentro de uma única chamada em lote para aumentar a consistência. A BytePlus e o CometAPI oferecem padrões de inferência em lote por esse motivo.
Notas finais e próximos passos
Seedream 4.5 é um modelo maduro, orientado à produção, com melhorias explícitas voltadas para fluxos de trabalho criativos reais: melhor consistência, texto e rostos aprimorados e suporte a múltiplas referências. Use CometAPI ou agregadores similares quando você quiser experimentação rápida e flexibilidade multi-modelo.
Desenvolvedores podem acessar a API do [Seedream 4.5](http://Seedream 4.5) etc via CometAPI; a versão mais recente do modelo é sempre atualizada com o site oficial. Para começar, explore os recursos do modelo no Playground e consulte o guia da API para instruções detalhadas. Antes de acessar, certifique-se de ter feito login no CometAPI e obtido a chave de API. O CometAPI oferece um preço muito inferior ao oficial para ajudar na sua integração.
Pronto para começar? → Teste gratuito do Seedream 4.5!
Se quiser saber mais dicas, guias e notícias sobre IA, siga-nos no VK, X e Discord!
