GPT-AMAGE-1-MINI

GPT-AMAGE-1-MINI


GPT-AMAGE-1-MINI. O Openai lançou um novo modelo de imagem hoje: gpt-image-1-minique eles descrevem como “um modelo de geração de imagens menor que é 80% menos barato que o modelo grande”.

Eles o lançaram muito silenciosamente – eu não ouvi sobre isso na palestra de Devday, mas mais tarde a vi na página Devday 2025.

Não foi instantaneamente óbvio para mim como usar isso através de sua API. Acabei vibe codificando uma ferramenta Python CLI para que eu pudesse experimentar.

Eu despejei a versão do Diff de texto sem formatação do Commit com a Biblioteca Python OpenAI, intitulada Feat (API): o Dev Day 2025 é lançado no ChatGPT GPT-5 Thinking e trabalhei com ele para descobrir como usar o novo modelo de imagem e construir um script para ele. Aqui está a transcrição e o script Openai_image.py que escreveu.

Eu tinha adicionado dependências de scripts em linha, para que você possa executá -lo com uv assim:

export OPENAI_API_KEY="$(llm keys get openai)"
uv run https://tools.simonwillison.net/python/openai_image.py "A pelican riding a bicycle"

Ele escolheu este estilo de ilustração sem que eu especifique:

Uma bela ilustração de um pelicano andando de bicicleta, pélican e bicicleta são exatamente como você espera. Parece esboçado, talvez lápis de cor? As duas pernas do Pelican estão nos pedais, mas também tem um tipo estranho de pata em um braço no guidão.

(Este é um teste muito diferente do meu normal “Gere um SVG de um pelicano andando de bicicleta”, pois está usando um gerador de imagem dedicado, sem ter um modelo baseado em texto, tente gerar código SVG.)

Minha ferramenta aceita um prompt e opcionalmente um nome de arquivo (se você não fornecer um, ele salva para um nome de arquivo como /tmp/image-621b29.png).

Ele também aceita opções para modelo e dimensões e qualidade de saída – o --help A saída lista esses, você pode ver isso aqui.

Os preços do Openai são um pouco confusos. A página do modelo afirma que imagens de baixa qualidade devem custar cerca de meio centavo e de qualidade média em torno de um centavo e meio. Ele também lista um preço de token de imagem de US $ 8/milhão de tokens. Acontece que há uma configuração de qualidade “alta” padrão – a maioria das imagens que eu gerei relatou entre 4.000 e 6.000 tokens de saída, que custam entre 3,2 e 4,8 centavos.

Uma última demonstração, desta vez usando --quality low:

 uv run https://tools.simonwillison.net/python/openai_image.py \
  'racoon eating cheese wearing a top hat, realistic photo' \
  /tmp/racoon-hat-photo.jpg \
  --size 1024x1024 \
  --output-format jpeg \
  --quality low

Isso salvou o seguinte:

GPT-AMAGE-1-MINI

E relatou isso como erro padrão:

{
  "background": "opaque",
  "created": 1759790912,
  "generation_time_in_s": 20.87331541599997,
  "output_format": "jpeg",
  "quality": "low",
  "size": "1024x1024",
  "usage": {
    "input_tokens": 17,
    "input_tokens_details": {
      "image_tokens": 0,
      "text_tokens": 17
    },
    "output_tokens": 272,
    "total_tokens": 289
  }
}

Isso levou 21 anos, mas estou em uma conexão Wi -Fi de conferência não confiável, então não confio muito nessa medição.

272 Tokens de saída = 0,2 centavos para que isso esteja muito mais próximo dos preços esperados da página do modelo.



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *