Gêmeos 3 Flash

Gêmeos 3 Flash


Gêmeos 3 Flash

17 de dezembro de 2025

Continua a ser um dezembro movimentado, embora não tão movimentado como no ano passado. A grande novidade de hoje é o Gemini 3 Flash, o mais recente da linha “Flash” do Google de modelos mais rápidos e menos caros.

O Google está enfatizando a comparação entre o novo Flash e o modelo top Gemini 2.5 Pro da geração anterior:

Com base nos fortes recursos multimodais, de codificação e de agente do 3 Pro, o 3 Flash oferece desempenho poderoso por menos de um quarto do custo do 3 Pro, juntamente com limites de taxa mais altos. O novo modelo 3 Flash supera o 2.5 Pro em muitos benchmarks, ao mesmo tempo que oferece velocidades mais rápidas.

As características do Gemini 3 Flash são quase idênticas às do Gemini 3 Pro: ele aceita texto, imagem, vídeo, áudio e PDF, gera apenas texto, lida com 1.048.576 tokens de entrada máximos e até 65.536 tokens de saída e tem a mesma data limite de conhecimento de janeiro de 2025 (também compartilhada com a série Gemini 2.5).

Os benchmarks parecem bons. O custo é atraente: 1/4 do preço do Gemini 3 Pro ≤200k e 1/8 do preço do Gemini 3 Pro >200k, e é bom não ter um aumento de preço para o novo Flash em comprimentos de token maiores.

É um pouco mais caro do que os modelos Flash anteriores – o Gemini 2.5 Flash custava US$ 0,30/milhão em tokens de entrada e US$ 2,50/milhão em saída, o Gemini 3 Flash custava US$ 0,50/milhão e US$ 3/milhão, respectivamente.

Aqui está uma comparação de preços mais extensa em meu site llm-prices.com.

Gerando alguns SVGs de pelicanos

Lancei o llm-gemini 0.28 esta manhã com suporte para o novo modelo. Você pode experimentar assim:

llm install -U llm-gemini
llm keys set gemini # paste in key
llm -m gemini-3-flash-preview "Generate an SVG of a pelican riding a bicycle"

De acordo com os documentos do desenvolvedor, o novo modelo suporta quatro opções de níveis de pensamento diferentes: minimal, low, mediume high. Isso é diferente do Gemini 3 Pro, que suporta apenas low e high.

Você pode executá-los assim:

llm -m gemini-3-flash-preview --thinking-level minimal "Generate an SVG of a pelican riding a bicycle"

Aqui estão quatro pelicanos, para níveis de pensamento mínimo, baixo, médio e alto:


Uma ilustração vetorial minimalista de um pássaro branco estilizado com um longo bico laranja e um boné vermelho andando de bicicleta azul escuro em uma única linha de solo cinza contra um fundo branco liso.
Ilustração minimalista: Um pássaro branco estilizado com um grande bico laranja em forma de cunha e um único ponto preto no olho anda em uma bicicleta vermelha com rodas pretas e um pedal amarelo contra um fundo sólido azul claro.
Uma ilustração minimalista de um pássaro branco estilizado com um grande bico amarelo andando em uma bicicleta vermelha em uma posição de corrida sobre um fundo azul claro.
Ilustração minimalista de arte linear de um pássaro branco estilizado com um grande bico laranja andando em uma bicicleta preta simples com um pedal laranja, centralizado contra um fundo circular azul claro.

A galeria acima usa um novo Web Component que construí usando Gemini 3 Flash para testar suas habilidades de codificação. O código na página fica assim:

<image-gallery width="4">
    <img src="https://static.simonwillison.net/static/2025/gemini-3-flash-preview-thinking-level-minimal-pelican-svg.jpg" alt="A minimalist vector illustration of a stylized white bird with a long orange beak and a red cap riding a dark blue bicycle on a single grey ground line against a plain white background." />
    <img src="https://static.simonwillison.net/static/2025/gemini-3-flash-preview-thinking-level-low-pelican-svg.jpg" alt="Minimalist illustration: A stylized white bird with a large, wedge-shaped orange beak and a single black dot for an eye rides a red bicycle with black wheels and a yellow pedal against a solid light blue background." />
    <img src="https://static.simonwillison.net/static/2025/gemini-3-flash-preview-thinking-level-medium-pelican-svg.jpg" alt="A minimalist illustration of a stylized white bird with a large yellow beak riding a red road bicycle in a racing position on a light blue background." />
    <img src="https://static.simonwillison.net/static/2025/gemini-3-flash-preview-thinking-level-high-pelican-svg.jpg" alt="Minimalist line-art illustration of a stylized white bird with a large orange beak riding a simple black bicycle with one orange pedal, centered against a light blue circular background." />
image-gallery>

Esses atributos alt também são gerados pelo Gemini 3 Flash, usando esta receita:

llm -m gemini-3-flash-preview --system '
You write alt text for any image pasted in by the user. Alt text is always presented in a
fenced code block to make it easy to copy and paste out. It is always presented on a single
line so it can be used easily in Markdown images. All text on the image (for screenshots etc)
must be exactly included. A short note describing the nature of the image itself should go first.' \
-a https://static.simonwillison.net/static/2025/gemini-3-flash-preview-thinking-level-high-pelican-svg.jpg

Você pode ver o código que alimenta o Web Component da galeria de imagens aqui no GitHub. Eu o construí solicitando o Gemini 3 Flash via LLM assim:

llm -m gemini-3-flash-preview '
Build a Web Component that implements a simple image gallery. Usage is like this:


  Imagem 1
  Imagem 2
  Imagem 3


Se uma imagem tiver um atributo data-thumb= que seja usado, outras imagens serão reduzidas. 

A galeria de imagens sempre ocupa 100% da largura disponível. O atributo width="5" significa que cinco imagens serão mostradas lado a lado em cada linha. O padrão é 3. Existem lacunas entre as imagens. Quando uma imagem é clicada, uma caixa de diálogo modal é aberta com a imagem em tamanho real.

Retorne um arquivo HTML completo com a implementação do Web Component e vários exemplos de uso dele. Use URLs https://picsum.photos/300/200 para essas imagens de exemplo.'

Foram necessárias algumas instruções de acompanhamento usando llm -c:

llm -c 'Use a real modal such that keyboard shortcuts and accessibility features work without extra JS'

llm -c 'Use X for the close icon and make it a bit more subtle'

llm -c 'remove the hover effect entirely'

llm -c 'I want no border on the close icon even when it is focused'

Aqui está a transcrição completa, exportada usando llm logs -cue.

Essas cinco instruções foram:

  • 225 entradas, 3.269 saídas
  • 2.243 entradas, 2.908 saídas
  • 4.319 entradas, 2.516 saídas
  • 6.376 entradas, 2.094 saídas
  • 8.151 entradas, 1.806 saídas

Somados, são 21.314 entradas e 12.593 saídas, totalizando 4,8436 centavos.

O guia para migrar do Gemini 2.5 revela uma decepção:

Segmentação de imagens: Os recursos de segmentação de imagem (retorno de máscaras de nível de pixel para objetos) não são suportados no Gemini 3 Pro ou Gemini 3 Flash. Para cargas de trabalho que exigem segmentação de imagem nativa, recomendamos continuar a utilizar o Gemini 2.5 Flash com o pensamento desligado ou o Gemini Robotics-ER 1.5.

Escrevi sobre esse recurso no Gemini 2.5 em abril. Espero que eles voltem em modelos futuros – eles são um recurso realmente interessante, exclusivo do Gemini.



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *