Nano Banana Pro, também conhecido como gemini-3-pro-image-preview, é o melhor modelo de geração de imagens disponível

Nano Banana Pro, também conhecido como gemini-3-pro-image-preview, é o melhor modelo de geração de imagens disponível


Nano Banana Pro, também conhecido como gemini-3-pro-image-preview, é o melhor modelo de geração de imagens disponível

20 de novembro de 2025

Logo após o lançamento do Gemini 3 Pro na terça-feira, hoje é o Nano Banana Pro, também conhecido como Gemini 3 Pro Image. Tive alguns dias de acesso de visualização e este é um surpreendentemente modelo de geração de imagem capaz.

Como costuma acontecer, os detalhes de baixo nível mais úteis podem ser encontrados na documentação da API:

Projetado para lidar com os fluxos de trabalho mais desafiadores por meio de raciocínio avançado, ele se destaca em tarefas complexas de criação e modificação multivoltas.

  • Saída de alta resolução: Recursos de geração integrados para visuais de 1K, 2K e 4K.
  • Renderização de texto avançada: Capaz de gerar texto legível e estilizado para infográficos, menus, diagramas e ativos de marketing.
  • Aterramento com a Pesquisa Google: o modelo pode usar a Pesquisa Google como ferramenta para verificar fatos e gerar imagens com base em dados em tempo real (por exemplo, mapas meteorológicos atuais, gráficos de ações, eventos recentes).
  • Modo de pensamento: O modelo utiliza um processo de “pensamento” para raciocinar por meio de instruções complexas. Ele gera “imagens de pensamento” provisórias (visíveis no backend, mas não carregadas) para refinar a composição antes de produzir o resultado final de alta qualidade.
  • Até 14 imagens de referência: agora você pode misturar até 14 imagens de referência para produzir a imagem final.

(…) Estas 14 imagens podem incluir o seguinte:

  • Até 6 imagens de objetos com alta fidelidade para incluir na imagem final
  • Até 5 imagens de humanos para manter a consistência do personagem

Experimentando alguns prompts de imagens de instruções detalhadas

Max Woolf publicou o guia definitivo para estimular o Nano Banana há apenas alguns dias. Decidi testar seus exemplos de prompts no novo modelo, solicitando resultados em 4K.

Aqui está o que obtive em seu primeiro prompt de teste, usando o AI Studio do Google:

Create an image of a three-dimensional pancake in the shape of a skull, garnished on top with blueberries and maple syrup.

Aqui está o que eu consegui:

Uma foto de qualidade muito detalhada de uma caveira feita de massa de panqueca, mirtilos por cima, xarope de bordo escorrendo, garrafa de xarope de bordo ao fundo.

O resultado foi um arquivo PNG de 24,1 MB e 5632 × 3072 pixels. Não quero publicar isso em meu próprio blog, então aqui está um link do Google Drive para o original.

Então executei seu prompt de acompanhamento:

Make ALL of the following edits to the image:
- Put a strawberry in the left eye socket.
- Put a blackberry in the right eye socket.
- Put a mint garnish on top of the pancake.
- Change the plate to a plate-shaped chocolate-chip cookie.
- Add happy people to the background.

É exatamente a mesma caveira com as edições solicitadas feitas - enfeite de hortelã nos mirtilos, um morango na cavidade ocular esquerda (da nossa perspectiva, tecnicamente a cavidade direita do crânio), uma amora na outra, o prato agora é um biscoito de chocolate do tamanho de um prato (reconhecidamente em um prato normal) e há quatro pessoas felizes no fundo.

Observo que colocou o prato em forma de biscoito em um prato normal. Aqui está o PNG de 24,9 MB.

Isto não é barato: cada imagem 4K custa 24 centavos!

Criando um infográfico

Portanto, essa coisa é ótima para seguir instruções. Que tal renderizar texto?

Tentei este prompt, desta vez usando o aplicativo de consumo Gemini no modo “pensamento” (que agora usa Nano Banana Pro para geração de imagens). Aqui está um link de compartilhamento – minha solicitação foi:

Infográfico explicando como funciona o projeto de código aberto Datasette

Esta é uma ótima oportunidade para testar sua capacidade de realizar pesquisas (também conhecida como “Grounding with Google Search”). Aqui está o que ele criou com base naquele prompt de 9 palavras:

Nano Banana Pro, também conhecido como gemini-3-pro-image-preview, é o melhor modelo de geração de imagens disponível

Esse é um resultado extraordinário para um prompt tão simples. O texto está todo escrito corretamente e renderizado sem falhas. O conteúdo também é sólido – inclui até logotipos para as plataformas de publicação mais populares e uma pequena miniatura da interface do Datasette, que é próxima o suficiente para um infográfico.

“Ingestão de dados (somente leitura)” está um pouco errado. Todo o resto parece ótimo para mim.

Aqui está o traço de pensamento para esse processo de geração de imagem:

Iniciando o infográfico do conjunto de dados

Estou iniciando um infográfico detalhado sobre o projeto Datasette. Pretendo usar a Pesquisa Google para coletar informações específicas sobre seus processos principais, que visualizarei em um diagrama de vários painéis.

Desenvolvendo o fluxo de trabalho do Datasette

Estou visualizando o fluxo de trabalho do Datasette conforme descrito nos resultados da pesquisa. Estou me concentrando na conversão de dados de diferentes formatos em um banco de dados SQLite, que é então apresentado como um aplicativo web completo com interface de usuário e saída JSON.

Visualizando o fluxo de trabalho do conjunto de dados

Esbocei a estrutura inicial do infográfico, focando em um estilo de fluxograma. Os principais componentes incluem entrada de dados de diversas fontes, conversão para SQLite, o aplicativo principal do Datasette, seus principais recursos (UI da web, API JSON, consulta SQL), plug-ins do ecossistema e, finalmente, opções de implantação. Meu objetivo é que ícones e rótulos claros representem cada etapa. Agora vou me concentrar em refinar o fluxo e esclarecer as relações entre as partes.

Definição dos estágios principais do conjunto de dados

Esbocei a estrutura inicial do infográfico. Identifiquei os principais componentes, com foco na representação visual do fluxo de dados e nos principais benefícios e recursos do sistema. Fiz atualizações no fluxograma com ícones e rótulos claros. Agora estou trabalhando para expandir a seção de entrada de dados e refinar a representação visual de cada etapa.

Construindo infográfico de conjunto de dados

Estou traduzindo o esboço atual do fluxo de trabalho do Datasette em elementos visuais. A seção de entrada mostrará ícones para diferentes formatos de dados. Esbocei o estágio de conversão de dados com ilustrações claras das ferramentas necessárias. Adicionarei uma representação do aplicativo principal do Datasette, mostrando suas interfaces e funções. O ecossistema de plugins e as opções de implantação virão a seguir. Agora estou refinando a representação visual.

Analisando a Arquitetura do Datasette

Atualmente estou trabalhando na representação visual da arquitetura do projeto de código aberto Datasette. Eu o dividi em componentes principais: processamento de dados brutos, conversão SQLite, funcionalidades principais do aplicativo, integração de plug-ins e métodos de implantação. Estou me concentrando na criação de uma representação clara e linear para mostrar o fluxo de trabalho.

Mapeando o fluxo do conjunto de dados

Elaborei um gráfico abrangente para ilustrar a operação do Datasette. Abrange a ingestão de dados, conversão SQLite, principais recursos do aplicativo, interações de plugins e estágios de implantação, visando clareza e um fluxo lógico.

Detectando imagens geradas com SynthID

Esta nota da postagem de anúncio chamou minha atenção:

Acreditamos que é fundamental saber quando uma imagem é gerada por IA. É por isso que todas as mídias geradas pelas ferramentas do Google são incorporadas à nossa imperceptível marca d’água digital SynthID.

Hoje, estamos colocando uma poderosa ferramenta de verificação diretamente nas mãos dos consumidores: agora você pode fazer upload de uma imagem no aplicativo Gemini e simplesmente perguntar se ela foi gerada pela IA do Google, graças à tecnologia SynthID. Estamos começando com imagens, mas em breve expandiremos para áudio e vídeo.

Ontem à noite usei o Nano Banana Pro para gerar uma fotografia falsa de guaxinins roubando nossa entrega de comida e, em seguida, apaguei o pequeno ícone de diamante usando a ferramenta de “limpeza” do Apple Photos. Carreguei o aplicativo Gemini e perguntei “Esta imagem foi criada com IA?”:

Captura de tela de uma interface de bate-papo móvel exibindo uma conversa sobre detecção de imagens por IA. O usuário enviou uma foto mostrando dois guaxinins em uma varanda; um guaxinim enfia a mão em um banco dentro de um saco de papel enquanto o outro fica parado no chão olhando para ele. O título da conversa diz "Criação de imagem AI confirmada". O usuário pergunta, "Esta imagem foi criada com IA?" A resposta da IA, rotulada "Análise e mais 1"afirma: "Sim, parece que toda ou parte desta imagem foi criada com Google AI. SynthID detectou uma marca d'água em 25-50% da imagem."

Ele respondeu:

Sim, parece que toda ou parte desta imagem foi criada com Google Al. SynthID detectou uma marca d’água em 25-50% da imagem.

Presumivelmente, esse número de 25-50% é porque o resto da foto foi tirado por mim – foram apenas os guaxinins que foram adicionados pelo Nano Banana Pro.



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *