Qwen3.5: Rumo a Agentes Multimodais Nativos

Qwen3.5: Rumo a Agentes Multimodais Nativos


Qwen3.5: Rumo a Agentes Multimodais Nativos. Qwen do Alibaba acaba de lançar os dois primeiros modelos da série Qwen 3.5 – um de peso aberto e outro proprietário. Ambos são multimodais para entrada de visão.

O peso aberto é um modelo Mixture of Experts chamado Qwen3.5-397B-A17B. Interessante ver Qwen destacar a eficiência do serviço como um benefício dessa arquitetura:

Construído sobre uma arquitetura híbrida inovadora que combina atenção linear (via Gated Delta Networks) com uma mistura esparsa de especialistas, o modelo atinge notável eficiência de inferência: embora compreenda 397 bilhões de parâmetros totais, apenas 17 bilhões são ativados por passagem direta, otimizando a velocidade e o custo sem sacrificar a capacidade.

São 807 GB no Hugging Face e Unsloth tem uma coleção de GGUFs menores variando em tamanho de 94,2 GB de 1 bit a 462 GB Q8_K_XL.

Peguei este pelicano do modelo hospedado OpenRouter (transcrição):

Pelican é muito bom, embora o pescoço não tenha contorno por algum motivo. A bicicleta é muito básica com quadro incompleto

O modelo hospedado proprietário é chamado Qwen3.5 Plus 2026-02-15 e é um pouco confuso. Pesquisador Qwen Junyang Lin diz:

Qwen3-Plus é uma versão API hospedada do 397B. Como o modelo suporta nativamente 256 mil tokens, o Qwen3.5-Plus suporta comprimento de contexto de token de 1 milhão. Além disso, ele suporta pesquisa e interpretador de código, que você pode usar no Qwen Chat com modo Auto.

Aqui está o seu pelicano, que é semelhante em qualidade ao modelo de peso aberto:

Qwen3.5: Rumo a Agentes Multimodais Nativos





Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *