Qwen3.5: Rumo a Agentes Multimodais Nativos
Qwen3.5: Rumo a Agentes Multimodais Nativos. Qwen do Alibaba acaba de lançar os dois primeiros modelos da série Qwen 3.5 – um de peso aberto e outro proprietário. Ambos são multimodais para entrada de visão.
O peso aberto é um modelo Mixture of Experts chamado Qwen3.5-397B-A17B. Interessante ver Qwen destacar a eficiência do serviço como um benefício dessa arquitetura:
Construído sobre uma arquitetura híbrida inovadora que combina atenção linear (via Gated Delta Networks) com uma mistura esparsa de especialistas, o modelo atinge notável eficiência de inferência: embora compreenda 397 bilhões de parâmetros totais, apenas 17 bilhões são ativados por passagem direta, otimizando a velocidade e o custo sem sacrificar a capacidade.
São 807 GB no Hugging Face e Unsloth tem uma coleção de GGUFs menores variando em tamanho de 94,2 GB de 1 bit a 462 GB Q8_K_XL.
Peguei este pelicano do modelo hospedado OpenRouter (transcrição):

O modelo hospedado proprietário é chamado Qwen3.5 Plus 2026-02-15 e é um pouco confuso. Pesquisador Qwen Junyang Lin diz:
Qwen3-Plus é uma versão API hospedada do 397B. Como o modelo suporta nativamente 256 mil tokens, o Qwen3.5-Plus suporta comprimento de contexto de token de 1 milhão. Além disso, ele suporta pesquisa e interpretador de código, que você pode usar no Qwen Chat com modo Auto.
Aqui está o seu pelicano, que é semelhante em qualidade ao modelo de peso aberto:

