QWEN/QWEN3-235B-A22B-INSTRUCT-2507
QWEN/QWEN3-235B-A22B-INSTRUCT-2507. Lançamento significativo de novos modelos de Qwen, publicado ontem sem muita fanfarra. (Atualizar: Provavelmente porque eles estavam cozinhando a instrução QWEN3-CODER-480B-A35B muito maior, que eles lançaram agora.)
Este é um acompanhamento para o lançamento de abril da família Full QWEN 3, que incluiu um modelo QWEN3-235B-A22B, que poderia lidar com o raciocínio e os prompts não raciocinadores (através de um /no_think alternar).
O novo Qwen3-235B-A22B-Instruct-2507 valas esse mecanismo – este é exclusivamente um não-raciocínio modelo. Parece que Qwen tem novos modelos de raciocínio no pipeline.
Este novo modelo é licenciado no Apache 2 e vem em dois tamanhos oficiais: um modelo BF16 (437,91 GB de arquivos na face abraçada) e uma variante FP8 (220,20 GB). VentureBeat estimar que o modelo grande precisa de 88 GB de VRAM, enquanto o menor deve ser executado em ~ 30 GB.
Os benchmarks nesses novos modelos parecem muito promissor. Os próprios números de Qwen têm que derrotar o Claude 4 Opus no modo de não pensar em vários testes, também indicando um impulso significativo em relação ao modelo anterior de 235B-A22B.
Ainda não vi nenhum resultado independente de referência. Aqui está o que eu recebi para “gerar um SVG de um pelicano andando de bicicleta”, que eu executei usando o QWEN3-235B-A22B-07-25: GRÁTIS no OpenRouter:
llm install llm-openrouter
llm -m openrouter/qwen/qwen3-235b-a22b-07-25:free \
"Generate an SVG of a pelican riding a bicycle"

