Kimi K2.5: Inteligência Agente Visual
Kimi K2.5: Inteligência Agente Visual (via) Kimi K2 pousou em julho como um LLM de peso aberto com parâmetro de 1 trilhão. Kimi K2 Thinking juntou-se a ele em novembro, o que adicionou capacidades de raciocínio. Agora eles o tornaram multimodal: os modelos K2 eram somente texto, mas o novo 2.5 também pode lidar com entradas de imagem:
Kimi K2.5 baseia-se no Kimi K2 com pré-treinamento contínuo em aproximadamente 15T de tokens visuais e de texto mistos. Construído como um modelo multimodal nativo, o K2.5 oferece recursos de codificação e visão de última geração e um paradigma de enxame de agentes autodirigido.
O “paradigma do enxame de agentes autodirigidos” afirma que isso significa melhores chamadas de ferramentas de longa sequência e treinamento sobre como dividir tarefas para vários agentes trabalharem ao mesmo tempo:
Para tarefas complexas, o Kimi K2.5 pode autodirigir um enxame de agentes com até 100 subagentes, executando fluxos de trabalho paralelos em até 1.500 chamadas de ferramentas. Em comparação com uma configuração de agente único, isso reduz o tempo de execução em até 4,5x. O enxame de agentes é criado e orquestrado automaticamente pelo Kimi K2.5 sem quaisquer subagentes ou fluxo de trabalho predefinidos.
Usei a interface do OpenRouter Chat para “Gerar um SVG de um pelicano andando de bicicleta” e funcionou muito bem:

Como um teste mais interessante, decidi exercitar as afirmações sobre o planejamento multiagente com este prompt:
Quero construir um plugin Datasette que ofereça uma UI para fazer upload de arquivos para um bucket S3 e armazene informações sobre eles em uma tabela SQLite. Divida isso em dez tarefas adequadas para execução por agentes de codificação paralela.
Aqui está a resposta completa. Produziu dez tarefas realistas e raciocinou sobre as dependências entre elas. Para comparação, aqui está o mesmo prompt contra Claude Opus 4.5 e contra GPT-5.2 Thinking.
O repositório Hugging Face tem 595 GB. O modelo usa a licença “MIT modificada” de Kimi, que adiciona a seguinte cláusula:
Nossa única modificação é que, se o Software (ou qualquer trabalho derivado dele) for usado para qualquer um de seus produtos ou serviços comerciais que tenham mais de 100 milhões de usuários ativos mensais ou mais de 20 milhões de dólares americanos (ou o equivalente em outras moedas) em receita mensal, você deverá exibir “Kimi K2.5” de forma destacada na interface do usuário de tal produto ou serviço.
