Kimi K2 Pensando

8 de Novembro, 2025

Kimi K2 Pensando. O Kimi K2 do laboratório chinês de IA Moonshot se estabeleceu como um dos maiores modelos de peso aberto – 1 trilhão de parâmetros – em julho. Eles agora lançaram a versão Thinking, também com um trilhão de parâmetros (MoE, 32B ativos) e também sob sua licença MIT modificada personalizada (portanto, não exatamente de código aberto).

Começando com Kimi K2, nós o construímos como um agente pensante que raciocina passo a passo enquanto invoca ferramentas dinamicamente. Ele estabelece um novo estado da arte no Último Exame da Humanidade (HLE), BrowseComp e outros benchmarks, aumentando drasticamente a profundidade do raciocínio em várias etapas e mantendo o uso estável da ferramenta em 200 a 300 chamadas sequenciais. Ao mesmo tempo, K2 Thinking é um modelo de quantização INT4 nativo com janela de contexto de 256k, alcançando reduções sem perdas na latência de inferência e no uso de memória da GPU.

Este tem apenas 594 GB no Hugging Face – Kimi K2 tinha 1,03 TB – o que acho que se deve à nova quantização INT4. Isso torna o modelo mais barato e mais rápido de hospedar.

Até agora, as únicas pessoas que o hospedam são os próprios Moonshot. Eu tentei por meio de sua própria API e por meio do proxy OpenRouter, por meio do plugin llm-moonshot (de NickMystic) e meu plugin llm-openrouter respectivamente.

O burburinho em torno deste modelo até agora é muito positivo. Poderia este ser o primeiro modelo de peso aberto competitivo com os mais recentes da OpenAI e Anthropic, especialmente para sequências de chamadas de ferramentas de agente de longa duração?

As pontuações de benchmark auto-relatadas da Moonshot AI mostram o K2 Thinking superando os principais modelos OpenAI e Anthropic (GPT-5 e Sonnet 4.5 Thinking) em “Agentic Reasoning” e “Agentic Search”, mas não totalmente no topo em “Coding”:

Fiz alguns testes de pelicano:

llm install llm-moonshot
llm keys set moonshot # paste key
llm -m moonshot/kimi-k2-thinking 'Generate an SVG of a pelican riding a bicycle'

Kimi K2 Pensando

llm install llm-openrouter
llm keys set openrouter # paste key
llm -m openrouter/moonshotai/kimi-k2-thinking \
  'Generate an SVG of a pelican riding a bicycle'

Soneto 4.5: Ilustração minimalista de desenho animado de um pássaro branco com bico laranja e pés em pé sobre uma bicicleta estilo penny-farthing de estrutura triangular com rodas de cubo cinza e um chapéu de hélice na cabeça, contra um fundo claro com linhas pontilhadas e uma linha de fundo marrom.

Análise Artificial disse:

Kimi K2 Thinking atinge 93% no 𝜏²-Bench Telecom, benchmark de uso de ferramenta agentica onde o modelo atua como agente de atendimento ao cliente. Esta é a pontuação mais alta que medimos de forma independente. O uso de ferramentas em contextos de agência de longo horizonte foi um ponto forte do Kimi K2 Instruct e parece que esta nova variante do Thinking traz ganhos substanciais

A CNBC citou uma fonte que forneceu o preço de treinamento do modelo:

O modelo Kimi K2 Thinking custou US$ 4,6 milhões para ser treinado, segundo uma fonte familiarizada com o assunto. (…) A CNBC não conseguiu verificar de forma independente os números do DeepSeek ou do Kimi.

A desenvolvedora do MLX, Awni Hannun, fez com que funcionasse em dois M3 Ultra Mac Studios:

O novo modelo Kimi K2 Thinking com parâmetro de 1 trilhão funciona bem em 2 M3 Ultras em seu formato nativo – sem perda de qualidade!

O modelo foi treinado com reconhecimento de quantização (qat) em int4.

Aqui ele gerou aproximadamente 3.500 tokens a 15 toks/s usando paralelismo de pipeline em mlx-lm

Aqui está o modelo da comunidade mlx de 658 GB.

Source link

Novos sabores para a Páscoa de 2026 incluem Sunny D, Pop-Tarts e Chili Lime Mango
20 de Janeiro, 2026

Em 2025, Peeps nos deu marshmallows com sabor Breyers Cookies & Cream e Rice Krispies Treats. Em 2026, a Peeps continua sua série de colaborações inesperadas com marcas, dando as boas-vindas à primavera com uma nova linha de sabores para a Páscoa: Sunny D, Pop-Tarts Frosted Strawberry e Chili Lime Mango. PEEPS “Como o doce…

Veja Mais Novos sabores para a Páscoa de 2026 incluem Sunny D, Pop-Tarts e Chili Lime Mango
14 carros raros que só aparecem uma vez na lua azul
22 de Dezembro, 2025

Imagine dirigir pelas ruas e de repente vislumbrar um carro que você nunca pensou que veria fora de um museu. Esse momento está reservado para carros raros, veículos tão únicos que deixam uma impressão duradoura. Embora alguns sejam edições limitadas, outros são designs únicos que capturam a imaginação dos amantes de automóveis em todo o…

Veja Mais 14 carros raros que só aparecem uma vez na lua azul
Como a IA está redefinindo a pesquisa e o que os líderes devem fazer agora
2 de Outubro, 2025

A inteligência artificial está transformando como as pessoas pesquisam, descobrem e agem com informações. Para os diretores de marketing e líderes seniores, isso não é uma questão de saber se o SEO está “morto”, mas de como se adaptar a uma nova era em que a visibilidade abrange assistentes orientados pela IA, ferramentas multimodais e…

Veja Mais Como a IA está redefinindo a pesquisa e o que os líderes devem fazer agora
Google testa insights de canais sociais no Search Console
8 de Dezembro, 2025

O Google Search Console está testando um recurso que mostra o desempenho dos canais sociais vinculados na Pesquisa Google, incluindo cliques, impressões e consultas. O Search Console Insights agora inclui dados de desempenho de canais sociais que o Google vinculou automaticamente ao seu site. O recurso mostra cliques, impressões, principais consultas e conteúdo de tendência…

Veja Mais Google testa insights de canais sociais no Search Console
Na verdade, juntando as peças para 2026-02-08 21:35:02.274442+01
8 de Fevereiro, 2026

Flutterby™! : Na verdade, juntando as peças em 08/02/2026 21:35:02.274442+01 Na verdade, juntando as peças para 2026-02-08 21:35:02.274442+01 por Dan Lyke 0 comentários Na verdade, juntar as peças para descobrir se os joelhos realmente cabem e qual é a altura do trem e assim por diante… A ideia atual é talvez fazer montanhas folheadas nas…

Veja Mais Na verdade, juntando as peças para 2026-02-08 21:35:02.274442+01
Novo álbum: Jonathan Calhoun – ‘Lifetime na I -79’
29 de Setembro, 2025

Charleston, artista baseado em WV Jonathan Calhoun retorna com Lifetime na I-79um quinto álbum que combina composições folclóricas pessoais com reflexão usada por estrada. Gravado em seu estúdio em casa, as canções centram -se em violão e vocais desprotegidos, rastreando lembranças pessoais e observações sociais. Com base em influências de Springsteen a Petty, enquanto forjar…

Veja Mais Novo álbum: Jonathan Calhoun – ‘Lifetime na I -79’

Postagens Similares

Deixe um comentário Cancelar resposta