Kimi K2 Pensando

8 de Novembro, 2025

Kimi K2 Pensando. O Kimi K2 do laboratório chinês de IA Moonshot se estabeleceu como um dos maiores modelos de peso aberto – 1 trilhão de parâmetros – em julho. Eles agora lançaram a versão Thinking, também com um trilhão de parâmetros (MoE, 32B ativos) e também sob sua licença MIT modificada personalizada (portanto, não exatamente de código aberto).

Começando com Kimi K2, nós o construímos como um agente pensante que raciocina passo a passo enquanto invoca ferramentas dinamicamente. Ele estabelece um novo estado da arte no Último Exame da Humanidade (HLE), BrowseComp e outros benchmarks, aumentando drasticamente a profundidade do raciocínio em várias etapas e mantendo o uso estável da ferramenta em 200 a 300 chamadas sequenciais. Ao mesmo tempo, K2 Thinking é um modelo de quantização INT4 nativo com janela de contexto de 256k, alcançando reduções sem perdas na latência de inferência e no uso de memória da GPU.

Este tem apenas 594 GB no Hugging Face – Kimi K2 tinha 1,03 TB – o que acho que se deve à nova quantização INT4. Isso torna o modelo mais barato e mais rápido de hospedar.

Até agora, as únicas pessoas que o hospedam são os próprios Moonshot. Eu tentei por meio de sua própria API e por meio do proxy OpenRouter, por meio do plugin llm-moonshot (de NickMystic) e meu plugin llm-openrouter respectivamente.

O burburinho em torno deste modelo até agora é muito positivo. Poderia este ser o primeiro modelo de peso aberto competitivo com os mais recentes da OpenAI e Anthropic, especialmente para sequências de chamadas de ferramentas de agente de longa duração?

As pontuações de benchmark auto-relatadas da Moonshot AI mostram o K2 Thinking superando os principais modelos OpenAI e Anthropic (GPT-5 e Sonnet 4.5 Thinking) em “Agentic Reasoning” e “Agentic Search”, mas não totalmente no topo em “Coding”:

Fiz alguns testes de pelicano:

llm install llm-moonshot
llm keys set moonshot # paste key
llm -m moonshot/kimi-k2-thinking 'Generate an SVG of a pelican riding a bicycle'

Kimi K2 Pensando

llm install llm-openrouter
llm keys set openrouter # paste key
llm -m openrouter/moonshotai/kimi-k2-thinking \
  'Generate an SVG of a pelican riding a bicycle'

Soneto 4.5: Ilustração minimalista de desenho animado de um pássaro branco com bico laranja e pés em pé sobre uma bicicleta estilo penny-farthing de estrutura triangular com rodas de cubo cinza e um chapéu de hélice na cabeça, contra um fundo claro com linhas pontilhadas e uma linha de fundo marrom.

Análise Artificial disse:

Kimi K2 Thinking atinge 93% no 𝜏²-Bench Telecom, benchmark de uso de ferramenta agentica onde o modelo atua como agente de atendimento ao cliente. Esta é a pontuação mais alta que medimos de forma independente. O uso de ferramentas em contextos de agência de longo horizonte foi um ponto forte do Kimi K2 Instruct e parece que esta nova variante do Thinking traz ganhos substanciais

A CNBC citou uma fonte que forneceu o preço de treinamento do modelo:

O modelo Kimi K2 Thinking custou US$ 4,6 milhões para ser treinado, segundo uma fonte familiarizada com o assunto. (…) A CNBC não conseguiu verificar de forma independente os números do DeepSeek ou do Kimi.

A desenvolvedora do MLX, Awni Hannun, fez com que funcionasse em dois M3 Ultra Mac Studios:

O novo modelo Kimi K2 Thinking com parâmetro de 1 trilhão funciona bem em 2 M3 Ultras em seu formato nativo – sem perda de qualidade!

O modelo foi treinado com reconhecimento de quantização (qat) em int4.

Aqui ele gerou aproximadamente 3.500 tokens a 15 toks/s usando paralelismo de pipeline em mlx-lm

Aqui está o modelo da comunidade mlx de 658 GB.

Source link

O novo papel da pesquisa local na experiência do cliente
18 de Novembro, 2025

Pergunte a si mesmo o seguinte: Você responde aos comentários? Você se envolve? Você faz a interação parecer pessoal? Você cumpre suas promessas? Você mantém as informações consistentes em todas as plataformas? Você compartilha atualizações recentes (por exemplo: fotos, postagens ou promoções) que mostram que você está ativo? Você fornece detalhes transparentes como preços, tempos…

Veja Mais O novo papel da pesquisa local na experiência do cliente
JustHTML é um exemplo fascinante de engenharia de vibração em ação
14 de Dezembro, 2025

JustHTML é um exemplo fascinante de engenharia de vibração em ação 14 de dezembro de 2025 Recentemente descobri JustHTML, uma nova biblioteca Python para análise de HTML lançada por Emil Stenström. É um software muito interessante, tanto como biblioteca útil quanto como estudo de caso em programação sofisticada assistida por IA. Primeiras impressões do JustHTML…

Veja Mais JustHTML é um exemplo fascinante de engenharia de vibração em ação
Novo álbum: OneNamedPeter – ‘Passing for Human’
11 de Dezembro, 2025

Artista residente em Sussex, Inglaterra OneNamedPeter obriga Passando por Humanoum álbum solo criado a partir de uma onda de inspiração revivida após uma pausa de três anos. A mistura do álbum de folk reflexivo, vigor do rock e devaneio reforçado por sintetizadores emerge com charme sincero, tecendo meditações artisticamente sobre alienação, amor e fuga de…

Veja Mais Novo álbum: OneNamedPeter – ‘Passing for Human’
Riley Gaines tenta flexionar Zohran Mamdani, com a bancada mais do que ele
25 de Agosto, 2025

A ironia parece estar perdida nela. Lindsey Weedston Postado em 25 de agosto 2025 16:00 CDT Em um evento do “Dia dos Men” do Brooklyn, o candidato a prefeito de Nova York Zohran Mamdani lutou para supino 135 libras sem ajuda. A ativista conservadora e ex -nadadora Riley Gaines rapidamente atacou, ressurgindo um vídeo antigo…

Veja Mais Riley Gaines tenta flexionar Zohran Mamdani, com a bancada mais do que ele
All the Young retorna com seu single hino, “Something More”
1 de Dezembro, 2025

… um hino indie-rock enérgico repleto de talento dos anos 90, energia Britpop e otimismo imparável. A forma como a faixa começa me lembra muito The Enemy em alguns lugares, com a natureza otimista e a guitarra estridente. Os vocais são absolutamente incríveis, com bastante poder por trás deles para seduzi-lo a cantar junto. No…

Veja Mais All the Young retorna com seu single hino, “Something More”
Os 8 KPIs de PPC mais importantes que você deve acompanhar
5 de Dezembro, 2025

Se seus relatórios de desempenho de PPC ainda começarem com métricas personalizadas, como taxa de cliques e impressões, você verá apenas a superfície do desempenho. Os executivos não ficam impressionados com as capturas de tela das setas verdes. Eles querem saber se a mídia paga está agregando lucro, construindo valor no pipeline e apoiando o…

Veja Mais Os 8 KPIs de PPC mais importantes que você deve acompanhar

Postagens Similares

Deixe um comentário Cancelar resposta