Like-K2-Instruct-0905
Like-K2-Instruct-0905. Novo modelo licenciado não muito pouco mit da China Moonshot AI, um acompanhamento do modelo Kimi-K2 altamente conceituado que eles lançaram em julho.
Este é uma melhoria incremental – eu o vi referido on -line como “Kimi K -2.1”. Ele obtém um pouco mais de um monte de benchmarks populares de codificação, refletindo a alegação de Moonshot de que “demonstra melhorias significativas no desempenho em benchmarks públicos e nas tarefas do agente de codificação do mundo real”.
Mais importante, o tamanho da janela de contexto aumentou de 128.000 para 256.000 tokens.
Como seu antecessor, este é um grande Modelo-1 trilhão de parâmetros em uma configuração de mistura de especialistas com 384 especialistas, 32B parâmetros ativados e 8 especialistas selecionados por token.
Eu usei a ferramenta de playground da Groq para tentar “gerar um SVG de um pelicano andar de bicicleta” e obteve esse resultado, em um total de 445 fichas/segundo, muito saudável, levando pouco menos de 2 segundos no total:

