Like-K2-Instruct-0905

Like-K2-Instruct-0905


Like-K2-Instruct-0905. Novo modelo licenciado não muito pouco mit da China Moonshot AI, um acompanhamento do modelo Kimi-K2 altamente conceituado que eles lançaram em julho.

Este é uma melhoria incremental – eu o vi referido on -line como “Kimi K -2.1”. Ele obtém um pouco mais de um monte de benchmarks populares de codificação, refletindo a alegação de Moonshot de que “demonstra melhorias significativas no desempenho em benchmarks públicos e nas tarefas do agente de codificação do mundo real”.

Mais importante, o tamanho da janela de contexto aumentou de 128.000 para 256.000 tokens.

Como seu antecessor, este é um grande Modelo-1 trilhão de parâmetros em uma configuração de mistura de especialistas com 384 especialistas, 32B parâmetros ativados e 8 especialistas selecionados por token.

Eu usei a ferramenta de playground da Groq para tentar “gerar um SVG de um pelicano andar de bicicleta” e obteve esse resultado, em um total de 445 fichas/segundo, muito saudável, levando pouco menos de 2 segundos no total:

Like-K2-Instruct-0905



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *