Devstral 2

Devstral 2


Devstral 2. Dois novos modelos da Mistral hoje: Devstral 2 e Devstral Small 2 – ambos focados em potencializar agentes de codificação, como o recém-lançado Mistral Vibe da Mistral, sobre o qual escrevi hoje cedo.

  • Devstral 2: Modelo aberto SOTA para agentes de código com uma fração dos parâmetros de seus concorrentes e atingindo 72,2% no SWE-bench Verified.
  • Até 7x mais econômico do que Claude Sonnet em tarefas do mundo real.

Devstral 2 é um modelo 123B lançado sob uma licença desajeitada – é “MIT modificado”, onde a modificação é:

Você não está autorizado a exercer quaisquer direitos sob esta licença se a receita mensal global consolidada de sua empresa (ou de seu empregador) exceder US$ 20 milhões (ou seu equivalente em outra moeda) no mês anterior. Esta restrição em (b) aplica-se ao Modelo e quaisquer derivados, modificações ou trabalhos combinados baseados nele, sejam fornecidos pela Mistral AI ou por terceiros. (…)

Mistral Small 2 está sob uma licença adequada do Apache 2, sem restrições estranhas. É um modelo de 24B que tem 51,6 GB no Hugging Face e deve quantizar significativamente menos.

Experimentei o modelo maior por meio do meu plugin llm-mistral assim:

llm install llm-mistral
llm mistral refresh
llm -m mistral/devstral-2512 "Generate an SVG of a pelican riding a bicycle"

Devstral 2

Para um modelo de ~ 120B, esse é muito bom!

Aqui está o mesmo prompt com -m mistral/labs-devstral-small-2512 para a versão hospedada por API do Devstral Small 2:

Um pequeno pelicano branco no que mais parece um carrinho de criança.

Novamente, um resultado decente dado o pequeno tamanho do parâmetro. Para efeito de comparação, aqui está o que consegui com o 24B Mistral Small 3.2 no início deste ano.



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *