Apresentando Mistral 3
Apresentando Mistral 3. Quatro novos modelos da Mistral hoje: três em sua série de modelos menores “Ministral” (14B, 8B e 3B) e um novo modelo Mistral Large 3 MoE com parâmetros 675B, 41B ativo.
Todos os modelos são capazes de visão e são lançados sob uma licença Apache 2.
Estou particularmente entusiasmado com o modelo 3B, que parece ser um modelo competente com capacidade de visão em um pequeno arquivo de aproximadamente 3 GB.
Xenova do Hugging Face fez funcionar em um navegador:
@MistralAI lança Mistral 3, uma família de modelos multimodais, incluindo três modelos densos de última geração (3B, 8B e 14B) e Mistral Large 3 (675B, 41B ativo). Tudo Apache 2.0! 🤗
Surpreendentemente, o 3B é pequeno o suficiente para rodar 100% localmente no seu navegador na WebGPU! 🤯
Você pode experimentar essa demonstração em seu navegador, que buscará 3 GB de modelo e, em seguida, transmitirá de sua webcam e permitirá que você execute prompts de texto com base no que o modelo está vendo, totalmente localmente.

As versões hospedadas pela API do Mistral dos novos modelos já são suportadas pelo meu plugin llm-mistral graças ao llm mistral refresh comando:
$ llm mistral refresh
Added models: ministral-3b-2512, ministral-14b-latest, mistral-large-2512, ministral-14b-2512, ministral-8b-2512
Experimentei pelicanos contra todos os modelos. Aqui está o melhor, do Mistral Large 3:

E o pior do Ministral 3B:

