Apresentando Mistral 3

Apresentando Mistral 3


Apresentando Mistral 3. Quatro novos modelos da Mistral hoje: três em sua série de modelos menores “Ministral” (14B, 8B e 3B) e um novo modelo Mistral Large 3 MoE com parâmetros 675B, 41B ativo.

Todos os modelos são capazes de visão e são lançados sob uma licença Apache 2.

Estou particularmente entusiasmado com o modelo 3B, que parece ser um modelo competente com capacidade de visão em um pequeno arquivo de aproximadamente 3 GB.

Xenova do Hugging Face fez funcionar em um navegador:

@MistralAI lança Mistral 3, uma família de modelos multimodais, incluindo três modelos densos de última geração (3B, 8B e 14B) e Mistral Large 3 (675B, 41B ativo). Tudo Apache 2.0! 🤗

Surpreendentemente, o 3B é pequeno o suficiente para rodar 100% localmente no seu navegador na WebGPU! 🤯

Você pode experimentar essa demonstração em seu navegador, que buscará 3 GB de modelo e, em seguida, transmitirá de sua webcam e permitirá que você execute prompts de texto com base no que o modelo está vendo, totalmente localmente.

Captura de tela de um homem de óculos segurando um objeto vermelho em forma de cubo até a câmera em uma interface de visão computacional ao vivo; o rótulo superior esquerdo diz “LIVE FEED”; o rótulo do controle deslizante superior direito diz “TAMANHO DE ENTRADA: 480PX”; painel inferior esquerdo intitulado “BIBLIOTECA DE PROMPT” com instruções “Descreva o que você vê em uma frase”. “Qual é a cor da minha camisa?” “Identifique qualquer texto ou conteúdo escrito visível.” “Que emoções ou ações estão sendo retratadas?” “Diga o nome do objeto que estou segurando na mão.”; abaixo dele um campo denominado “PROMPT” contendo o texto “escreva um haicai sobre isso”; painel inferior direito intitulado “OUTPUT STREAM” com botões “VIEW HISTORY” e “LIVE INFERENCE” e texto gerado “Cubo vermelho mantido firme, dedos enquadram o brilho suave da luz – O mistério brilha.”; uma pequena barra de status na parte inferior mostra “ttft: 4188ms tokens/sec: 5.09” e “ctx: 3.3B-Instruct”.

As versões hospedadas pela API do Mistral dos novos modelos já são suportadas pelo meu plugin llm-mistral graças ao llm mistral refresh comando:

$ llm mistral refresh
Added models: ministral-3b-2512, ministral-14b-latest, mistral-large-2512, ministral-14b-2512, ministral-8b-2512

Experimentei pelicanos contra todos os modelos. Aqui está o melhor, do Mistral Large 3:

Apresentando Mistral 3

E o pior do Ministral 3B:

Um céu negro. Um chão marrom. Um conjunto de formas abstratas marrons e cinzas flutua ameaçadoramente.



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *