Os melhores LLMs de peso aberto disponíveis agora vêm da China

Os melhores LLMs de peso aberto disponíveis agora vêm da China


Algo que se tornou inegável este mês é que os melhores modelos de peso aberto disponíveis agora vêm dos laboratórios de IA chineses.

Eu continuo a ter muito amor por Mistral, Gemma e Llama, mas meu sentimento é que Qwen, Moonshot e Z.ai têm positivamente fumou -os Ao longo de julho.

Aqui está o que saiu este mês, com links para minhas anotações em cada um:

A única licença desajeitada entre eles é o Kimi K2, que usa um MIT modificado não compatível com OSI. Os modelos de Qwen são todos o Apache 2 e Z.ai’s são MIT.

Todos os maiores modelos chineses oferecem suas próprias APIs e estão cada vez mais disponíveis em outros fornecedores. Consegui executar versões dos modelos QWEN 30B e GLM-4.5 AIR 106B no meu próprio laptop.

Não posso deixar de me perguntar se parte do motivo do atraso na liberação do modelo de peso aberto do OpenAI vem do desejo de ser notavelmente melhor do que essa linha verdadeiramente impressionante de modelos chineses.



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *