Meu laptop de 2,5 anos pode escrever invasores de espaço em JavaScript agora, usando o GLM-4.5 Air and MLX -

Meu laptop de 2,5 anos pode escrever invasores de espaço em JavaScript agora, usando o GLM-4.5 Air and MLX

29 de julho de 2025

Eu escrevi sobre a nova família de modelos GLM-4.5 ontem-novos modelos de peso aberto (MIT licenciado) da Z.ai na China, que seus benchmarks reivindicam altamente a pontuação na codificação, mesmo contra modelos como o Claude Sonnet 4.

Os modelos são muito grandes-o modelo menor GLM-4.5 ainda é de 106 bilhões de parâmetros totais, que é 205,78 GB em abraçar o rosto.

Ivan Fioravanti construiu esta versão quantizada de 3bits de 44 GB para MLX, especificamente de tamanho para que pessoas com máquinas de 64 GB pudessem ter uma chance de executá -lo. Eu tentei … e funciona extremamente bem.

Eu alterei o seguinte prompt:

Write an HTML and JavaScript page implementing space invaders

E se afastou por um tempo e produziu o seguinte:

Claramente, este não é um exemplo particularmente novo, mas ainda acho que é digno de nota que um modelo em execução no meu laptop de 2,5 anos (um MacBook Pro M2 de 64 GB) é capaz de produzir código como esse – especialmente o código que funcionou pela primeira vez sem mais edições necessárias.

Como eu corri o modelo

Eu tive que executá -lo usando o atual main Filial da biblioteca MLX-LM (para garantir que eu tivesse esse compromisso adicionando glm4_moe apoiar). Eu corri isso usando UV assim:

uv run \
  --with 'https://github.com/ml-explore/mlx-lm/archive/489e63376b963ac02b3b7223f778dbecc164716b.zip' \
  python

Então, nesse intérprete Python, usei a receita padrão para executar modelos MLX:

from mlx_lm import load, generate
model, tokenizer = load("mlx-community/GLM-4.5-Air-3bit")

Que baixou 44 GB de pesos do modelo para o meu ~/.cache/huggingface/hub/models--mlx-community--GLM-4.5-Air-3bit pasta.

Então:

prompt = "Write an HTML and JavaScript page implementing space invaders"
messages = ({"role": "user", "content": prompt})
prompt = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True
)
response = generate(
    model, tokenizer,
    prompt=prompt,
    verbose=True,
    max_tokens=8192
)

A resposta começou assim:

O usuário quer que eu crie um jogo de invasores espaciais usando HTML, CSS e JavaScript. Eu preciso criar um jogo completo e funcional com os seguintes recursos:

Nave espacial do jogador que pode se mover para a esquerda/direita e atirar

Invasores inimigos que se movem em formação e disparam de volta

Rastreamento de pontuação

Sistema de vidas/saúde

Jogo sobre as condições (…)

Seguido pelo HTML e esta saída de depuração:

Prompt: 14 tokens, 14.095 tokens-per-sec
Generation: 4193 tokens, 25.564 tokens-per-sec
Peak memory: 47.687 GB

Você pode ver a transcrição completa aqui ou visualizar a fonte no Github ou experimentá -la no seu navegador.

Um pelicano para uma boa medida

Eu corri meu benchmark Pelican contra os modelos de tamanho completo ontem, mas não pude resistir a tentar contra esse modelo menor de 3 bits. Aqui está o que eu recebi "Generate an SVG of a pelican riding a bicycle":

Fundo azul, Pelican parece uma nuvem com uma bicicleta laranja, a bicicleta é reconhecível como uma bicicleta, se não exatamente a geometria correta.

Aqui está a transcrição para isso.

Nos dois casos, o modelo usou cerca de 48 GB de RAM no pico, deixando -me com apenas 16 GB para todo o resto – tive que sair de alguns aplicativos para que o modelo funcione, mas a velocidade era muito boa quando chegou.

Os modelos de codificação local são realmente bons agora

É interessante como quase todos os modelos lançados em 2025 têm como alvo especificamente a codificação. Esse foco está claramente valendo a pena: esses modelos de codificação estão recebendo Muito bom agora.

Dois anos atrás, quando tentei pela primeira vez lhama, nunca sonhou Que o mesmo laptop que eu estava usando um dia seria capaz de executar modelos com recursos tão fortes quanto o que estou vendo do GLM 4.5 Air – e Mistral 3.2 Small, e Gemma 3 e Qwen 3, e uma série de outros modelos de alta qualidade que surgiram nos últimos seis meses.

Source link

Postagens Similares

YouTube expande monetização para algumas questões controversas
14 de Janeiro, 2026

O YouTube está atualizando suas diretrizes de conteúdo adequado para anunciantes para permitir que mais vídeos sobre certas “questões controversas” obtenham receita total com anúncios, desde que o conteúdo não seja gráfico e seja apresentado em um contexto dramatizado ou baseado em discussão. A mudança foi descrita em um vídeo do Creator Insider e está…

Veja Mais YouTube expande monetização para algumas questões controversas
Principais fatores que influenciam as citações do ChatGPT
26 de Novembro, 2025

O SE Ranking analisou 129.000 domínios exclusivos em 216.524 páginas em 20 nichos para identificar quais fatores se correlacionam com as citações do ChatGPT. O número de domínios de referência classificados como o preditor mais forte de probabilidade de citação. O que os dados dizem Backlinks e sinais de confiança A diversidade de links mostrou…

Veja Mais Principais fatores que influenciam as citações do ChatGPT
Cada nós quebra o ciclo com “os movimentos”
19 de Janeiro, 2026

Every Us não é apenas uma banda, mas sim um sentimento compartilhado, um som moldado pela conexão e energia coletiva. Com sede na cidade de Nova Iorque, o projeto existe para captar aqueles momentos fugazes em que a música nos faz sentir parte de algo maior do que nós mesmos. Com um single lançado agora…

Veja Mais Cada nós quebra o ciclo com “os movimentos”
Internet reage a um barão de Sacha Buff Cohen em ‘Ironheart’
24 de Julho, 2025

“O divórcio é um inferno de um motivador de fitness.” Anna boa Postado em 24 de julho de 2025 10:00 CDT O Barão de Sacha Cohen não é estranho à transformação de corpo inteiro, mas este pode ser o seu mais cair o queixo ainda. Vídeo em destaque O ator de 52 anos aumentou para…

Veja Mais Internet reage a um barão de Sacha Buff Cohen em ‘Ironheart’
14 coisas para organizar antes do início do ano novo
7 de Dezembro, 2025

À medida que o ano termina, a organização pode proporcionar um novo começo para os próximos meses. Há uma certa sensação de realização quando você elimina itens antigos que não servem mais para você. Não se trata apenas de arrumar. Trata-se de criar espaço para coisas novas entrarem em sua vida. Organizar antes do ano…

Veja Mais 14 coisas para organizar antes do início do ano novo
Ouça: Hovercraft – “New Pine Overcoat” + “Angel” –
17 de Dezembro, 2025

As faixas “New Pine Overcoat” e “Angel” são dois destaques emotivamente ricos do HovercraftAs gravações recém-surgidas, digitalizadas a partir de demos originais de meados da década de 1990 gravadas em sua base em Grimsby, Reino Unido. Tons de guitarra quentes e com raízes folk, lirismo sincero e melodias dolorosas convergem com uma sensação de redescoberta,…

Veja Mais Ouça: Hovercraft – “New Pine Overcoat” + “Angel” –