Meu laptop de 2,5 anos pode escrever invasores de espaço em JavaScript agora, usando o GLM-4.5 Air and MLX

29 de Julho, 2025

Meu laptop de 2,5 anos pode escrever invasores de espaço em JavaScript agora, usando o GLM-4.5 Air and MLX

29 de julho de 2025

Eu escrevi sobre a nova família de modelos GLM-4.5 ontem-novos modelos de peso aberto (MIT licenciado) da Z.ai na China, que seus benchmarks reivindicam altamente a pontuação na codificação, mesmo contra modelos como o Claude Sonnet 4.

Os modelos são muito grandes-o modelo menor GLM-4.5 ainda é de 106 bilhões de parâmetros totais, que é 205,78 GB em abraçar o rosto.

Ivan Fioravanti construiu esta versão quantizada de 3bits de 44 GB para MLX, especificamente de tamanho para que pessoas com máquinas de 64 GB pudessem ter uma chance de executá -lo. Eu tentei … e funciona extremamente bem.

Eu alterei o seguinte prompt:

Write an HTML and JavaScript page implementing space invaders

E se afastou por um tempo e produziu o seguinte:

Claramente, este não é um exemplo particularmente novo, mas ainda acho que é digno de nota que um modelo em execução no meu laptop de 2,5 anos (um MacBook Pro M2 de 64 GB) é capaz de produzir código como esse – especialmente o código que funcionou pela primeira vez sem mais edições necessárias.

Como eu corri o modelo

Eu tive que executá -lo usando o atual main Filial da biblioteca MLX-LM (para garantir que eu tivesse esse compromisso adicionando glm4_moe apoiar). Eu corri isso usando UV assim:

uv run \
  --with 'https://github.com/ml-explore/mlx-lm/archive/489e63376b963ac02b3b7223f778dbecc164716b.zip' \
  python

Então, nesse intérprete Python, usei a receita padrão para executar modelos MLX:

from mlx_lm import load, generate
model, tokenizer = load("mlx-community/GLM-4.5-Air-3bit")

Que baixou 44 GB de pesos do modelo para o meu ~/.cache/huggingface/hub/models--mlx-community--GLM-4.5-Air-3bit pasta.

Então:

prompt = "Write an HTML and JavaScript page implementing space invaders"
messages = ({"role": "user", "content": prompt})
prompt = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True
)
response = generate(
    model, tokenizer,
    prompt=prompt,
    verbose=True,
    max_tokens=8192
)

A resposta começou assim:

O usuário quer que eu crie um jogo de invasores espaciais usando HTML, CSS e JavaScript. Eu preciso criar um jogo completo e funcional com os seguintes recursos:

Nave espacial do jogador que pode se mover para a esquerda/direita e atirar

Invasores inimigos que se movem em formação e disparam de volta

Rastreamento de pontuação

Sistema de vidas/saúde

Jogo sobre as condições (…)

Seguido pelo HTML e esta saída de depuração:

Prompt: 14 tokens, 14.095 tokens-per-sec
Generation: 4193 tokens, 25.564 tokens-per-sec
Peak memory: 47.687 GB

Você pode ver a transcrição completa aqui ou visualizar a fonte no Github ou experimentá -la no seu navegador.

Um pelicano para uma boa medida

Eu corri meu benchmark Pelican contra os modelos de tamanho completo ontem, mas não pude resistir a tentar contra esse modelo menor de 3 bits. Aqui está o que eu recebi "Generate an SVG of a pelican riding a bicycle":

Fundo azul, Pelican parece uma nuvem com uma bicicleta laranja, a bicicleta é reconhecível como uma bicicleta, se não exatamente a geometria correta.

Aqui está a transcrição para isso.

Nos dois casos, o modelo usou cerca de 48 GB de RAM no pico, deixando -me com apenas 16 GB para todo o resto – tive que sair de alguns aplicativos para que o modelo funcione, mas a velocidade era muito boa quando chegou.

Os modelos de codificação local são realmente bons agora

É interessante como quase todos os modelos lançados em 2025 têm como alvo especificamente a codificação. Esse foco está claramente valendo a pena: esses modelos de codificação estão recebendo Muito bom agora.

Dois anos atrás, quando tentei pela primeira vez lhama, nunca sonhou Que o mesmo laptop que eu estava usando um dia seria capaz de executar modelos com recursos tão fortes quanto o que estou vendo do GLM 4.5 Air – e Mistral 3.2 Small, e Gemma 3 e Qwen 3, e uma série de outros modelos de alta qualidade que surgiram nos últimos seis meses.

Source link

Refresque-se com estes jantares fáceis de verão Keto – baixo teor de carboidratos e grande sabor!
30 de Novembro, 2025

Se há uma coisa que aprendi depois de passar mais de uma década nos verões de Sacramento, é isto: quando estão 112 graus lá fora, o durar coisa que eu quero fazer é ligar o forno. O calor esgota sua energia e, de repente, até o jantar mais simples parece uma tarefa árdua. É exatamente…

Veja Mais Refresque-se com estes jantares fáceis de verão Keto – baixo teor de carboidratos e grande sabor!
A consistência atende à criatividade no “telefone do construtor” de Christopha
7 de Setembro, 2025

Quando você pensa em dedicação na música, o nome de Christopha merece estar na frente e no centro. Nascido e criado no norte e leste de Londres, ele não é apenas um rapper e escritor, mas também um sonhador implacável que tem esculpido sua própria pista com consistência e ofício. Depois de um longo trecho…

Veja Mais A consistência atende à criatividade no “telefone do construtor” de Christopha
TikTok do robô de entrega “Akira” desviando de um sem-teto em Miami acumula mais de 3 milhões de visualizações
5 de Fevereiro, 2026

Um vídeo viral que mostra um robô de entrega de comida manobrando cuidadosamente em torno de um homem sem casa dormindo em uma calçada de Miami está incitando comentários sobre a distopia moderna. O criador do TikTok, @hackedliving, compartilhou o clipe em 29 de janeiro de 2026, que desde então acumulou quase 3 milhões de…

Veja Mais TikTok do robô de entrega “Akira” desviando de um sem-teto em Miami acumula mais de 3 milhões de visualizações
Anana Kaye revela sua nova oferta íntima, “Cordelia”
9 de Janeiro, 2026

Anana Kaye, de Nashville, revelou recentemente sua nova oferta íntima, “Cordelia”, e essa fusão de tons sombrios, melódicos e pop certamente fará você dançar rapidamente. … uma joia cinematográfica do pop alternativo que mistura melodias sombrias, metais comoventes e vocais que canalizam Arcade Fire e Blondie – instantaneamente contagiante. A faixa é incrivelmente cinematográfica, com…

Veja Mais Anana Kaye revela sua nova oferta íntima, “Cordelia”
Jade Street e Apple Martin encontram sua órbita em “satélites”, um devaneio dolorosamente íntimo de saudade, distância e restrição
8 de Dezembro, 2025

A dupla de Los Angeles Jade Street explora uma intensidade silenciosa e taciturna em “Satellites”, transformando os momentos mais suaves da vida em um devaneio nebuloso e atmosférico que anuncia a jovem banda alternativa – com a assombrosa estreia vocal de Apple Martin em seu centro – como um novo artista atraente para assistir. siga…

Veja Mais Jade Street e Apple Martin encontram sua órbita em “satélites”, um devaneio dolorosamente íntimo de saudade, distância e restrição
Destaque: FADED – EP ‘Out Of Season’ –
24 de Fevereiro, 2026

Banda inglesa DESAPARECIDO explora uma realidade melancólica e desconexa no Fora de temporada EP. Esta coleção de faixas, considerada muito sombria para o seu próximo álbum otimista, equilibra a grandiosidade orquestral com a coragem pós-punk. Da mística barroco-pop de “Lava Bird” à taciturna faixa-título, o lançamento consolida seu talento para manobras tonais dinâmicas e uma…

Veja Mais Destaque: FADED – EP ‘Out Of Season’ –

Meu laptop de 2,5 anos pode escrever invasores de espaço em JavaScript agora, usando o GLM-4.5 Air and MLX

Como eu corri o modelo

Um pelicano para uma boa medida

Os modelos de codificação local são realmente bons agora

Postagens Similares

Deixe um comentário Cancelar resposta