Carregue llama-3.2 webgpu no seu navegador de uma pasta local

8 de Setembro, 2025

Carregue llama-3.2 webgpu no seu navegador de uma pasta local (Via) Inspirado por um comentário sobre o Hacker News, decidi ver se era possível modificar os transformadores.

Eu coloquei o problema para a CLI do Codex, habilitada para GPT-5 da OpenAI, assim:

git clone https://github.com/huggingface/transformers.js-examples
cd transformers.js-examples/llama-3.2-webgpu
codex

Então este prompt:

Modify this application such that it offers the user a file browse button for selecting their own local copy of the model file instead of loading it over the network. Provide a "download model" option too.

Codex agitou -se por vários minutos, mesmo executando comandos como curl -sL https://raw.githubusercontent.com/huggingface/transformers.js/main/src/models.js | sed -n '1,200p' Para inspecionar o código -fonte da biblioteca transformadores.js subjacentes.

Após quatro avisos, o total (mostrado aqui) construiu algo que funcionou!

Para experimentá -lo, você precisará de sua própria cópia local do modelo LLAMA 3.2 ONNX. Você pode obter isso (um download de ~ 1,2 GB)) como assim:

git lfs install
git clone https://huggingface.co/onnx-community/Llama-3.2-1B-Instruct-q4f16

Em seguida, visite minha página llama-3.2-webgpu no Chrome ou Firefox todas as noites (como o WebGPU é necessário), clique em “Pasta de navegação”, selecione essa pasta que você acabou de clonar, concorde com a confirmação de “fazer upload” (confuso, pois nada é carregado no modelo do seu navegador, o arquivo do modelo é aberto localmente) e clique em “carregar” carregar “carregar”.

Aqui está uma demonstração animada (gravada em tempo real, não acelerei isso):

Carregue llama-3.2 webgpu no seu navegador de uma pasta local

Eu empurrei um ramo com essas mudanças aqui. A próxima etapa seria modificar isso para apoiar outros modelos, além da demonstração do LLAMA 3.2, mas tenho o prazer de ter chegado a essa prova de conceito com tão pouco trabalho além de lançar alguns avisos no Codex para ver se poderia descobrir.

De acordo com o Codex /status Comando isso usou 169.818 tokens de entrada, 17.112 tokens de saída e 1.176.320 tokens de entrada em cache. No preço de token GPT-5 atual (entrada de US $ 1,25/milhão, entrada em cache de US $ 0,125/milhão, saída de US $ 10/milhão) que custaria 53,942 centavos, mas o Codex CLI liga no meu plano de chatgpt de US $ 20/mês existente para que isso tenha sido agrupado.

Source link

Disney+ bateu depois que Bob Iger provocou conteúdo gerado por IA; O criador de Owl House incentiva os fãs a piratearem
14 de Novembro, 2025

“As pessoas PRECISAM fazer barulho sobre isso.” Lindsey Weedston Postado em 14 de novembro de 2025 14h00 CST O CEO da Disney, Bob Iger, gerou uma onda de reação após sugerir que o Disney+ poderia em breve permitir que os assinantes gerassem seu próprio conteúdo gerado por IA. Vídeo em destaque Durante a teleconferência de…

Veja Mais Disney+ bateu depois que Bob Iger provocou conteúdo gerado por IA; O criador de Owl House incentiva os fãs a piratearem
EDC versátil com um orçamento enviado por Kinga na Polônia
26 de Agosto, 2025

Nota do editor: O Carry’s Carry parece ótimo e faz todo o sentido para seu trabalho em um ambiente de varejo. Aprecio especialmente a representação local da marca polonesa em algumas das ferramentas, e como nada aqui é super caro, mas ainda pode fazer o trabalho. De todo o equipamento aqui, o que eu mais…

Veja Mais EDC versátil com um orçamento enviado por Kinga na Polônia
Estratégias preguiçosas de link building que funcionam
13 de Novembro, 2025

Gosto de criar novas abordagens para link building. Uma maneira de debater uma abordagem é reverter um método comum. Criei algumas abordagens para link building, várias são passivas e outras duas são um pouco mais ativas, mas têm muito pouco a ver com divulgação por e-mail. Escrevi sobre essas dicas por volta de 2013, mas…

Veja Mais Estratégias preguiçosas de link building que funcionam
Hora de abater – inquietação
10 de Fevereiro, 2026

Quando postei esta imagem no Instagram, recebi um aviso imediato. Aparentemente, a frase “Hora de selecionar” é frequentemente associada a postagens, presumivelmente imagens, que são removidas do site por serem inadequadas. Este alerta foi, no mínimo, surpreendente para mim, e considerei brevemente se deveria prosseguir com a postagem. (Sim.) Mas, de qualquer forma, quero cortar…

Veja Mais Hora de abater – inquietação
Sistrix relata uma queda acentuada nas pesquisas da web chatgpt
24 de Setembro, 2025

A Sistrix relata que o ChatGPT está desencadeando pesquisas na Web ao vivo com muito menos frequência para pessoas que usam o aplicativo sem fazer login. Em verificação diária no local nas últimas duas semanas, a parcela de respostas que chamou a Web caiu acima de 15% para menos de 2,5%. A Sistrix não atribui…

Veja Mais Sistrix relata uma queda acentuada nas pesquisas da web chatgpt
Ouça: Woven Hollow – “Reprisões” –
29 de Setembro, 2025

“Reprisões” é uma nova faixa emocionante da dupla baseada no Colorado Tecido ococuja mistura de intimidade folclórica sonhadora e narrativa lírica reflete sobre os ciclos que repetimos e os confortos aos quais nos apegamos – particularmente em uma era digital em que o consumo de mídia pode servir como uma fuga. Construída na dupla de…

Veja Mais Ouça: Woven Hollow – “Reprisões” –

Postagens Similares

Deixe um comentário Cancelar resposta