Dimensionando a codificação autônoma de longa duração

Dimensionando a codificação autônoma de longa duração


Dimensionando a codificação autônoma de longa duração. Wilson Lin, da Cursor, tem feito alguns experimentos para ver até onde você pode levar uma grande frota de agentes de codificação “autônomos”:

Esta postagem descreve o que aprendemos executando centenas de agentes simultâneos em um único projeto, coordenando seu trabalho e observando-os escrever mais de um milhão de linhas de código e trilhões de tokens.

Eles acabaram executando planejadores e subplanejadores para criar tarefas e, em seguida, fazendo com que os trabalhadores executassem essas tarefas – semelhante à forma como Claude Code usa subagentes. Cada ciclo terminava com um agente juiz decidindo se o projeto foi concluído ou não.

Outro dia nas minhas previsões para 2026 eu disse que até 2029:

Acho que alguém terá construído um navegador completo usando principalmente assistência de IA, e isso nem será surpreendente. Lançar um novo navegador é um dos projetos de software mais complicados que posso imaginar(…) o código da trapaça são os conjuntos de conformidade. Se houver testes existentes, será muito mais fácil.

Posso estar atrasado há três anos, porque o Cursor escolheu “construir um navegador da web do zero” como caso de teste para sua abordagem de enxame de agentes:

Para testar este sistema, apontamos para um objetivo ambicioso: construir um navegador web do zero. Os agentes trabalharam por quase uma semana, escrevendo mais de 1 milhão de linhas de código em 1.000 arquivos. Você pode explorar o código-fonte no GitHub.

Mas quão bem eles se saíram? Seu anúncio inicial, alguns dias atrás, foi recebido com ceticismo nada surpreendente, especialmente quando ficou claro que o CI do GitHub Actions estava falhando e não havia instruções de construção no repositório.

Parece que eles resolveram isso nas últimas 24 horas. O README mais recente inclui instruções de construção que segui no macOS assim:

cd /tmp
git clone https://github.com/wilsonzlin/fastrender
cd fastrender
git submodule update --init vendor/ecma-rs
cargo run --release --features browser_ui --bin browser

Isso me deu uma janela de navegador funcional! Aqui estão as capturas de tela que tirei do google.com e do meu próprio site:

O cromo do navegador é elegante, mas tem um nome de guia ilegível na parte superior. A página inicial do Google parece correta, mas os botões não estão estilizados corretamente e a Pesquisa Google tem um enorme ícone de adição flutuando próximo a ela.

Meu blog parece correto, mas a aspa de fechamento direita em uma citação (que é implementada como imagem de fundo no parágrafo final) é exibida incorretamente várias vezes.

Honestamente, isso é muito impressionante! Você pode dizer que eles não estão apenas empacotando um mecanismo de renderização existente por causa dessas falhas de renderização muito óbvias, mas as páginas são legíveis e parecem corretas.

O repositório FastRender ainda usa submódulos Git para incluir várias especificações WhatWG e CSS-WG no repositório, o que é uma maneira inteligente de garantir que os agentes tenham acesso aos materiais de referência de que possam precisar.

Esta é a segunda tentativa que vi de construir um navegador completo usando codificação assistida por IA nas últimas duas semanas – a primeira foi o navegador HiWave, um novo mecanismo de navegador em Rust anunciado pela primeira vez neste tópico do Reddit.

Quando fiz minha previsão para 2029, essa era mais ou menos a qualidade do resultado que eu tinha em mente. Não creio que veremos projetos desta natureza competirem com o Chrome, Firefox ou WebKit tão cedo, mas tenho que admitir que estou muito surpreso em ver algo tão capaz emergir tão rapidamente.



Source link

Postagens Similares

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *