Claude Opus 4.1 melhora os recursos de codificação e agente

5 de Agosto, 2025

A Anthropic lançou o Claude Opus 4.1, uma atualização para seu modelo principal, que é dito para oferecer um melhor desempenho em codificação, raciocínio e manuseio de tarefas autônomas.

O novo modelo já está disponível para usuários do Claude Pro, assinantes de código Claude e desenvolvedores usando a API, Amazon Bedrock ou o Vertex AI do Google Cloud.

Ganhos de desempenho

Claude Opus 4.1 pontuações 74,5% no SWE-banch Verificado, uma referência para problemas de codificação do mundo real, e está posicionado como um substituto para o Opus 4.

O modelo mostra melhorias notáveis na refatoração e depuração do código de vários arquivos, principalmente em grandes bases de código. De acordo com o feedback do GitHub e da empresa citado pelo Anthropic, ele supera o Opus 4 na maioria das tarefas de codificação.

A equipe de engenharia de Rakuten relata que Claude 4.1 identifica com precisão as correções de código sem introduzir alterações desnecessárias. Windsurf, uma plataforma de desenvolvedor, mediu um ganho de desempenho de desvio padrão em comparação com o Opus 4, comparável ao salto do Soneto Claude 3.7 para o Sonnet 4.

Casos de uso expandido

O Antrópico descreve o Claude 4.1 como um modelo de raciocínio híbrido projetado para lidar com saídas instantâneas e pensamento estendido. Os desenvolvedores podem ajustar os “orçamentos de pensamento” por meio da API para equilibrar o custo e o desempenho.

Os principais casos de uso incluem:

Agentes da IA: Resultados fortes nas tarefas de bancada Tau e de longo horizonte tornam o modelo adequado para fluxos de trabalho autônomos e automação corporativa.
Codificação avançada: Com suporte para 32.000 tokens de saída, o Claude 4.1 lida com a refatoração complexa e a geração de várias etapas enquanto se adapta ao estilo e ao contexto de codificação.
Análise de dados: O modelo pode sintetizar idéias de grandes volumes de dados estruturados e não estruturados, como registros de patentes e trabalhos de pesquisa.
Geração de conteúdo: Claude 4.1 gera uma escrita mais natural e prosa mais rica do que as versões anteriores, com melhor estrutura e tom.

Melhorias de segurança

O Claude 4.1 continua a operar sob o padrão de segurança de segurança da AI da AI. Embora a atualização seja considerada incremental, a empresa executou voluntariamente avaliações de segurança para garantir que o desempenho permaneça dentro dos limites de risco aceitáveis.

Inovação: O modelo recusou solicitações de violação de políticas 98,76% das vezes, acima dos 97,27% com a Opus 4.
Excesso de reflexão: Em solicitações benignas, a taxa de recusa permanece baixa em 0,08%.
Viés e segurança infantil: As avaliações não encontraram regressão significativa no viés político, comportamento discriminatório ou respostas de segurança infantil.

Anthrópica também testou a resistência do modelo para prometer injeção e uso indevido do agente. Os resultados mostraram comportamento comparável ou melhorado sobre o Opus 4, com treinamento e salvaguardas adicionais para mitigar os casos de borda.

Olhando para o futuro

Anthrópica diz que atualizações maiores estão no horizonte, com o Claude 4.1 posicionado como uma liberação focada na estabilidade antes dos saltos futuros.

Para as equipes que já estão usando o Claude Opus 4, o caminho de atualização é perfeito, sem alterações na estrutura ou preço da API.

Imagem em destaque: Ahyan Stock Studios/Shutterstock

Source link

Lemon retorna com a nova música vibrante, “Let It Out!”
13 de Novembro, 2025

Lemon, de Amsterdã, retornou sensacionalmente com seu novo e vibrante single, “Let It Out!”. Se você me perguntasse qual é a melhor música deles até hoje (até hoje), eu teria que dizer isso, pois realmente me trouxe de volta aos dias de Madchester. … um hino eufórico e cheio de groove que canaliza a arrogância…

Veja Mais Lemon retorna com a nova música vibrante, “Let It Out!”
FDNY HONRAS FIREFIGHTER CAUS
10 de Setembro, 2025

O FDNY apareceu para suas décadas depois. Susan LaMarca Postado em 10 de setembro 2025 18:30 CDT Quando Kristin Marino saiu do Plaza Hotel em seu dia de casamento, ela recebeu uma visão que a impediu de trilhos: uma linha de bombeiros do Departamento de Bombeiros de Nova York (FDNY) em uniforme completo, esperando para…

Veja Mais FDNY HONRAS FIREFIGHTER CAUS
15 frascos de perfume vintage que podem ser extremamente valiosos
20 de Novembro, 2025

Os colecionadores costumam achar os frascos de perfume vintage fascinantes por causa do cuidado dispensado a seus formatos e detalhes. Essas garrafas geralmente ganham valor quando apresentam acabamento manual, cores de vidro raras ou designs de edição especial. A presença da embalagem original pode agregar ainda mais interesse aos compradores. Ao olhar mais de perto,…

Veja Mais 15 frascos de perfume vintage que podem ser extremamente valiosos
Ontem – uma música de backup do administrador de banco de dados
24 de Fevereiro, 2026

Organizar meu arquivo físico esta semana trouxe um sorriso ao meu rosto quando encontrei uma cópia impressa de algo que salvei anos atrás, mas que ainda é apropriado hoje. Não tenho certeza de quando o salvei, mas acho que pode ter sido quando eu era voluntário na Habitat for Humanity Detroit, no final dos anos…

Veja Mais Ontem – uma música de backup do administrador de banco de dados
Como alavancar seu gráfico de conhecimento de conteúdo para apoiar sua estratégia de marketing
17 de Julho, 2025

Os gráficos de conhecimento existem há muito tempo e se mostraram valiosos em sites de mídia social, instituições de patrimônio cultural e outras empresas. Um gráfico de conhecimento é uma coleção de relacionamentos entre entidades definidas usando um vocabulário padronizado. Ele estrutura os dados de uma maneira significativa, permitindo maiores eficiências e precisões na recuperação…

Veja Mais Como alavancar seu gráfico de conhecimento de conteúdo para apoiar sua estratégia de marketing
A Chipotle basicamente admite que continuará aumentando os preços porque os clientes não vão embora
10 de Fevereiro, 2026

A liderança da Chipotle está duplicando os aumentos de preços do cardápio, dizendo aos investidores que não estão preocupados em perder clientes importantes, apesar da inflação mais ampla e da desaceleração do tráfego. Durante uma recente teleconferência de resultados trimestrais, os executivos da empresa enquadraram a medida como uma aposta calculada sobre quem ainda passaria…

Veja Mais A Chipotle basicamente admite que continuará aumentando os preços porque os clientes não vão embora