A Anthropic lançou oficialmente o Claude Opus 4.8 – um desafiante direto do GPT-5.5 da OpenAI e do Gemini 3.1 Pro do Google. O lançamento vem com foco principal na codificação do agente, automação massiva e melhor raciocínio. A empresa também afirma que o novo modelo é notavelmente “mais honesto e menos propenso a fazer reivindicações sem fundamento durante fluxos de trabalho complexos”.
De acordo com a Atropic, o Opus 4.8 está imediatamente disponível globalmente e mantém a mesma estrutura de preços do Opus 4.7, apesar das extensas melhorias de capacidade.
Cloud Ops 4.8 vs GPT 5.5 vs Gemini 3.1 Pro
A Anthropic publicou um gráfico de comparação direta em seu comunicado à imprensa. Embora Claude Opus 4.8 fosse a categoria de qualidade mais alta em geral, o GPT-5.5 na verdade a melhorou em uma área crítica: codificação de terminal de agente.
A imagem de referência mostra:
Claude Opus 4.8 obteve 69,2% para codificação de agente no SWE-Bench Pro, à frente de 58,6% do GPT-5.5 e 54,2% do Gemini 3.1 Pro.
GPT-5.5 liderou a codificação de terminal de agente Terminal-Bench 2.1 com 78,2%, superando 74,6% do Opus 4.8.
O Opus 4.8 apresentou as maiores pontuações de raciocínio multidisciplinar com e sem o instrumento.
No uso de computadores por agentes certificados pela OSWorld, o Opus 4.8 liderou por pouco, com 83,4%.
Para tarefas de função cognitiva medidas pelo GDPval-AA, o Opus 4.8 obteve pontuação de 1.890 em comparação com 1.769 do GPT-5.5 e 1.314 do Gemini.
O Opus 4.8 também superou os benchmarks de Análise Financeira de Agentes com 53,9%.
A imagem também destaca quantos modelos top existem agora, especialmente entre o Claude Opus 4.8 e o GPT-5.5.
Anthropic enfatiza ‘melhoria da honestidade’
Um dos maiores pontos de discussão da Anthropic envolve o lançamento. A empresa disse que os testadores iniciais consideraram o Opus 4.8 “mais confiável e mais rápido em seu julgamento” durante as tarefas dos agentes. Antrópico se concentra especificamente na redução do estresse.
A empresa disse que o Opus 4.8 tem “cerca de quatro vezes menos probabilidade” do que o Opus 4.7 de permitir a passagem de código malicioso sem causar problemas. A Antrópico também disse que o modelo agora “alcança novos patamares em medidas de nossos atributos sociais, como apoiar a autonomia do consumidor e agir no melhor interesse do consumidor”.
A empresa acrescentou que as contribuições para comportamentos abusivos, como trapaça ou uso indevido, são “extremamente baixas” no Opus 4.7.
O novo esforço muda o controle sobre como os usuários interagem com a nuvem
Uma grande adição ao lançamento são as configurações de ‘esforço’ personalizáveis. Os usuários do Claude.ai agora podem estimar quanto poder computacional um modelo gasta em uma tarefa. Configurações de baixo esforço produzem respostas mais rápidas enquanto usam menos tokens. Configurações mais altas forçam o modelo a raciocinar mais profundamente antes de responder.
Anthropic disse: “Os usuários agora têm esta opção, o controle de esforço está disponível em todos os planos”.
A empresa observa que o Opus 4.8 tem como padrão ‘alto esforço’, que considera ser o melhor equilíbrio entre velocidade e qualidade de saída. Para fluxos de trabalho difíceis, os usuários podem escolher os modos de esforço ‘Extra’ ou ‘Máximo’ que alocam mais tokens para argumentos mais profundos.
Fluxos de trabalho dinâmicos impulsionam os agentes de IA
A Anthropic introduziu simultaneamente um recurso de visualização de pesquisa chamado ‘Fluxos de trabalho dinâmicos’ no CloudCode. O recurso permite que o sistema coordene centenas de subagentes paralelos de IA em uma única sessão de codificação.
A Anthropic descreve esse recurso dizendo: “A nuvem pode agendar trabalho e então executar centenas de subagentes paralelos em uma única sessão”.
De acordo com a empresa, o recurso é capaz de lidar com “migrações em escala de base de código em centenas de milhares de linhas de código, desde o início até a integração”.
Preço de Claude Opus 4.8
Apesar do aumento de desempenho, a Antrópica não conseguiu aumentar o valor do padrão.
O valor certificado da empresa permanece:
US$ 5 por milhão de tokens de entrada
US$ 25 por milhão de tokens emitidos
O custo do modo rápido é o seguinte:
US$ 10 por milhão de tokens de entrada
US$ 50 por milhão de tokens emitidos
A Anthropic também afirmou que o modo Rápido para Opus 4.8 agora é “três vezes mais barato” operacionalmente do que a versão anterior, ao mesmo tempo que fornece respostas com velocidade de 2,5×.





