Início Mundo Claude Opus 4.8 vs GPT 5.5 vs Gemini 3.1 Pro – Análise...

Mundo

Claude Opus 4.8 vs GPT 5.5 vs Gemini 3.1 Pro – Análise completa da versão mais recente da IA

Por

28 Maio 2026

A Anthropic lançou oficialmente o Claude Opus 4.8 – um desafiante direto do GPT-5.5 da OpenAI e do Gemini 3.1 Pro do Google. O lançamento vem com foco principal na codificação do agente, automação massiva e melhor raciocínio. A empresa também afirma que o novo modelo é notavelmente “mais honesto e menos propenso a fazer reivindicações sem fundamento durante fluxos de trabalho complexos”.

Anthropic lançou Claude Opus 4.8 na quinta-feira (Unsplash)

De acordo com a Atropic, o Opus 4.8 está imediatamente disponível globalmente e mantém a mesma estrutura de preços do Opus 4.7, apesar das extensas melhorias de capacidade.

Cloud Ops 4.8 vs GPT 5.5 vs Gemini 3.1 Pro

A Anthropic publicou um gráfico de comparação direta em seu comunicado à imprensa. Embora Claude Opus 4.8 fosse a categoria de qualidade mais alta em geral, o GPT-5.5 na verdade a melhorou em uma área crítica: codificação de terminal de agente.

A imagem de referência mostra:

Claude Opus 4.8 obteve 69,2% para codificação de agente no SWE-Bench Pro, à frente de 58,6% do GPT-5.5 e 54,2% do Gemini 3.1 Pro.

GPT-5.5 liderou a codificação de terminal de agente Terminal-Bench 2.1 com 78,2%, superando 74,6% do Opus 4.8.

O Opus 4.8 apresentou as maiores pontuações de raciocínio multidisciplinar com e sem o instrumento.

No uso de computadores por agentes certificados pela OSWorld, o Opus 4.8 liderou por pouco, com 83,4%.

Para tarefas de função cognitiva medidas pelo GDPval-AA, o Opus 4.8 obteve pontuação de 1.890 em comparação com 1.769 do GPT-5.5 e 1.314 do Gemini.

O Opus 4.8 também superou os benchmarks de Análise Financeira de Agentes com 53,9%.

A imagem também destaca quantos modelos top existem agora, especialmente entre o Claude Opus 4.8 e o GPT-5.5.

Anthropic enfatiza ‘melhoria da honestidade’

Um dos maiores pontos de discussão da Anthropic envolve o lançamento. A empresa disse que os testadores iniciais consideraram o Opus 4.8 “mais confiável e mais rápido em seu julgamento” durante as tarefas dos agentes. Antrópico se concentra especificamente na redução do estresse.

A empresa disse que o Opus 4.8 tem “cerca de quatro vezes menos probabilidade” do que o Opus 4.7 de permitir a passagem de código malicioso sem causar problemas. A Antrópico também disse que o modelo agora “alcança novos patamares em medidas de nossos atributos sociais, como apoiar a autonomia do consumidor e agir no melhor interesse do consumidor”.

A empresa acrescentou que as contribuições para comportamentos abusivos, como trapaça ou uso indevido, são “extremamente baixas” no Opus 4.7.

O novo esforço muda o controle sobre como os usuários interagem com a nuvem

Uma grande adição ao lançamento são as configurações de ‘esforço’ personalizáveis. Os usuários do Claude.ai agora podem estimar quanto poder computacional um modelo gasta em uma tarefa. Configurações de baixo esforço produzem respostas mais rápidas enquanto usam menos tokens. Configurações mais altas forçam o modelo a raciocinar mais profundamente antes de responder.

Anthropic disse: “Os usuários agora têm esta opção, o controle de esforço está disponível em todos os planos”.

A empresa observa que o Opus 4.8 tem como padrão ‘alto esforço’, que considera ser o melhor equilíbrio entre velocidade e qualidade de saída. Para fluxos de trabalho difíceis, os usuários podem escolher os modos de esforço ‘Extra’ ou ‘Máximo’ que alocam mais tokens para argumentos mais profundos.

Fluxos de trabalho dinâmicos impulsionam os agentes de IA

A Anthropic introduziu simultaneamente um recurso de visualização de pesquisa chamado ‘Fluxos de trabalho dinâmicos’ no CloudCode. O recurso permite que o sistema coordene centenas de subagentes paralelos de IA em uma única sessão de codificação.

A Anthropic descreve esse recurso dizendo: “A nuvem pode agendar trabalho e então executar centenas de subagentes paralelos em uma única sessão”.

De acordo com a empresa, o recurso é capaz de lidar com “migrações em escala de base de código em centenas de milhares de linhas de código, desde o início até a integração”.

Preço de Claude Opus 4.8

Apesar do aumento de desempenho, a Antrópica não conseguiu aumentar o valor do padrão.

O valor certificado da empresa permanece:

US$ 5 por milhão de tokens de entrada

US$ 25 por milhão de tokens emitidos

O custo do modo rápido é o seguinte:

US$ 10 por milhão de tokens de entrada

US$ 50 por milhão de tokens emitidos

A Anthropic também afirmou que o modo Rápido para Opus 4.8 agora é “três vezes mais barato” operacionalmente do que a versão anterior, ao mesmo tempo que fornece respostas com velocidade de 2,5×.

Link da fonte

Claude Opus 4.8 vs GPT 5.5 vs Gemini 3.1 Pro – Análise completa da versão mais recente da IA

Cloud Ops 4.8 vs GPT 5.5 vs Gemini 3.1 Pro

A imagem de referência mostra:

Anthropic enfatiza ‘melhoria da honestidade’

O novo esforço muda o controle sobre como os usuários interagem com a nuvem

Fluxos de trabalho dinâmicos impulsionam os agentes de IA

Preço de Claude Opus 4.8

DEIXE UMA RESPOSTA Cancelar resposta

Últimas notícias

Le vendredi 29 mai est déclaré jour chômé : quels travailleurs...

8ª temporada de ‘Love Island USA’ revela 12 membros do elenco...

O governo boliviano se recusou a negociar a renúncia do presidente...

La machine à buts du Dinamo Zagreb rejoint Persib, les pourparlers...

Os analistas de Wall Street gostam das ações financeiras da Ameriprise?

Parece que Serena Williams estava voltando ao tênis

Les Tigres placent le releveur Kenley Jansen en IL de 15...

Crescem as demandas pelo fechamento de centros de detenção nos EUA...

Categoria