A Anthropic lançou Claude Opus 4.6, chamando-o de “mod mais poderoso” da empresa até agora. Em um comunicado de imprensa na quinta-feira, a empresa de IA liderada por Dario Amodei acrescentou que a nova atualização do modelo “planeja cuidadosamente, mantém as tarefas da agência por um longo período de tempo, pode trabalhar de forma mais confiável em bases de código maiores e tem melhores habilidades de revisão e depuração de código para encontrar seus próprios erros”.
Aqui estão 5 pontos-chave sobre Claude Opus 4.6
1. Janela de contexto de token gigante de 1 milhão (beta)
O Opus 4.6 introduz uma janela de contexto de 1 milhão de tokens, uma novidade para modelos de classe Opus. Isso permite que a IA processe e raciocine documentos, bases de código ou conjuntos de dados extremamente longos sem perder informações anteriores.
2. As capacidades de codificação e agente foram significativamente melhoradas
Um modelo cuidadosamente planejado pode sustentar tarefas mais longas da agência, funcionar de forma confiável em bancos de dados maiores e demonstrar habilidades mais fortes de revisão de código e depuração, de acordo com a Anthropic. Comete erros com mais eficiência do que seu antecessor (Claude Opus 4.5).
3. Vários indicadores
Opus 4.6 lidera a indústria em diversas métricas:
Pontuação mais alta no Terminal-Bench 2.0 (codificação de agente)
Impulsiona o último teste da humanidade (raciocínio multidisciplinar complexo)
Ele supera o GPT-5.2 da OpenAI em ~ 144 pontos em Elo e Claude Opus 4,5 em 190 pontos em GDPval-AA (trabalhando com conhecimento economicamente valioso em finanças, direito e outras áreas)
A melhor coisa sobre o BrowseComp (é difícil encontrar informações na web)
4. As oportunidades de trabalho diário foram ampliadas
Além da codificação, o Opus 4.6 foi desenvolvido para tarefas comuns no local de trabalho:
Faça uma análise financeira detalhada
Realize pesquisas aprofundadas
Crie e edite documentos, planilhas e apresentações
A multitarefa é executada de forma independente no Claude Cowork, que pode lidar com várias solicitações complexas ao mesmo tempo
5. Forte perfil de segurança
De acordo com o scorecard do sistema da Antrópico, o Opus 4.6 apresenta um perfil geral de segurança tão bom ou melhor do que qualquer modelo de fronteira, mostrando uma baixa taxa de mau comportamento nas avaliações de segurança.
Scott White, chefe de produto da Anthropic para modelos Claude AI, disse que a empresa planeja se concentrar na melhoria das capacidades. “Essas são as áreas em que vamos nos esforçar muito”, disse ele, listando segurança cibernética, ciências biológicas, saúde e serviços financeiros.





