A Anthropic está a exortar os principais laboratórios de inteligência artificial a considerarem um obstáculo coordenado e verificável ao progresso, alertando que os rápidos avanços na tecnologia poderão em breve permitir que os sistemas de IA se melhorem mais rapidamente do que conseguem gerir os riscos sociais.
O criador da Cloud disse que a capacidade da IA para completar tarefas por si só está a duplicar aproximadamente a cada quatro meses e que está a avançar em direcção ao “auto-aperfeiçoamento iterativo”, o ponto em que a tecnologia pode melhorar sem intervenção humana.
“Se os sistemas são totalmente capazes de construir os seus sucessores, as formas como os protegemos, monitorizamos e moldamos o seu comportamento são da maior importância”, disse a startup num longo post na quinta-feira, acrescentando que uma ruptura permitiria à sociedade “lidar com as suas implicações maiores”.
“Ainda não chegamos lá e, novamente, a melhoria espontânea não é inevitável. Mas pode acontecer mais cedo do que a maioria das organizações está preparada”, escreveram no post o cofundador da Anthropic, Jack Clark, e a líder do Anthropic Institute, Marina Favaro.
Há receios de que os sistemas avançados de IA possam ir além do controlo humano e causar danos sociais à medida que a tecnologia se torna cada vez mais capaz. O próprio modelo Mythos da Anthropic enviou ondas de choque por setores, incluindo bancos e software, no início deste ano, com sua capacidade de encontrar vulnerabilidades em códigos existentes.
Mas a regulamentação tem sido lenta, especialmente nos Estados Unidos, onde está sediada a maioria dos principais laboratórios de IA. A ordem executiva da administração Trump foi colocada nos laboratórios no início desta semana, exigindo que eles submetessem voluntariamente seus modelos mais capazes a testes oficiais de segurança cibernética antes de serem divulgados ao público.
Os pesquisadores da AIG já haviam pressionado por uma pausa, mas com pouco sucesso. Elon Musk, dono do laboratório de IA xAI, estava entre os apoiadores de um esforço de 2023 do Instituto sem fins lucrativos Future of Life para interromper o desenvolvimento de IA por seis meses para dar tempo para salvaguardas.
A Anthropic há muito se posiciona como um laboratório de IA focado em segurança. No início deste ano, recusou-se a permitir que os militares dos EUA utilizassem os seus modelos de vigilância doméstica e de armas totalmente autónomas, o que provocou uma reacção negativa do governo que o colocou numa lista negra de segurança nacional, prevista para entrar em vigor em 2026.
A Reuters informou na sexta-feira que a disputa estava mostrando sinais de abrandamento em partes do governo dos EUA.
Ainda assim, a Anthropic continuou a lançar modelos poderosos e, em fevereiro, recuou numa importante promessa de segurança, dizendo que não bloquearia mais IA potencialmente perigosa se os rivais chegassem perto de igualar as suas capacidades.
Foi recentemente avaliada em colossais 965 mil milhões de dólares e apresentada confidencialmente para uma oferta pública inicial nos EUA na segunda-feira, colocando-a à frente da rival OpenAI na corrida para garantir valor e financiamento significativo.
ação conjunta
A postagem de quinta-feira da Antrópico alertou que uma desaceleração unilateral ou mal coordenada poderia retornar se atores menos cautelosos continuassem a avançar, reduzindo potencialmente a segurança geral.
Ele disse que seria necessária uma pausa significativa entre “vários laboratórios com bons recursos” que trabalham na fronteira tecnológica, bem como regras sobre quais condições desencadeariam ou encerrariam tal pausa e quem a supervisionaria.
“Uma pausa unilateral de um laboratório, em contraste, pode ser alcançada imediatamente, mas consegue muito pouco: mudará quem está na frente, mas não criará o extenso processo de pensamento que falta atualmente”, disse a startup.
O seu braço de investigação, o Instituto Antrópico, planeia estudar sistemas para apoiar a automação e, nos próximos meses, reunirá decisores políticos, investigadores, grupos da sociedade civil e empresas rivais de IA para discutir a gestão de riscos como um auto-aperfeiçoamento iterativo.
OpenAI, xAI, Alphabet, Meta Platforms e a francesa Mistral não responderam imediatamente aos pedidos de comentários sobre se participariam da teleconferência.








