Por Stephen Nellis
SÃO FRANCISCO (Reuters) – A Nvidia (NVDA) divulgou novos dados nesta quarta-feira mostrando que seu mais recente servidor de inteligência artificial pode melhorar o desempenho de novos modelos – incluindo dois populares na China – em até 10 vezes.
Os dados surgem no momento em que o mundo da IA muda seu foco do treinamento de modelos de IA, onde a Nvidia domina o mercado, para aproveitá-los para uso por milhões de usuários, onde a Nvidia enfrenta mais concorrência de rivais como Advanced Micro Devices e Cerebras.
O especialista em dados da Nvidia é conhecido como uma mistura de modelos de IA. O truque é uma maneira de tornar os modelos de IA mais eficientes, agrupando as perguntas atribuídas aos “especialistas” dentro do modelo. Sua popularidade explodiu este ano depois que o Dipsic da China surpreendeu o mundo no início de 2025 com um modelo de código aberto de alto desempenho que treinava menos em chips Nvidia do que seus rivais.
Desde então, a abordagem de combinação de especialistas foi adotada pela OpenAI, fabricante do ChatGPT, pela francesa Mistral e pela chinesa Moonshoot AI, que lançou seu próprio modelo de código aberto altamente classificado em julho.
Enquanto isso, a Nvidia se concentrou em afirmar que tais modelos podem exigir menos treinamento em chips, mas suas ofertas ainda podem ser usadas para servir esses modelos aos usuários.
A Nvidia disse na quarta-feira que seu mais recente servidor de IA, que reúne 72 chips líderes em um único computador com links rápidos entre eles, melhorou o desempenho do modelo de pensamento KM2 da Moonshot em 10 vezes em relação às gerações anteriores de servidores Nvidia, um ganho de desempenho semelhante ao que a Nvidia viu com o modelo DIPS da Nvidia.
A Nvidia diz que os ganhos vêm principalmente do grande número de chips que ela pode colocar nos servidores e dos links mais rápidos entre eles, uma área onde a Nvidia ainda tem vantagem sobre seus rivais.
A Nvidia diz que a concorrente AMD (AMD) está trabalhando em servidores semelhantes repletos de chips mais potentes que chegarão ao mercado no próximo ano.
(Reportagem de Stephen Nellis em São Francisco, edição de Deepa Babington)



