O momento SLM da Índia: Por que o apoio orçamental é crucial para modelos de IA desenvolvidos internamente

Expectativas orçamentais: Após a sua ascensão global há alguns anos, a IA generativa permeou rapidamente todos os cantos da vida digital, alimentada por enormes modelos de aprendizagem profunda treinados em grandes quantidades de dados. As principais categorias neste grupo são modelos de linguagem grande (LLMs) e modelos de linguagem pequena (SLMs). LLMs são sistemas de IA massivos e de uso geral treinados em grandes conjuntos de dados com bilhões de parâmetros, o que os torna vastos em capacidade, mas extremamente intensivos em recursos para construir, operar e manter. Em contraste, os SLMs são modelos compactos e focados em tarefas que trocam amplitude de funcionalidade por eficiência em tarefas específicas, exigem muito menos dados, poder de computação e custos, e podem ser executados localmente ou até mesmo em dispositivos de ponta. Embora os LLMs atuem como motores básicos poderosos, os SLMs permitem a implantação de IA acessível e específica de domínio.

À medida que a Índia procura estabelecer-se como uma potência global de IA, o desenvolvimento de modelos indígenas precisa de ser um pilar central da sua estratégia mais ampla para o ecossistema de IA. À medida que ocorre a expansão da infra-estrutura de computação de alto desempenho, é essencial um esforço semelhante para construir modelos nacionais para desbloquear totalmente os benefícios nacionais em inovação, segurança e crescimento económico.

Um passo fundamental nesta estratégia gira em torno da definição do tamanho e da complexidade certos dos modelos indígenas, que devem corresponder aos casos de utilização previstos, ao nível de capacidade necessário para as aplicações visadas e à disponibilidade de financiamento e recursos técnicos a longo prazo. Embora os LLM de triliões de parâmetros sejam viáveis ​​para intervenientes bem financiados, sejam gigantes tecnológicos globais ou grandes empresas na Índia, a verdadeira escolha para o resto gira em torno da escolha de modelos que abordem os problemas da Índia de uma forma mais sustentável.

Num ambiente com recursos limitados e com novas infra-estruturas computacionais nacionais, a dependência de LLMs de triliões de parâmetros não é prática nem necessária. A Índia precisa de uma abordagem de “cavalos para cursos” – isto é, construir SLMs feitos à medida ao nível das bases, desde aconselhamento agrícola a serviços multilingues aos cidadãos, apoiando necessidades de cuidados de saúde primários que sejam rentáveis ​​e cheguem aos utilizadores na sua língua materna e no modo da sua escolha. Portanto, os SLMs não são um compromisso no contexto indiano, são o ajuste estratégico certo. O ponto de partida mais prático da Índia é desenvolver SLMs otimizados para idiomas locais, tarefas específicas de domínio e implantação econômica – tornando esses modelos cada vez maiores e mais elaborados ao longo do tempo.

Num país diversificado como a Índia, onde uma grande população rural e semiurbana utiliza cada vez mais smartphones e a Internet, o valor real dos SLMs reside em ferramentas práticas e conscientes do contexto para casos de utilização específicos. Estes incluem cidadãos que desejam compreender e candidatar-se a esquemas de bem-estar ou subsídios governamentais, pequenos empresários ou artesãos que necessitam de formação para o desenvolvimento de competências nas línguas locais ou de aconselhamento jurídico ou financeiro básico, recolhendo reclamações, classificando-as e atribuindo-as às partes interessadas certas.


Como a Índia abriga mais de 19.500 línguas e dialetos e muitas comunidades falam línguas menos conhecidas, um LLM que sirva para todos pode não atender a muitas comunidades e necessidades. Dado o rápido crescimento contínuo da conectividade na Índia, com 85,5% dos agregados familiares indianos a terem um smartphone e 86,3% dos agregados familiares com acesso à Internet, de acordo com o governo, estão reunidas as condições para a implantação e utilização em larga escala de SLMs para aumentar a produtividade, aumentar a eficiência e reduzir custos.

A Índia já tomou medidas nesse sentido através da Missão India AI, no âmbito da qual o governo está a dedicar recursos ao desenvolvimento de LLM e SLM. Algumas das iniciativas recentes da Bharatgen visam apoiar as línguas indianas, melhorar o serviço público e desenvolver aplicações centradas no cidadão. Já estamos vendo sucesso inicial com SLMs como Sarv1, um modelo de parâmetros 2BN que suporta 10 principais idiomas indianos. Uma advertência a ser observada, no entanto, é que, embora os SLMs exijam muito menos recursos do que os LLMs, construí-los ainda requer acesso à computação GPU, conjuntos de dados de domínio e idioma local de alta qualidade, cientistas qualificados, domínios de supervisão, engenheiros especializados, engenheiros e ferramentas de aprendizagem de dados. Testes rigorosos para otimização, segurança, privacidade e conformidade. Isso requer investimento de capital que vai desde a curadoria de dados até a computação e o acesso à implantação capaz.

Servir a diversidade linguística, cultural e regional da Índia requer milhares de SLMs especializados para servir diferentes regiões, línguas e indústrias, pelo que o apoio orçamental e a infra-estrutura partilhada tornam-se essenciais em vez de incentivos opcionais. O orçamento de 2026 deve, portanto, dar prioridade ao financiamento e aos incentivos específicos para a construção de SLM indígenas. Isso ajudará:

IndiaAI aprimora missão: O apoio orçamental em 2026 acelerará os esforços para expandir a infra-estrutura informática, a recolha de dados, as subvenções para formação de modelos, as colaborações público-privadas e o reforço de capacidades.

Democratizando o Acesso:
O apoio orçamental ajudará a incentivar os fornecedores de serviços em nuvem a acolher modelos nacionais. Reduzirá a barreira à entrada de um grupo mais vasto de inovadores, aumentando a integração, o empreendedorismo e a inovação para além dos grandes intervenientes.

Idioma local suportado: O financiamento destinado à construção de recursos linguísticos e conjuntos de dados específicos de domínios ajudará a desenvolver aplicações de IA em línguas regionais e para áreas específicas de setores, como agricultura, saúde, comércio local e governação rural. Reforçará a inclusão digital, criará conteúdo local e permitirá a prestação de serviços públicos nas línguas locais.

Ao dar prioridade a modelos indígenas e sensíveis ao contexto, a Índia pode construir um ecossistema de IA que reflita as suas próprias realidades linguísticas, económicas e sociais. O orçamento para 2026 servirá de catalisador para transformar esta visão numa vantagem escalonável da IA ​​para a Índia.

Sócio da Deloitte Índia S. Anjani Kumar, Pawan Reddy, Diretor Associado, Deloitte Índia

Link da fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui