Quando a Adobe lançou o Portable Document Format (PDF) em 1993, um consultor do Gartner o chamou de “a ideia mais inteligente que já ouvi na vida”. Os usuários precisam mexer os dedos e esperar que arquivos de tamanho megabyte sejam baixados pela Internet de seus telefones e, em seguida, esperar que seus computadores os sirvam. A diretoria do fabricante do software queria encerrar o projeto. Mas o PDF venceu, especialmente depois que o Internal Revenue Service, a autoridade fiscal dos Estados Unidos, começou a usá-lo para formulários fiscais digitais. Existem mais de 2,5 trilhões de PDFs circulando hoje. Mas será que o formato sobreviverá à revolução da IA?
Imagem representativa.
Os PDFs ainda apresentam falhas. É doloroso vê-los em um smartphone. É difícil copiar dados deles. Ferramentas de software que leem telas para pessoas cegas têm dificuldade com PDFs. O tipo de arquivo, sobre o qual a Adobe perdeu o controle em 2008, também é uma ferramenta para malware: de acordo com a Check Point, uma empresa de segurança cibernética, um em cada cinco ataques cibernéticos por e-mail usa anexos em PDF.
Recentemente, surgiu outra fonte de críticas. Grandes modelos de linguagem (LLMs) gerados artificialmente são frequentemente confundidos por PDFs e confundem a leitura de uma página em múltiplas colunas da esquerda para a direita em vez de de cima para baixo, por exemplo, ou cabeçalhos e rodapés. A dificuldade de analisar PDFs é uma das razões pelas quais os chatbots de IA às vezes “alucinam” bobagens.
Digite os spoilers. Startups como a Factify têm a missão de criar um novo tipo de arquivo que melhor se adapte à tecnologia. Matan Gavish, seu líder, fala sobre sua visão “megalomaníaca” de substituir o PDF.
No entanto, Duff Johnson, chefe da PDF Association, guardiã do formato, diz que a culpa não é do tipo de arquivo, mas de nós. Ele afirma que não há razão para que os desenvolvedores não possam criar bots capazes de usar PDFs. O assistente de IA integrado ao Acrobat, leitor de PDF da Adobe, foi projetado para fazer exatamente isso, observa Leonard Rosenthal, o guru de PDF do software. O Google, líder em IA, também desenvolveu uma ferramenta para desenvolvedores que utilizam seus modelos Gemini que facilita a importação de PDFs. O domínio do formato ainda pode continuar.