Já começa a ser um lugar-comum afirmar que a inteligência artificial está a revolucionar praticamente tudo, dia após dia. No seio de PORTLEX, estamos a realizar diversas experiências e testes para explorar que tarefas, tanto no domínio da lexicografia como no da investigação em geral, podem ser otimizadas ou mesmo transformadas através da utilização de modelos de inteligência artificial. Neste experimento específico, procurei combinar uma tarefa técnica muito habitual na lexicografia – a análise comparativa de entradas de dicionários – coas vastas possibilidades que os modelos de IA oferecem para a criação de conteúdo de divulgação. Portanto, o objetivo era duplo:
- Observar como diferentes modelos de IA abordariam a análise comparativa a partir dum prompt deliberadamente simples, sabendo bem que a complexidade do prompt influencia diretamente a pertinència e profundidade da análise.
- Fundamentalmente, explorar como apresentar a síntese dos resultados de forma visual, multimodal e acessível ao público não especialista, utilizando ferramentas de IA para automatizar ao máximo este processo de divulgação.
Partilho aqui os passos que seguim, na esperança de que possam inspirar outras pessoas.
O percurso detalhado
O processo envolveu várias etapas, desde a recolha de dados nos dicionários até à integração final dos elementos multimédia:
- Preparação do material a analisar: O primeiro passo consistiu em escolher e preparar as entradas específicas do verbo “tardar” de ambos os dicionários galegos:
- Dicionário Estraviz (www.estraviz.org/tardar)
- Dicionário da Real Academia Galega (academia.gal/dicionario/-/termo/tardar)
- Análise comparativa com inteligência artificial: Para obter uma análise detalhada e multifacetada, recorrim a diversos modelos de IA. Utilizei o seguinte prompt para solicitar a comparação das entradas:
Compara estas entradas de dous dicionários de galego para o verbo tardar: *Estraviz: https://www.estraviz.org/tardar*Dicionário da Real Academia Galega:https://academia.gal/dicionario/-/termo/tardarCompara as duas entradas:Que aceções são comuns ou equivalentes?Que aceções são diferentes?Que dicionário tem melhores definições? Explica porquê.Que dicionário apresenta melhores exemplos? Explica porquê.Que entrada che parece mais completa? Explica porquê. - Recolha de relatórios de IA: Compilei um total de oito relatórios gerados por diferentes modelos de IA, incluindo:
- Perplexity
- GPT-4o
- Claude Sonnet (presumivelmente Claude 3 Sonnet)
- Copilot
- Gemini 1.5 Pro (ou a versão mais recente disponível)
- Grok (presumivelmente Grok-1 ou posterior)
- Deepseek
- Qwen (presumivelmente Qwen1.5 ou similar)
- Síntese e elaboração no NotebookLM: Cos relatórios em mãos, utilizei o NotebookLM da Google para integrar todas as informações. Nesta plataforma, elaborei um resumo ou síntese comum, reunindo as principais conclusões e os pontos mais relevantes dos diferentes relatórios de IA. Esta etapa foi crucial para consolidar a análise.
- Criação de conteúdo áudio: Para tornar a apresentação mais dinâmica e acessível, criei ali mesmo um áudio automatizado em galego. Este áudio contou com dous locutores virtuais que apresentaram os resultados da análise de forma clara e com um toque de humor, visando um maior envolvimento do público. Para poder integrá-lo melhor no que pretendia fazer, descarreguei-no e hospedei-no na plataforma Vocaroo.
- Desenvolvimento da apresentação visual em HTML: Com base na síntese elaborada no NotebookLM, pedim ao modelo Claude para criar uma apresentação visual em formato HTML. O objetivo era ter uma estrutura web interativa para apresentar os dados.
- Resolução de desafios técnicos com ajuda da IA: Encontrei algumas dificuldades ao tentar incorporar o áudio na apresentação HTML. Para solucionar este problema, pedi ajuda ao modelo Gemini, que forneceu o código e as instruções necessárias para integrar com sucesso o áudio.
- Resultado final: uma apresentação multimodal funcional: O culminar destes passos foi uma apresentação multimodal funcional que pode ser consultada aqui. Esta apresentação combina conteúdo visual (a estrutura HTML cos principais dados da análise) e auditivo (o podcast explicativo), oferecendo uma exploração completa e envolvente da análise comparativa das duas entradas de dicionários.
O que se pode concluir disto todo?
Este experimento não só demonstrou o potencial da combinação de diversas ferramentas de IA e plataformas digitais, não apenas para lançar análises lexicográficas, mas também para divulgar de maneira automatizada os resultados obtidos de maneira acessível. A integração estratégica de modelos de IA e ferramentas multimédia, nomeadamente o áudio com recurso a vozes sintéticas, revela-se crucial para enriquecer a experiência do utilizador, tornando a informação técnica consideravelmente mais apelativa e fácil de assimilar. Importa sublinhar que este tipo de abordagem exige não tanto competências técnicas avançadas, mas sim a capacidade de combinar inteligentemente os recursos existentes. Como alguém disse (não lembro quem!), e com razão, a inteligência artificial é inteligente, se nós formos inteligentes ao utilizá-la.