As ferramentas de inteligência artificial vinhérom para ficar e, mais cedo ou mais tarde, irão fazer parte da vida quotidiana de todas nós. Passaremos a ouvir e a falar com robôs coa mesma frequência e normalidade com que o fazemos com familiares, amigos ou colegas de trabalho. Pola primeira vez na história, as pessoas vamos falar com entidades não humanas nas nossas próprias línguas. Sem dúvida, isto terá consequências profundas para todas as comunidades linguísticas, e a galegofalante não será uma exceção. Porém, a nossa pequena grande comunidade tem as suas particularidades e, portanto, não podo deixar de me pergutar como afetará esta revolução linguística à aprendizagem e ao uso do galego.
Estamos como estamos… e o que tal aí vem!
Recapitulemos. Em 2025 uma parte significativa da população galega já não aprendeu galego na família ou no seu círculo social mais próximo. Os últimos dados sobre as competências em galego da mocidade mostram que as escolas tampouco estão a paliar esta tendência. Polo contrário, uma porção significativa do corpo docente apresenta competências deficientes em galego, tanto patrimonial (ditos, provérbios, colocações, expressões fixas…) como formal. Além disso, a diminuição de falantes de galego nos espaços urbanos torna cada vez mais difícil ouvir galego de forma casual nas ruas, nos comércios ou nos espaços de lazer. Quem quiger aprender galego na cidade com outras pessoas, vai ter de o procurar cada vez mais em determinados círculos sociais… ou na internet. E é aqui que poderiam entrar em ação as ferramentas de inteligência artificial.
É muito provável que, num futuro mais próximo do que pensamos, as novas gerações de neofalantes acedam ao galego através destas ferramentas, especialmente chatbots de conversação, em etapas cruciais do seu processo de aprendizagem. Não parece uma ideia disparatada. A integração de chatbots e outros componentes de IA em aplicações para aprender línguas está a tornar-se cada vez mais comum. Praticar francês, alemão ou catalão com robôs é possível na maioria dos telemóveis, de forma gratuita e através de aplicações tão populares e quotidianas como o WhatsApp. A utilização de IA para traduzir ou corrigir textos já é uma prática generalizada. Tanto que vários estudos (1, 2) revelam que, no caso do inglês, as palavras e expressões utilizadas por estes modelos de IA já estão a influenciar significativamente a língua dos falantes não nativos.
Portanto, bem pode ser que o galego falado e escrito por estes modelos de IA não só poda tornar-se o principal input em que se baseará a aprendizagem do galego para muitos aprendentes no futuro, mas também o principal modelo linguístico formal para muitos novos falantes nativos. Por este motivo, é fundamental preocuparmo-nos coa qualidade desse input artificial, coa forma como estes modelos aprendem o galego e coas possíveis deficiências, interferências e vieses que já apresentam quando o falam e escrevem.
O risco dos algoritmos adaptativos para o galego
A inteligência artificial fundamenta-se numa enorme base textual inicial que lhe confere uma competência básica em diferentes línguas. No caso específico do galego, esta base é constituída por textos produzidos ao longo dos anos pola sua comunidade de falantes e “escreventes”, uma comunidade que se caracteriza por uma crescente presença de neofalantes e pola intensa e constante pressão do castelhano. Esta base de dados engloba textos de qualidades, registos e estilos diversos. Tal diversidade proporciona à IA uma rica exposição à língua, mas simultaneamente introduz interferências e erros comuns. É importante notar que os modelos linguísticos aprendem essencialmente através de padrões estatísticos, sem discriminar entre o que é “normativo” e o que não é. Consequentemente, a língua que estas ferramentas produzem reflete, em grande medida, o galego mais frequentemente utilizado.
Mas a situação de minorização do galego em relação ao castelhano tem um impacto profundo na sua utilização social. Esta realidade manifesta-se através da interferência constante do castelhano na variante oral e escrita da língua galega, praticamente em todos os falantes. Como resultado, quando surgem com frequência desvios da norma, como o uso de “a partires de” ou a confusão entre os pronomes “che” e “te”, estes são processados polos modelos, que os incorporam e reproduzem naturalmente. Paralelamente, se os textos que alimentam a IA carecerem de expressões patrimoniais como “madia leva” ou “lástima fora”, os chatbots desenvolverão uma tendência natural para as evitar. Além disso, dado que estas ferramentas operam com algoritmos adaptativos, tendem a perpetuar estas ocorrências quando os utilizadores as validam através da sua utilização ou omissão continuada. Isto significa que, se uma pessoa cometer erros de ortografia ou utilizar fraseologia influenciada polo castelhano, a IA tenderá a replicar esses mesmos padrões em todas as suas conversas com ele. Isto constitui um risco significativo, pois a nossa interação coa IA em galego pode, num curto espaço de tempo, não só reforçar como também amplificar padrões incorretos e interferências do castelhano.
De novo, a nossa responsabilidade coletiva
Sem dúvida, a chegada dos chatbots capazes de manter conversas fluidas e avançadas em galego representa uma oportunidade sem precedentes para a transmissão da língua. Para as novas gerações, isto significa ter acesso a uma ferramenta gratuita de aprendizagem comunicativa disponível 24 horas por dia. Para o corpo docente, abre-se um universo de possibilidades didáticas inovadoras, o que possibilita a incorporação de atividades dinâmicas e significativas nas aulas de galego. No entanto, é crucial compreender que a aprendizagem do galego por parte da IA é uma questão de futuro que devemos enfrentar agora. Se as pessoas falantes de castelhano, as neofalantes e até as falantes nativas começarem a depender principalmente dos modelos de IA para aprender galego ou gerar textos e áudios nesta língua, a qualidade e as características do galego utilizado por estas IAs serão determinantes para a própria evolução da língua.
Torna-se, portanto, fundamental prestarmos atenção à qualidade do galego que utilizamos na interação coa IA e ao feedback que lhe proporcionamos quando detetamos desvios ou interferências. Tal como nos preocupamos em transmitir às novas gerações um galego que combine elementos patrimoniais e formais, também devemos assegurar que a IA adquira estas competências. Este desafio exige uma consciencialização coletiva sobre a importância da qualidade linguística, especialmente considerando o contexto sociolinguístico particular do galego. No entanto, também sabemos que as consciencializações em torno da língua ou mesmo de questões relacionadas coa nossa própria sobrevivência são cada vez mais difíceis de conseguir nesta era das bolhas de filtros e da polarização nas redes sociais.
No entanto, nem tudo são brêtemas neste panorama. Surgem iniciativas importantes como o Projeto Nós, impulsionado pola Xunta e a USC, que já disponibiliza um tradutor neuronal multilíngue gratuitamente, desenvolve sistemas de reconhecimento de voz e aplicações de síntese de voz. Precisamente no âmbito deste projeto está a se desenvolver uma emocionante campanha de doações de vozes por todo o país. E não vai poder ser de outro jeito: o sucesso da IA como ferramenta de preservação e transmissão da língua dependerá da nossa capacidade, como comunidade, de garantirmos que estas tecnologias aprendam e reproduzam um galego de qualidade, significativo para nós, mantendo tanto a sua riqueza patrimonial como a sua correção formal, quando o contexto o requer.