Oportunidades e riscos da inteligência artificial generativa aplicados às redacções

Desde o lançamento do ChatGPT em 2022, as redacções em todo o mundo enfrentam tanto as oportunidades como os riscos da inteligência artificial generativa. Contudo, nem todas têm os mesmos meios para explorar estas tecnologias. Enquanto nos EUA e na Europa as redacções já experimentam modelos linguísticos avançados, "muitas redacções no Sul Global estão a ser deixadas para trás", sublinha um artigo do Reuters Institute.
Um dos grandes desafios é a forte predominância de línguas ocidentais como o inglês, francês e espanhol no desenvolvimento destes modelos, o que leva a que ferramentas de IA tradicionais reproduzam "profundos preconceitos linguísticos e culturais", dificultando o uso e a aplicação destas tecnologias em contextos locais.
A jornalista Gretel Kahn conversou com especialistas de países como a Índia, Bielorrússia, Nigéria, Mali, Paraguai e Filipinas, que estão a criar soluções adaptadas às suas realidades. Estes pioneiros procuram "colmatar as lacunas entre as redacções e o público", desenvolvendo ferramentas que integrem e respeitem as suas línguas e culturas. A sua missão é garantir que a transformação digital da informação não se faça à custa da diversidade linguística global.
As actuais ferramentas de IA simplesmente "não funcionam bem (ou não funcionam de todo)" para estas línguas, especialmente fora dos grandes idiomas como o inglês, francês ou espanhol. Isto "agrava as desigualdades nas redacções e nas comunidades", afastando ainda mais os jornalistas e públicos que trabalham fora do eixo linguístico dominante.
Jaemark Tordecilla, jornalista e tecnólogo das Filipinas, partilhou que embora haja interesse em usar IA nas redacções asiáticas, o acesso continua limitado. “Durante muito tempo, [a transcrição] funcionou bem para o inglês e não funcionou de todo para o filipino”, disse Tordecilla. Só recentemente os jornalistas filipinos começaram a usar ferramentas de transcrição automatizada, e mesmo assim enfrentam custos elevados.
Em muitos casos, os jornalistas são obrigados a partilhar contas de subscrição paga, o que levanta preocupações de segurança e privacidade. Para as línguas regionais das Filipinas, a situação é ainda mais crítica: estas ferramentas tornam-se “essencialmente inúteis”, impossibilitando o seu uso em reportagens locais.
Sannuta Raghu, jornalista indiana e responsável pelo Laboratório de IA da Scroll.in, diz que no contexto indiano, onde existem 22 línguas oficiais, as ferramentas de IA falham de forma sistemática: produzem "resultados imprecisos, alucinações e traduções incorrectas", explicou. Para além disso, não compreendem as complexidades da comunicação linguística na região, como as diferenças marcadas entre o discurso falado e o escrito ou a utilização frequente de "linguagem mista", em que o hindi e o inglês, por exemplo, são usados numa mesma frase.
"Precisamos de dados suficientemente ricos para podermos compreender isso", defendeu Raghu, sublinhando que a escassez de dados de qualidade é uma das principais causas das desigualdades linguísticas na IA. Esta lacuna resulta, segundo ela, de uma combinação entre a complexidade técnica e a falta de interesse por parte das grandes empresas tecnológicas. Ainda assim, assinala que a situação "está agora a começar a melhorar", à medida que mais iniciativas locais e colaborações procuram preencher essas falhas.
Além das limitações técnicas, os modelos de IA também carecem de sensibilidade cultural e política, o que levanta sérias preocupações para as redacções. Raghu aponta que há uma “inclinação americana em tudo o que é produzido pela IA”. Deu como exemplo um caso em que testaram uma ferramenta para escrever um texto sobre críquete e o modelo “inventou jogadores” e demonstrou desconhecimento básico das regras do jogo.
A falta de dados contextuais para realidades fora do eixo ocidental limita a capacidade dos modelos linguísticos de grande porte de abordar temas profundamente enraizados noutras culturas. Daria Minsky, especialista bielorrussa em inovação nos media, explica que ao trabalhar com redacções no exílio notou grande cepticismo em relação à IA, não apenas por erros factuais, mas sobretudo pela ausência de nuance em contextos politicamente sensíveis.
Daria Minsky exemplifica como os modelos de IA podem reproduzir, sem questionamento, narrativas impostas por regimes autoritários. Usando o seu país como exemplo, explicou que até algo aparentemente simples como a ortografia pode carregar significados políticos profundos. “A palavra bielorrusso é muito carregada politicamente em termos da forma como se escreve”, disse. Ao comparar diferentes modelos, notou que “o ChatGPT escreve a versão democrática, enquanto o DeepSeek usa a versão antiga, soviética. É bielorrusso versus bielorrusso. Bielorrusso é um termo imperialista usado pelo regime. Se as redacções usarem bielorrusso em vez de bielorrusso, arriscam-se a perder o seu público e a sua reputação.”
Os modelos de IA são treinados com base em dados disponíveis online. Assim, as línguas e realidades políticas menos representadas são distorcidas, porque os modelos aprendem sobretudo a partir da informação mais visível, que muitas vezes reflecte a narrativa oficial dos regimes autoritários.
Minsky aponta que estas questões “acontecem também na Birmânia, onde a oposição usa ‘Birmânia’ em vez de ‘Myanmar’”, e até nos EUA, onde “houve debate sobre a utilização de ‘Golfo do México’ ou ‘Golfo da América’, depois de Trump começar a mudar os nomes”.
Colmatar o fosso
Apesar dos desafios, várias redacções do Sul Global estão a criar as suas próprias soluções de IA, adaptadas aos contextos linguísticos e culturais locais.
Na África Ocidental, a agência Tama Media lançou a Akili, uma aplicação que oferece verificação de factos por voz em línguas africanas locais. Segundo Moïse Mounkoro, conselheiro editorial do projecto, a ideia surgiu devido à alta taxa de desinformação e ao facto de “muitas pessoas comunicarem através de mensagens de voz em vez de lerem e escreverem”. Como explicou: “Para as pessoas que são analfabetas ou que não falam francês, inglês ou espanhol, a forma mais comum de comunicar é oralmente. (...) Se quisermos tocar essas pessoas, temos de usar a sua língua”.
A Akili responde de forma oral às perguntas dos utilizadores, com base em fontes fiáveis como a BBC Africa e a própria Tama Media. Para expandir a aplicação a mais línguas, estão a testar o software do Google Tradutor e a desenvolver as suas próprias soluções com dicionários online.
No Paraguai, o meio digital El Surti está a desenvolver o GuaraníAI, um chatbot que reconhece e responde em guarani, uma língua indígena falada por cerca de 12 milhões de pessoas. A equipa está a criar um conjunto de dados de guarani falado para que os modelos consigam compreender e gerar discurso nesta língua, garantindo que o público indígena também é incluído na transformação digital.
Sebastián Auyanet, responsável pelo projecto, pretende combater a exclusão dos falantes de línguas não dominantes no acesso à inteligência artificial. No Paraguai, onde o guarani é língua oficial ao lado do espanhol e falado por cerca de 90% da população não indígena, Auyanet destaca a importância de adaptar os sistemas à oralidade desta língua: “O guarani é uma língua oral, não escrita (...) não há forma de entrar nesse mundo se falarmos numa língua que nenhum destes sistemas consegue utilizar”, afirmou.
Paralelamente, Daria Minsky trabalha com redacções no exílio para criar ferramentas de IA que respeitem as nuances culturais e políticas locais. Estas soluções permitirão às redacções monitorizar fontes fiáveis e hiper-locais.
A necessidade destas iniciativas prende-se com o facto de as ferramentas de IA estarem a acentuar o fosso entre redacções. Segundo Tordecilla, há redacções em Manila que já usam IA para investigações e outras, sobretudo nas zonas rurais das Filipinas, que lutam para sobreviver: “Estamos a falar de redacções que têm cinco pessoas (...) cada minuto que gastam na transcrição é um minuto que não gastam a fazer reportagens”, alertou. Contudo, são essas redacções, que operam em línguas “de poucos recursos”, que estão a ser deixadas para trás pelas grandes tecnológicas.
A jornalista Sannuta Raghu reforça que reduzir a lacuna digital da IA é fundamental para alcançar um público mais vasto. A sua redacção criou o “Factivo 1.0”, uma ferramenta que transforma artigos em vídeo de forma automática, em diversas línguas locais. “Para uma pequena redacção de língua inglesa como nós, o universo disponível é de cerca de 30 milhões de indianos, mas para entrar no círculo maior precisaríamos de ser capazes de fazer linguagem à escala”, explicou.
(Créditos da imagem: Freepik)