“Colonialismo de dados” ou a disputa entre a imprensa e as “big techs”
Num artigo de Carlos Castilho publicado no “Observatório da Imprensa” – associação com a qual o CPI mantém um acordo de parceria –, o autor aborda o processo legal iniciado pelo "The New York Times" (NYT) no final de dezembro contra a OpenAI e Microsoft sobre os direitos de autor.
O centro da disputa está no banco de dados digitalizado do NYT, conhecido como "Morgue", que abrange 13 milhões de textos, estatísticas, dados e oito milhões de imagens desde a fundação do jornal em 1851.
Esta acumulação de dados faz com que empresas jornalísticas controlem informações contextualizadas, valiosas para os algoritmos de IA. As empresas de tecnologia, por sua vez, processam enormes volumes de dados diários, mas têm menos de 20 anos, logo o seu arquivo é muito recente comparado com o de jornais com mais de um século, gerando uma interdependência paradoxal entre a IA e a imprensa.
“Os bancos de dados de empresas jornalísticas estão no centro da batalha com as Big Techs porque eles contêm dados, fatos e eventos contextualizados, o que facilita a tarefa dos algoritmos da inteligência artificial”, refere Castilho.
O processo baseia-se no facto de estes algoritmos de inteligência artificial, usados pela OpenAI/Microsoft, teram “bisbilhotado” o banco de dados do NYT sem pagar nada, numa operação classificada como treino para pesquisa.
Para o autor, esta batalha judicial “marca um novo episódio da corrida das empresas de alta tecnologia em busca de informações arquivadas em bancos de dados digitalizados e que se encontram, em sua maioria, sob controle de empresas estruturalmente analógicas”.
O artigo destaca a falta de regulamentação na IA, resultando em condições propícias para abusos e acções questionáveis por parte das empresas de tecnologia.
A analogia histórica é traçada com exemplos do passado, como a resistência dos jornais à transmissão de notícias via rádio aquando do aparecimento da rádio e o adiamento da introdução da Frequência Modulada (FM) nas transmissões radiofónicas.
O autor sugere que, assim como no passado, a batalha entre as "big techs" e a imprensa pode terminar num impasse.
“Tudo indica que, como no passado, a batalha entre big techs e imprensa deve terminar empatada porque as partes envolvidas vão acabar descobrindo que é preferível ‘perder os anéis para salvar os dedos’”, escreve Castilho, defendendo que este processo legal é uma “jogada” do NYT para “ganhar posições de força quando o acordo de convivência se tornar inevitável”.
O artigo aponta para a dificuldade em resolver a questão de propriedade de dados, destacando que os dados disputados na guerra entre a imprensa e as "big techs" não pertencem originalmente a nenhuma das partes envolvidas, mas sim aos indivíduos cujas conversas, pesquisas e transações foram extraídas sem devida compensação.
O autor compara, por isso, a situação actual com um “colonialismo de dados”, onde grandes corporações se apropriam de informações sem compensar os detentores originais.