Plataforma web detecta fake news em português de forma automática

Na atual era de fake news tem sido cada vez mais desafiador distinguir notícias falsas ou falsificadas das reais. Uma plataforma web criada por pesquisadores ligados ao Centro de Ciências Matemáticas Aplicadas à Indústria (CeMEAI) pode facilitar essa tarefa. Por meio de uma combinação de modelos estatísticos e técnicas de aprendizado de máquina, a plataforma é capaz de predizer a probabilidade de um texto ser fake. Resultados preliminares indicaram que o sistema foi capaz de detectar notícias falsas com 96% de precisão.

“A ideia da plataforma é oferecer à sociedade uma ferramenta adicional para identificar de forma não somente subjetiva se uma notícia é ou não falsa”, diz Francisco Louzada Neto, diretor de transferência tecnológica do CeMEAI e coordenador do projeto.

Sediado no Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP), em São Carlos, o CeMEAI é um dos Centros de Pesquisa, Inovação e Difusão (CEPIDs) financiados pela FAPESP.

Características das fake news

Ao receber um texto, que deve conter a notícia completa, o sistema aplica métodos estatísticos para avaliar características de escrita, como palavras usadas ou classes gramaticais mais frequentes.

Essas características são utilizadas por um classificador baseado em um modelo de aprendizado de máquina que é capaz de distinguir padrões de linguagem, vocabulário e semântica de notícias falsas e de verdadeiras e, dessa forma, inferir automaticamente se um texto submetido à plataforma é ou não uma fake news.

“As fake news apresentam padrões na redação do texto, uso e frequência de palavras que podem ser identificáveis pelo classificador”, afirma Louzada.

Para treinar os modelos foi usado um banco de dados construído por pesquisadores da USP, composto por uma grande quantidade de notícias verdadeiras e falsas escritas em português. Além disso, os modelos foram expostos ao vocabulário usado em mais de 100 mil notícias publicadas nos últimos cinco anos.

A base de notícias serviu de entrada para os modelos estatísticos computacionais empregados na plataforma buscarem automaticamente padrões na redação do texto, como o uso e a frequência das palavras. “Precisamos sempre atualizar e dar mais subsídios para os modelos usados pela plataforma, de modo a melhorar a acurácia e aumentar a capacidade de predição de fake news”, avalia Louzada.

Os pesquisadores pretendem usar as fake news que circularão nas eleições brasileiras deste ano e as relacionadas à pandemia de Covid-19 para calibrar os modelos.

“O combate às fake news é uma corrida de gato e rato porque, ao mesmo tempo que tem surgido plataformas como a que desenvolvemos para detectá-las, os métodos para produzir essas notícias falsas também têm sido aprimorados”, avalia Louzada.

Uma das preocupações é que o sistema também possa ser usado por criadores de fake news para avaliar o potencial de uma notícia falsa passar por verdadeira antes de ser difundida. “Esse é um risco com o qual teremos que lidar”, conclui. (Com informações da Agência Fapesp)

Damos valor à sua privacidade

Nós e os nossos parceiros armazenamos ou acedemos a informações dos dispositivos, tais como cookies, e processamos dados pessoais, tais como identificadores exclusivos e informações padrão enviadas pelos dispositivos, para as finalidades descritas abaixo. Poderá clicar para consentir o processamento por nossa parte e pela parte dos nossos parceiros para tais finalidades. Em alternativa, poderá clicar para recusar o consentimento, ou aceder a informações mais pormenorizadas e alterar as suas preferências antes de dar consentimento. As suas preferências serão aplicadas apenas a este website.

Cookies estritamente necessários

Estes cookies são necessários para que o website funcione e não podem ser desligados nos nossos sistemas. Normalmente, eles só são configurados em resposta a ações levadas a cabo por si e que correspondem a uma solicitação de serviços, tais como definir as suas preferências de privacidade, iniciar sessão ou preencher formulários. Pode configurar o seu navegador para bloquear ou alertá-lo(a) sobre esses cookies, mas algumas partes do website não funcionarão. Estes cookies não armazenam qualquer informação pessoal identificável.

Cookies de desempenho

Estes cookies permitem-nos contar visitas e fontes de tráfego, para que possamos medir e melhorar o desempenho do nosso website. Eles ajudam-nos a saber quais são as páginas mais e menos populares e a ver como os visitantes se movimentam pelo website. Todas as informações recolhidas por estes cookies são agregadas e, por conseguinte, anónimas. Se não permitir estes cookies, não saberemos quando visitou o nosso site.

Cookies de funcionalidade

Estes cookies permitem que o site forneça uma funcionalidade e personalização melhoradas. Podem ser estabelecidos por nós ou por fornecedores externos cujos serviços adicionámos às nossas páginas. Se não permitir estes cookies algumas destas funcionalidades, ou mesmo todas, podem não atuar corretamente.

Cookies de publicidade

Estes cookies podem ser estabelecidos através do nosso site pelos nossos parceiros de publicidade. Podem ser usados por essas empresas para construir um perfil sobre os seus interesses e mostrar-lhe anúncios relevantes em outros websites. Eles não armazenam diretamente informações pessoais, mas são baseados na identificação exclusiva do seu navegador e dispositivo de internet. Se não permitir estes cookies, terá menos publicidade direcionada.

Visite as nossas páginas de Políticas de privacidade e Termos e condições.

Importante: A Medicina S/A usa cookies para personalizar conteúdo e anúncios, para melhorar sua experiência em nosso site. Ao continuar, você aceitará o uso. Veja nossa Política de Privacidade.