Cientistas usam inteligência artificial e rede social para criar modelo que prevê ansiedade e depressão – Notícias
Pesquisadores da USP (Universidade de São Paulo) estão usando inteligência artificial e uma das maiores plataformas do mundo, o Twitter, para tentar criar modelos de predição de ansiedade e depressão que, no futuro, podem dar sinais desses transtornos antes do diagnóstico clínico.
A construção da base de dados, chamada SetembroBR, foi um primeiro passo e está descrita em artigo publicado na revista científica Language Resources and Evaluation. O nome é uma homenagem ao movimento Setembro Amarelo — uma campanha de prevenção ao suicídio realizada anualmente — e também pelo fato de a coleta de dados ter começado em um mês de setembro.
Na segunda etapa do trabalho, ainda em desenvolvimento, os cientistas conseguiram alguns resultados preliminares. Entre eles, o que aponta ser possível detectar se uma pessoa apresenta maior risco de vir a desenvolver depressão, apenas com base na rede social de amigos e seguidores, ou seja, sem levar em conta as postagens feitas pelo próprio indivíduo.
A base criada pelo grupo engloba informações relacionadas a texto (em português) e à rede de conexões de 3.900 usuários do Twitter que, depois do levantamento, relataram diagnóstico ou tratamento de transtorno mental. O corpus (coletânea de informações sobre determinado tema) inclui todos os tuítes públicos escritos por esses usuários individualmente — sem retuítes —, o que totalizou cerca de 47 milhões desses pequenos textos.
“Inicialmente fizemos uma coleta nas timelines em um trabalho artesanal, analisando textos de cerca de 19 mil usuários do Twitter, o que corresponde quase à população de uma pequena cidade. E depois usamos dois conjuntos — uma parte de usuários realmente diagnosticados com transtornos mentais e outra aleatória, que serviu de controle. Queríamos diferenciar pessoas com depressão da população em geral”, explica Ivandre Paraboni, professor da EACH-USP (Escola de Artes, Ciências e Humanidades) e autor para correspondência do artigo.
Além dos usuários, a pesquisa coletou textos de sua rede de amigos e seguidores. Isso porque é comum que uma pessoa com algum tipo de transtorno mental siga determinadas contas, como fóruns de discussão ou alguma celebridade que publicamente assumiu estar com depressão. “Essas pessoas se atraem porque têm interesses comuns”, completa Paraboni, que é pesquisador associado do C4AI (Centro de Inteligência Artificial), um CPE (Centro de Pesquisa em Engenharia) constituído pela Fapesp (Fundação de Amparo à Pesquisa do Estado de São Paulo) e pela IBM Brasil na USP.
A fundação também apoia o estudo por meio do projeto “Análise da linguagem em redes sociais para detecção precoce de transtornos de saúde mental”, liderado por Paraboni.
Distúrbios de saúde mental, entre eles a depressão e a ansiedade, têm sido mencionados pela OMS (Organização Mundial da Saúde) como uma preocupação crescente no mundo. Estimativas do órgão calculam que cerca de 3,8% da população — ou 280 milhões de pessoas — é afetada pela depressão, de acordo com dados de 2021.
Com a pandemia de Covid-19, período em que os textos do Twitter foram coletados pelos pesquisadores, houve um aumento de 25% na prevalência global de ansiedade e depressão.
No Brasil, um estudo recente do Ministério da Saúde, que envolveu 784 mil participantes, revelou que 11,3% dos brasileiros já foram diagnosticados com depressão, a maior parte deles mulheres.
Pesquisas anteriores mostraram que transtornos mentais muitas vezes se refletem na linguagem usada por indivíduos que sofrem dessas condições, o que levou à realização de um número considerável de trabalhos com Processamento de Linguagem Natural (NLP, na sigla em inglês), com foco em depressão, ansiedade e transtorno bipolar, entre outros distúrbios. A maior parte delas, porém, foi realizada em língua inglesa, nem sempre refletindo o perfil brasileiro.
Modelos
Para realizar o estudo, o grupo da USP submeteu o corpus textual a procedimentos de pré-processamento e limpeza de dados para remover hashtags, URLs, emoticons e caracteres fora do padrão, mas mantendo-se a escrita original.
Foram utilizados métodos de aprendizado profundo (do inglês deep learning) para criar quatro classificadores de texto e embeddings de palavras individualizadas ou dependentes de contexto, com o uso de modelos baseados em transformers do tipo BERT (um algoritmo de aprendizado profundo). Esses modelos correspondem a uma rede neural que aprende o contexto e o significado dos textos com o monitoramento de relações em dados sequenciais, como palavras em uma frase.
Como entrada, foi utilizada uma amostra de 200 tuítes, selecionados aleatoriamente, de cada usuário. Os parâmetros são definidos executando-se cinco vezes a validação cruzada dos dados de treinamento e calculando-se os resultados médios.
A pesquisa detectou que os modelos de transformers do tipo BERT foram os que tiveram o melhor desempenho nas tarefas de previsão de depressão e transtorno de ansiedade. A diferença entre ele e a segunda melhor alternativa, a LogReg, foi estatisticamente significativa.
Como os modelos analisam sequências de palavras ou frases inteiras, observou-se que indivíduos com depressão, por exemplo, tendem a falar de assuntos relacionados a si mesmos, usando expressões e verbos na primeira pessoa e termos como morte, crise e psicólogo.
“Os indicativos de depressão que aparecem no consultório não são necessariamente os mesmos que estão na rede social. Por exemplo: percebemos, de maneira bem forte, o uso na rede de pronomes na primeira pessoa, como “eu” e “mim”, o que na psicologia é um indicativo clássico de depressão. Mas também constatamos uma incidência alta entre os usuários depressivos da utilização do símbolo de coraçãozinho, o emoji da afetividade, que talvez ainda não esteja caracterizado na psicologia”, afirma Paraboni.
O professor destaca que os textos coletados foram totalmente anonimizados. “Não divulgamos nenhum tuíte nem o nome de usuários. Tomamos o cuidado de nem os próprios alunos envolvidos no projeto terem acesso a dados de usuários, para proteger a identidade das pessoas”, diz.
Agora, além de ampliarem a base de dados, os pesquisadores trabalham para refinar a técnica computacional empregada e aprimorar os modelos iniciais, visando, no futuro, a uma ferramenta que talvez possa vir a ser aplicada na prática. Ela poderia auxiliar tanto em uma eventual triagem inicial de pessoas com indicativos de transtornos como ajudar pais, familiares e amigos de jovens com risco de depressão e ansiedade.
O Brasil é o terceiro país que mais utiliza redes sociais no mundo, segundo um levantamento divulgado no início de março pela Comscore, atrás de Índia e Indonésia e à frente de Estados Unidos, México e Argentina.
São 131,5 milhões de usuários conectados no país durante 46 horas por mês, em média, o que representa quase dois dias inteiros. As redes mais acessadas pelos brasileiros são YouTube, Facebook, Instagram, TikTok, Kwai e Twitter, que recentemente mudou suas regras, além de ter passado a cobrar por alguns tipos de serviço.
De ansiedade a Parkinson: veja quais problemas de saúde podem ter origem no intestino: