Rastreamento de ansiedade por meio da voz em gestantes utilizando machine learning

Pinto, Paula Leandra Loeblein

Use este identificador para citar ou linkar para este item: http://bdm.ufmt.br/handle/1/4743

Tipo documento:	Trabalho de Conclusão de Curso
Título:	Rastreamento de ansiedade por meio da voz em gestantes utilizando machine learning
Autor(es):	Pinto, Paula Leandra Loeblein
Orientador(a):	Sousa, Rafael Teixeira
Membro da Banca:	Sousa, Rafael Teixeira
Membro da Banca:	Lopes, Robson da Silva
Membro da Banca:	Mota, Amanda Sodré
Resumo :	Este trabalho aborda a problemática da dificuldade de acesso ao diagnóstico precoce de ansiedade em gestantes, frequentemente tardio devido a barreiras no acesso a profissionais de saúde. Essa limitação evidencia a necessidade de alternativas acessíveis e eficientes para apoiar a identificação de sinais ansiosos por meio de métodos não invasivos. Foram utilizadas como entrada para os modelos 110 amostras de áudio e dados demográficos obtidos a partir do projeto Grávida Digital, sendo empregados os questionários GAD-2 e PSS como referência para a rotulagem dos dados. O objetivo deste estudo é rastrear sinais de ansiedade em gestantes por meio da voz, utilizando técnicas de Machine Learning. A metodologia adotada foi uma pesquisa exploratória com base em dados previamente coletados. O processo envolveu a análise e tratamento dos dados, extração de características acústicas e processamento dos áudios, além da avaliação de diferentes modelos de classificação para identificar a abordagem mais eficaz. Foram testados conjuntos de features como MFCC, OpenSMILE e PyAudio (incluindo MidTerm), aplicados a janelas de 8 segundos. Para a classificação, foram avaliados cinco algoritmos: KNN, Logistic Regression, SVC, XGBoost e Gradient Boosting, com uso de métricas como AUC, F1-score e acurácia. As ferramentas empregadas incluem Python, scikitlearn, Librosa e OpenSMILE para a extração e o processamento dos dados. Os resultados indicaram que o conjunto MFCC foi o mais robusto e que a inclusão de dados demográficos pode melhorar o desempenho dos modelos. O melhor desempenho foi obtido com o modelo Logistic Regression, utilizando PyAudio com os escores do GAD-2 como rótulo, alcançando AUC de 0.705 e F1-score de 0.51. No entanto, a variação entre os classificadores sugere que técnicas de ensemble e ajustes nos parâmetros podem melhorar a estabilidade dos modelos. Conclui-se que a análise de voz tem potencial para o rastreamento de sinais ansiosos em gestantes, podendo ser aprimorada com otimizações adicionais.
Resumo em lingua estrangeira:	This work addresses the issue of the difficulty in accessing early diagnosis of anxiety in pregnant women, which is often delayed due to barriers in accessing healthcare professionals. This limitation highlights the need for accessible and efficient alternatives to support the identification of anxious signs through non-invasive methods. A total of 110 audio samples and demographic data from the Grávida Digital project were used as input for the models, with the GAD-2 and PSS questionnaires employed as reference for labeling the data. The aim of this study is to track signs of anxiety in pregnant women through voice, using Machine Learning techniques. The methodology adopted was an exploratory research based on previously collected data. The process involved the analysis and processing of data, extraction of acoustic features, and audio processing, as well as evaluating different classification models to identify the most effective approach. Feature sets such as MFCC, OpenSMILE, and PyAudio (including MidTerm) were tested, applied to 8-second windows. For classification, five algorithms were evaluated: KNN, Logistic Regression, SVC, XGBoost, and Gradient Boosting, using metrics such as AUC, F1-score, and accuracy. The tools employed include Python, scikit-learn, Librosa, and OpenSMILE for data extraction and processing. The results indicated that the MFCC feature set was the most robust, and that the inclusion of demographic data can improve the model performance. The best performance was achieved with the Logistic Regression model, using PyAudio with GAD-2 scores as labels, reaching an AUC of 0.705 and F1-score of 0.51. However, the variation between classifiers suggests that ensemble techniques and parameter adjustments may improve the stability of the models. It is concluded that voice analysis has the potential to track anxious signs in pregnant women, which can be further enhanced with additional optimizations.
Palavra-chave:	rastreamento de ansiedade reconhecimento de fala machine learning processamento de voz gestação
Palavra-chave em lingua estrangeira:	Anxiety detection speech recognition machine learning voice processing pregnancy
CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma:	por
País:	Brasil
Instituição:	Universidade Federal de Mato Grosso
Sigla da instituição:	UFMT CUA - Araguaia
Departamento:	Instituto de Ciências Exatas e da Terra (ICET) – Araguaia
Programa:	Ciência da Computação - CUA
Referência:	PINTO, Paula Leandra Loeblein. Rastreamento de ansiedade por meio da voz em gestantes utilizando machine learning. 2025. 55 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Instituto de Ciências Exatas e da Terra, Universidade Federal de Mato Grosso, Barra do Garças, 2025.
Tipo de acesso:	Acesso Aberto
URI:	http://bdm.ufmt.br/handle/1/4743
Data defesa documento:	2-May-2025
Aparece na(s) coleção(ções):	Ciência da Computação - Araguaia

Arquivos deste item:

Arquivo	Descrição	Tamanho	Formato
TCC_2025_Paula Leandra Loeblein Pinto.pdf		2.54 MB	Adobe PDF	Ver/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas