Use este identificador para citar ou linkar para este item: http://bdm.ufmt.br/handle/1/4295
Registro completo de metadados
Campo DCValorIdioma
dc.creatorArruda, Gabriel Thompson Marques-
dc.date.accessioned2024-12-12T21:17:06Z-
dc.date.available2024-10-02-
dc.date.available2024-12-12T21:17:06Z-
dc.date.issued2022-07-20-
dc.identifier.citationARRUDA, Gabriel Thompson Marques. Modelagem de tópicos no estudo da preferência de perfis robôs em tweets relativos a CPI da Covid. 2022. 34 f. Trabalho de Conclusão de Curso (Graduação em Estatística ) - Universidade Federal de Mato Grosso, Instituto de Ciências Exatas e da Terra, Cuiabá, 2022.pt_BR
dc.identifier.urihttp://bdm.ufmt.br/handle/1/4295-
dc.description.abstractTwitter is a social network that falls into the microblog category, that is, it allows its users to send and receive short messages through texts and images, within this category concentrates the greater number of users. For this reason, this network has strong relevance in multiple aspects of contemporary society, including in politics. Aiming at this scenario of influence and social impact, many users resort to robot profiles (or bots) to automatically trigger hundreds or even thousands of messages (tweets). This work aims to apply the Latent Dirichlet Allocation (LDA) to identify if there is a preference of robot users for any of the modeled topics. Thus, data collection was carried out through the Twitter API, over approximately 1 month, with the keywords CPI and COVID. 459,145 tweets were collected in Portuguese from 109,027 different users. These users were subject to the analysis of the “Pegabot” platform, which assigns a probability that a given account is or is not a robot. After the pre-stage processing, only users who posted 100 or more messages during the period were selected, remaining 26,966 observations from 189 different accounts. Through the use of LDA it was possible to identify 4 topics, the first topic is associated with the ministry of health, since the second refers to senator Renan Calheiro, the third one focuses on Bolsonaro, while the fourth is related to government in general. In all topics robots had the highest number of publications. It was only found that topic 1 was the one with the lowest proportion of users robots.pt_BR
dc.description.provenanceSubmitted by Carlos Eduardo da Silveira (carloseduardoufmt@gmail.com) on 2024-12-10T20:36:00Z No. of bitstreams: 1 TCC_2022_Gabriel Thompson Marques Arruda.pdf: 1437457 bytes, checksum: 6f6e4bfb9ec2b4aec30bff2943cfabd2 (MD5)en
dc.description.provenanceApproved for entry into archive by Carlos Eduardo da Silveira (carloseduardoufmt@gmail.com) on 2024-12-12T21:17:06Z (GMT) No. of bitstreams: 1 TCC_2022_Gabriel Thompson Marques Arruda.pdf: 1437457 bytes, checksum: 6f6e4bfb9ec2b4aec30bff2943cfabd2 (MD5)en
dc.description.provenanceMade available in DSpace on 2024-12-12T21:17:06Z (GMT). No. of bitstreams: 1 TCC_2022_Gabriel Thompson Marques Arruda.pdf: 1437457 bytes, checksum: 6f6e4bfb9ec2b4aec30bff2943cfabd2 (MD5) Previous issue date: 2022-07-20en
dc.languageporpt_BR
dc.publisherUniversidade Federal de Mato Grossopt_BR
dc.rightsAcesso Abertopt_BR
dc.titleModelagem de tópicos no estudo da preferência de perfis robôs em tweets relativos a CPI da Covidpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Oliveira, Anderson Castro Soares de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8698014900594878pt_BR
dc.contributor.referee1Oliveira, Anderson Castro Soares de-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/8698014900594878pt_BR
dc.contributor.referee2Bortolini, Juliano-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/6210909768845403pt_BR
dc.contributor.referee3Morita, Lia Hanna Martins-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/8952048121396398pt_BR
dc.creator.Lattes.pt_BR
dc.description.resumoO Twitter é uma rede social que se enquadra na categoria de microblog, isto é, permite que os seus usuários enviem e recebam mensagens curtas por meio de textos e imagens, dentro desta categoria concentra o maior número de usuários. Por esta razão, esta rede possui forte relevância em múltiplos aspectos da sociedade contemporânea, bem como na política. Visando este cenário de influência e impacto social, muitos usuários fazem o uso de perfis robôs (ou bots) com o propósito de disparar automaticamente centenas ou até mesmo milhares de mensagens (tweets). Este trabalho tem como objetivo aplicar a Alocação Latente de Dirichlet para identificar se existe preferência dos usuários robôs por algum dos tópicos modelados. Assim, a coleta de dados foi realizada por meio da API do Twitter, num período de aproximadamente 1 mês, com as palavras chaves CPI e COVID. Foram coletados 459.145 tweets em português de 109.027 usuários distintos. Estes usuários foram submetidos a plataforma Pegabot, que atribui uma probabilidade daquela determinada conta ser ou não um robô. Após a fase de pré processamento, foi selecionado apenas os usuários que publicaram 100 ou mais mensagens durante o período, restando 26.966 observações de 189 contas distintas. Por meio da Alocação Latente de Dirichlet foi possível verificar a existência de 4 tópicos, o primeiro tópico associado com o ministério da saúde, já o segundo refere-se ao senador Renan Calheiro, o terceiro tópico tem como principal foco o Bolsonaro, enquanto o quarto com o governo de modo geral. Em todos os tópicos os robôs tiveram maior número de publicações. Apenas foi constatado que o tópico 1 foi o que apresentou a menor proporção de usuários robôs.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentInstituto de Ciências Exatas e da Terra (ICET)pt_BR
dc.publisher.initialsUFMT CUC - Cuiabápt_BR
dc.publisher.programEstatística - CUCpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICApt_BR
dc.subject.keywordModelagem de tópicospt_BR
dc.subject.keywordAlocação latente de Dirichletpt_BR
dc.subject.keywordRobôspt_BR
dc.subject.keywordCovidpt_BR
dc.subject.keywordCPIpt_BR
dc.subject.keywordTwitterpt_BR
dc.subject.keyword2Topic modelingpt_BR
dc.subject.keyword2Latent Dirichlet allocationpt_BR
dc.subject.keyword2Robotspt_BR
dc.subject.keyword2Covidpt_BR
dc.subject.keyword2CPIpt_BR
dc.subject.keyword2Twitterpt_BR
Aparece na(s) coleção(ções):Estatística

Arquivos deste item:
Arquivo Descrição TamanhoFormato 
TCC_2022_Gabriel Thompson Marques Arruda.pdf1.4 MBAdobe PDFVer/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.