Implementasi LDA untuk Pengelompokan Topik Tweet Akun Bot Twitter bertagar #covid-19

Muhammad Alif Noor Febriansyach, Faza Rashif, Goldio Ihza Perwira Nirvana, Nur Aini Rakhmawati

Abstract


Twitter merupakan media sosial yang sedang mengalami perkembangan yang pesat, karena pengguna dapat berinteraksi satu sama lain menggunakan media komputer atau perangkat mobile. Perubahan tagar trending  yang berubah dengan cepat sesuai sesuai dengan intensitas pengguna membicarakan hal tertentu. Sehingga media social twitter ini cocok untuk merumpi membicarakan hal-hal terkini, salah satunya masalah COVID-19. Hal ini tidak menutup kemungkinan ada oknum yang menggunakan predikat ini untuk membuat berita untuk menggiring opini public mengenai COVID-19 mengenai berita baik maupun berita yang tak bersumber yang dapat menyebar dengan cepat. Pada penelitian ini penulis ingin mengetahui macam-macam topik yang dibahas oleh  akun bot terhadap penyebaran informasi menggunakan tagar #covid19. Penelitian ini dilakukan dengan menggunakan metode Latent  Dirichlet  Allocation  (LDA ). Analisis dilakukan setelah melakukan text mining pada 162 Tweet dari 62 akun bot Twitter. Untuk menentukan jumlah topik yang optimal, yakni dengan melihat nilai perplexity dan topik coherence. Hasil yang didapatkan adalah  5 topik teratas antara lain tentang kondisi dan dampak pandemi saat ini, himbauan untuk menjaga jarak agar Kesehatan tetap terjaga, perkembangan penyebaran COVID 19 yang ada di Indonesia, vaksinasi yang terjadi di beberapa wilayah di Indonesia, dan cara menghadapi COVID-19.

Kata kunci—Covid-19, Twitter, Akun Bot, LDA



Full Text:

PDF

References


D. Inayah dan F. L. Purba, “Implementasi Social Network Analysis Dalam Penyebaran Informasi Virus Corona (Covid-19) Di Twitter,” Semin. Nas. Off. Stat., vol. 2020, no. 1, hal. 292–299, 2021, doi: 10.34123/semnasoffstat.v2020i1.

J. Clement, “twitter: number of monthly active users 2010-2019,” statista.com, 2019, [Daring]. Tersedia pada: https://www.statista.com/statistics/282087/number-of-monthly-active-twitter-users/.

J. Sinuhaji, “Peneliti Sebut Persen dari 200 Juta Cuitan Virus Corona di Twitter Adalah Bot,” pikiran-rakyat.com, 2020. https://www.pikiran-rakyat.com/teknologi/prpeneliti-sebutpersen-dari-200-juta-cuitan-virus-corona-di-twitter-adalah-bot (diakses Apr 06, 2021).

F. F. Rachman dan S. Pramana, “Analisis Sentimen Pro dan Kontra Masyarakat Indonesia tentang Vaksin COVID-19 pada Media Sosial Twitter,” Heal. Inf. Manag. J., vol. 8, no. 2, hal. 100–109, 2020, [Daring]. Tersedia pada: https://inohim.esaunggul.ac.id/index.php/INO/article/view/223/

A. A. Amrullah, A. Tantoni, N. Hamdani, R. T. R. L. Bau, M. R. Ahsan, dan E. Utami, “Reviewatas Analisis Sentimen Pada Twitter Sebagai Representasi Opini Publik Terhadap Bakal Calon Pemimpin,” Pros. Semin. Nas. Multi Disiplin Ilmu Call Pap. Unisbank, vol. 2, no. 1, hal. 978–979, 2016.

I. Putra dan I. Dana, “Pengaruh Profitabilitas, Leverage, Likuiditas Dan Ukuran Perusahaan Terhadap Return Saham Perusahaan Farmasi Di Bei,” E-Jurnal Manaj. Univ. Udayana, vol. , no. 11, hal. 249101, 2016.

P. G. Pratama dan N. A. Rakhmawati, “Social bot detection on 2019 indonesiapresident candidates supporters tweets,” Procedia Comput. Sci. 161, hal. 813–820, 2019.

“Unsupervised Machine Learning: What is, Algorithms, Example,” Guru99. https://www.guru99.com/unsupervised-machine-learning.html (diakses Jun 27, 2021).

V. Sharma, “Unsupervised Learning an Angle for Unlabelled Data World,” TechTarget, 2018. https://www.datasciencecentral.com/profiles/blogs/unsupervised-learning-an-angle-for-unlabelled-data-world (diakses Jun 27, 2021).

M. Steyvers dan T. Griffiths, “Probalistic Topic Models,” Latent Semant. Anal. A Road To Mean., vol. 3, no. 3, hal. 993–1022, 2010, [Daring]. Tersedia pada: http://www.sciencedirect.com/science/article/pii/S0140366413001047ceas.cc/2004/167.pdfdoi.acm.org/101806338eprints.soton.ac.ukieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=7033160

Y. Sahria dan D. H. Fudholi, “Analisis Topik Penelitian Kesehatan di Indonesia Menggunakan Metode Topic Modeling LDA,” J. Rekayasa Sist. dan Teknol. Inf., vol. 4, no. 2, hal. 336–344, 2020, [Daring]. Tersedia pada: http://jurnal.iaii.or.id.

W. M. Darling, “A theoretical and practical implementation tutorial on topic modeling and gibbs sampling,” Proc. 49th Annu. Meet. Assoc. Comput. Linguist. Hum. Lang. Technol., hal. 1–10, 2011.

R. F. Rizki, “Mau Deteksi Akun Bot di Twitter? Gunakan Botometer,” Teknologi.id, 2020. https://teknologi.id/insight/mau-deteksi-akun-bot-di-twitter-gunakan-botometer (diakses Mar 30, 2021).

“Topic modeling,” cfss.uchicago.edu, 2021. https://cfss.uchicago.edu/notes/topic-modeling/#:~:text=Perplexity is a statistical measure,of words in your documents (diakses Apr 06, 2021).

F. Rashif, G. I. P. Nirvana, dan M. A. N. Febriansyach, “Dataset dari Akun Bot Twitter,” 2021. https://zenodo.org/record/4679107#.YHKM8OgzaUk.




DOI: http://dx.doi.org/10.31154/cogito.v7i1.299.170-181

Refbacks

  • There are currently no refbacks.


CogITo Smart Journal
A publication of Fakultas Ilmu Komputer, Universitas Klabat
In partnership with Coris and IndoCEISS
Phone: +62 (431) 891035
email: editorial.cogito@unklab.ac.id | web: http://cogito.unklab.ac.id/index.php/cogito
 
Free counters!
View CogITo Smart Journal Stats

CogITo Smart Journal is indexed by:
  DOAJ    SINTA     Indonesia OneSearch by Perpusnas    Crossref    Google Scholar      Base Search PKP Index    neliti    EBSCO Information Science    mendeley          scilit    road    worldcat    DRJI    OpenAIREplus    copac    Gent University Library Stanford Library    Harvard Library    Leiden University Libraries    The University of Sheffield    Boston University Library    University of Manchester    University of Oxford    CORE    Livivo
 



CogITo Smart Journal is licensed under a Creative Commons Attribution 4.0 International License.