Klasifikasi Komentar Cyberbullying Pada Sosial MediaTwitter
Kode Repository :SKI70/MUH/19
NPM :065115332
Nama :Muhammad Rizqi Aulia Putra
Pembimbing 1 :-Dr. Sri Setyaningsih, M.Si.
Pembimbing 2 :-Dr. Ir. Hermawan
Abstrak :-KLASIFIKASI KOMENTAR CYBERBULLYING PADA SOSIAL
MEDIA TWITTER
Muhammad Rizqi Aulia Putra1), Sri Setyaningsih2), Hermawan Thaheer3)
Email : muhammadrizqi.working@gmail.com
1, 2 & 3)Program Studi Ilmu Komputer, FMIPA, Universitas Pakuan Bogor
Abstrak
Seiring dengan perkembangan zaman, perkembangan teknologi pun semakin canggih. Anak-anak dan remaja
sekarang sudah mahir menggunakan teknologi dan mengakses internet. Di zaman era teknologi ini kasus
cyberbullying semakin banyak, Namun hal ini memberikan dampak negative, Berbagai kabar tidak baik
tersebar secara cepat di dunia maya dan pada akhirnya muncul komentar negatif yang bersifat menyakiti hati
anak. Sebagai dampaknya remaja yang berkeseharian riang, menjadi murung dan selalu menangis, Pada
penelitian ini akan dibuat Klasifikasi Pada Komentar Cyberbullying di Sosial Media Twitter Menggunakan
Klasifikasi Term Frequency-Inverse Document Frequency (TF-IDF) dan Cosine Similarity. Pada penelitian
ini yaitu membandingkan similaritas antar dokumen. Kemudian mencari nilai similaritas tertinggi antar
dokumen. Apabila total similaritas yang didapatkan adalah nol (0) maka dokumen yang diolah tidak memiliki
kesamaan dan jika nilai yang didapatkan maksimal adalah 1 maka dokumen tersebut memiliki kemiripan.
Penelitian yang dilakukan telah berhasil menerapkan metode Term Frequency-Inverse Document Frequency
dan Cosine Similarity untuk kategorisasi dan klasifikasi Cyberbullying berdasarkan tweet komentar twitter
berbasis website. Sistem kategorisasi ini menggunakan data komentar, dan jenis Cyberbullying yang terdiri
dari 5 kategori, yaitu kategori Flaming, Denigration, Outing, Harassment, Cyberstalking. Data yang
digunakan sebanyak 1200 data yang terbagi menjadi 5 kategori Cyberbullying dan dibagi menjadi data latih
dan data uji. Data latih maupun data uji dari setiap kategori berbeda terdiri dari dua kelas akun aktor dan
kategori yaitu kategori flamming 66 data uji, denigration 54 data uji, outing 39 data uji, harassment 118 data
uji, cyberstalking 51 data uji. aplikasi sudah akurat dengan menghasilkan tingkat akurasi 91.11%. Jadi hasil
analisa terhadap hasil akurasi adalah 91.11%.
Keywords: Term Frequency-Inverse Document Frequency (TF-IDF), Cosine Similarity, Twitter,
Cyberbullying