Pengelompokan topik Penelitian Berdasarkan Judul Jurnal Dengan Metode K-Means Clustering

  • Kode Repository : SK133/AYU/2020
  • NPM : 065115426
  • Nama : Ayu Shafira
  • Pembimbing 1 : -Dr. Iyan Mulyana, S.Kom., M.Kom
  • Pembimbing 2 : -Fajar Delli Wihartiko, SSi,.,MM.,M.Kom.
  • Abstrak : -PENGELOMPOKAN TOPIK PENELITIAN BERDASARKAN JUDUL JURNAL DENGAN METODE K-MEANS CLUSTERING Ayu ShafiraIyan Mulyana, Fajar Delli W. Email : ayushafiraa3@gmail.com Program Studi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Pakuan, Jl. Pakuan, RT. 002/RW. 006, Tegallega, Kecamatan Bogor Tengah, Kota Bogor, Jawa Barat, 16129 Abstrak Salah satu cara untuk mengatasi dalam pengarsipan dokumen jurnal penelitian digital di era sekarang ini yang semakin bertambah banyak dengan cara mengelompokkan jurnal tersebut sesuai dengan topik penelitian nya agar dokumen rapi dan mudah diakses oleh pengelola. Jurnal yang digunakan pada penelitian ini adalah jurnal Program Studi Ilmu Komputer Institute Pertanian Bogor dan variabel yang digunakan adalah Judul Jurnal, yang memiliki acuan Topik Penelitian yaitu Komputasional dan Optimasi (Computational Intelligence and Optimization/CIO), Sistem Komputer dan Jaringan (Computer Systems and Network/CSN), dan Rekayasa Perangkat Lunak dan Ilmu Informasi (Software Engineering and Information Sciences/SEIS), dan terdapat pula banyak sub topik di dalamnya. Data yang digunakan sebanyak 60 data yang pada proses pengelompokan nya melalui proses Text Mining dengan tahapan berupa Case Folding, Tokenizing, Filltering, Stemming, serta pembobotan dengan Term Weighting. Pengelompokan dokumen berupa teks menggunakan Metode K-Means Clustering dan di Evaluasi menggunakan Metode Silhouette Coefficient. Range kluster yang diuji coba yaitu k=2 sampai k=6 dan hasil evaluasi untuk nilai k optimal berada pada jumlah k=5 dengan nilai silhouette coefficient 0.2583 dan hasil pengelompokan serta pelabelan kluster yaitu pada kluster 1 dengan label geographic information system (presentase 41,6%), pada kluster 2 dengan label machine learning (presentase 100%), pada kluster 3 dengan label software engineering (presentase 63,63%), pada kluster 4 dengan label computational intelligence (presentase 63,63%), dan pada kluster 5 dengan label HCI for development (presentase 37,5%). Kata Kunci : K-Means Clustering, Text Mining, Pengelompokan Jurnal, Sillhouette Coefficient
  • Program Studi : Ilmu Komputer