SKRIPSI Sistem Informasi
PENGEMBANGAN METODE PENGAMBILAN INFORMASI DAN KLASIFIKASI PADA POSTER JADWAL KAJIAN ISLAM MENGGUNAKAN PENDEKATAN NAMED ENTITY RECOGNITION DAN NAÏVE BAYES CLASSIFIER
ABSTRAK
Rosidy, Ahmad Syarif. 2019. Pengembangan Metode Pengambilan Informasi dan Klasifikasi Pada Poster Jadwal Kajian Islam Menggunakan Pendekatan Named Entity Recognition Dan Naïve Bayes Classifier. Skripsi, Program Studi Sistem Informasi STMIK PPKIA Pradnya Paramita. Pembimbing: (I) Dr. Tb. Mohammad Akhriza, S.Si., MMSI, (II) Mochamad Husni, S.PdI., MM., MMSI
Kata Kunci: Klasifikasi, Optical Character Recognition (OCR), Named Entity Recognition (NER), Naïve Bayes Classifier (NBC)
Situs web kajianmuslim.com merupakan portal penyebaran poster jadwal kajian islam di Indonesia. Situs web ini memiliki jumlah tayang perhari yang cukup tinggi. Namun rata-rata jumlah poster yang di-posting hanya 0,6 poster/hari tidak sebanding dengan 41 poster/hari yang masuk ke admin. Hal ini disebabkan proses posting yang dilakukan dengan pengambilan informasi dan klasifikasi poster secara manual tidak efisien waktu. Peningkatan efisiensi waktu dapat dilakukan dengan membuat sebuah sistem terkomputerisasi yang menerapkan model framework dengan performa yang baik. Penelitian ini bertujuan mengembangkan model pengambilan informasi dan klasifikasi poster serta menguji performa model tersebut. Model yang dikembangkan mengkombinasikan metode Optical Character Recognition (OCR), Named Entity Recognition (NER), dan Naïve Bayes Classifier (NBC). Model tersebut diimplementasi pada sebuah sistem berbasis web sebagai media pengujian performa akurasi. Hasil pengujian dengan 50 poster uji menunjukkan performa akurasi yang cukup baik. Akurasi hasil pengambilan informasi dengan NER berdasarkan jumlah data training adalah sebagai berikut: informasi tanggal 84% (34 data training), nama ustaz 92% (619 data training), nama masjid 90% (1058 data training), dan nama kota 82% (285 data training). Sedangkan hasil optimal klasifikasi NBC diperoleh menggunakan 120 poster data training dengan akurasi keseluruhan kelas 86%, kelas tabligh akbar 84%, dan kelas kajian umum 88%. Performa akurasi yang cukup baik membuktikan bahwa model yang diusulkan mampu digunakan sebagai metode alternatif pengambilan informasi dan klasifikasi poster jadwal kajian islam.
| 15510009 | 001.42 AHM P SKR SistemInformasi | Perpus STMIK (Sistem Informasi) | Tersedia |
Tidak tersedia versi lain