PERBANDINGAN ALGORITMA NAIVE BAYES DAN LOGISTIC REGRESSION TERHADAP ANALISIS SENTIMEN (STUDI KASUS: DEBAT CALON PRESIDEN DAN CALON WAKIL PRESIDEN REPUBLIK INDONESIA TAHUN 2024-2029)

Tangka, Ignatius Lucky Henokh and Angdresey, Apriandy and Sitanayah, Lanny (2014) PERBANDINGAN ALGORITMA NAIVE BAYES DAN LOGISTIC REGRESSION TERHADAP ANALISIS SENTIMEN (STUDI KASUS: DEBAT CALON PRESIDEN DAN CALON WAKIL PRESIDEN REPUBLIK INDONESIA TAHUN 2024-2029). Skripsi thesis, UNIVERSITAS KATOLIK DE LA SALLE MANADO.

[img] PDF
COVER-LEMBAR_PENGESAHAN_IgnatiusTangka.pdf

Download (605kB)
[img] PDF
ABSTRAK_IgnatiusTangka.pdf

Download (12kB)
[img] PDF
KATA_PENGANTAR-DAFTAR_ISI_IgnatiusTangka.pdf

Download (85kB)
[img] PDF
BAB_I_IgnatiusTangka.pdf

Download (23kB)
[img] PDF
BAB_II-LAMPIRAN_IgnatiusTangka.pdf
Restricted to Repository staff only

Download (2MB)

Abstract

Analisis sentimen adalah studi komputasional yang meneliti opini, perasaan, dan emosi dalam teks, menggunakan teknik seperti pengolahan bahasa alami, komputasi linguistik, dan text mining. Tujuannya adalah mengklasifikasikan polaritas teks dengan algoritma seperti Naive Bayes dan Logistic Regression, yang telah menunjukkan akurasi yang signifikan dalam berbagai penelitian. Studi ini khususnya mengkaji komentar pada YouTube tentang debat Calon Presiden dan Calon Wakil Presiden pada pemilihan umum 2024 di Republik Indonesia. Opini publik memiliki pengaruh penting terhadap elektabilitas pasangan calon pemimpin, pada Tugas Akhir ini bertujuan mengembangkan aplikasi yang dapat membandingkan efektivitas kedua algoritma dalam mengklasifikasikan sentimen, dengan menggunakan metrik seperti akurasi, presisi, dan recall. Pemilihan kedua algoritma ini didasarkan pada akurasi penelitian terkait yang seimbang dan penggunaan prinsip probabilitas, serta statistika. Tugas Akhir ini menggunakan data sebanyak 108.867 komentar yang diambil dari YouTube, yang kemudian diproses melalui tahap text preprocessing yang melibatkan case folding, tokenizing, cleaning, stopword removal, dan stemming untuk menghasilkan data yang bersih dan siap digunakan. Hasil pengujian menunjukkan bahwa kedua algoritma mampu mengklasifikasikan sentimen ke dalam kelas positif, negatif, dan netral, meskipun terdapat perbedaan dalam performa masing-masing algoritma. Dalam 10 kali iterasi diperoleh akurasi sebesar 85,17% untuk algoritma Naive Bayes dengan 0,039 error rate, sedangkan untuk Logistic Regression diperoleh akurasi sebesar 90,67% dan error rate sebesar 0,053. Aplikasi yang dikembangkan tidak hanya mampu melakukan analisis sentimen pada data massal, tetapi juga menyediakan fitur untuk pengujian komentar baru secara individu, menampilkan hasil analisis dalam bentuk diagram garis dan himpunan data yang telah diproses.

Kata Kunci: Analisis Sentimen, Naive Bayes, Logistic Regression, Komentar YouTube.

Item Type: Thesis (Skripsi)
Creators:
CreatorsNIM/NIDN
Tangka, Ignatius Lucky HenokhNIM.20013047
Angdresey, ApriandyNIDN.0924049201
Sitanayah, LannyNIDN.0919048302
Subjects: T Technology > T Technology (General)
Divisions: Fakultas Teknik > Teknik Informatika
Depositing User: UPT Perpustakaan Universitas Katolik De La Salle Manado
Date Deposited: 01 Aug 2024 05:43
Last Modified: 01 Aug 2024 05:43
URI: http://repo.unikadelasalle.ac.id/id/eprint/3635

Actions (login required)

View Item View Item