Ithb Repository

Penerapan Metode Information Gain dan Support Vector Machine untuk Identifikasi Konten Kasar pada Tweets

Kevin Aprilion, - (2022) Penerapan Metode Information Gain dan Support Vector Machine untuk Identifikasi Konten Kasar pada Tweets. S1 thesis, Institut Teknologi Harapan Bangsa.

[thumbnail of 1116006_TA_Title.pdf] Text
1116006_TA_Title.pdf

Download (209kB)
[thumbnail of 1116006_TA_Author.pdf] Text
1116006_TA_Author.pdf
Restricted to Repository staff only

Download (146kB)
[thumbnail of 1116006_TA_Chapter1.pdf] Text
1116006_TA_Chapter1.pdf

Download (72kB)
[thumbnail of 1116006_TA_Chapter2.pdf] Text
1116006_TA_Chapter2.pdf
Restricted to Repository staff only

Download (413kB)
[thumbnail of 1116006_TA_Chapter3.pdf] Text
1116006_TA_Chapter3.pdf

Download (231kB)
[thumbnail of 1116006_TA_Chapter4.pdf] Text
1116006_TA_Chapter4.pdf
Restricted to Repository staff only

Download (583kB)
[thumbnail of 1116006_TA_Chapter5.pdf] Text
1116006_TA_Chapter5.pdf

Download (68kB)
[thumbnail of 1116006_TA_Appendix.pdf] Text
1116006_TA_Appendix.pdf
Restricted to Repository staff only

Download (143kB)
[thumbnail of 1116006_Paper-TA.pdf] Text
1116006_Paper-TA.pdf

Download (846kB)

Abstract

Dalam penggunaan jejaring sosial apalagi Twitter sering sekali menemukan tulisan yang mengandung kata-kata kasar dan bersifat ofensif dalam Bahasa Indonesia. Penelitian ini akan menguji akurasi metode Information Gain, metode TF-IDF dan menguji parameter pada metode SVM untuk mengetahui kombinasi metode dan parameter terbaik untuk identifikasi. Pada penelitian ini memiliki beberapa indikator utama yaitu menggunakan stemming atau tidak menggunakan stemming pada saat preprocessing jenis pengambilan fitur, parameter C dan gamma, dan jenis kernel. Data yang digunakan didapat dari website penyedia dataset, berupa kumpulan data Twitter yang terdapat kata kasar. Berdasarkan pengujian, hasil akurasi tertinggi didapatkan dengan nilai 93.1402% dengan f-measure 90.7787% hasil ini didapat dengan menggunakan dataset Twitter yang tidak dilakukan pelabelan manual metode yang gunakan adalah Information Gain dengan stemming. Dari penelitian ini, dapat disimpulkan bahwa menggunakan stemming dan pengambilan fitur dapat mempengaruhi nilai akurasi dalam pendeteksian kata kasar tersebut. Faktor seperti jenis kernel dan parameter SVM juga menjadi salah satu hal yang mempengaruhi hasil pendeteksian kata kasar tersebut.

Item Type: Thesis (S1)
Additional Information: Pembimbing 1 : Ken Ratri Retno Wardani, S.Kom, M.T.
Uncontrolled Keywords: Identifikasi Kata Kasar, Pembobotan Kata, TF-IDF, Information Gain (IG), Support Vector Machine (SVM).
Subjects: T Technology > T Technology (General)
Divisions: ITHB > Teknik Informatika
Depositing User: Mr Agung
Date Deposited: 30 May 2023 02:58
Last Modified: 30 May 2023 02:58
URI: http://repository.ithb.ac.id/id/eprint/28

Actions (login required)

View Item
View Item

Ithb Repository is powered by EPrints 3.4 which is developed by the School of Electronics and Computer Science at the University of Southampton. About EPrints | Accessibility