Kevin Aprilion, - (2022) Penerapan Metode Information Gain dan Support Vector Machine untuk Identifikasi Konten Kasar pada Tweets. S1 thesis, Institut Teknologi Harapan Bangsa.
![[thumbnail of 1116006_TA_Title.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Title.pdf
Download (209kB)
![[thumbnail of 1116006_TA_Author.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Author.pdf
Restricted to Repository staff only
Download (146kB)
![[thumbnail of 1116006_TA_Chapter1.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Chapter1.pdf
Download (72kB)
![[thumbnail of 1116006_TA_Chapter2.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Chapter2.pdf
Restricted to Repository staff only
Download (413kB)
![[thumbnail of 1116006_TA_Chapter3.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Chapter3.pdf
Download (231kB)
![[thumbnail of 1116006_TA_Chapter4.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Chapter4.pdf
Restricted to Repository staff only
Download (583kB)
![[thumbnail of 1116006_TA_Chapter5.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Chapter5.pdf
Download (68kB)
![[thumbnail of 1116006_TA_Appendix.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_TA_Appendix.pdf
Restricted to Repository staff only
Download (143kB)
![[thumbnail of 1116006_Paper-TA.pdf]](http://repository.ithb.ac.id/style/images/fileicons/text.png)
1116006_Paper-TA.pdf
Download (846kB)
Abstract
Dalam penggunaan jejaring sosial apalagi Twitter sering sekali menemukan tulisan yang mengandung kata-kata kasar dan bersifat ofensif dalam Bahasa Indonesia. Penelitian ini akan menguji akurasi metode Information Gain, metode TF-IDF dan menguji parameter pada metode SVM untuk mengetahui kombinasi metode dan parameter terbaik untuk identifikasi. Pada penelitian ini memiliki beberapa indikator utama yaitu menggunakan stemming atau tidak menggunakan stemming pada saat preprocessing jenis pengambilan fitur, parameter C dan gamma, dan jenis kernel. Data yang digunakan didapat dari website penyedia dataset, berupa kumpulan data Twitter yang terdapat kata kasar. Berdasarkan pengujian, hasil akurasi tertinggi didapatkan dengan nilai 93.1402% dengan f-measure 90.7787% hasil ini didapat dengan menggunakan dataset Twitter yang tidak dilakukan pelabelan manual metode yang gunakan adalah Information Gain dengan stemming. Dari penelitian ini, dapat disimpulkan bahwa menggunakan stemming dan pengambilan fitur dapat mempengaruhi nilai akurasi dalam pendeteksian kata kasar tersebut. Faktor seperti jenis kernel dan parameter SVM juga menjadi salah satu hal yang mempengaruhi hasil pendeteksian kata kasar tersebut.
Item Type: | Thesis (S1) |
---|---|
Additional Information: | Pembimbing 1 : Ken Ratri Retno Wardani, S.Kom, M.T. |
Uncontrolled Keywords: | Identifikasi Kata Kasar, Pembobotan Kata, TF-IDF, Information Gain (IG), Support Vector Machine (SVM). |
Subjects: | T Technology > T Technology (General) |
Divisions: | ITHB > Teknik Informatika |
Depositing User: | Mr Agung |
Date Deposited: | 30 May 2023 02:58 |
Last Modified: | 30 May 2023 02:58 |
URI: | http://repository.ithb.ac.id/id/eprint/28 |