Ithb Repository

PENERAPAN CONTEXTUAL GENERATION OF WORD EMBEDDINGS UNTUK MENANGANI OUT-OF-VOCABULARY PADA PART-OF-SPEECH TAGGING BAHASA INDONESIA

Alfiyanto Kondolele, 1117041 and Hery Heryanto, (Pembimbing) (2023) PENERAPAN CONTEXTUAL GENERATION OF WORD EMBEDDINGS UNTUK MENANGANI OUT-OF-VOCABULARY PADA PART-OF-SPEECH TAGGING BAHASA INDONESIA. S1 publication, Institut Teknologi Harapan Bangsa.

Full text not available from this repository.

Abstract

Out of Vocabulary atau biasa dikenal dengan OOV adalah kasus dimana model mengalami kebingungan pada saat melakukan prediksi kelas dari suatu token pada dokumen. Hal ini dapat disebabkan oleh kurangnya data pada saat melatih model, sehingga word embedding dari token tertentu tidak tersedia. OOV dapat terjadi pada Natural Processing Languange tasks. Salah satunya, yaitu Part of Speech Tagging. Part of Speech Tagging merupakan proses klasifikasi token-token pada dokumen sesuai dengan labelnya. Pada penelitian ini, indikator utama adalah ukuran dari konteks yang digunakan untuk membentuk word embedding pada token-token yang OOV. Untuk permodelan OOV word embedding menggunakan arsitektur Deep Learning Comick (Contextual Generation of Word Embedding). Dataset yang digunakan adalah teks Bahasa Indonesia yang bersumber dari penelitian Arawinda Dinakaramani, Fam Rashel, Andry Luthfi & Ruli Manurung pada tahun 2014. Berdasarkan pengujian yang dilakukan dengan menggunakan 17 ukuran konteks yang berbeda dan metode cross validation 5 fold, didapatkan akurasi pada train dataset: 94.08%, validation dataset: 89.14%, dan test dataset: 89.40%. Sedangkan untuk simpangan baku train dataset: 0.50%, validation dataset: 0.46%, dan test dataset: 0.60%.

Item Type: Publication (S1)
Uncontrolled Keywords: Deep Learning, Natural Languange Processing, Bidirectional Long Short Term Memory (BiLSTM), Out-of-Vocabulary, Part-of-Speech Tagging
Subjects: T Technology > T Technology (General)
Divisions: ITHB > Teknik Informatika
Depositing User: Staf Perpus - Mhs ithb
Date Deposited: 19 Mar 2025 08:50
Last Modified: 19 Mar 2025 08:50
URI: http://repository.ithb.ac.id/id/eprint/266

Actions (login required)

View Item
View Item

Ithb Repository is powered by EPrints 3.4 which is developed by the School of Electronics and Computer Science at the University of Southampton. About EPrints | Accessibility