Journal Article
Analyzing Sentiment with Self-Organizing Map and Long Short-Term Memory Algorithms
Abstract
This research delves into the impact of Chat Generative Pre-trained Transformer, one of OpenAI's Generative Pretrained Transformer models trained on a vast corpus of internet text to understand the mechanics of human language. The emergence of ChatGPT has sparked significant debate and attention in research and education, with concerns on platforms like Twitter regarding potential negative consequences such as forgery and misinformation. This study aims to perform sentiment analysis classification of public opinions toward ChatGPT on Twitter in Indonesia, categorizing sentiments into positive, negative, and neutral. In the data clustering stage, the Self-Organizing Map (SOM) technique is used. After text data is weighted and clustered, Long Short-Term Memory (LSTM) is applied as the classification technique to determine public sentiment. Experimental results show that the proposed model, with optimal parameters including ReLU activation, SOM size of 5, and 128 epochs for both SOM and LSTM, achieves an accuracy of 95.07%, demonstrating robust performance for sentiment analysis related to ChatGPT.
Overview
Penelitian ini menganalisis sentimen masyarakat Indonesia terhadap Chat Generative Pre-trained Transformer (ChatGPT) dengan memanfaatkan data tweet yang diklasifikasikan ke dalam sentimen positif, negatif, dan netral.
Pendekatan yang digunakan mengombinasikan teknik clustering Self-Organizing Map (SOM) dan model Long Short-Term Memory (LSTM) untuk menghasilkan klasifikasi sentimen yang lebih akurat.
Key Contributions
- Melakukan pengumpulan dan pengolahan data tweet terkait ChatGPT untuk dianalisis sentimennya dalam konteks Indonesia.
- Menerapkan Self-Organizing Map (SOM) sebagai teknik clustering pada data teks yang telah melalui tahapan pembobotan.
- Menggunakan Long Short-Term Memory (LSTM) sebagai model klasifikasi untuk menentukan hasil akhir sentimen publik terhadap ChatGPT.
- Mencapai akurasi sekitar 95,07% dengan kombinasi parameter optimal, menunjukkan kinerja yang kuat untuk tugas analisis sentimen berbasis SOM dan LSTM.