Departemen Informatika Universitas Diponegoro kembali menyelenggarakan kegiatan Undip Global Classroom (UGC) sebagai bagian dari penguatan kolaborasi akademik internasional dan pengembangan wawasan global mahasiswa. Pada kesempatan kali ini, kegiatan UGC dilaksanakan untuk mata kuliah Pengolahan Bahasa Alami (Natural Language Processing/NLP) dengan menghadirkan narasumber internasional, Dr. Suraya Alias dari Universiti Malaysia Sabah.
Mengusung tema “Beyond Text Summarization: Then and Now”, kuliah tamu ini membahas perkembangan teknologi text summarization dari pendekatan klasik berbasis aturan hingga teknologi modern berbasis Large Language Models (LLMs) dan arsitektur Transformer.
Dalam pemaparannya, Dr. Suraya menjelaskan bahwa ledakan informasi digital saat ini membuat manusia sulit memproses seluruh informasi teks secara manual. Oleh karena itu, teknologi automatic text summarization menjadi salah satu solusi penting dalam bidang NLP untuk menghasilkan ringkasan yang singkat, akurat, dan tetap mempertahankan inti informasi dari dokumen asli.
Mahasiswa diperkenalkan pada dua pendekatan utama dalam text summarization, yaitu:
Extractive Summarization, yang memilih kalimat penting langsung dari teks sumber tanpa modifikasi, dan
Abstractive Summarization, yang mampu menghasilkan kalimat baru melalui proses parafrase dan pemahaman konteks secara mendalam.
Selain menjelaskan konsep dasar, kegiatan ini juga mengupas evolusi arsitektur NLP mulai dari metode statistik seperti TF-IDF dan vector space models, perkembangan deep learning berbasis Seq2Seq dan LSTM, hingga revolusi Transformer melalui mekanisme self-attention yang menjadi fondasi model modern seperti BERT, GPT, T5, dan berbagai LLM terkini.
Salah satu bagian yang menarik perhatian peserta adalah pembahasan mengenai mekanisme attention pada Transformer yang memungkinkan model memahami hubungan antar kata dalam konteks kalimat secara simultan, sehingga menghasilkan pemahaman bahasa yang jauh lebih baik dibanding pendekatan NLP generasi sebelumnya.
Kegiatan UGC ini juga dilengkapi dengan dua sesi demonstrasi interaktif. Demo pertama menampilkan perbandingan langsung antara extractive summarization dan abstractive summarization menggunakan teks berbahasa Inggris bertema Artificial Intelligence. Pada demonstrasi tersebut, peserta dapat melihat bagaimana pendekatan ekstraktif hanya memilih bagian penting dari teks asli, sedangkan pendekatan abstraktif mampu menghasilkan ringkasan baru yang lebih natural dan ringkas.
Demo kedua memperlihatkan proses fine-tuning model Transformer untuk tugas text summarization menggunakan Airline Review Dataset. Dalam sesi ini, mahasiswa diperkenalkan pada tahapan pelatihan model, evaluasi performa menggunakan metrik seperti ROUGE dan BERTScore, hingga analisis hasil ringkasan yang dihasilkan model BART setelah proses fine-tuning.
Dr. Suraya juga membagikan pengalaman penelitiannya dalam pengembangan Malay Text Summarizer Framework yang mengombinasikan teknik sentence compression dan sentence clustering untuk meningkatkan kualitas ringkasan otomatis dalam bahasa Melayu.
Melalui kegiatan ini, mahasiswa tidak hanya memperoleh pemahaman teoritis mengenai perkembangan NLP modern, tetapi juga mendapatkan pengalaman praktis terkait implementasi teknologi AI generatif dan Transformer dalam peringkasan teks. Kegiatan Undip Global Classroom ini diharapkan dapat memperluas wawasan internasional mahasiswa serta memperkuat jejaring akademik antara Universitas Diponegoro dan Universiti Malaysia Sabah dalam bidang kecerdasan buatan dan pengolahan bahasa alami.