KUALA LUMPUR, 11 September – Projek Pembangunan Model Kecerdasan Buatan Bahasa Melayu (AI-BM) yang dikenali sebagai Wahana Rintis Semantik Ayat Nasional (WaRiSAN Melayu) bakal menjadi pusat sehenti bagi pengumpulan, pemurnian dan pengesahan data Bahasa Melayu.
Timbalan Dekan Penyelidikan dan Inovasi, Fakulti Teknologi dan Sains Maklumat Universiti Kebangsaan Malaysia (UKM), Prof Madya Dr. Abdul Hadi Abd Rahman berkata projek itu sekali gus memberi tumpuan kepada pembangunan piawaian Bahasa Melayu dalam teknologi AI agar hasil yang dijana lebih teratur, sahih dan beretika.
Beliau yang juga ketua projek menjelaskan, model asas WaRiSAN Melayu itu akan menjadi rujukan utama bagi aplikasi dan model AI lain supaya penggunaan bahasa lebih tepat daripada segi istilah dan konteks.
Ia kini berada pada fasa pembangunan sekitar 60 peratus dan dijangka siap sepenuhnya awal tahun hadapan, dengan fasa pengujian diselesaikan tahun ini.
“Kebanyakan model luar menggunakan data yang diperoleh melalui 'web crawling' tanpa kawalan, menyebabkan hasil bercampur dengan bahasa lain seperti Bahasa Indonesia dan kurang tepat.
"Melalui WaRiSAN Melayu, data yang digunakan adalah rasmi serta disahkan, sekali gus menjamin teks yang dihasilkan lebih sahih, kemas dan sesuai dengan konteks bidang.
"Justeru, WaRiSAN Melayu akan berfungsi sebagai rujukan piawai kepada model-model AI lain supaya berkembang mengikut garis panduan yang seragam," katanya ketika menjadi tetamu dalam rancangan Selamat Pagi Malaysia di sini hari ini.
Tambahnya, usaha itu turut melibatkan kerjasama pelbagai agensi termasuk Dewan Bahasa dan Pustaka (DBP), Radio Televisyen Malaysia (RTM), Jabatan Digital Negara, Kementerian Digital, agensi kerajaan serta sumber akademik lain bagi memastikan data yang dikumpul lebih seimbang dan relevan.
Projek WaRiSAN Melayu merupakan sebahagian daripada bajet Belanjawan 2025 bagi memperkasa kedudukan Bahasa Melayu sebagai bahasa kebangsaan di era digital melalui teknologi AI.
BERITA BERKAITAN: