Selama beberapa dekade, asisten digital seperti Alexa dan Siri gagal berbicara dalam bahasa orang-orang Nigeria. Kini, realitas ini sedang berubah, berkatNaijaVoices, proyek kecerdasan buatan berbahasa lokal yang menandai terobosan dalam teknologi suara yang benar-benar berbahasa Nigeria.
Didirikan dengan misi untuk membuat kecerdasan buatan lebih inklusif, NaijaVoices sedang mengatasi salah satu celah terbesar dalam ekosistem digital negara ini: ketidakmampuan sistem kecerdasan buatan berbicara untuk memahami dan merespons dalam bahasa-bahasa Nigeria seperti Yoruba, Igbo, dan Hausa.
Selama bertahun-tahun, orang-orang Nigeria sehari-hari tidak bisa berbicara dengan sistem AI seperti Alexa, Siri, dalam bahasa daerah kami yang sebenarnya kami gunakan di rumah dan di pasar," kata Abraham Owodunni, peneliti PhD di Ohio State University dan kontributor utama dalam proyek ini. "NaijaVoices mengubah hal itu dengan memberikan suara yang kaya dan nyata kepada AI agar dapat memahami aksen, peribahasa, dan irama kami.
Proyek ini telah merilis dataset ucapan yang sangat besar dengan lebih dari 1.838,5 jam, yang diambil dari 5.455 penutur asli dan lebih dari 645.000 kalimat unik. Dataset ini tersedia secara terbuka di HuggingFace, memungkinkan para peneliti, pengembang, dan perusahaan untuk membangun sistem AI yang benar-benar "mendengar" orang-orang Nigeria.
Bukan sekadar keberhasilan teknologi, NaijaVoices adalah intervensi budaya yang mendalam. Alih-alih mengandalkan data web yang dikumpulkan secara otomatis, tim bekerja sama dengan komunitas lokal untuk menciptakan secara bersama prompt teks yang berakar pada budaya dan merekam suara asli dari berbagai kelompok usia dan daerah.
Kami melakukan sesuatu yang sederhana tetapi kuat: kami membangun data yang tepat, dengan cara yang benar," jelas Owodunnni. "Ketika model AI bicara modern dilatih dengan NaijaVoices, mereka belajar suara kami, sehingga akurasi meningkat, dan hasilnya terdengar seperti kami.
Aplikasi langsungnya sangat luas dan kritis. Dari kesehatan, di mana pasien dapat menggambarkan gejala dalam bahasa ibu mereka, hingga keuangan, dengan verifikasi berbasis suara yang aman untuk penutur non-Inggris, proyek ini sedang mereformasi akses terhadap layanan penting. Layanan darurat, siaran informasi publik, alat literasi, dan layanan pelanggan kini dapat disesuaikan dengan bahasa yang sebenarnya digunakan orang-orang.
Moto tim, "bahasa kami adalah kekuatan kami", menekankan pendekatannya dalam pengumpulan dan anotasi data. Dari penulis hingga fasilitator, setiap kontributor adalah pemangku kepentingan dalam membentuk produk akhir. Menurut Owodunni, "pendekatan berbasis komunitas ini adalah alasan data tersebut autentik dan model yang dilatih pada dataset ini bekerja lebih baik."
NaijaVoices bukan hanya membangun data, tetapi juga menumbuhkan bakat kecerdasan buatan lokal. Inisiatif ini telah mengubah proses pembuatan data menjadi jalur keterampilan, memberdayakan penulis, insinyur, dan linguistik dengan pengalaman nyata dalam pemrosesan bahasa alami dan teknologi suara.
Keberhasilannya juga didukung oleh kemitraan yang kuat, mulai dari Lacuna Fund dan Meta, hingga Universitas McGill, Mila, Masakhane, Intron, dan kolaborator global serta Afrika lainnya. "Setiap mitra membawa keahlian seperti komputasi, pendanaan, linguistik, atau penerapan sehingga produk akhirnya etis dan bermanfaat," kata Owodunni.
Namun tim tetap menyadari secara mendalam pentingnya isu etika. "Persetujuan, privasi, dan rasa hormat datang terlebih dahulu," kata Owodunni mengonfirmasi. Suara tidak pernah diambil secara rahasia; data dihapus identitasnya, dan keragaman berdasarkan jenis kelamin, usia, dan wilayah diprioritaskan.
Menghadapi masa depan, proyek ini bertujuan untuk memperluas dampaknya di seluruh Afrika. "NaijaVoices adalah sebuah model yang secara tepat didokumentasikan dalam kertas penelitian kami, yang diterbitkan pada Interspeech 2025," kata Owodunni. "Model yang sama berbasis komunitas dapat digunakan untuk membangun dataset yang kuat untuk bahasa Afrika lainnya, sehingga seorang anak di Kano, Kampala, atau Kisangani dapat belajar dan berbank dalam bahasa yang paling mereka kuasai."
Masih ada tantangan yang harus dihadapi. Mulai dari biaya penyimpanan dan komputasi, serta pelatihan model, hingga kebutuhan pendanaan yang berkelanjutan dan kerangka kebijakan yang mendukung, perjalanan ini masih jauh dari selesai. "Dari sisi kebijakan, kami ingin melihat layanan publik dan platform utama diwajibkan untuk menawarkan dukungan bahasa setempat. Keputusan satu ini akan mempercepat inklusi dan pasar AI berbahasa Nigeria," kata Owodunni.
Salah satu inisiatif terbaru proyek ini adalah NaijaVoices Language Heritage Micro-Grants, paket sebesar ₦4 juta yang ditujukan untuk mendukung proyek komunitas yang mem dokumentasikan dan melestarikan bahasa-bahasa Nigeria.
Bagi peneliti kecerdasan buatan Nigeria yang masih pemula, Abraham Owodunni memberikan nasihat ini: "Mulailah dengan masalah yang dirasakan oleh komunitas Anda. Bangun bersama orang-orang, bukan untuk mereka. Bagikan hasil Anda sehingga orang lain bisa mencapai lebih tinggi."
Dengan rencana untuk memperluas cakupan bahasa dan menguji solusi dalam pendidikan dan kesehatan, NaijaVoices semakin menjadi contoh pengembangan AI yang inklusif di seluruh benua ini.
Visi ini sederhana," kata Owodunni menutup, "jika Anda bisa mengucapkannya di Nigeria, AI seharusnya memahaminya dengan indah.
Disediakan oleh SyndiGate Media Inc. (Syndigate.info).