Teknologi Text-to-Speech (TTS) terus berkembang pesat, memungkinkan mesin untuk mengucapkan teks dengan suara yang semakin alami dan ekspresif. Namun, di balik kemudahan yang ditawarkan, terdapat proses pengembangan dan pengujian yang kompleks. Salah satu elemen krusial dalam proses ini adalah pemilihan dan penyusunan materi yang akan menjadi bahan untuk diujikan pada sistem TTS. Materi uji ini bukan sekadar kumpulan kata, melainkan instrumen penting untuk mengukur dan meningkatkan berbagai aspek kualitas suara yang dihasilkan.
Memilih materi yang tepat untuk pengujian TTS adalah seni sekaligus sains. Tujuannya adalah untuk mengekspos sistem pada berbagai tantangan fonetik, prosodi, dan linguistik yang mungkin dihadapi dalam penggunaan dunia nyata. Materi yang baik harus mampu menyoroti kelebihan dan kekurangan model TTS, mulai dari pelafalan kata-kata yang jarang ditemui, intonasi yang tepat dalam kalimat tanya atau seru, hingga ritme bicara yang alami.
Kualitas sistem TTS dapat diukur dari beberapa dimensi utama: kejelasan (intelligibility), naturalitas (naturalness), dan ekspresi (expressiveness). Tanpa materi uji yang memadai, pengembang akan kesulitan untuk memberikan umpan balik yang konkret dan terukur.
Dalam menyusun materi uji, ada beberapa kriteria kunci yang perlu diperhatikan:
Materi harus mencakup semua fonem (unit bunyi terkecil dalam bahasa) yang ada dalam bahasa target. Ini termasuk konsonan, vokal, diftong, dan kombinasi konsonan yang mungkin sulit dilafalkan. Misalnya, dalam Bahasa Indonesia, pengujian bisa meliputi perbedaan antara /a/, /i/, /u/, /e/, /o/, serta kombinasi seperti "ng", "ny", "sy", dan kata-kata yang diawali atau diakhiri dengan huruf tertentu.
Kalimat yang digunakan tidak hanya boleh sederhana. Materi uji yang baik akan memasukkan kalimat dengan berbagai struktur gramatikal (kalimat aktif, pasif, majemuk, bertingkat) dan tingkat kesulitan semantik. Ini termasuk idiom, peribahasa, metafora, dan frasa yang maknanya tidak literal.
Prosodi mencakup irama, intonasi, aksen, dan jeda. Materi uji perlu dirancang untuk menguji bagaimana sistem TTS menangani:
Untuk menguji ketahanan model, materi uji seringkali menyertakan kata-kata teknis, nama diri, istilah ilmiah, atau kata-kata yang jarang digunakan dalam percakapan sehari-hari. Ini membantu mengidentifikasi area di mana model mungkin kesulitan dalam pelafalan atau pemahaman konteks.
Materi uji bisa berupa transkrip dari percakapan nyata, teks dari buku atau artikel, atau bahkan kalimat yang secara khusus dibuat untuk tujuan pengujian. Kombinasi keduanya seringkali memberikan hasil yang paling komprehensif. Teks otentik memberikan realisme, sementara teks sintetis memungkinkan kontrol penuh terhadap elemen linguistik yang ingin diuji.
Misalnya, untuk menguji pengucapan imbuhan "me-" dalam Bahasa Indonesia, materi uji bisa mencakup kalimat seperti: "Dia menulis surat." dan "Burung itu menangkap ikan." Pengembang perlu memastikan bahwa pelafalan imbuhan "me-" di sini konsisten dan benar sesuai kaidah fonotaktik bahasa Indonesia.
Selain itu, kalimat seperti "Apakah kamu pergi ke sana?" harus diucapkan dengan intonasi tanya yang jelas, berbeda dengan "Kamu pergi ke sana." yang merupakan sebuah pernyataan. Pengujian dengan materi yang beragam inilah yang memungkinkan pengembang untuk menyempurnakan algoritma dan suara TTS agar lebih mendekati kualitas suara manusia.
Dengan pemilihan materi uji coba TTS yang cermat dan terstruktur, kualitas suara yang dihasilkan oleh sistem TTS dapat terus ditingkatkan, membuka lebih banyak peluang untuk aplikasinya di berbagai bidang, mulai dari asistensi suara, narasi buku audio, hingga dukungan komunikasi bagi penyandang disabilitas.