Microsoft Membuka Akses Terbatas Ke AI Neural Text-to-speech

Microsoft membuka akses terbatas ke AI text-to-speech yang disebut Suara Neural Khusus, yang memungkinkan pengembang membuat suara sintetis khusus. Teknologi tersebut adalah bagian dari layanan Azure AI yang disebut Ucapan . Perusahaan dapat menggunakan teknologi untuk hal-hal seperti   asisten dan perangkat pintar bertenaga suara, chatbot, pembelajaran online, dan membaca buku audio atau berita. Mereka harus mengajukan permohonan akses dan mendapatkan persetujuan dari Microsoft sebelum dapat memanfaatkan Suara Neural Khusus.

Teknologi ini dapat memberikan suara yang terdengar lebih alami daripada banyak layanan text-to-speech lainnya, menurut Microsoft . Suara khusus menggunakan kumpulan suara, atau fonem, untuk membuat font suara. Suara Neural Khusus menggunakan beberapa jaringan saraf dalam upaya untuk memastikan prosodi (nada dan durasi setiap fonem) dan pengucapan akurat. Itu membantu AI untuk meniru suara aktor dengan benar atau menggunakan suara sintetis yang terdengar realistis.

Beberapa perusahaan sudah menggunakan teknologi ini, termasuk AT&T dan Warner Bros. Mereka baru-baru ini memasang sistem di AT&T Experience Store di Dallas, tempat orang dapat berinteraksi dengan Bugs Bunny . Menggunakan kombinasi Suara Neural Khusus, augmented reality, dan 5G, Bug dapat mengobrol dengan pelanggan secara waktu nyata dan berkeliling toko untuk membantu mereka menemukan wortel emas yang tersembunyi.

Eric Bauza, aktor yang saat ini mengisi suara Bugs, merekam lebih dari 2.000 baris dan frasa dengan bantuan Microsoft untuk membuat font suara. Warner Bros. dan Microsoft bekerja sama untuk menciptakan suara khusus yang menyentuh kepribadian dan infleksi karakter. Duolingo juga telah menggunakan Suara Neural Khusus untuk membuat karakter unik guna membantu orang mempelajari bahasa baru, sementara Progressive memperdebatkan teknologi untuk chatbot Flo-nya.