Desain Antarmuka Pengguna Suara (VUI) dengan ayunan penuh secara bertahap berubah menjadi maju dan populer hari ini. Asisten pribadi digital seperti Alexa Amazon, Siri Apple, Google Now, dan Cortana Microsoft, secara teratur berkembang menjadi asisten suara terbaik yang tersedia di pasar.
Sejak peluncuran Echo, perangkat asisten suara oleh Amazon pada Desember 2014, hingga saat ini sekitar 8,2 juta perangkat terjual, dan kembalinya pencarian suara terus meningkat. Laporan Tren Internet MindMeld 2016, statistik bahwa 60% orang tahun lalu mulai menggunakan penelusuran suara, dan dalam enam bulan terakhir 41% orang mulai.
Prediksi oleh penelitian BCC menegaskan bahwa pada tingkat pertumbuhan tahunan sebesar 12,1%, pasar global untuk teknologi pengenalan suara sebesar $ 104,4 miliar pada tahun 2016 akan meningkat menjadi $ 184,9 miliar pada tahun 2021.
Gelombang ini didorong oleh kemajuan teknologi dan pembelajaran mendalam, yang memungkinkan pengembang membangun sistem yang memiliki akurasi luar biasa untuk tugas-tugas seperti pengenalan ucapan, bahasa, dan analisis gambar.
Microsoft, pada tahun 2016 mengumumkan bahwa sistem pengenalan ucapan terbaru mencapai kesetaraan dengan transkrip manusia dalam mengidentifikasi ucapan manusia.
Kecepatan kemajuan teknologi suara mengubah cara kita berinteraksi dengan perangkat kita. Namun, beberapa metode desain UX yang umum masih dalam praktik – yang mencakup riset pengguna, pembuatan persona, alur pengguna, pembuatan prototipe, pengujian kegunaan, dan desain berulang – beberapa perbedaan untuk UI suara harus diperhatikan.
Jika Anda berencana untuk memulai proyek pertama desain antarmuka pengguna suara, di bawah ini adalah lima tip penting yang akan membantu Anda –
Percakapan – Berbicara vs mengetik
Sangat penting untuk memastikan bahwa UI suara mengenali ucapan alami dan harus menerima berbagai masukan.
Mengetik dan berbicara satu hal yang sama itu berbeda, daripada menggunakan sedikit kata kunci, menggunakan kalimat atau pertanyaan lengkap.
Visualisasikan hari Minggu pagi Anda, saat Anda mengetik “makan siang di sekitar” di ponsel. Daftar semua tempat yang relevan akan muncul di layar Anda. Tetapi, saat kami berkomunikasi dengan layanan suara, Anda akan cenderung bertanya dengan cara seperti, “Alexa, di mana tempat terbaik untuk makan siang di sekitar?”
Pastikan mesin mampu mengenali dan bereaksi terhadap ribuan perintah yang berbeda agar berhasil.
Jadikan pengenalan intuitif
Tidak ada yang suka mempelajari ratusan perintah untuk menjalankan tugas tertentu. Berhati-hatilah untuk tidak membuat sistem yang rumit, tidak ramah pengguna, dan membutuhkan terlalu banyak waktu untuk membiasakan diri.
Mesin harus mampu mengingat kita dan menjadi lebih produktif dengan setiap penggunaan.
Misalkan, Anda menanyakan arah perangkat Anda, yang seperti,
“Alexa, bisakah kamu memberiku petunjuk arah ke rumah.”
“Tentu, di mana rumahmu?”
“Kamu tahu di mana rumahku!”
“Maaf, Anda harus mengulanginya.”
Adegan ini menciptakan pengalaman mengecewakan bagi pengguna yang tidak memuaskan atau tidak berhasil.
Namun, jika sistem menyimpan informasi tentang alamat rumah Anda, segera daftar semua petunjuk arah akan disediakan. Mungkin respons suara singkat dengan elemen visual seperti peta dan petunjuk arah. Memberikan pengalaman seperti ini dengan cepat bermanfaat dan memuaskan. Desain yang intuitif, seperti GUI atau antarmuka pengguna grafis, harus dikerjakan dengan benar oleh para desainer.
Approachability – Analisis apa yang dibutuhkan pengguna
Dua hal penting yang membuat Interaksi Suara berhasil adalah perangkat yang mengenali orang yang berbicara, dan pembicara memahami perangkat. Para desainer harus selalu mengakui potensi pemeriksaan bicara, gangguan pendengaran, dan setiap elemen yang dapat mempengaruhi interaksi, seperti gangguan kecerdasan. Bahkan bahasa, aksen, atau nada suara memengaruhi cara perangkat menafsirkannya.
Sebagai seorang desainer, Anda harus cerdas tentang di mana dan bagaimana menggunakan desain dan suara dengan cara yang dapat digunakan oleh siapa saja, tidak relevan dengan cara mereka berbicara atau cara mereka mendengarkan.
Pertimbangkan lingkungan lingkungan pengguna
Mengatakan sesuatu di ponsel Anda dengan suara kereta yang keras dan sibuk di latar belakang adalah contohnya, mengapa perlu untuk mengenali bagaimana kondisi yang berbeda mempengaruhi jenis antarmuka yang Anda rancang. Jika aplikasi utama adalah untuk mengemudi, maka itu adalah pilihan yang sangat baik – tangan dan mata pengguna sibuk, tetapi suara dan telinga mereka tidak. Jika Anda menggunakan aplikasi di suatu tempat di tempat yang bising, lebih baik meminta pada antarmuka visual, karena kebisingan di sekitar membuat pengenalan dan pendengaran suara lebih menantang.
Jika kegunaan aplikasi Anda ada di rumah dan di angkutan umum, penting untuk menyediakan opsi untuk beralih antara suara dan antarmuka visual.
Umpan balik – interaksi dua sisi
Dalam percakapan normal, seseorang harus memberi tahu yang lain, bahwa dia tertarik pada percakapan dengan menganggukkan kepala, tersenyum, dan beberapa gerakan lainnya. Demikian pula, itu harus dikirimkan ke pengguna yang berinteraksi dengan mesin Anda. Sangat penting untuk menghargai ini dengan desain Anda, sehingga pengguna memahami perangkat mereka dihidupkan dan memperhatikan mereka.
Sistem harus selalu memberi tahu pengguna tentang apa yang terjadi. Selain itu, penting untuk memperhatikan bagaimana pengguna Anda akan memahami bahwa sistem sadar dengan cara non-invasif. Anda dapat menampilkannya dengan efek suara atau senter sesuai pilihan Anda.