@kazuhito
Kazuhito Kidachi's Personal Web Site Since 2000

デザイニング・ボイスユーザーインターフェース

買った時期で言えば『Voice User Interface設計』より先だったはずだけど、読み終えたのは遥かに遅かった、『デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則』について。オライリー本は買って読んでなかったのだけど、VUIに関する専門書が少ない状況下では、やはり読んでおきたい一冊でした。

本書を読んですぐAlexaスキルとかGoogle アシスタント対応アプリが作れるようになるかと言えば、そうではないです。VUIデザインにまつわる原理原則を包括的に取り扱った、ともすれば抽象度が若干高めにも映る内容なので、スキルなりアプリを急いで作らなきゃって向きに本書はオススメできないかなと。一方、VUIの基本的な考え方なりアプローチを学ぶには、良い本だと思いました。

優れたデザイナーなら誰でも知っているように、デザインは物事が正しく動く時のことだけを考えていてはいけない。うまくいかなかったときのためのデザインが必要だ。VUIでは常にどこかでエラーが起きているものなので、特に重要となる。

常に、って書かれると結構ビビりますが、まぁそういうものなのでしょうね。音声発話を取り扱うというのは、それだけハードルが(少なくとも現時点ではまだ)高くて、技術的にも過渡期なのだという理解を自分はしました。その辺りが将来こなれてきてもなお、エラーハンドリングの重要性が変わることはない、とは思いますけど。

同じ物を2種類の言葉で参照することを、共参照(または同一指示)と呼び、これは会話の本質的部分だ。これがないと会話はたちまち破綻する。

たちまち、とか書かれるとそこでまた微妙にビビるのですが、共参照という言葉を本書で初めて知りました。確かに、共参照が不可能な前提でコミュニケーションを考えると、言い回しがいちいち過剰で冗長になり、破綻しないまでもお互いストレスマッハになること請け合いです。会話の円滑さというのは、日常的に意識することはないけれど、共参照のおかげなのだということを認識しました。

VUIは一直線だ。ユーザーはアプリが言うと決めたことを全部聞かされ、飛ばすことはできない。だからこそ、音声は手短にまとめる必要がある。文はできるだけ短く、重要な要素に限定し、その中でもいちばん重要なものを最初に持ってくる。

飛ばすことはできない、というのはスクリーンリーダーによるWebコンテンツの読み上げを考えるときにも意識する部分ですね。Webコンテンツであればまだ、要素の種類であったりランドマーク、あるいはそれを目的としたリンクの存在によって行き来する手段を提供することは可能ではあるけれど、VUIは確かに一直線すぎる。VUIデザインにまつわる難しさの中ではトップクラスかもしれないと思いました。

VUIデザインの難題のひとつに、ユーザーにできることをどうやって教えるかという問題がある。

ウェイクワードの後のウェルカムメッセージのあとで、都度そういう「できること」を提示するのも煩わしいですし、確かに難題です。そこは将来的には、ユーザーの利用頻度だったり学習状況を検知して、提示の可否をシステム的に判断できるようにならないかなぁと期待をするのですけど、どうなるでしょうね。

現在地:ホーム > 覚え書き > 月別アーカイブ > 2019年1月 > デザイニング・ボイスユーザーインターフェース
Google カスタム検索を利用しています