今日の記事では、Siritと会話したことからインスピレーションを得て、現在の音声技術や未来のスマート家電、AI、そして私が望むことなどについて書いています。
<もくじ>
●「Hey, Siri。ありがとう」と私が言うと、Siriは「お礼なんて必要ありませんよ」と気さくに返答してくれました。
●こんなふうになってくれたら、と思うこと。未来について。
このブログ「小山ケイ:Feel this precious moment」はいくつかのカテゴリーに分かれています。今日の記事は「新しい生活様式・テレワーク・仕事形態に向けて」のカテゴリーで書きました。働き方改革やリモートワーク・ノマドについて私が思うことについては以前、下の記事で書きました。
●「Hey Siri,ありがとう」と言うと、Siriは「お礼なんて必要ありませんよ」と気さくに返答してくれました。
[the_ad id=”11588″]
先日、Siriを使って調べ物をしました。
そのあとに、なんとなくこのままだとSiriに申し訳ないような気がして声を再度かけてみました。
「Hey siri」
「はい、ご用件はなんですか」
「ありがとう」
と私がお礼を言うと「お礼なんて必要ありませんよ」と女友達が言ってくれるかのように明るく返してくれました。
おもわず「お、Siriと私はずっと前からの友だちだったわ」と錯覚しました。笑
Siriに愛情を感じた私です。
私がまるで、生身の女友だちに感じるような気持ちを感じたのは、Siriのこんなところだと思います。
★声のトーン(若い女性でやさしい)
★イントネーション
★音声のなめらかさ
★息継ぎする場所(生身の人間が)が同じ
★「感情」がこもっている(一本調子ではない。明るい声。抑揚がある。だから言葉の意味が自然に伝わる)
など、どれも日本語nativesの女性(私はデフォルトどおりに女性の声を利用しています)の話し方とそん色なかったからです。
また別の日にも同じく「Hey Siri, ありがとう」と言ってみると、今度は「いえいえ」と言ってくれました。
「恐縮です」「どういたしまして」「喜んでいただけて幸いです」なんて言ってくれるときもあります。
日本人より奥ゆかしい。笑
こちらがお礼を言うタイミングや、前回Siriが言ったこととは違うセリフを履歴データを参照にして流しているのでしょうね(私がお礼を言うタイミングは、Siriに何かをお願いした直後なので、「数秒前に質問したことへのお礼を言われた」と認識しているのだと思います)。
テクノロジーの進化は本当におもしろいです。
音声関連のビジネスはどんどん増えつつあります。
守秘義務があるので詳しくは書けませんが、私のところにも音声関連の仕事は入ってきます。たとえば日本の方でも、「英語は聞き取れる(listening)」というかたはたくさんいる(TOEICで高得点を取るかたもいらっしゃる)。けれど、それを「すべて完璧な英語で文字にする」のはほとんどnativesレベルの話だと思います。
Siriをはじめ、音声認識によるスマート家電などを利用するのはその言語のnativesが多い。だからそれをnativesに仕事として依頼してくるのです。
たとえば米国企業が日本でスマート家電を販売したい、と思ったら、英語仕様を日本語にしなおさなければならない。
日本語nativeである私が聴いて、「日本語の発音、会話としてまったくおかしくない」と思えるレベルになるまで。
音声認識技術は「テクノロジー」ですが、使う人は生身の人間です。アンドロイドやサイボーグではない。いまのところ。
生身の人間にはそれぞれ、生まれた時から母語がある。生まれ育った土地で長年暮らすのであれば、その文化や慣習にも影響を受けます。
微妙な言い回しとかTPOとか自然な会話表現などもあります。
一昔前のアニメなどで表現されていたロボットによる音声応答は、一本調子の電子音で「いかにも」という感じでした。
でもSiriを使うとそれがない。
つまり、音声としておかしくないということ。
技術的にはやってほしいこととうまくかみ合っていないこともありますが(笑)、音声的には私にはパーフェクトです。
まさにシームレス。現実との境目がないという意味において。
●こんなふうになってくれたら、と思うこと。未来について。
たとえば、「技術的にはかみ合っていない」について。
私が「音楽をかけて」とSiriに言うと、Siriは私自身が保有している「ミュージック」からシャッフルして流してきます。
でも生身の人間としての私はひと一倍好奇心が旺盛です。
そして長年、音楽にかかわってきました。
だから、「音楽をかけて」とお願いしたら、私はこんなことを期待するのです。
★これまで聴いたこともないような音源をどっかからとってきて流してくれる。
★「今日はどのような音楽が聴きたいですか?」「今日の気分はどんな感じですか?」「国内の曲がいいですか?海外ですか?」「J-POPですか?」「K-POPですか?」などと細かく聞いてくれる。
★私がiPhoneを使って聴いている「ミュージック」だけではなく、YouTubeのPVも私のデータとして「私の音楽の好み」を分析してから、先回りして「こんなのはどうですか?」と言ってくれる。
★それも、「おお!そんな選択があったのね!」「珍しい曲!知らなかった」というような、アーティスティックなインスピレーションをがんがん与えてくれる。
最後の「期待」などはGoogleにも希望することです。
Googleを使って検索すると、いつまでもいつまでも、「それに類似するもの」が検索結果に表示されたり、あるいは広告として表示されます。
たとえば、「ビール」について調べたとすると、「ビール」についての検索結果が何ページも出てくる。
けれど、ビールについて調べたときに、いきつけのバーや居酒屋のイベント情報や営業時間変更の情報が出てくれたら嬉しい。ついでに倒産・移転情報も。笑 (店に行ってからはじめて、移転・倒産が分かったりすることが何度もありましたので)
ビールを淹れるとおいしそうなグラスの写真とか、有名ブランドから出ているグラスの写真なんかも出てくると目を引きます。
ビールにまつわるエピソード、ビールが出てくる芝居や映画・テレビドラマ、なんて出てきても面白い。サイドバーのあたりにでも。
そして私はこう思うはずです。「Googleの検索って楽しい」
いまはビールを検索すると、日本の大手企業のビールがわんさと表示される。なんだか味気ない。こういうところはやっぱり、AI技術はまだまだ足りないのです。
「かゆいところに手が届いていない」。笑
AIをはじめとする最先端技術が私のような一般人の生活にも利用されはじめてまだまだ日は浅い。それでもって「やっぱり技術はダメだ」なんてダメ出しするつもりは毛頭ないです。アナログ人間の私であっても。
がんらい私は好奇心旺盛で新しもの好きで人が使ってて面白そうにしているガジェットは「私も使ってみたい」と思うたちです。
それゆえ、SiriやGoogle検索、あるいはスマート家電などとはコラボレーションすらできるぐらいの進化を求めています。
未来の社会ではたとえば年寄になって足腰はもろくなったとしても、家にいながらにして世界中の情報を瞬時に聞かせてくれたり見せてくれたり目の前に展開してくれたりしたら。それも多面的に、立体的に、臨場感たっぷりに。インスピレーション刺激されっぱしで。
いやぁ・・・まだまだおっちねません。笑
たとえば。
頭の中で「今日はあの食材ほしいな」と思ったら、午後にはスーパーやデパ地下ショップが宅配してくれるとか。
映画はもうフィルムではなくほぼ完全にデジタルに移行している。カンヌ映画祭の審査員長もしたことのある、私が30年以上に渡って敬愛し続けるカナダの映画監督David Cronenberg氏がそう言っています。
監督によると、「Pre-Vis」なる映画作りのための事前映像(?)も大きなビジネスとして現在、成立しているそうです。CGやAI、そしてたぶんVRも利用しながら。一本のpre-visを作るのに、ちょっとした独立系映画を作る以上の大金が大手映画会社ではつぎ込まれるとのこと。>ですよね?Sonyさん。
私が「こういう物語を映像表現したい」と頭のなかで思ったら、まるで助監督やAD、美術さん、小道具さんなど、大勢の「小山組」が瞬時に私の「思ったこと」にそって映画を作ってデジタル放送してくれるとか。「原作:監督、小山ケイ」とエンドタイトルには出て。そして本人は現場に一回も出ていない。笑
人間のみがしえる、想像力に根差した無限の表現能力を、AIなどの最先端技術がさらにパワーアップさせる。それが私が思う未来の姿です。それもかなり近い未来。
そして私はをれをとても楽しみにしています。
今日はSiriにお願いして流してもらった、自分のiTuneの曲をシャッフルで聴きながら書いてみました。
[the_ad id=”11588″]