本日の備忘録/ロボットにとって顔とは何か?

 16日公開。Promobot社が3Dモデリングによるハイパーリアルなヒューマノイドロボット開発のための部門を設けたとかなんとか。海外へも売り込みをかける予定みたいだから、そのうち「ハイパーリアルな」外装を装着したロボットに出喰わすことも出て来るんだろうか*1

 頭部だけでなく全身の外装開発にも着手するみたいなことも研究開発者氏は云っているのだけれど、そういうことであれば、本邦のオリエント工業*2にだって大いに商機はありそうだが、というような与太はさておき……*3

 しかし、外装そのものがいかに精緻なものであろうと、精緻に見合った繊細なコントロールが現在の技術でできるのかどうか、素人目からするといささか覚束ないように思える。柔らかい外装を動かない状態で眺めているぶんにはたしかにリアルなのだが、外装部分をコントロールするメカニズムのほうは、現状、必ずしもそのリアルに見合ったものになっていないのではないか。

 このあたりはたとえば、ハンソン・ロボティクス社のソフィアの映像をあれこれ見比べてみるといい*4。ソフィアは比較的ヒトに近しく柔らかい顔面部の外装を備えたロボットである。しかし、柔らかい素材の歪み方のせいもあってか、表情として不自然、あるいは表情として解釈しようとすると、実際にはそのような意図はないに違いない何やら複雑怪奇なニュアンスが表現されているようにも見えてくる。おそらくデザイン的には『エクス・マキナ』のアイヴァ(AVA)に影響を与えているのだろうけれど、ソフィアの表情のはとてもヒトが実演しているアイヴァに及ぶものではない。

 そういう現状を見るかぎり、柔らかくリアルな顔面はロボットにふさわしいものになっていないと云えるように思う。家庭内でのAIとのコミュニケーションにとってノイズとなりそうな要因が多いからである。家庭内でAIに求められるであろうコミュニケーションの質を考えた場合、ヒトとヒトの間で求められるような複雑なニュアンスを帯びた顔面表現は不要であって、ヒトの顔面への過度の類似は、余計なものだと見ておくほうが、少なくとも当面の間は無難ではないだろうか。

 たしかに精緻な人間的表情を実現しようとすれば、冒頭のヴィデオのようなヒトの顔面を写実的に扱う頭部こそ適切な選択であるように思えなくもない。ただし、精緻な外装がその効能を発揮できるのは、表情筋の細やかな動きによって外装をコントロールし得る場合に限られる。ヒトが表情を変化させる場合と異なり、外装に余計なシワやたるみが生じることもあれば、外装の装着具合によって「人相」が微妙に変化してしまうことだってある。結果として、リアルに作られた顔面では、表情に余計なニュアンスが生じてしまったり不自然な表情に見えたりしてしまう。そういう表情で「人類ぶっ壊す」的な発言をすれば、気味が悪いぜってことになっちゃうしかない。

 最後の表情は僕にはずいぶん不気味なものと感じられるがどうか。

 一見精緻でリアルな顔面が表現されるべき内容以外のノイズみたいなものをうっかり表現してしまうのに対して、以下のような表情の表現は、リアルではないものの表現されて然るべき内容に概ねふさわしい形を与えるものになっているんぢゃないだろうか。

 16日公開*5。少々以前に小型版が話題になった製品*6の実物大モデルみたいなの。小型版同様、実際のロボットではなくヒトとコミュニケートするのは、立体的な映像になる。

 ちょっとおもしろいなと思ったのが、以下のような記号の登場だ。

20210318021920

キャラクタの頭上、小さな驚きや気づきを表す記号に注目

 キャラクタがマンガ/アニメ的なものであるばかりではなく、キャラクタ以外の空間にマンガ的な記号表現が添えられている。その結果、表情の精緻で微細な変化に頼らずに来客への気づきがわかりやすく表現されている。マンガに登場する記号表現には、すでに蓄積された伝統とでもいえそうなものが存在する。それを利用すればディスプレイにユーザに伝えるべき表情がもたらす情報は、柔らかくリアルな外装を用いた表情表現以上に的確なものになるのではないか。外装をコントロールする技術を改めて開発する必要がない点は、さしあたり大きなアドバンテージになるんぢゃないか。そんなふうに見える。

 もちろん、ディスプレイに浮かび上がる映像そのものは外界に直接働きかけることはできない。したがって、ロボット部分とディスプレイ部分をどう組み合わせるのかという問題は残る。しかし、頭部部分のディスプレイだけロボットに組み込む程度のことなら比較的簡単に実現できるように素人目には見えるし、あるいはマジンガーZガンダムのようにロボットに乗り込んで操縦するというような設定でロボット部分とディスプレイ部分を組み合わせるといった形のようなデザインを考えることはさほど難しくはないようにも見える。

 そのあたりの詳細はさておくとしても、マンガ/アニメ的な表現は有意義であるように思える。絵についてはいうまでもなく、周辺の記号的な表現においても、マンガ表現にはすでに歴史的な蓄積がある。したがって、映像と記号の2つを介した表現は、より高度で誤解の少ない情報伝達に用い得る可能性がある。わざわざ現実のヒトの表情を解析し立体的な構造物を作動させ、的確に柔らかい外装をコントロールして然るべき現実的な表情を実現するよりも遥かに効率も良いのではないか。というかまぁ、そのほうが何となく愉しそうぢゃないか。

 そうぢゃないですかねぇ、そうでもないですかねぇ。うーん(´-`).。oO

 

ふろく

 当初、何となく使えそうかなと思っていたのだけれど、使わずじまいになっちゃったアレコレを以下に。

 何となくAIとヒトとの関係って、ディスプレイやスピーカとマイクやキーボードを使ったコミュニケーションだけでは不足があるというか気持ちの良いものにはならないんぢゃないかという素人臭い気分くらいはご理解いただけるんぢゃないかと甘えたことを考えている。

 2011年のTED講演。ロボットとヒトとがどう情報を遣り取りするかを考えることは、AIとの協調作業、あるいは隔てられたヒト同士の情報の遣り取りが求められるような時代には重要な課題になってくるとこいらへん。

 気になるのは、ロボットの信頼性が確保されるのにどの程度のロボットらしさが必要なのかというあたり。上の講演では、コンピュータとロボットの違いを自明のものとして扱っているけれど、ロボットと云ってもスマートスピーカ程度のものやMebotのようなものから、Boston Dynamics社のAtlasみたいなもの*7まで、現状でもピンきりだろう。スマートスピーカ程度であれば、言葉を発せられるようにしたノートパソコンとの差は小さいだろう。どの程度発話するPCから離れたとき、ヒトから得られる親しみや信頼は意味あるだけのものになるのかは大いに気になるところぢゃないか。

 Cynthia Breazealは、この講演の後しばらくして、世界初(という触れ込みの)Social RobotだったっけかFamily RobotだったっけかであるJibo*8というロボットの開発に取り組むことになる。クラウドファンディングで目標額の2倍を超える4億円もの資金調達を達成したこともあって、当初は大きな話題を呼んだので、閲覧諸賢の中には御記憶の方もいらっしゃるだろう。

 今日の目で見れば、スマートスピーカに表情表現と映像情報を表示するディスプレイと、移動機能に若干のその他の動作を装備しているに過ぎないというふうにも見える。けれど、先のTED講演を見た後なら、あまり精緻なロボットのメカニズムを用いずに最低限のロボット的な愛着を引き出すデザインが施されていると見えもするだろう。

 たとえばこのディスプレイ部分にGateboxの表情表現(頭部+記号)が表示されるようなロボットはどうだろうか? Jiboよりも感情移入しやすいロボットになったろうか、ならなかったろうか。

 2010年代半ばから後半、Jiboを中途半端に模倣したと思えるロボットって結構出てきていたのだけれど、表情部分に本格的な考察をめぐらしたと思えるものってなかったよなぁ。うーん。個人的にはJiboの表情表現って、かなりカッコいいし実用的なもの足り得ているんぢゃないかと思うんだがなぁ*10

 今月23日に公開された映像。Jiboとの影響関係は知らないけれど、コンセプトくらいには受け継がれたものがあってもおかしくないように感じられる。Jiboをスマートフォンの代わりに組み込んだMebotみたいな感じ? ただし、表情表現がまったく違う。どういう形でこういう表現が選ばれるようになったのか、気にならないでもない。

 2018年。チャンネルは慶應義塾大学だけれど、岡田美智男は豊橋科学技術大学。Cynthia Breazealとはずいぶん異なった視角からの議論が興味深い。ずいぶん異なって見える一方で、「ヒトらしさ」を引き算で考えるというアプローチは、Jiboのデザインと重なって見えなくもない。講演の中でもスマートスピーカへの言及があったりするしぃ。

 マンガに似たような表情表現としては、こちらのようなタイプが最もポピュラーであるかもしれない。これは「Sawyer - The Smart, Collaborative Robot from Rethink Robotics」(Rethink Robotics GmbH、YouTube)をご覧になればおわかりいただけるように産業用ロボットなんかに利用されているケースも多いタイプ。他に上下方向以外にも眉毛が動いたり、口も描かれていたりするようなものもある。ただし、意外なことに(と思えるのだけれど、そうでもないですかね?)こうしたタイプの表情表現ではマンガ的記号表現が併用されることは少ないみたいだ。なんでだろう? また、マンガ的な表現としても垢抜けない印象がある。どうしてこのようないかにも洗練の足りないデザインが選ばれたのだろう?

 自閉症児に社会性を教育するのに効果をあげているとか何とかが話題になったロボカインド・ロボティクス(Robokind Robotics)のロボット。5、6年くらい以前、話題になった折に見たCNNの映像がショッキングなものだった*12。ヒトによる指導をテンで受け付けなかった子どもが、ロボットを交えた指導だとみるみる関心を持って来る様子はちょっと俄には信じがたいものだったんだけれど。上は柔らかい外装が実現している表情表現が割とお粗末である例になるかも、と思って選んだヤツ。

 コンピュータよりロボットのほうに親しみを覚えるというのは理解できる(ような気がする)出来事ではある。しかし、ヒト以上にロボットに対して心を開くとはどういうことか?

 

 柔らかい外装を用いた表情表現も、そのコントロール技術が洗練されればずいぶん利用範囲は広がるに違いない。たとえば、表情のコントロールがプレイの面白さにとって重要な意味を持つ(んぢゃないですかね?)ポーカーや麻雀のようなゲーム用ロボットならば、ヒト的に見て精緻な表情コントロールがあっていいはず。所謂「ポーカー・フェイス」ばかりでなく、初心者相手の場合には自分の手牌のまずさに思わず顔をしかめるようなロボットだって求められるだろう。Jiboのような単純な表情表現はまったく不向きだということになりもする。ただし、そういうあたりの細かな検討が必要になるほど、現在の表情コントロールの技術は高くないように見える。もちろん、そのへんは門外漢素人であるこちらの勉強不足、無知による間違いだということだってありそうだけれど\(^o^)/

 大体からにして、こういうことを僕が考えてみたところで何の意味もないんだからなぁ\(^o^)/\(^o^)/

 

 『口ごもるコンピュータ』、マケプレものしかないみたいだけれど。こういうの、さっさと電子書籍化しちゃえばいいのにぃ。共立出版なんだしぃ。

 

おバカな答えもAIしてる 人工知能はどうやって学習しているのか?

おバカな答えもAIしてる 人工知能はどうやって学習しているのか?

 

 

*1: 「'Attractive' robots designed using realistic human attributes」(BBC News、YouTube)によると、《The hyper-realistic humanoid robots are scheduled for mass production by the end of the year, with the aim of using them in retail or care environments》とのことだから、うっかりすると年内にも目にできる可能性があるわけか。へぇ~。

*2: リンク先はウィキp。オフィシャル・サイトの閲覧はそちらを経由されたし。

*3: ただし、「2010年には歯学部生の訓練用としてテムザックと昭和大学歯学部が共同開発した患者ロボット『昭和花子』の軟部組織再現に技術協力するなど、ラブドール以外の分野にも進出を始めている」(ウィキp)などという話もあって、まんざら与太話とばかりは云えないのかも。

*4:cf. 「sophia robot」によるYouTubeでの検索結果

*5: 書き終えるまで忘れていたのだけれど、8日に日本語版「Gatebox Grande - 大型キャラクター召喚装置 - PV『未来のおもてなし』」(Gatebox、YouTube)が公開されていたのだった\(^o^)/

*6:cf. 「Gatebox -プロモーションムービー 『おかえり』」(Gatebox、YouTube) 

*7:「Do You Love Me?」(Boston Dynamics、YouTube

*8: リンク先はオフィシャルサイト。でも、PCからだと閲覧できるコンテンツはもはやなくなっちゃったみたい。うーん。

*9: 「Jibo videos」、名前はオフィシャルっぽいのだけれど、ひょっとすると野良アカウントさん。オフィシャルのチャンネルは、すでになくなっている模様。

*10: 製品化されたのだけれど、結構高い値段と開発の遅れ、開発キットも出なかったことなどが原因になってポシャっちゃったとかなんとか。NTTが開発会社を買収したように仄聞しているのだけれど、その後どうなったのかは知らない。どうなっちゃったのかしらね?

*11: 講演のほう、いささか長くて見ていられないという向きには、「“弱いロボット”が育む優しい心【SDGs 2030年の世界へ】」(TBS NEWS、YouTube、2021年)「頼りないロボット、実は最強!?」(中日新聞デジタル編集部、YouTube、2020年)など参照されたし。あと講演の後半で紹介される『口ごもるコンピュータ』(共立出版)は名著。

*12: ので、そいつを取り上げようと思ったのだけれど、軽く検索した範囲では見当たらなかった。