本日の備忘録/Artificial Intelligence Helps Make Movies Speak Many Languages

 のっけが千葉真一なのにはびっくりしたけれど、それはさて措き、VOAが取り上げるくらいなのだから、もうとっくに知っているヒトは知っている話題なのかもしれないけれど、当方は初めて知った話ということでメモ。

 

 これらの技術があれば、声優不要、吹替にはAIさえあれば大丈夫ということになる。吹替音声がAIで合成可能なばかりではなく、吹替先の言語に合わせた口の動きを正確に映像化出来てしまう。となれば、これはもう使われないはずはない技術だということになる(んぢゃないかな)。

 イメージ部分に目を向ければ、「本日の備忘録/ディープフェイクとか」で触れたDeepFake、音声部分に関していえば「本日の降霊術2.0/声と顔」で取り上げたCoeFont、それぞれが洗練され、あとは統合され利用されるのを待つばかりというところなんだろうか。

 さらに、その気になりさえすれば「本日の備忘録/降霊術2.0、その後」でも触れた梅蘭芳美空ひばりのように、俳優そのものもAIで作り上げることも可能になってゆくのかもしれない。こうなるともう金さえあれば故人オールスターズ総出演俺様流完璧演出映画を作り上げることだって夢ではないってことになるのだろう。

 あとは各場面にふさわしい劇伴音楽を自動生成するAIプログラムの開発だってな具合なんだろうか*1。作曲家の誰それ風の作品ならすでに作成可能みたいだから、たとえば脚本と劇伴音楽の関係を学習させれば、それなりに合う音楽くらい、案外さっさと出来ちゃいやしないかしら。

 

 金があれば……で、本邦において最も金があるところの一つが行政府であるわけで、こうしたDeepFakeの進化版みたいなものがホイホイ使えるなんてなことになれば、「本日の備忘録/ディープフェイクとか」で触れたような問題は改めてクローズアップされることになるんだろうな。

 

 と、それはさておき、上のようなものを目にしてしまうと、同じように「AI」の語が見出しにあるこちらがずいぶんしょぼくれて見えてしまうのがなぁ。

 それにそもそもいつ頃のことだったか思い出せないのだけれど、ずいぶん昔、今世紀初頭といっていい時分(だったんぢゃないかなぁ)にも、以下のような坂本龍馬の声を再生すると称するプロジェクトみたいなのがあったのだった。

「AI」の語は登場しないが、たしか坂本龍馬の骨格その他から声を推定してモンタージュ・ヴォイスだかなんだかの手法で声を拵えたとかなんとかだったと思う。こちらの映像のほうが首まで動かしている分、原 敬のよりなにほどかリアルだといえばリアルだといえるかもしれない。原 敬のほうで用いられた「AI」というのはどんなものだったのだろうか、なんとなく気になって来ないでもない。口唇の動きが言葉に合っていないようにも見えるけれど、そのへんは原 敬といい勝負かもなぁ。

 

 結局のところ、そんなこんなで、かけられるお金の多寡がそこいらへんの差ってことなんだろうか。アメリカ映画の資本力なら、日本語吹替版も字幕版と同時公開なんちゅうこともホイホイやらかしちゃいかねんかもなぁ。そうなると、ハリウッドの世界映画支配の力はますますスゴいことになったりしちゃうんだろうか。う~ん。

 

 上のような映像技術とメタヴァースとVRとを組み合わせたものの遠い延長線上に聳えているAI-CITY、というようなボンヤリとしたイメージが浮かんでくる。浮かんでくるけれど、「延長線上」とするにはちょっと無理がありますかね。う~ん。

 それにしても板橋しゅうほう*2、もっと知名度が高くあって然るべき作家さんだと思うんだがなぁ。

 

*1: 音楽そのものの生成については、「本日の備忘録/バベルの仏塔」ビートルズ風作品の自動生成の例に触れたことがある。

*2:SYUFO - Wikipediaアイ・シティ - Wikipedia

尾骶骨の行方

20220330113509

所用の道すがら、2015年頃だったっけか。

 先日未明の夢。

 

 場所は町屋のときわ食堂か。店内の混み具合からすればたぶん夕刻。

――とうとう我が国で3例目の尾骶骨を持たない赤ん坊が生まれました」

 報道番組の中年のアナウンサーが、興奮を隠しきれない調子で、しかし、読み誤りのないようにということか、うつむき気味に原稿から目を離さず、いつもよりいくらか早く話すテレビ画面のようすに、店内の呑助たちの目も釘付けになっている。

――世界ではすでに24の事例が確認されており、この半年の間の急増ぶりに様々な原因解明の努力が進められております」

 化学物質によってもたらされた畸形であるとか人類進化の新局面であるとか、それぞれの専門分野に引き寄せた解説を試みる科学者たちへのインタヴュー、尻尾の痕跡という獣性の象徴が失われたことを通して人類がいよいよ神性を獲得したのだと断言する何とかいうカルトの教祖、あるいは無責任な放言を口にする元政治家やタレントのコメンテーターたちもいつの間にやら番組に参加して、報道番組は徐々にバラエティ番組に姿を変えてゆくようだ。しまいには『幼年期の終り』のラストを引き合いに、どういう理屈でだか「尾骶骨が消えたからと云って尻尾が生えてこない保証はない」というような与太を語る者まで現れる始末。

――バカげてるよね、慌てて考え出した答えなんて、当てにならないに決まっているよね。だいたいからにして……」

 狭いテーブルを共にしている*1、40代半ば過ぎと見えるスーツ姿の酔っ払いが酔っ払いらしからぬ醒めた意見を、誰にともなく独り言ちている。テーブルを共にしているのは他に僕以外いないのだから、ひょっとすると僕が話相手と目されているのかもしれないとは思うのだけれど、とくにこちらの返答を促すようすもない。

 たしかに番組に登場したあれこれは、いずれも話として陳腐であるかナンセンスであるかのどちらかであるような気もしたのだけれど、そういう見方も真理にたどり着けないおバカなヒトの営みとして無下にするものでもないのではないか、むしろ鼓舞するくらいのほうが、バカげた見方同士の淘汰に曝され磨きもかかり大したものに育っていかないとも限らない、とかなんとか、声に出さず考え始めたところで酔っぱらいが座った目つきでこちらを睨めつけ、「ちっ」と舌打ちし、

――バカが」

と一言呟いたのだった。まるでこちらの思考を読みでもしたようなタイミングだったものだから、こちらはたじろぎうろたえるばかり。

 

 そこから初めて男との遣り取りがあったような気もするのだけれど、以降の成り行きは何も記憶に残っていない。たぶん、大した揉事にはならなかったのではないかと思うのだが。

 

 どうということのない夢なのだけれど、見てからというもの何度となくその断片が思い出されて変な気分になる。というわけでお祓い的にまとめてメモしておく。

 それにしても「尾骶骨がなくなる」とはどういうことなのだろうか。脊椎下部の尾骶骨と呼ばれていた部分の骨がなくなり数が減ってしまうことなのだろうか。それとも、脊椎全体の骨の数は変わらないのだが、位置関係や形状が変化して、もはや尻尾の跡とは見えないものに成り果ててしまうことなのだろうか。

 なんてなことは、気にしてもまったく意味がないに違いないのだけれど。

 

 

*1: 共にしていたと思うのだけれど、位置関係がよくわからない。正確に思い出そうとしてみると、実はそのテーブルに僕はついておらず、天井にでもへばりついて鳥瞰的に店内を見渡していたような気もする。

本日のギターメモ/傾向と対策

 4月27日あたり、viewsが2000を突破したみたい。公開が昨年5月18日。一年にちょっと足りない期間でこれだけの再生回数に達するとは思ってもみなかったところ*1。誠に感謝の念に堪えませんですm(_ _)m。

 しかしながら、再生回数の伸びはいいとして、いかにも万年入門者という、この編曲と演奏では高望みは出来ないというあたりもとより承知ではございますが、再生回数に比して、再生ページ*2再生画面下の親指がわずか6つ*3しか上がっていないのは切ないところ。一応確認したところ、内緒になっている指下げ(DISLIKE)は現在に至るまで一つもないのだけれど。

 

 あ、そうそう、このカヴァーへのコメントも一つ賜ったのだった。再生ページの閉じているコメント欄ではもちろんなくて、「neanderthal yabuki - prelude for a small fake」(YouTube)のコメント欄。あっちのコメント欄が使えないからこっちに書くよ、という、なんと海外からのもの。《Your work on this cover is just totally insane and I love it. Trying my best to recommand your channel to friends because you deserve it !》だそうで、宣伝係も務めてくださって、しかもコメント全体としても褒めてくれているように読めなくはないけれど*4……とはいえ、なにしろ《Your work on this cover is just totally insane》なんだからなぁ\(^o^)/。

 

傾向と対策

 こうした傾向を解釈するとどうなるか?

 「カイエ」、もしくはそれに「ギター」「アコースティックギター」を加えたキーワードでYouTube検索して僕のカヴァーにたどり着くヒトはそこそこいらっしゃるのだが、期待に応えてくれるようなアレンジ、演奏ではなかった、というあたりか。たしかに、YouTubeで公開されている「カバー」の作られ方に耳を傾けていると、出来るだけ原曲アレンジに近しいものを、と考える傾向が強いみたい。「カイエ」のカヴァーに関しても、ピアノによる演奏だったりボーカロイドを使った打ち込みだったり、音色の選択はいろいろあっても、音の構成に関しては原曲アレンジに忠実なものになっている。ところが当方のものは、「本日のギターメモ/大貫妙子「カイエ」カヴァーの試み 」に書いた通り、《原曲アレンジへの配慮はほぼない》のだから、タイトルから原曲に忠実なアレンジを期待してアクセスしたのだけれど聴いてみたらば勝手なアレンジ、がっかり失望したリスナーさんも多かったんだろうなぁ。せっかくのご期待、裏切ってすみませんm(_ _)m。

 以上のように考えてみると、だいたい次のような対策を考えることが出来るだろう。

「カイエ」のアコースティックギターによるカヴァーには、たぶんそれなりの潜在需要があると思われる。YouTube上では無名である僕の、ヘッタクソなアレンジと演奏でも1年足らずで2000を超えるviewsを稼いだからだ。数としては少ないようにも見えるけれど、ヒット曲とは云えないインストもののカヴァーであることを考えると「それなり」という形容をした上でなら、結構な数なんぢゃないか。

 したがって、大貫妙子「カイエ」は、カヴァーの選曲として結構いい線を行っていたのだといえそう。

 しかし一方で、原曲に忠実なアレンジではないために*5、充分な評価は得られていないみたいだ。とすれば、原曲にいくらかなりとも忠実なアレンジを心がければ、アクセス評価共々、まだ数は増やせるんぢゃないかと考えられる。原曲に忠実なギター向けアレンジとなると、万年入門者レヴェルの演奏しか出来ない僕の手に余る。でも、昨今のお若い方たちの腕前からするとイイ線を行くレヴェルのものが出て来てもおかしくないだろう。そういうカヴァーなら、チャレンジする値打はあるんぢゃないだろうか。というか、そういうギター・ソロ、聴いてみたいよね。

 

 関係ないけれど、まぁ、そんなこんなで2000突破の(?)翌日、うっかり迂闊にもまた歳を喰ってしまいましたとさ\(^o^)/

 

 

立ち読み課題図書、その他

 どちらもお仕事ネタでございますが。

 

 といって、放置人生というわけにも参りませんがぁ。

 

*1: 謙遜ではない。YouTubeでの公開作中、500を超える再生回数のものは他にないんだもんね\(^o^)/。このカヴァーが最新公開作なのにぃ。うー。

*2: 埋め込みヴィデオの下にあるリンク先。

*3: しかも、うち1つは自分で上げたものだからして^^;、実質5つ。

*4: いやいや、「友人に勧めて、みんなで寄ってたかって馬鹿にしちゃうぞ」という可能性は否定しきれないのだがぁ\(^o^)/。

*5: もちろん、忠実であるかどうか以前に、音楽として編曲のあり方はどうなのよ、というあたりも、実は要検討なのかも。この路線でももっと洗練されたアレンジであったなら、いくらかマシな評価は受けられたかもしれない。でも、そういうアレンジを考えるのは、まずもって面倒臭そうだし、そもそもそこいらへん、自分で客観的に再検討するだけの力量に欠けるので今は措くしかない\(^o^)/。

本日の備忘録/Big Brother(s)

 4月27日公開。改めてスゴいなと思う。200億ものデータからして、80億の世界人口を凌駕しちゃってるもんね。もちろん、重複もあってのことだろうし、重複があればこそ一定程度の精度も期待できるのだろうけれど、それにしても、ぢゃないかしらねぇ。

 

 と、今さらのようにビビっちゃう顔認証技術は、BBCの日本語版記事に限ってみても気になる話が他にもそこそこ並んでいる。

 これらから、雑かもしれないけれどサクッと導き出される注意点はまず2つ。

 第一に、顔認識の技術そのものが優れているとしても、それを扱う権力、組織、ヒトの、すべてことごとくが清廉潔白で何らの欲望も野心も持たない世の安寧だけを望む聖人君子ばかりだという保証がない点。公務員の不祥事の類は、日常茶飯事だとまでは云わないまでも、珍しいものだともいえないだろう。そのあたりは google:職員 不正閲覧  不正アクセスとかテケトーなキーワードでググってみればわかる*1。戸籍を不正閲覧したり診療情報に不正アクセスしたりする人間ならば、興味関心の対象となる個人を顔認証システムで追跡しようと考えることもじゅうぶんあるだろう。運営当初は大丈夫でも、運営が長期に及ぶに連れ、問題となる行動をとる組織、人物も必ず出て来る。だってにんげんだものってやつだ。だから、《これが検索に使われるのは犯罪発生後だけです》とは云い切れるわけがない。犯罪発生前からというか、それ自身、犯罪の一部として使用が開始されることもあり得ない話ではない。

 第二に、AIやコンピュータによる判断は公正公平なものであるという保証などありはしない点。「AI」や「コンピュータ」という言葉には、偏見や情実のような人間的な判断に割り込んでくる不公正を排除した、機械ならではの冷静沈着な客観的判断を期待させるところがある。しかし、実際にそれらに判断させるための学習の過程にはヒト同様の偏りが持ち込まれてしまう危険は排除できない。なにしろヒトによる判断の集積を学習素材とする以上、たとえば、「本日の備忘録/On AI: Are machines learning to be racist?」で触れたように《深層学習型の人工知能となると、すでにあるデータから判断の方法を生み出すことになる。採用人事に当たるAIの開発には過去の採用時のデータが用いられる。となれば、元々データに潜むヒト由来のバイアスは排し得ない》というわけだ。ステータスを示す徴表や、皮膚の色、服装のために、しかじかの怪しい場所には寄り付かないはずだといったような先入観が働いて、顔検索の正しい発見判定がなされないといったようなケースも想像される。

 こうなってくると、犯罪の解決や死体の身元確認に便利だから、というだけで、ホイホイ使われることには抵抗を覚える。なにがしかの制限や規制と不正に使用した者への厳しい懲罰制度が必要だと思える。

 

 さらに気になるのは、ひょっとすると日本なんかでもヴィデオのものと同水準の技術がすでに用いられていないとも限らないことだ。たとえば、今年1月の所謂google:池袋82歳パパ活殺人事件のことを思い出してみるといい。といってもここで目を向けたいのは、事件そのものではなく、容疑者たち3人が一晩で逮捕されるに至ったことである。容疑者たちは、本格的に逃亡を図るより前、JR西八王子駅(だったっけか?)を出たところで逮捕されている。事件後、カラオケボックスに籠もっていたこと、中央線を利用して逃亡しようとしていたことや降車するであろう駅が、警察にはおそらくほとんどお見通しだったわけだ。

 警察の捜査手法についてはまったくの素人だから、実際に何が行われて逮捕に至ったかはわからない。けれど、冒頭のヴィデオで示されたような技術が用いられていたとすれば、こうした素早い容疑者特定と追跡、逮捕がきわめて容易に行われ得ただろうと妄想することは出来る。

 ホテル内の防犯カメラ、街中の防犯カメラ、JR駅構内の監視カメラがあっても、それらカメラの映像単独では容疑者特定は出来ないだろう。たとえば、何らかの顔写真のデータベースみたいなものとカメラ映像を素早く照合し、容疑者を特定して、逃亡先を割り出す作業が必要になる。防犯カメラ映像とデータベースの映像との高速な照会となると、冒頭のヴィデオに登場したようなシステムが使われていたとすれば……ってなことをついつい考えてしまう。

 なんてなことを真剣に考え出すと陰謀論入門ってな感じになっちゃいますかね\(^o^)/。

 

 もちろん、素人には思いもよらないような人手による照合手法が伝統的に確立されているなんてことだって、案外ありそうな気がしないでもないし、もしそうだったら上のような妄想は、警視庁さまごめんなさいm(_ _)mですわね\(^o^)/

 

立ち読み課題図書、その他

 情報収集をサボりっぱなしなのでよくは知らないのだけれど、ネットを眺めているかぎりでは井草聖二、かなり人気が出て来たように見える。音源付き教則本/譜面集、気になるところ。5月23日発売予定とのこと。

 

 《一時的に在庫切れ/できるだけ早急に入荷できるよう努めております》とのこと。めずらしいご挨拶。しかしなぁ、カスタマレヴュー、ヒドいのが結構上位に上がってきているなぁ。「どうして」の理由に応える記述がないとかなんとか。そうだとなれば、修辞疑問文ではないかという発想がないんだろうか。それとも、わかっていても出版社の名前からあらぬ反感でも覚えてケチを無理やり案出でもしたのだろうか。

 

 全然知らなかったのだけれど、西村賢太発掘モノなのだそうな。紙の文庫はすでにマーケットプレイスものしかない。まだ書店で並んでいるかな?

 

*1: 実際にググってみたら、思っていた以上にその手の話って転がっているのね。率直にいって驚いた\(^o^)/