2022-11-27

大塚凱 あるアルゴリズム選好者の覚書

あるアルゴリズム選好者の覚書

大塚凱


今週の週刊俳句に寄稿の依頼をいただいたのは、今年の3月に共著『AI研究者と俳人 人はなぜ俳句を詠むのか』(2022年, dZERO)を上梓したことも大きいのだろうと思います。他にどのような記事があるのかあまり存じ上げない上、何を書いてもいいとのご依頼だったので、このところ考えていることの覚書というようなニュアンスで心の赴くままに記していこうと思います。きっと他の方の記事の方が優れていたり気合が入っていたりすると思うので、私の方は特段無理には読んでいただきたいとは思っていませんが、特に私の活動に反感や違和感を抱いている方や、できるだけ無視している・興味がないという方には読んでいただけたら光栄です。


このところ、北海道大学 大学院情報科学研究院 調和系工学研究室のAI俳句研究の一部に参加していることのご縁でご依頼をいただくことがしばしばあるのですが、決して私のみが俳句関係者として関わっているという研究ではない、ということになかなか触れることができないでいました。この場を借りてこのプロジェクト自体が、これまでさまざまな俳句関係者に支えられて継続されている、ということを、改めてお礼と共に申し上げます。私の知る限りでも、愛媛大学の愛大俳句研究会、「itak」メンバーほか北海道の俳人、marukobo.comさん、その他各地の俳句イベントなどでの縁もあり、これまで研究が進展してきました。そもそも、学習の教師データとなっている俳句作品の数々自体、先行する俳人たちのものですし。
研究結果の還元として、調和系工学研究室ではAIにより生成された俳句のデータを閲覧することができるので、こちらに付記しておきます(https://ai-issa.jp/)。


さて、先日、京都大学の論文に関する記事(https://mainichi.jp/articles/20221102/k00/00m/040/234000c)が報道され、TwitterやFacebook上で観測する限り、俳句関係者の反応はおおかた否定的なものだったと記憶しています(まあ、そもそもネガティブでなければわざわざ取り沙汰することもないと思いますので、「おおかた」は既にバイアスのかかった把握には違いありません。)私はこちらの研究には全く関与していない上、報道があるまで存じ上げなかったのだけれど、せっかくなので論文(Hitsuwari, J., Ueda, Y., Yun, W., & Nomura, M,.(2022).Does human–AI collaboration lead to more creative art? Aesthetic evaluation of human-made and AI-generated haiku poetry. Computers in Human Behavior, 139)を読みました。ちなみに、本研究で用いられているAI俳句は前述の調和系工学研究室のAI俳句研究「AI一茶くん」からの提供です。以下は、私の理解するところによる論文の概要と、私の考えることです。統計的な操作や実験の設計自体に対しての議論は、俳句メディアに掲載するものとしては趣旨からそれますので、あくまで論文の示唆する研究の前提と結果に対して、私の考えたことの覚書とご理解ください。また、これはあくまで研究者ではない一俳句関係者としての私の個人的な考えであり、調和系工学研究室とは関連ありません。私の読解や学術的認識に誤りがある可能性があるので、お気づきの方はご指摘願います。
先行研究では、人間が作った絵画とAIが生成した絵画の識別が困難であるという一貫した結果が示されている。さらに、2018年のある研究では、参加者が美術専攻の場合にも識別が困難であることを明らかにした。興味深いことに、絵画の作者の区別ができない場合でも、好みや美しさを評価してもらうと、評価スコアが異なる。加えて、芸術における好みは、実際の作者ではなく、鑑賞者が誰を作者と信じているかに影響されるという研究もあった(=「帰属的作者」という概念)。

2021年の研究では、GPT-2による生成詩の領域で、人による選択を受けていないAI生成詩と、人が選択しているAI生成詩に関して、前者は人間がAIによる生成詩であると区別できたが、後者は区別できなかった。2022年の研究ではこれが追試されている。

一方で、AIアートの評価では「アルゴリズム嫌悪」(=AIを帰属的作者と意識した人間は、作品への評価を低下させる)という心理的特性が問題となる。

本研究の結果として、(実験に直接的に関与している俳句の非専門家であるという状況において)人が選択しているAI生成俳句の評価が有意に高く、人間の作った俳句=人の選択していないAI生成俳句の評価はそれより低く、かつ両者には有意な差がなかった。

鑑賞者は人の選択していないAI生成俳句と人間の作った俳句を区別できない上、人が選択しているAI生成俳句の帰属的作者を人間であると有意に認識していた。

人間の作った俳句を、正しく人間の作った俳句だと考えた鑑賞者が、作品に対して有意に評価を高くした訳ではない一方で、AI生成俳句をAIによる生成だと考えた鑑賞者は、作品を有意に低く評価していた。また、俳句の評価が高いほどAIによる生成だと感じる確率は低くなり、俳句の評価が高いほど人間の作った俳句であると感じる確率が高い。これは、人間のアルゴリズム嫌悪を示唆している。

前述の2021年の研究では、人間の作った詩が、人が選択しているAI生成詩・人の選択していないAI生成詩のいずれよりも高い評価を得ていたので、今回の研究とは矛盾する。これは、俳句の場合は明確に有季定型などのルールがあるため、AIによる学習がこれまでの研究よりも優れていた可能性があると指摘している。

さらに、俳句に使われている言葉が互いに矛盾しないかどうかという「一貫性」に注目した鑑賞者は、人間が作った俳句を人間が作ったと正しく回答した率(ヒット率)が高い。一方、「規則性」「意図性」に注目した参加者は、AIが生成した俳句に対して高いヒット率を示した。 AIが生成した俳句は、意味が一貫しておらず、理解しにくいものが散見された。そのため、規則性に注目することは、 人間が作った俳句を判別するためのツールとして機能した。 また、 先行研究によるとAIアートの鑑賞では規則性が認められることが多く、意図性の有無はAIアート研究の主要テーマの一つである。これらの要因とAIアート検出の関係は指摘されているものの、実証されてはいない。本研究は、これをデータとして初めて示したという。
少なくとも現状のAI俳句においては、2018年の絵画での研究と異なり、”十分に発達した俳句専門家”であれば容易に識別できる確率が高いでしょう。(”十分に発達した俳句専門家”って誰だよ、というツッコミはさておき)。ただし、冒頭の拙著や『人工知能が俳句を詠む―AI一茶くんの挑戦―』(川村秀憲・山下倫央・横山想一郎共著、2021年、オーム社)の巻末で実際に私が選句を行っているAI俳句、つまり(僭越ながら)「”十分に発達した俳句専門家”が選択しているAI生成俳句」であれば、少なくとも人間がAIによる生成詩であると区別することは既に困難であるということは言えるのではないでしょうか。他方で、人による選択を受けていないAI生成俳句を、鑑賞者がAI生成俳句だと区別できない状況には、AI俳句生成の力の更なる発展が不可欠であると感じています。

今回の俳句関係者による否定的な反応の一部は、AIが俳句を生成するという営みそのものに対してというよりは、「非専門家が選択したAI生成詩と人間が作った詩を、非専門家は区別できない」というジャンル内部の人間からすれば当然の帰結が、真にメッセージを持たないのではないか、という違和感によるものだったのだろうと思います。(もちろん、人工知能領域の学術研究としてはそれを対照実験の手続に基づいてきちんと明らかにすること自体に意味があると私は考えます。)

先行研究に反して、人が選択しているAI生成俳句の評価が、人間の作った俳句の評価よりも高かったという結果も、ネガティブな反応を引き起こした一因だったかもしれません。(非専門家は専門家よりも非専門家同士の感覚の方に親和する、というのは直感的に考えられうる経路であり、今回の結果に関してはそれが反映されている可能性があります。)

確かに、これはあくまで非専門家による比較評価であり俳句の品質の絶対評価を行なっているものではなく、厳密には俳句の評価を行えていないのではないかということは指摘されるべきかと思います。また、非専門家による今回の結果と経験者・専門家による結果はまた大きく異なる可能性があり、その結果と対照することで俳句に関わる経験や知識、専門性がむしろ計測できる可能性があるということではないか、と個人的には感じています。

それなりのサンプル量を形成して統制された環境下で実験を行う必要性から、今回の研究ではCrowdworksで募集した385人による鑑賞を実施しています。ゼロベースから俳句専門家による多量の鑑賞データを集めることも難しいでしょうから、これは現実的な妥協点にも思えます。逆に言えば、より研究を進展させられる余地が残されているということも意味しているでしょう。

一方で、今回の研究で私が最も面白いと感じたのはこの部分です。
人間の作った俳句を、正しく人間の作った俳句だと考えた鑑賞者が、作品に対して有意に評価を高くした訳ではない一方で、AI生成俳句をAIによる生成だと考えた鑑賞者は、作品を有意に低く評価していた。また、俳句の評価が高いほどAIによる生成だと感じる確率は低くなり、俳句の評価が高いほど人間の作った俳句であると感じる確率が高い。これは、人間のアルゴリズム嫌悪を示唆している。
皮肉にも、SNSで拝見した批判の一部には「アルゴリズム嫌悪」という本研究が指摘した旨味の部分を、自ら“実証”しているような言論も含まれている印象がありました。なお、アルゴリズム嫌悪という現象は倫理的に悪いとかそういう代物ではなく、そういう特性とわれわれ人間はすでに共にある、ということを認識しておくことが大事なのだと解釈しています。むしろその現象の存在を前提として、例えば、実装フェーズでアルゴリズム嫌悪に配慮したさまざまな動線やメカニズムの設計することが可能になるのでしょう。逆に、私自身は人工知能による駄句の方が人間の作った駄句に対してよりも評価が甘くなる「アルゴリズム選好」をしている可能性があるなと思いました。

さらに言えば、先行研究のこの部分もとても興味深いです。
興味深いことに、絵画の作者の区別ができない場合でも、好みや美しさを評価してもらうと、評価スコアが異なる。加えて、芸術における好みは、実際の作者ではなく、鑑賞者が誰を作者と信じているかに影響されるという研究もあった(=「帰属的作者」という概念)。
人間のもつ自覚的な意識と無意識の間に隔たりがあるということ、そして、人間がある認識を自覚することでその認識が強化されるということの示唆と解釈できるかもしれません。人間の自覚する意識が、ある側面では「アテにならない」にもかかわらず、その意思決定の責任を主体として負うことができる/負わなければならないという点で、人間というのは面白い存在です。


ミルグラムの「アイヒマン実験」の結果は「実験担当者からの指示という仕掛けによって悪事をなす主体者の責任者が曖昧になるほど、自制心や良心の機能は低下する」ということを示唆する点で人間のもつ自覚的な意識の危うさを論じる際に引き合いに出されることもありますが、この実験では、そばにいる複数の実験担当者の意見が食い違った場合には、主体者は全員実験を継続しなかった=悪事をなさなかったことも報告されています。自らの自制心や良心がほんの少しでもナッジされれば、人間はそれを自覚し、自らの行動を変えることができるという点で、私は、人間に希望を抱いてもいます。それが単純に「責任を負いたくない」という心の働きなのだとしたら、人間にそのような特性があると理解しておくのは、人間が共同体を営むことにおいて大きな助けになります。


 このところ思うのは、作品に比べて、俳句の選=評価や評価の方が、はるかに稀少なリソースであり、データとして十分に記録されづらいということです。その点で、私の関心は「俳句をどのように読むのか」ということを、俳句の読み手側がむしろ「俳句」という総体を集合的に規定するのではないか、という仮説に基づきます。


『AI研究者と俳人』での私の発言は読者論に終始した嫌いがありますので、「いかにして俳句を評価するか」「俳句をどう読むのか」ということから立ち返って、「なぜ俳句を書くのか」「どのような俳句を書くのか」という書き手サイドの論へと、進まなければならないと痛感しています。


『AI研究者と俳人』は、企画編集者の松戸さち子さんの方針に促される形で、意識的に「私個人の俳句観」に基づいて発言をしています。俳句の一般論を語ることを避けたため、その内容には異議のある方も大勢いらっしゃることだと思いますが、まあ、できるだけ最大公約数的に発言したところでまったく面白くなかったと思いますのでお許しください。松戸さんの設計のお陰で、良い方向に私の自制心の機能が低下したと感じています。(とはいえ、思い返すと「音数制約」と「季語システム」から俳句の読み方を立ち上げる論は、長谷川櫂「『季語』と『切れ』はオリジナル」(夏石番矢編『俳句百年の問い』,1995年,講談社,pp394-416.)に近い内容であったかと思いますので、必ずしも私固有の俳句観とも言えない一般性は帯びていると自負します。)

また、本書は川村教授との対談を文字起こししたものを主に編集して構成されました。いわば、口述筆記に近い形式です。そのため、ジャーゴンや比喩が多くやや難解な印象を与えてしまった面があるかと省みていますが、それも口述という独特の身体性を伴った形式による所為だと、私自身がゲラを手にして驚いたことでもありました。おそらく最初から書き言葉で執筆する形式であれば、あるいは対談だとしても往復書簡のような形式であれば、これほどまでに比喩で比喩を洗うような一連にはなっていなかったと思います。トークショーを聴いているくらいの密度で読み進めていただくのが、一番の「デコード処理」に違いありません。


トークショーで思い出しましたが、先日、人前でお話しする機会を得ました(「真空社:堂園昌彦氏・小川楓子氏・大塚凱氏・生駒大祐氏トークショー 〜AI俳句はなぜ『ことり』を作れないのか?〜」2022年10月9日に紀伊国屋書店新宿本店にて開催)。その場で「いま歳時記や辞書を用いることがドーピングだと見做されていないのであれば、人工知能の活用もドーピングとして嫌悪されない可能性が見出せる」という趣旨の発言を口走りましたが、これは不適切でした。正確には、むしろ「歳時記や辞書の存在は、書籍というテクノロジー/出版というコミュニケーションという、現代では所与となった環境によって俳諧成立の事後的に、俳句における先例や季語の本意、文法、語彙等を整理し、それをティピカルに強化する方向にフィードバックさせている張本人であり、そもそも現代俳句を形作っている」とまでいうべきであり、「ドーピング」という外部的なデバイスであるかのような表現は論理が転倒していました。人工知能というテクノロジー自体はまだ俳句において「外部デバイス的立ち位置」には違いありませんが、私の申し上げる「歳時記や辞書の存在は〜」という内容が人工知能による学習過程のアナロジーに基づく俳句観だとしたら、その俳句観はすでに理解可能な、内部的なものということができるのではないでしょうか(まあこれも、いささか構造主義的な把握にすぎるというか、前提となっている仮定が強すぎるというご指摘は甘受します。あるいは「人間が季語システムや学校古典文法に『疎外』されている」という比喩も可能なのでしょうか?)。


1950年頃の「天狼」には1949年の湯川秀樹ノーベル物理学賞受賞の影響と思しき、原子論と結びつけた俳論がしばしば取り沙汰されています。前述のあれこれが、原子論に触発された議論と同様に、ややもすると無理筋に突き進んでいく危うさを孕んでいるとは重々承知しつつ、そうならないように意識していきたいと思います。というか、そもそもなぜ自分が人工知能の俳句研究に関連して言論をしているのか、もはやわからなくなってきました。それを言い始めると、なんで自分が俳句を読み、書き続けているかも同様にわからないのですが。特にエンジニア出身で実際に人工知能研究に関わっている詩歌関係者もいらっしゃいますので、皆さんの考えをお聞きしたいなという、今日この頃です。


川村秀憲・大塚凱著『AI研究者と俳人 人はなぜ俳句を詠むのか』2022年3月/dZERO ≫amazon
川村秀憲・山下倫央・横山想一郎『人工知能が俳句を詠む―AI一茶くんの挑戦―』2021年/オーム社 ≫amazon

4 comments:

晴陽 さんのコメント...

AIに季語やスタイルといったパラメータを与えてプロトタイプとなる句を数百句作らせて、気に入ったものに自分で少し手を入れて、「これ私の句です」って発表するんでしょうか?それは、常識として認められないと思いますけどね。

晴陽 さんのコメント...

もう一つ問題があって、近い将来AI研究が進んで句会で点が取れるレベルの句を容易に作れるようになった時に、コンピュータリソースをつぎ込んでAIに数百億、数千億の句を作らせた人がそれらの句を誰でも見れるようにDB化してネット上に公開したら、それらの句って既発表の句になりますね。そうなった場合、我々が句を作った時にDBに似たような句があれば、類句ありとして発表できなくなります。これって誰も徳しませんよね?俳句というジャンルが成り立たなくなると思います。北大の先生はその辺りどう考えているのでしょう?

晴陽 さんのコメント...

譬え話をすると、我々が釣り堀で釣り大会をしていると、投網を使って魚を獲ろうとする人が現れた。大会に参加している釣り人からは、そりゃルール違反でしょうと声があがる。それにその投網で魚を獲り続けたら、釣り堀の魚を全部獲り尽くしてしまうんじゃないの?と。

晴陽 さんのコメント...

AI俳句については以下の記事が分かりやすいです。

フルポン村上の俳句修行・番外編 AIが作った俳句の価値は(座談会)
https://book.asahi.com/article/14458321

記事中で北大の山下さんは
・AIが作った1億句のデータベースが存在している
・将来的には句作に使えるツールにするのが目標
と述べています。1億句というと日本で1年間に作られる全句数がこれくらいのオーダーではないかと思います。今のところ句のレベルは玉石混交な状態だろうと思いますが、AIの進歩とCPUリソースを注ぎ込む事で秀句、佳句といったレベルの句が1億、10億、100億と作られる可能性が否定できません。それらの句が公開されて既出の句となってしまうと、非常に困るわけです。
AIを句作のツールにするというのは、句のアイデア出しや、人間が詠んだ句の推敲・バリエーションの派生に利用するというのが想像されるのですが、やはりそれは人間が自分の頭を使ってするべき事で、AIにさせてはいけないと思います。はっきり言ってこれは俳句というジャンルの危機だと思いますので、俳人協会などの各俳句団体は、句作におけるAIの利用に反対である、AIの利用は認めない、という旨の声明を出すべきではないかと思います。