2020年のピューリッツアー賞の調査報道部門はニューヨーク・タイムズのタクシー免許の許認可に関する報道だった。〈600のインタビューと100以上の記録申請、大規模なデータ分析、銀行の内部記録や他の文書の検討〉(訴状より)で1年半をかけた調査報道だったが、ChatGPTは、中身をそのままパクって引用元を示さず、チャットのなかで披露してしまっていることをニューヨーク・タイムズは訴状のなかで指摘していた。
ニューヨーク・タイムズの記事を右側、ChatGPTの答えを左側にしたその訴状を最初に読んだときに、これは明らかな著作権の侵害だから、裁判は当然ニューヨーク・タイムズが勝つだろうと思っていた。
ところが、専門家に聞いてみると、タイムズの旗色のほうが悪いのだという。
というのは、アメリカの著作権法には、古くから「フェアユース」という考えかたがあり、ざっくり言って仮に著作物を無断で使っても、それが利益目的ではなく、社会の発展に役立つものであれば、許されるということらしいのだ。
OpenAI社は、著作権で守られたコンテンツと競争するようなチャットをChatGPTはつくらないとしている。つまり報道機関の利益を害しない、利益目的ではないという主張だ。
タイムズは、10月23日の記事で、OpenAIの元社員の告発を掲載している。
生成AIは、質問に対して、大規模言語モデルで学習した該当する答えを、・著作物のコピーを答えとして出す、・それとまったく違うものとして出す、の二通りが考えられるが、元社員は「OpenAIはその中間で生成AIを学習させていた」と記事で主張をしていた。つまり中間であれば、やはり報道機関の利益を害するだろう、ということなのだが、どれほどの読者が説得されただろうか。
著作権法第30条の4
さて、日本での状況はどうだろう?
日本の著作権法は、「フェアユース」を長年認めてこなかったのだが、日本でも、2018年に生成AIの進展を予想する形で、著作権法に第30条の4が加わった。
これは、「技術の開発又は実用化のための試験の用に供する場合」や「多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」場合において、著作物の利用が可能だとする条項だ。