「命令では、オープンAIがユーザーとデータ主体のデータを収集しながら、それについての情報が提供されていないことに注目している。さらに重要なのは、このプラットフォームの基盤であるアルゴリズムの『学習』のために大量の個人データを収集・処理していることについて、それを正当化できる法的根拠が見当たらないことだ」
チャットGPTは、その大規模言語モデル(LLM)のために、膨大なネット上のデータを学習させている。最新版のGPT-4については非公開だが、前身のGPT-3では、主な学習データ量は570ギガバイト(半角英数字で5700億字分)に上る。また、ユーザーがチャットGPTに入力した指示文(プロンプト)なども、一部の有料サービスを除き(※詳細は後述)、学習データに組み込まれる。オープンAIは、学習データに個人データが含まれる場合があることを認めており、可能な場合には個人データを削除する、としているが、詳細は不明だ。
同庁は、これらのデータの収集と処理を問題視した。オープンAIは4月5日、チャットGPTからの個人データ削除の取り組みなどを表明。しかしイタリア当局は12日、オープンAIに対して、データ処理に関する情報開示などの必要な措置を同月末までに取るよう指示した、と発表している。
イタリアによる一時停止命令のきっかけとなったのは、3月20日に発覚したチャットGPTの不具合だ。
他人のチャット履歴のタイトルが表示された、との報告がソーシャルメディア上に相次いで投稿された。さらにオープンAIによる調査の結果、同じ不具合によって、有料のチャットGPTプラスのユーザーの1.2%で、氏名、メールアドレス、住所、クレジットカード番号の下4桁と有効期限が、9時間にわたって他のユーザーに表示された可能性があった、という。
GDPR違反への制裁金は、最大で2000万ユーロ(約29億円)か前年度の世界の売上高の4%の、いずれか高いほうを科される。