ネットの閲覧履歴から性別を、画像から性別や人種を判定することは、AIには朝飯前だ。
だが、AIが依拠する膨大なデータ自体に思わぬバイアスが潜んでいるという。
* * *
どこもかしこもAIだらけだ。検索しない日はないし、レストランを調べた後は、広告が至るところに現れる。ネットで買い物をすれば「これもいかが?」と関連商品を薦められ、ツイッターを開けば、オーディエンス機能が自分のフォロワーの男女比や収入帯まで教えてくれる。顔写真からその人の性別や年齢を判定するアプリは複数存在し、いくつかの閲覧履歴から、男女をかなりの精度で判定することも難しくないらしい。さすがはAI、何やらスゴい進化を遂げている、気がする。
そもそもAIは、男性と女性をどうやって見分けているの?
人工知能や機械学習に詳しいヤフー データ&サイエンスソリューション統括本部の鎌田篤慎さんと、産業技術総合研究所の神嶌敏弘さんが、わかりやすく教えてくれた。
「現代のAIは、大量のデータに基づき強く特徴として現れている要素で見分け、データの統計的な傾向を元に分類しているだけです。身体的な特徴でも閲覧履歴などの行動様式でも、データは人間が与えたもの。AIが意思を持って判断しているわけではないんです」(鎌田さん)
どんなデータを人間が学習させるかは、AIの機能に大きな影響を及ぼすという。
さらに、AIにある程度の精度を確保するためには、与えるデータの量も重要だ。 数年前は、各社からリリースされていた顔認識ソフトの精度に、男女や人種間でかなりのバラつきがあると報告された。
「あるソフトでは、女性より男性のほうが個人を判定する精度が高い傾向がありましたし、白人よりダークスキンの人々の判定精度が低い傾向がありました」(神嶌さん)
つまり、AIは女性らしさより男性らしさを認識しやすい、ということ?