近年、ビジネスのさまざまなシーンで統計学が使われるようになった。特に、人工知能の分野で注目されているのが「ベイズ統計学」だ。これは18世紀にイギリスの牧師トーマス・ベイズによって作られた統計学だが、なかなか応用される機会がなく、21世紀になりコンピューターの発展と共に一気に実用化が進んだ。インターネットの検索エンジンや迷惑メールフィルタ、AIによる自動運転、お客さんが商品を買う確率の予測、がん検査など、多くの分野で応用されている。冨島佑允氏の新著『東大・京大生が基礎として学ぶ 世界を変えたすごい数式』(朝日新聞出版)では、この「ベイズ統計学」について記されている。一部を抜粋、再編集し、紹介する。
* * *
事前確立と事後確率
迷惑メールフィルタにはベイズ統計学が応用されていて、「このメールが迷惑メールである確率は〇〇%である」というふうに分析結果を確率として出力します。このようにベイズ統計学では、分析した結果を確率として出力します。
ベイズ統計学は、新しいデータを学習することで今までの分析をアップデートしていくのが特徴です。ですので、新しいデータを読み込む前の分析結果(=確率)を「事前確率」、新しいデータを学習した後の分析結果(=確率)を「事後確率」と呼んで区別しています。