AERA 2020年11月30日号より
AERA 2020年11月30日号より
この記事の写真をすべて見る
AERA 2020年11月30日号より
AERA 2020年11月30日号より

 テレワークやオンライン会議の広がりを背景に、AI(人工知能)による自動文字起こしサービスが進化している。これまでは精度に不安があったが、ユーザーからは「ついに使えるものが出てきた」との声があがっている。AERA 2020年11月30日号では、進化する文字起こしサービスを取り上げた。

【AIによる音声文字起こしサービスはコチラ】

*  *  *

 新しいテクノロジーはまずは試してみるのがモットーの複業研究家、西村創一朗さん(32)は9月初め、スマホ画面に釘付けになった。

「これはすごい。すごすぎる」

 Zoomで行った60分の講座を収録した音声を、文字起こしサービス「Rimo Voice」で読み込むと、約5分でテキスト化された。速さに加え、驚いたのはその精度だ。「あー」「えー」などを削除する「ケバ取り」も自動で行われ、適度に句読点や行替えも入っていた。

「いろいろな自動文字起こしサービスを試してきましたが、ついに本当に使えるものが出てきたと感動しました」(西村さん)

 主宰するオンラインサロンで、インタビューや講座内容を掲載することも多いため、西村さんにとって文字起こしは日常の作業だ。これまで試したサービスは精度がイマイチで、聞き直して修正するのにかなりの時間を要した。修正作業を依頼したライターから「最初から自分で起こしたほうが早かった」と言われたこともある。

 開発したRimoの相川直視(あいかわ なおよし)社長によれば、精度は、他のサービスと同様に録音環境によって大きく左右されるが、雑音や発話の重なりなどがなければ、9割を超えるという。

■テキスト化で検索可能

 専門業者の精度はお墨付きだが、1分200円前後が相場なので1時間なら1万2千円程度。ケバ取りや特急仕上げなどを頼めば数千円が上乗せされる。一方Rimoは30秒で20円(従量課金の場合)。1時間だと2400円だ。同社によればサービス開始から2カ月あまりで5千ユーザーを突破。11月末には、動画を視聴しながら、そこから書き起こしたテキストも同じ画面で確認できるようになる。

次のページ