Googleをすべて信じていいのか? 時代遅れのサイトにならないための最新SEO思考法 (2/4) 〈dot.〉|AERA dot. (アエラドット)

AERA dot.

Googleをすべて信じていいのか? 時代遅れのサイトにならないための最新SEO思考法

このエントリーをはてなブックマークに追加
鈴木良治dot.#朝日新聞出版の本#読書
鈴木良治/アンドバリュー株式会社代表取締役社長。京都大学卒業後、リクルート入社。リクルートを退社後Webの分野に進出し、ベンチャー企業の立ち上げなどを経て、格安でSEO対策を行えるサイト管理システムの提供や書籍の完全無料公開など、書籍の執筆にとどまらないSEO対策の普及活動を行っている

鈴木良治/アンドバリュー株式会社代表取締役社長。京都大学卒業後、リクルート入社。リクルートを退社後Webの分野に進出し、ベンチャー企業の立ち上げなどを経て、格安でSEO対策を行えるサイト管理システムの提供や書籍の完全無料公開など、書籍の執筆にとどまらないSEO対策の普及活動を行っている

2014年9月26日におけるGoogleでの「一戸建て」と「一戸建」の検索結果。「一戸建て」は4180万件の検索結果が表示されているのに対し、「一戸建」は77万3000件しか表示されていないことがわかります

2014年9月26日におけるGoogleでの「一戸建て」と「一戸建」の検索結果。「一戸建て」は4180万件の検索結果が表示されているのに対し、「一戸建」は77万3000件しか表示されていないことがわかります

2018年2月時点で、「Google 翻訳」を利用して日本語から英語に翻訳し(上画像)、その翻訳を日本語に戻してみたもの(下画像)。そこまで長くなく複雑な文章でもありませんが、日本語に戻したものは、意味の通らない文章になってしまっています。また、このような現象は、文章から読点(、)を抜くとより顕著になります

2018年2月時点で、「Google 翻訳」を利用して日本語から英語に翻訳し(上画像)、その翻訳を日本語に戻してみたもの(下画像)。そこまで長くなく複雑な文章でもありませんが、日本語に戻したものは、意味の通らない文章になってしまっています。また、このような現象は、文章から読点(、)を抜くとより顕著になります

2018年2月にGoogleで「デジタル一眼」(左画像)と「デジタル一眼レフ」(中央画像)、「デジタル一眼レフカメラ」(右画像)を検索した検索結果の1ページ目。各Webページの対応関係は、ページタイトルやWebサイトではなくURLを基に判断しています

2018年2月にGoogleで「デジタル一眼」(左画像)と「デジタル一眼レフ」(中央画像)、「デジタル一眼レフカメラ」(右画像)を検索した検索結果の1ページ目。各Webページの対応関係は、ページタイトルやWebサイトではなくURLを基に判断しています

「検索エンジンが共起語や文脈を把握できる水準にないと判断できる根拠は実際に対策をしてデータをとるのが1番ですが、簡単に確認できるものも多く、1例として、Googleが提供している翻訳ツール『Google翻訳』での事象が挙げられます。試しに適当な文章を日本語から英語に翻訳し、翻訳された英語を日本語に再度翻訳してみてください。最近はかなり精度が向上してきたので短文なら問題ないこともありますが、そこそこ長文になってくると、元に戻したときの日本語はたいてい意味がわからないものになるはずです。Google翻訳で文章がおかしくなるタイミングは、『元の言語の文意を把握する際』と、その『文意を反映した文章を翻訳する言語で作成する際』の2回あります。そして、複数のデータを確認すると、文意が把握できており、共起語というものが機能しているのなら起き得ない翻訳ミスが数多く見られるのです」

 鈴木さんがこのように情報の検証を重視する背景には、日本では検索エンジンの「最新」施策が導入されにくいことがあるという。それは日本語という主に日本でしか使用されない言語の特殊性によるもので、アメリカにおいて英語で実施された施策は、日本に導入されるまでに相当の時間がかかってしまう場合があるという。

「そもそもアルファベットは26文字ですが、日本語は平仮名と片仮名だけで96文字(濁音、半濁音、撥音を含めると169文字)あり、常用漢字だけでも2136文字・4388音訓(2352音・2036訓)あるので、利用される文字数が圧倒的に違います。そして、単語ごとにスペースで区切られる英語などの言語と異なり、日本語は隙間なく単語が続く上に、漢字や平仮名、片仮名などが入り乱れるため、単語を把握するのも圧倒的にたいへんです。加えて、日本語の文章は英語の『SV(主語+動詞)』や『SVO(主語+動詞+目的語)』『SVOO(主語+動詞+目的語+目的語)』のような文型がなく、接続詞や接続助詞によってどこまでも長くなるため、文型から内容を把握することも困難です」

 結論として、アメリカで実施したGoogleの施策(発表)を日本に導入するには、技術的に大きなハードルを越えなければならないのだ。

「それに加え、日本は世界第3位の経済大国ではありますが、日本語はほぼ日本でしか利用されないので、言語としての市場の発展性がありません。たとえば、スペイン語に対応すれば中南米に、フランス語に対応すればアフリカに波及することができますが、非常に高い技術的なハードルを越えても、日本語では、効果が日本だけにとどまってしまうのです」

 日本語はSEO業界にとって後進国であり続ける宿命があるにもかかわらず、検索エンジン大手のGoogleやYahoo!、Bingなどがアメリカの企業であり、多くの施策がアメリカから導入されていくので、日本のSEO業界はアメリカの動向を気にしてしまう。そして、多くの「SEOの専門家」が得た情報を検証せずにそのまま利用しているため、現実と相違したさまざまな問題が起きてしまうのだ。

●「文脈」と「共起語」では効果を出せない!?

「たとえば、Googleで『一戸建て』と『一戸建』というキーワードを検索してみてください。ほんの少し表記が異なるだけですが、検索結果に表示されるWebサイトの数も、その順位も異なることが確認できます。どちらの表記でも検索する人は同じものを検索しているので、Googleが『一戸建て』と『一戸建』を同じ意味の単語であると判断できているのなら、同一の検索結果を出すでしょう。しかし、(徐々に改善されてきてはいますが)この検索結果に表示されるWebページ数は、2014年の時点で送り仮名のあるものはないものの約55倍もの件数が表示され、2017年の時点で10倍弱、2018年の2月時点でも3倍強の違いがあり、検索結果に表示されるサイトもほとんどが異なります」



トップにもどる dot.オリジナル記事一覧

関連記事関連記事

このエントリーをはてなブックマークに追加
あわせて読みたい あわせて読みたい