BERTが日本語を含む72言語に展開!
目次
GoogleはTwitterでBERTアルゴリズムが世界中で展開されたことを発表しました。
BERT, our new way for Google Search to better understand language, is now rolling out to over 70 languages worldwide. It initially launched in Oct. for US English. You can read more about BERT below & a full list of languages is in this thread…. https://t.co/NuKVdg6HYM
— Google SearchLiaison (@searchliaison) December 9, 2019
以下からは2019年12月10日(火)20時現在の情報をまとめたものになりますので、違っていたら指摘してください。
Googleの最新アルゴリズム『BERT』とは!?
Bidirectional Encoder Representationsと呼ばれ、頭文字をとってBERTと呼ばれます。
特徴は、会話型検索においてGoogleが自然言語をよりよく理解するのに役立ちます。
BERTは単なるアルゴリズムではなく、研究論文と機械学習の自然言語処理フレームワークです。
Googleが作成してから約1年前にオープンソース化されています。
自然言語処理(NLP)の事前トレーニングのためのニューラルネットワークベースの手法を導入し、オープンソース化しました。このテクノロジーにより、誰でも独自の最先端の質問応答システムをトレーニングできます。 【Google公式】検索をこれまで以上に理解する
自然言語処理(NLP)のフレームワークであることから自然言語処理の研究分野全体が自然言語の理解を向上させたとも言われています。
オープンソース化後に以下のような論文も発表されています。
言語理解のための事前トレーニング
またBERTの事前トレーニングでは英語版Wikipediaを使い事前訓練して学習しているそうです。
つまり人が話す言葉や人でしかわからなかった曖昧な表現も理解できるようになったということでしょうか。
BERTでどのような課題を解決できるのか!?
簡単に言うとロボットがまったく理解していないことで、人間だと簡単に理解できるような言葉の問題を解決してくれます。
多くの単語は曖昧で同義語もあることから今までは複数の意味を持つ単語で構成されるような文やフレーズは解決できませんでした。
例えば日本語ですと、
パンツ=ズボンの場合や下着を指す場合があります。
会話の前後で人間だとどちらか判断できます。
ご飯もそうですね。
ごはん=白飯の場合もあれば、食事の場合「今日ご飯何にする?」みたいな会話もありますよね。
前後関係がより理解できるようになったと言えば伝わるでしょうか。
SEOライティングというような言葉が生まれているのはこういう問題をロボットにわからせるために必要でした。
ただ、このような問題を解決できるようになったのがBERTです。
これはデザインファミリーの主観ですが、BERTの反映や今後の更新(発展?)でSEOライティングではなく、
本当に良いコンテンツがより評価されるようになるのではないでしょうか。
BERTはどの言語に影響しているのか!?
GoogleSearchLiaisonは、BERTが72の言語で展開されていることを発表しました。
またGoogle合同会社のエヴァンジェリストの金谷氏のツイッターでは日本語を含むことも記載されています。
BERT が日本語を含む 70 以上の言語でロールアウトを開始しました。BERT について詳しい情報は改めてこちらの記事をご覧ください。
https://t.co/bVhKDM1Wqj https://t.co/0vYRLV5kSL
— 金谷 武明 ★ Takeaki Kanaya (@jumpingknee) December 10, 2019
BERTは検索結果でどのように影響するのか!?
Googleは以前、BERTが米国での英語ロールアウト時に検索クエリの10%に影響を与えたことを発表しています。今回も同様の%程度は影響を与える可能性があります。
また会話型検索にも大きく影響があるのではないかと考えています。
音声検索も対象です。
日本語検索エンジンでもよりコンテンツを理解し、最も適切なWEBページにユーザーを導くことを期待しています。
BERT用にコンテンツを修正する必要があるのか!?
最後にみなさんが気になる部分かと思います。
結論は無いということです。
BERTは理解を深めるためのフレームワークです。コンテンツ自体は判断しないとされています。
そのページの内容をよりよく理解するだけです。
なので会話型検索では有効なのかもしれません。
検索順位を上げたい方はより良いコンテンツ作りをするほかにないのではないでしょうか。
何か楽して、コツを知ってなどは今はありません。
地道にユーザーのためにコンテンツを作っていきましょう!
気を付けないといけないのはBERTに対応したSEO対策ですというような営業には騙されないようにしてください!!
この記事を書いた人
-
大谷 将大
株式会社デザインファミリー CIO
株式会社デザインファミリー
CIO
自称SEO研究家の大谷です。私は「趣味がSEO」。人に変態と言われながら研究者並みの知識を無駄に積み重ねてきました。不定期ですが、SEOセミナーも行っています。
自称SEO研究家の大谷です。私は「趣味がSEO」。人に変態と言われながら研究者並みの知識を無駄に積み重ねてきました。不定期ですが、SEOセミナーも行っています。