Googleのサービスの根幹ともいえる「Google検索」。その検索結果のランク付けや表示の要素を記載した内部文章が漏洩したと、ソフトウェア会社のSparkToroが報告しています。
↑仕組みがバレた?(画像提供/Google)
SparkToroのRand Fishkinが入手した「Google APIコンテンツ・ウェアハウス」には、検索結果を生成するさまざまな要素がどのように機能するかを従業員に説明する、社内APIドキュメントが含まれています。合計2500ページ以上のドキュメントには、古いものから最新のものまで存在するそう。
このデータでは、Google検索が検索結果を順序付ける際に考慮する要素を含んでいます。しかし、最終的にランキングを決定する各要素の「重要性/重み」は明らかにされていません。
今回のデータはGoogleが3月27日にGitHub経由で誤って公開し、5月7日に削除されたようです。しかしデータはサードパーティーのサービスによってインデックス化されていたため、このようなコピーが流出しました。
Googleは今回の漏洩について、まだコメントを出していません。今回のデータによるGoogle検索のハックは難しそうですが、誰もが日々使っている巨大システムの内部が垣間見えた、興味深い出来事と言えそうです。
Source: SparkToro via 9to5Google