News

2017.06.25

投稿者: 岩本卓三

検索エンジンの仕組みをわかりやすく説明してみた


 

検索エンジンってなんですか?

知りたい情報に関する語句を入力して検索ボタンを押すと、入力した語句に一番近いと思われる情報を有するサイトがリストアップされるサービスのことです。具体的にはGoogle, Yahoo, MSN等が検索サービスを提供しています。 検索エンジンとはウェブ情報を集め、データベースに蓄積し、ユーザーの求め(検索語句を入力)に応じて情報を表示させる一連の処理を実行するシステムのことです。


 

どうやってウェブ情報を集めているの?

検索エンジンロボット(プログラム)を使用してウェブ情報を集めています。ロボットを使用して情報を収集する方式をロボット型検索エンジンといいます。このロボット型検索エンジンでは、クローラーと呼ばれるプログラムがネットを定期的に巡回し、ウェブ上のファイル(HTML文書だけでなく、画像、PDF、CSSファイル、JavaScriptファイルまで含む)を集めます。クローラーはリンクをたどることによって、世界中のありとあらゆるウェブサーバーと通信し、そのサーバー内のコンテンツを取得していきます。これが検索エンジンの仕組みです。


 

クローラーってなんですか?

クローラー(Crawler)とは、ウェブ上のリンクをたどるようにプログラムされたロボットのことです。「ボット(Bot)」、「スパイダー」、「ロボット」などとも呼ばれます。クローラーは世界中のありとあらゆるリンク先のウェブサーバーと通信し、そのサーバー内のコンテンツを取得していくように設計されています。


 

クローラーの種類

Googleが持つクローラーには用途に応じて複数のクローラーがあります。例えば通常のWEB検索には「Googlebot」、画像検索には「Googlebot-Image」、モバイル検索には「Googlebot-Mobile」といったように、目的に応じた様々なクローラーが存在します。あなたのメールの受信BOXにスパムメールが届いた経験があることでしょう。これもクローラーの仕業です。昼夜絶え間なくネット上を巡回してはスパムメール用にメアドを抽出しているのです。


 

検索結果はどうやって表示されるの?

このクローラーによってサーバー内へ取り込まれたコンテンツのキーワードやテーマを高度なアルゴリズムによって分析し、スコアリング(有用度合を点数化)します。分析した結果とその取り込んだファイル自体を検索しやすいように、索引(インデックス)を付けてデータベース化(保存)します。そして、検索エンジンはユーザーの求め(検索語句を入力)に応じて、データベースから画像やサイトをリストアップし表示させます。


 

検索結果の表示順はどうやって決まるの?

検索エンジンは収集してきたウェブ情報のコンテンツ内容、ページ、リンク、アクセスを解析し、要素ごとに性質や重要性を数値化します。検索エンジンが情報としての有用性や価値を総合的に判断して、数値が高い順に検索結果として表示します。


 

まとめ

検索エンジンとはユーザーの求め(検索語句を入力)に応じて情報を表示させる一連の処理を実行するシステムのことです。検索エンジンの結果に表示してもらうのには、クローラーにサイトを見つけてもらうことです。検索結果にはユーザーの求め(入力した語句)に最も近い順にサイトが表示されますが、ユーザーの求めに近いサイトが複数ある場合、コンテンツの内容がユーザーにとって有益と判定された順に表示されます。この一連の処理が検索エンジンの仕組みです。


最近の投稿