- どこどこJPのデータについて
- 地域情報
どこどこJPの位置情報の調査方法を詳しく解説
ホスト名から位置情報を特定する方法
(1)ホスト名とは
「ホスト名」とは、インターネットなどのネットワーク上でコンピューターなどの機器を識別するための名前(文字列)のことをいいます。
コンピューター、FAX、コピー機、Wi-Fiルーターなどネットワークに接続している機器全てに「ホスト名」があると思ってください。
DNS(Domein Name System)サーバーを例にしてみましょう。
「〜//www.docodoco.jp/」というWebサーバーがあったとします。
この場合、「docodoco.jp」がドメイン名で、「WWW(World Wide Web)」の部分がホスト名です。
※厳密には「DNS(Domein Name System)サーバー」に問い合わせなければ正式なドメイン名とホスト名は表記からは分かりませんが、あくまで解説のために断言していることはご留意ください。
このように、IPアドレスに対して、人が分かりやすく管理しやすくするためにネットワーク内のマシンやサーバーに名前を付けたものが「ホスト名」です。
そして、DNS(Domain Name System)を用いて、IPアドレスからホスト名を調べることを逆引きといいます。
(2)ホスト名には特定の地域を表すキーワードが含まれている場合がある
IPアドレスを逆引きしたホスト名とその他の情報を元に分析を行うと、ISP(インターネットサービスプロバイダー)が提供しているIPアドレスには、ホスト名に地域を表すキーワードを含まれていることがわかります。これが、地域判定の手がかりとなります。
(3)キーワードの判定ルールは膨大なパターン数
- 同じ文字列を含むホスト名が近い地域に集中し、市の名前の略称とも一致する
- この数字が県内で共通しているから、この数字が都道府県を表していると考えられる
など、ネットワークを熟知した専任のスタッフ(Net Tracer)がルールを推測し、妥当性を検証します。ほんの一部ですが、判定ルールの例をご紹介します。
ホスト名がつけられたIPアドレスは、全世界に存在する全てのIPアドレスの約半数をも占めているのです。
そのため、大体はこの「ホスト名」からの判定をすることになります。 では残り半分のIPアドレスからは位置情報を特定できないのでしょうか。
結論から言うとそうではありません。
- ネットワーク機器の繋がりから位置情報を特定
- お客様からの情報提供、フィードバックから判定
の2種類の手法も存在します。 それぞれ見ていきましょう。
tracerouteから位置情報を特定する方法
位置情報の調査方法、2つ目は「traceroute(トレースルート)」。つまりネットワーク機器の繋がりを元にしたIP Geolocation調査の方法です。調査方法の解説の前に、インターネット上でデータがどのように伝達されているかを整理しておきましょう。
(1)インターネット上でのデータの伝達に欠かせない「ルーター」とは
インターネットは、ルーターと呼ばれるネットワーク機器が相互に接続された網目状のネットワークで形成されています。
では一体ルーターとはなんなのでしょうか。 ではここで、スマートフォンでGoogleサイトから何かを検索したときのことを思い出してください。
この際とても大まかに、
- スマートフォン→Wi-Fi→付近のアンテナ基地→インターネット→Google
という順番で接続を繰り返しているのですが、それぞれ異なるネットワークのため本来は直接接続することができません。
これを解決するのがルーターであり「異なるネットワークを双方で接続する役割」を持ちます。
ルーターの主要機能は、次にどのルーターにデータを転送すればいいのかを判断することです。データには、データの送信元と宛先の情報が付与されています。
データを受け取ったルーターは、宛先の情報を元に隣接するルーターのうちでもっとも宛先に近いルーターにデータを転送します。
次のルーターも同様にして、隣接するルーターから次の転送先を選びます。この繰り返しによって、データは最短経路で宛先に届けられるのです。
(2)tracerouteとは 〜位置情報の特定方法〜
そして、コンピューター間を接続するネットワークの経路リストを表示するコマンドのことを「traceroute」といいます。
ネットワークの経路上にどのようなルーターが中継しているのかがすぐに分かり、それぞれのルーターのホスト名には地域を表すキーが含まれています。
ここでポイントとなるのが、アクセスユーザーは最寄りのルーターの位置と地理的に近い位置に住んでいる可能性が高いということです。
ルーターの位置を特定することで、それを最寄りのルーターとして使っているアクセスユーザーの位置を判定することが可能です。
逆に、ユーザの住所が分かれば、最寄りのルーターの位置を知る重要な手掛かりとなります。
この調査にはネットワークに関する知識と経験が求められます。
株式会社Geolocation Technologyでは専任のスタッフ(Net Tracer)によって、継続的な調査が行われています。
経路の変化を検知し、毎月10~20%を更新しています。
位置情報判定の確実性を高めるために、調査方法は1つではなく複数用いられます。
つづいては、お客様からの情報提供やフィードバックによる調査の仕組みをご紹介します。
お客様からの情報提供とフィードバックから位置情報を特定する方法
(1)お客様からの情報提供とフィードバックが必要な理由
IPアドレスの割当ては、ISP(インターネットサービスプロバイダー)の操作である日突然変わる場合があります。
例えば、ある地域でユーザーが増え、IPアドレスが足りなくなった場合、ISPは以下のようなことがあります。
- 足りない地域に在庫から新規のIPアドレスを割り当てる
- 足りない地域に余裕がある別の地域のIPアドレスを割り当てる
前者なら判定不能のIPアドレスが出現、後者であれば使われる場所と判定結果に間違いが生じます。
こうした変化にいち早く気づき修正を行うことで、株式会社Geolocation Technologyはデータベースの品質を向上させています。
(2)株式会社Geolocation Technologyの精度向上の取り組み
IPアドレスの変化をより早く検知するためには、当社サービスのエンドユーザーからのフィードバックが欠かせません。この情報を元に、専任のスタッフ(Net Tracer)が
- 正確な報告かどうか
- どこまで正確に判定できるか
など、フィードバック情報が寄せられた環境も考慮して、検証を加えています。
さらに、このようなIPアドレスの変動を修正し、日次でデータベースに更新・反映させています。
この精度向上の取り組みは、DFLS(Daily Feedback Loop System)と呼ばれ、日々変化するIPアドレス情報を最新最善に保っています。
また、フィードバックをくださる情報提供企業「DFLSサポーター」は、株式会社Geolocation TechnologyとIP Geolocation技術を利用したすべてのサービスをご利用いただく方との架け橋となっています。
報告をいただいたIPアドレスは、優先的に調査対象となるためDFLSサポーター企業では、エンドユーザーの要望にいち早く応えられるというメリットになっています。
まとめ
- ホスト名とは、インターネットなどのネットワーク上でコンピューターなどの機器を識別するための名前(文字列)のこと
- DNS(Domain Name System)を用いて、IPアドレスからホスト名を調べることを逆引きという
- 逆引きをおこなうと、IPアドレスにはホスト名に地域を表すキーワードを含まれていることがわかる
- ホスト名がつけられたIPアドレスは、全世界に存在する全てのIPアドレスの約半数をも占めている
- 残り半数は、コンピューター間を接続するネットワークの経路リストを表示するコマンド「traceroute」から判定する方法、お客様からの情報提供とフィードバックから位置情報を特定する方法がある