チュートリアル
ツイートの地理空間メタデータ
Twitterのお客様が構築する商品の多くは、ツイートの位置情報またはそれを投稿したユーザーの位置情報を利用する必要があります。たとえば、国の特定地域での医療関連法規に関する世論に興味がある場合や、異なる地域における顧客満足度をトラッキングする場合があります。また、異常気象が発生した際のソーシャルメディアでのコミュニケーションについて調査をする場合もあります。
位置情報を商品で使用または統合することを検討しているお客様は、用途にもっとも合ったデータの種類を判断する際に困難に直面します。この判断材料としては、異なる種類のデータにおける精度と正確さ、異なる種類のデータのフィルタリングのしやすさがあります。
ツイートに含まれる地理空間メタデータ
Twitterには、ツイートを投稿するときに「位置情報タグ」を付けるオプションがあります。この位置情報のタグ付けは正確な位置情報に基づいて行う、Twitter Place(詳細についてはこちらとこちらをご覧ください)を割り当てる、またはその両方を使うこともできます。Twitter Placesは周辺地域レベルものとして考えられ、位置周辺を定義する緯度と経度の座標による「境界ボックス」が提供されます。このタイプの地理メタデータは「ツイート位置情報」と呼ばれ、もっとも高精度です。ツイート位置情報は地理情報にアクセスするのに言語解析または言語処理を必要としません。ツイート位置情報に頼る場合の主な問題点は、位置情報のタグ付けがされているツイートはわずか1~2%にすぎない点です。さらに、非常に広い地域(州全体や県全体など)をターゲットにする場合、その地域全体を抽出するには、非常に多くのPowerTrackルールを使う必要があります。しかし、特定の国のフィルタリングはplace_country:演算子で簡単にできます。また、Placesには便利なオプションがあり、たとえば国コードや場所名で絞り込みができます。
地理空間メタデータの2つ目のソースは、ツイートコンテンツ内の位置の@ツイートです。このタイプの「@ツイート位置情報」メタデータの場合、ニックネームも含めて、関心のある場所の名前をツイートメッセージから解析する必要があります。マンハッタンと@ツイートされているものもあれば、ビックアップルと@ツイートされているものもあります。関心のある場所がTwitterで何と呼ばれているかわかっている場合には、このタイプのツイートはかなり扱いやすくなります。キーワードまたはフレーズを使って、その言葉を検索するのみです。一方で、ユーザーの正確な位置情報の指標としては信頼性は高くなく、精度は低い傾向にあります。
最後に、どのTwitterプロフィールにも「場所」設定があり、アカウント所有者が入力できます。このプロフィールの場所が地理空間メタデータ最大のソースです。全員がこの情報を提供しているわけではないことに加え、ユーザーが任意のフレーズを入力できます。あるTwitterアカウントではその場所が「コロラドの丘陵部在住」と設定され、別のアカウントではあまり参考にならない「両親が暮らしている場所」と設定されている場合があります。 このタイプの参照はほかの2つの中間に位置し、GPSで確認された明確な地理的位置ではないものの、ユーザーが自分の位置情報として指定しているため、信頼できる可能性は高くなります。このタイプのデータのフィルタリングオプションは豊富にあり、後ほど取り上げます。
まとめると、地理情報を参照したツイートには3種類のメタデータがあります。
- ツイート位置情報: 正確な位置情報またはTwitter Placeで位置情報のタグ付けがされたツイート。
- 経度と緯度の座標による正確な位置: -85.7629, 38.2267
- 名前(「ルイビル中心部」)と「境界ボックス」を定義する4つの緯度と経度の座標を使用するTwitter Place
- @ツイート位置情報: ツイートメッセージから解析した地理空間位置。
- 「ルイビルにいるなら、大通りからちょっと入ったピザ屋がおすすめ」
- 「ルイビルにいますが、土砂降りの雨です」
- プロフィールの場所: 関心のある場所をアカウントレベルの位置情報から解析。
- 「ダービーの本場、ルイビルに住んでいます!」
- 「美しいコロラドの町の1つ、ルイビルに住んでいます」
このメタデータがTweetペイロードに送信される方法と、それを絞り込みする方法の詳細について示すJSONの例については、この記事をご参照ください。
このメタデータを地理情報参照ツイートに使う方法
Twitter PowerTrackでは、さまざまな方法でこれらのタイプの地理空間メタデータを絞り込みできます。こういったフィルターまたはルールは、50を超えるPowerTrack演算子(全リストはこちらをご覧ください)を使って作成されています。
「Filtering Twitter by location」の記事で、ツイートの位置情報とプロフィールの場所のフィルタリングに使えるPowerTrack演算子の概要について、ご確認ください。プロフィールの場所がTwitter地理情報メタデータのソースの大部分を占めるため、Twitterではプロフィールのジオエンリッチメントを提供しています。
プロフィールジオによって地理情報のデータ量が格段に増加するため、このエンリッチメントにはさまざまな用途があります。Twitterプロフィールのジオエンリッチメントの機能の概要は、こちらのドキュメントをご参照ください。
ソリューション作成の準備が整った方は