チュートリアル
ワンタイムHistorical PowerTrackジョブ
はじめに
Historical PowerTrack(HPT)は、バッチを使用したジョブベースの設計で、大規模にツイートを配信できるように構築されています。ワンタイムジョブを購入する場合は、日付範囲と一連のフィルタリングルールを設定し、推奨されるいずれかのプロセスを使用してジョブをダウンロードするという簡単なプロセスに従う必要があります。Twitterでは、複数のジョブにアクセスしたい個人向けにサブスクリプションベースのオプションも提供しています。
リクエスト期間の長さによっては、ジョブの生成に数時間から数日かかることがあります。データファイルは、10分間分を1ファイルとして生成され、少なくとも1つのツイートを含みます。そのため、30日分のデータセットでは、一致するツイート数とは関係なく、一般的におよそ4,300ファイルが含まれます。
Historical PowerTrack製品の詳細については、概要のドキュメントをお読みください。
注: ワンタイムジョブでは、Historical PowerTrack APIエンドポイントでの操作は必要ありません。ほとんどの操作は、アカウントマネージャーが行います。
ルールとフィルタリング
ワンタイムジョブを設定するために必要な最初の手順は、ジョブ用に一連のルールと日付範囲を設定することです。ジョブには、それぞれ2,048文字以内のフィルタリングルールを最大1,000個まで追加できます。これにより、作業中のプロジェクトに関連するツイートのみを確実に受け取ることができます。
一連のルールを作成する方法の詳細については、次のドキュメントをお読みください。
ジョブの送信
ルールセットを作成したら、次のフォームを送信してご連絡ください。その後、ジョブの内容を確認し、見積もりを作成します。
ジョブのダウンロード
HPTジョブには、ダウンロード、解凍、結合する必要のある何千ものファイルが含まれている可能性があることを考慮すると、自動化されたプロセスを使用することが必要になります。次のページでは、データの処理を始めるのに役立ついくつかの戦略例を示します。
データフォーマット
ツイートを返すすべてのTwitter APIは、JavaScript Object Notation(JSON)を使用してエンコードされたデータを提供します。JSONは、名前付き属性と関連する値を持つキーと値のペアに基づいています。ツイートには、テキストコンテンツ自体に加えて、140を超える関連属性を持つ可能性があります。
これらの属性とツイートペイロードの構成の詳細については、データディクショナリーのドキュメントをお読みください。
Historical PowerTrack製品で配信される各ツイートには、マッチングルールの拡張機能も含まれています。複数のルールを使用している場合は、マッチングルールIDを使用して、ジョブ内で個々のツイートがどのルールにマッチしているかを識別できます。この拡張機能の詳細については、PowerTrackデータフォーマットのページをご覧ください。