For Want Of A Better Word

【Googleトレンド】【Casperjs】急上昇中キーワードをスクレイピングで取得 (1) -検討編

      2015/04/19

特定カテゴリの急上昇中キーワードを取得して、自分のサイトに表示したい。その時、自分のサイトの関連記事・あるいは検索結果を出すということをしてみたひ。。

単純にガジェットを埋め込むだけなら、Googleさんがスクリプトを提供してくれているのだけれど、キーワードと上昇率のjsonだけとかが欲しいなーと。。。
んでだ。

対応策

①検索結果のWEBサイトをスクレイピングしてみようかと。

 とりあえずwgetしたけど、JS表示部分はだめでした。
PHP PearのHTTP/client.phpを取得しても同じ。
ということでスクレイピングはだめ。

②埋め込み用のjsの中身を見て、実際にデータを取得しているリクエストを確認して、その部分だけをやってみる。

tamper Dataを除いてリクエストを確認。下記がデータ取得っぽいと思ったが。。

http://www.google.co.jp/trends/fetchComponent?hl=ja&cat=0-44&geo=JP&cmpt=q

URL直接打ち込むと「Internal Server Error」おいGoogle!!

断念。

③あんまり思いつかないので、JSをサーバーサイドで実行させてその結果を取得する方法を検討。

サーバーサイドJSというとNode.jsとかが思いつきますが、スクレイピング向けライブラリの下記を見つけた。

こいつでやってみるか!!

続きはここから

 - casperjs, google, googleanalytics, javascript | js, スクレイピング

  関連記事

Google Developerコンソール プロジェクトの削除

プロジェクトを選択して左下 課金と設定(Billing & Setti …

アドテクまわりの用語

素人ながら「アドテクノロジープロフェッショナル養成講座」という本を読んでいて、用 …

【ギブアップ】CentOS+casper.jsでキャプチャを取ると日本語が化けて「□」になる。

=== 追記 === casperjs、phantomjsじゃないけど、wkht …

[js] chart.jsのグラフをwkhtmltopdfでpdfに保存する

表題のことをしたいとなった。   結論目的は果たされたのだけどハマリポ …

クロスドメインのJSの利用とAjax通信の整理

jsonpとかcors設定とか、どういうときに必要か良く分からなくなったので整理 …