For Want Of A Better Word

【Googleトレンド】【Casperjs】急上昇中キーワードをスクレイピングで取得 (1) -検討編

      2015/04/19

特定カテゴリの急上昇中キーワードを取得して、自分のサイトに表示したい。その時、自分のサイトの関連記事・あるいは検索結果を出すということをしてみたひ。。

単純にガジェットを埋め込むだけなら、Googleさんがスクリプトを提供してくれているのだけれど、キーワードと上昇率のjsonだけとかが欲しいなーと。。。
んでだ。

対応策

①検索結果のWEBサイトをスクレイピングしてみようかと。

 とりあえずwgetしたけど、JS表示部分はだめでした。
PHP PearのHTTP/client.phpを取得しても同じ。
ということでスクレイピングはだめ。

②埋め込み用のjsの中身を見て、実際にデータを取得しているリクエストを確認して、その部分だけをやってみる。

tamper Dataを除いてリクエストを確認。下記がデータ取得っぽいと思ったが。。

http://www.google.co.jp/trends/fetchComponent?hl=ja&cat=0-44&geo=JP&cmpt=q

URL直接打ち込むと「Internal Server Error」おいGoogle!!

断念。

③あんまり思いつかないので、JSをサーバーサイドで実行させてその結果を取得する方法を検討。

サーバーサイドJSというとNode.jsとかが思いつきますが、スクレイピング向けライブラリの下記を見つけた。

こいつでやってみるか!!

続きはここから

 - casperjs, google, googleanalytics, javascript | js, スクレイピング

  関連記事

google-logo
GoogleAppEngine使ってみる-公開の巻

基本的には下記参照 https://developers.google.com/ …

casperjs
Caperjs evaluateの中でquerySelectorAllの引数に変数を設定しても動かない。

firebugでためす限り、 document.getElementById() …

js-logo
【jQuery】 lightBox風のHTML表示

plugin:facebox [参考]http://www.syboos.jp/ …

casperjs
【メモ】casperjsでソーシャルボタンのHTMLをキャッシュしたかったけど、出来なかった。

標題通り。 js処理とか、api通信とかを省略して、表示を早く出来るかなと期待し …

js-logo
node.jsって

参考になるサイト http://bizria.jp/technical/node …