For Want Of A Better Word

【Googleトレンド】【Casperjs】急上昇中キーワードをスクレイピングで取得 (1) -検討編

      2015/04/19

特定カテゴリの急上昇中キーワードを取得して、自分のサイトに表示したい。その時、自分のサイトの関連記事・あるいは検索結果を出すということをしてみたひ。。

単純にガジェットを埋め込むだけなら、Googleさんがスクリプトを提供してくれているのだけれど、キーワードと上昇率のjsonだけとかが欲しいなーと。。。
んでだ。

対応策

①検索結果のWEBサイトをスクレイピングしてみようかと。

 とりあえずwgetしたけど、JS表示部分はだめでした。
PHP PearのHTTP/client.phpを取得しても同じ。
ということでスクレイピングはだめ。

②埋め込み用のjsの中身を見て、実際にデータを取得しているリクエストを確認して、その部分だけをやってみる。

tamper Dataを除いてリクエストを確認。下記がデータ取得っぽいと思ったが。。

http://www.google.co.jp/trends/fetchComponent?hl=ja&cat=0-44&geo=JP&cmpt=q

URL直接打ち込むと「Internal Server Error」おいGoogle!!

断念。

③あんまり思いつかないので、JSをサーバーサイドで実行させてその結果を取得する方法を検討。

サーバーサイドJSというとNode.jsとかが思いつきますが、スクレイピング向けライブラリの下記を見つけた。

こいつでやってみるか!!

続きはここから

 - casperjs, google, googleanalytics, javascript | js, スクレイピング

  関連記事

google-logo
GoogleAppENgine javaでHelloWorld

(途中。。) pythonはとりあえずやったけど。javaをやっていない。 会社 …

js-logo
【js】cookieから名前指定で値を取る。

 

js-logo
【JS】メモ_スコープを絞ってその場で実行

良く忘れるのでメモ。 こん中にfunctionを書きまくってもよいぜ。 [cra …

google-logo
GoogleAppEngineでDataStoreを使ってみる(データストア)(by 作ればわかる GoogleAppEngineプログラミング)

データストアとは GAEのDB。key-value型のデータベース。 Javaク …

js-logo
[js]現在時刻の取得(yyyy-mm-dd hh:mi:ss)