For Want Of A Better Word

【wkhtml】CentOSでWEBサイトのキャプチャ_日本語文字化け解決

      2015/04/18

CaperJS(phantomjs)でWEBサイトのキャプチャを取ると日本語が表示されない現象で前躓いていた。

【ギブアップ】CentOS+casper.jsでキャプチャを取ると日本語が化けて「□」になる。 – For Want Of A Better Word

で改めて調べたけど。結果自分の環境ではダメだった。
・CentOS6.5
・phantomjs 1.9.0

下記とかは、日本語フォント入れれば解決するよって言っているけど、
PhantomJS入門 スクリーンキャプチャを撮るまで – Murayama blog.

下記によると、完全な解決は見つかっていないようでしょうがない。
PhantomJSで日本語が文字化けして辛い – なんかかきたい

ということで、phantomjsは諦めて下記参考に「wkhtml」で取得で行けました。


プログラムでスクリーンキャプチャの取得 – Linux編 – Program LOG

wkhtmlインストールはrpmが配布されていたのでそれをもとに

でキャプチャ

yahoo.jpgは下記の通り。

f:id:fz6:20150126105758j:plain

ふー次は、phpとかと組み合わせたいな。

 - wkhtml, スクレイピング

  関連記事

casperjs
casperjsの実行結果をphpで取得

特別難しいことは無いけれどメモ。シェルとしてcasperjsスクリプトを実行して …

no image
【wkhtml】オプションの確認

wkhtmlのオプションは下記(下記は-hで表示される一部。wkhtml -Hで …

casperjs
【メモ】casperjsでソーシャルボタンのHTMLをキャッシュしたかったけど、出来なかった。

標題通り。 js処理とか、api通信とかを省略して、表示を早く出来るかなと期待し …

casperjs
【Googleトレンド】【Casperjs】急上昇中キーワードをスクレイピングで取得 (1) -検討編

特定カテゴリの急上昇中キーワードを取得して、自分のサイトに表示したい。その時、自 …

casperjs
【Googleトレンド】【Casperjs】急上昇中キーワードをスクレイピングで取得 – (2) Casperjsのインストール

ということで続き。下記を参考に。 【参考】http://thesportsbus …