For Want Of A Better Word

phpでhtmlからタグ、スクリプトの除去

      2015/04/18

スクレイピング中に需要が。
simple_html_parserの「innertext」では内部要素のタグが出る場合があったので、手で。

HTMLタグの除去はstrip_tags()を使えばOK.
この場合jsのコードが残る。

jsコード削除処理

上記を作って、それをstrip_tag()に渡す。
こんな感じ

 - php

  関連記事

クロームでブラウザ・端末エミュレート機能の使い方。えらく見つけづらくなった。。

クロームのエミュレーターが見つけづらくなったのでメモ。 ①デベロッパーツールを開 …

[PHP][PDO]prepareでのバインド方法整理

データをstmtに渡す部分をちょくちょく待ちがえて混乱するのでメモ 参考:htt …

【php】strtotimeで日付計算する場合の基準日の指定のくせ「A non well formed numeric value encountered in 」

またちょっと嵌った。。。 strtotime() 書式化された文字列からunix …

[Cake]CakePHPで意識の低いトランザクション commit rollback

cakeで複数のテーブルにまたがったトランザクション管理をしたい。   …

【メモ】simple_html_parserの使い方リンク

[インストール~DOMオブジェクトの取得] http://so-zou.jp/w …