For Want Of A Better Word

phpでhtmlからタグ、スクリプトの除去

      2015/04/18

スクレイピング中に需要が。
simple_html_parserの「innertext」では内部要素のタグが出る場合があったので、手で。

HTMLタグの除去はstrip_tags()を使えばOK.
この場合jsのコードが残る。

jsコード削除処理

上記を作って、それをstrip_tag()に渡す。
こんな感じ

 - php

  関連記事

[Cake]CakePHPで意識の低いトランザクション commit rollback

cakeで複数のテーブルにまたがったトランザクション管理をしたい。   …

[php]mail()の送信元、エラー送信先設定(from, return-path)

ちょっと整理。 設定例 [crayon-594e561ac28ef5095467 …

CakePHPでjoinしようとしたときのエラー 【Notice (8): Undefined offset: 0 [CORE/Cake/Model/Datasource/DboSource.php, line 1714]】

Cakeでfind()からjoinしようとしたときに下記Noticeが出て、検索 …

[PHP][PDO]prepareでのバインド方法整理

データをstmtに渡す部分をちょくちょく待ちがえて混乱するのでメモ 参考:htt …

[ruby][php]Excel出力操作の方法

Excel出力が要件としてもとめられた、言語は問わない、WEBではなくバッチで。 …