For Want Of A Better Word

phpでhtmlからタグ、スクリプトの除去

      2015/04/18

スクレイピング中に需要が。
simple_html_parserの「innertext」では内部要素のタグが出る場合があったので、手で。

HTMLタグの除去はstrip_tags()を使えばOK.
この場合jsのコードが残る。

jsコード削除処理

上記を作って、それをstrip_tag()に渡す。
こんな感じ

 - php

  関連記事

CakePHPでjoinしようとしたときのエラー 【Notice (8): Undefined offset: 0 [CORE/Cake/Model/Datasource/DboSource.php, line 1714]】

Cakeでfind()からjoinしようとしたときに下記Noticeが出て、検索 …

【メモ】simple_html_parserの使い方リンク

[インストール~DOMオブジェクトの取得] http://so-zou.jp/w …

CentOSをインストールしたときにいつも最初にやること(apache mysql phpのインストール)

SElinuxの無効化 iptableの無効化 apacheのインストール・自動 …

【PHP】【Slim】インストールー手動ダウンロード と Composer

ずーっと思ってた、CakeとかCodeIgnaitorとか、俺には多機能すぎる! …

[php][日付け]指定日と日数を入力してその期間の日付け配列を取得する