For Want Of A Better Word

phpでhtmlからタグ、スクリプトの除去

      2015/04/18

スクレイピング中に需要が。
simple_html_parserの「innertext」では内部要素のタグが出る場合があったので、手で。

HTMLタグの除去はstrip_tags()を使えばOK.
この場合jsのコードが残る。

jsコード削除処理

上記を作って、それをstrip_tag()に渡す。
こんな感じ

 - php

  関連記事

[php]ログインセッションの維持・有効期間について (session,cookie)

cookieとsessionファイルと、登場人物が複数いるので、どこに何を設定す …

クロームでブラウザ・端末エミュレート機能の使い方。えらく見つけづらくなった。。

クロームのエミュレーターが見つけづらくなったのでメモ。 ①デベロッパーツールを開 …

辞書順比較・数値順比較・自然順の違い

Contents1 辞書順と数値順2 (補足)辞書順で、「文字と数字」 「大文字 …

【サクッと始める】PHPでGoogle Analytics API(WEBアプリケーション)

注意 ①本記事で使っているGoogleAPI用PHPライブラリ「google-a …

[php]mail()の送信元、エラー送信先設定(from, return-path)

ちょっと整理。 設定例 [crayon-5ce1187e636d19575313 …