For Want Of A Better Word

phpでhtmlからタグ、スクリプトの除去

      2015/04/18

スクレイピング中に需要が。
simple_html_parserの「innertext」では内部要素のタグが出る場合があったので、手で。

HTMLタグの除去はstrip_tags()を使えばOK.
この場合jsのコードが残る。

jsコード削除処理

上記を作って、それをstrip_tag()に渡す。
こんな感じ

 - php

  関連記事

辞書順比較・数値順比較・自然順の違い

Contents1 辞書順と数値順2 (補足)辞書順で、「文字と数字」 「大文字 …

phpでsimplexml_load_fileを使ってハマった所

スクレイピングの一歩としてrssをパースしようとした。 その時「simplexm …

phpでImageMagickを使うための各種インストール

phpからImageMagickを使いたい。peclのimagickをインストー …

CakePHPでjoinしようとしたときのエラー 【Notice (8): Undefined offset: 0 [CORE/Cake/Model/Datasource/DboSource.php, line 1714]】

Cakeでfind()からjoinしようとしたときに下記Noticeが出て、検索 …

[php]ログインセッションの維持・有効期間について (session,cookie)

cookieとsessionファイルと、登場人物が複数いるので、どこに何を設定す …