For Want Of A Better Word

phpでhtmlからタグ、スクリプトの除去

      2015/04/18

スクレイピング中に需要が。
simple_html_parserの「innertext」では内部要素のタグが出る場合があったので、手で。

HTMLタグの除去はstrip_tags()を使えばOK.
この場合jsのコードが残る。

jsコード削除処理

上記を作って、それをstrip_tag()に渡す。
こんな感じ

 - php

  関連記事

php-logo
PEARの使い方

http://www.phpbook.jp/pear/command/ コマンド …

php-logo
【PHP】【Tips】foreachで配列の値を変更するときに参照渡しを利用すると便利!

いまさらだけど、便利だった。 多次元配列で特定項目を一様に編集したい時とか。 デ …

php-logo
phpでsimplexml_load_fileを使ってハマった所

スクレイピングの一歩としてrssをパースしようとした。 その時「simplexm …

cakephp_logo
【Cake】bakeの手順 | デフォルト管理画面をbootstrapに対応させる

※CakePHPのマニュアルが嫌いだ!! cakeを落としてきて、 wget h …

apache-logo
Xamppでのphp設定時の注意点/php.iniファイルの場所

xamppで一生懸命php.iniの設定変更をして、エラーログを出力しようとした …