For Want Of A Better Word

phpでsimplexml_load_fileを使ってハマった所

      2015/04/18

スクレイピングの一歩としてrssをパースしようとした。
その時「simplexml_load_file」を使ったのだけれどこつこつ詰まるので記録。

パースしたデータはオブジェクトなので、Stringと型比較をすると一致しない。

単純にテキストと「===」とかで比較するとfalseになる。
DBに投げて、WHERE条件なんかで比較しても一致しないことになる。
比較する前にキャストしろ!

【参考】http://killonebirdwithtwostones.hatenablog.com/entry/20120920/1348130514

サンキュー!!

descriptionが取れない

【参考】http://qiita.com/s0hno/items/36316dbb737ebe8b2bcf
サンキュー!!

descriptionでとった値が再度オブジェクトに設定しようとしても、うまく行かない。

別名プロパティで設定してやった。
これでえーやと。。。

特定のタグ(ユニークで無い)だけにアクセスしたい

[参考]http://php.net/manual/ja/simplexml.examples-basic.php
下記でOK

foreach($obj->タグ As $data){
//処理
}

@attributesのデータ取得方法

[参考]http://php.net/manual/ja/simplexmlelement.attributes.php
attributes()メソッドで配列として取得するしかないみたい。
なんのためにこうなっているのかはいまいち不明。

元データ
object(SimpleXMLElement)#14 (9) {
[“title”]=>
string(XX) “タイトル”
[“link”]=>
object(SimpleXMLElement)#9 (1) {
[“@attributes”]=>
array(XX) {
[“type”]=>
string(9) “text/html”
[“href”]=>
string(41) “http://sample.jp/
}
}

こんな感じの時にhrefを取るとしたら

$attr = $obj->link->attributes();
echo $attr[“href”];

という感じになる。

 - php

  関連記事

php-logo
phpでhtmlからタグ、スクリプトの除去

スクレイピング中に需要が。 simple_html_parserの「innert …

php-logo
オブジェクト指向

オブジェクト指向は意味がふらふらしてます。 C++作者のBjrne Strous …

php-logo
UTF-8の16進数文字コードを指定して出力とか

PHPで文字コードを16進数で指定して出力する方法。pack()を使う。 [cr …

php-logo
プログラミングPHP 第9章(グラフィクス)ポイント

HTML中で呼び出される、画像ファイルの部分を、phpファイルに置き換えることで …

php-logo
【PHP】php5.5にしたら ssh2.soとmecab.soでエラーが。

下記のようなエラー。 PHP Warning:PHP Startup: Unab …