UPDATE 2: http://htmlpurifier.org/phorum/read.php?3,5088,5113 Yazar zaten sorunu tespit etti.htmlpurifier, üçüncü taraf kaynak onavantajı kaynağı
GÜNCELLEME: Sorun, sürüm 4.2.0'a özel olarak görünüyor. 4.1.0'a düşürdüm ve çalışıyor. Tüm yardımların için teşekkür ederim. Paketin yazarı bildirildi.
ben kazıma am bazı sayfalar gibi:
http://form.horseracing.betfair.com/horse-racing/010108/Catterick_Bridge-GB-Cat/1215
W3C doğrulama göre, geçerli XHTML Sıkı olduğunu.
Daha sonra bir DOMDocument öğesine yüklenmeden önce HTML'yi temizlemek için http://htmlpurifier.org/ kullanıyorum. Ancak, yalnızca tek bir içerik satırı döndürüyor.
Çıktı:
12:15 Catterick Bridge - Tuesday 1st January 2008 - Timeform | Betfair
Kodu:
echo $content; # all good
$purifier = new \HTMLPurifier();
$content = $purifier->purify($content);
echo $content; # all bad
BTW Sen bu etki alanından gelen tüm sayfalar için başlık bırakır dediğiniz gibi, başka bir siteden kaynaklı veriler için çalışmaktadır.
İlgili Bağlantılar
- HTMLPurifier dies when the following code is run through it (benzer konuda cevaplanmamış soru)
Bize göstermediğinizden emin olun * hangi * satır! Tahmin etmenin tüm eğlencesini alırdı. –
@Pekka, :) ekledi –
Strange, başlık gibi görünüyor. Kullandığınız kodu gösterebilir misiniz? (Arıtma çağrısı ve ayarları) –