Bu basit_html_dom ayrıştırıcısını bir dış url'yi denemek ve ayrıştırmak için kullanıyorum. Çoğu sayfada doğru şekilde kullanabiliyorum.Örnek HTML DOM ayrıştırıcısı ayrıştırılmıyor <body> etiketi
Ancak web sitesi http://talksport.com/football/atletico-madrid-beat-arsenal-and-west-ham-signing-portuguese-wonderkid-diogo-jota
ayrıştırıcı html < vücut > etiketi tanımıyor ayrıştırmak çalıştığınızda.
require 'simple_html_dom.php';
$html = file_get_html('http://talksport.com/football/atletico-madrid-beat-arsenal-and-west-ham-signing-portuguese-wonderkid-diogo-jota');
// Find any tag for eg. <div>
$tag = $html->find('div',0);
var_dump($tag);
Sonuç olarak null olsun.
Ben Bu neden oluyor anlamaya çalıştı ve$x = $html->find('html',0)->children();
$ x <kafa> etikettir tek çocuk vardır bulundu. < gövde > etiketi, hiçbir şekilde ayrıştırılmamıştır.
Böyle bir sorunu daha önce karşılaştıran var mı? Lütfen yardım et.
DOMDocument html iyi oluşturulmadığından, bana bir çok Uyarı veriyor. Örneğin için. DOMDocument :: loadHTML(): Son etiket: Kurum içinde beklenen '>', satır: 132 –
teşekkürler. libxml_use_internal_errors kullanarak uyarıların nasıl devre dışı bırakılacağını anladım –