2011-08-23 13 views

cevap

24

Çeşitli yollar. Bu gerçekten belgenin kendisine ve verilen HTML işaretlemesinin tutarlı olup olmadığına bağlıdır. Bu özel örnekte size Element#childNodes() tarafından td 'ın alt düğümlerin almak ve sonra TextNode ya da olmasın eğer tek tek her düğümü test edebilir.

E.g.

 
TextA 
TextB 

sonuçlanır

Element td = getItSomehow(); 

for (Node child : td.childNodes()) { 
    if (child instanceof TextNode) { 
     System.out.println(((TextNode) child).text()); 
    } 
} 

Ben Jsoup Element#children() döndü olurdu (alt öğelerini almak için yaptığı gibi gibi çocuk metin düğümlerini almak için bir Element#textNodes() falan sunulan güzel olacağını düşünüyorum örneğinizdeki <br /> öğesi).

+15

1.6.2 için Element # textNodes() yöntemini uyguladıktan sonra öneri için teşekkürler. https://github.com/jhy/jsoup/commit/7b9f17760049161b775fd23b15653961620e259d –

+1

@JonathanHedley Sen bir hayat kurtarıcısın! Çok çalışman için sana yeterince teşekkür edemem. Kodunuz ve yorumlarınız mükemmel ve bana Google ve StackOverflow saatlerini kurtardı. – stackular