2011-05-13 7 views
9

Java için HtmlUnit mükemmel ancak tam kaynağı nasıl görüntüleyeceğimi veya bir web sitesinin kaynağını bir dize olarak nasıl döndüreceğimi anlayamadım. Bu konuda bana yardımcı olan var mı?HtmlUnit kaynağını görüntülemek için

Siteyi okuyacağımı biliyorum, ancak şimdi kaynağı bir dizeye döndürmek istiyorum.

HtmlPage mySite = webClient.getPage("http://mysite.com"); 

Teşekkürler! API bakarak itibaren

cevap

12

, benim düşünce olacaktır:

mySite.getWebResponse().getContentAsString(); 
+0

'toString() yöntemi kesinlikle işe yaramayacaktır, ikinci olsa da emin değilim. İşe yarayabilir gibi geliyor ama hiç denemedim. –

+0

mySite.getWebResponse(). GetContentAsString(); Eserleri! Kaynakın tamamını, sayfa içeriği menüsünden "kaynağı görüntüle" yi seçmiş gibi döndürür! Teşekkürler! –

+2

HtmlPage'de 'asXml()' yöntemi budur. Bu "kabul edilen" cevap olabilir, ancak bu, HtmlUnit'in bu bilgileri almanızı amaçladığı bir yol değildir. –

2

Eğer mySite.asXml() denedi? Yoksa, web sayfasının tam HTML kaynağını alacak mySite.getDocumentElement().toString()

14
String pageSource = myPage.asXml(); 

yapabilirsiniz. satır sonları/beyaz boşluk dahil, sayfa size görünür metnin tamamını alacak

String pageText = myPage.asText(); 

. Tarayıcınızdaki sayfada ve Ctrl+A sonra Ctrl+V bir değişkene aynı olsaydı aynı olurdu.