2016-04-09 22 views
-1
aşağıdaki işaretlemenizdeki ihlallerin listesini almak gerekir

yılında br elemanları tarafından ayrılmış olsun nasılmetin scrapy

<b><font size="2" face="Verdana">Violations:</font></b><br> 
<i><font size="2" face="Verdana">A summary of the violations found during the inspection are listed below.</font></i><br> 
<br> 
<font size="2" face="Verdana">209 Food not protected from contamination [s. 12(a)] <br> 
<br> 
302 *Critical* Equipment/utensils/food contact surfaces not properly washed and sanitized [s. 17(2)] <br> 
<br> 
306 Food premises not maintained in a sanitary condition [s. 17(1)] <br> 
<br> 
</font><br> 

Bunu başarmak nasıl yapabileceğimiz hakkında fikriniz var mı? Bu

response.xpath('string(//font)').extract() 

UPD gibi

cevap

0

Kullanım şey: kullanın seçici response.xpath("string(//font[5])").extract() Bana belgedeki tüm font elemanları verir bu sayfayı http://www.healthspace.ca/Clients/FHA/FHA_Website.nsf/0/ABD0FA785D27B11588257C6900050EA3?OpenDocument

+0

ayrıştırmak eğer. '// font [text() = "Violations:"]/aşağıdaki :: font' 'ı denedim ama bu da işe yaramıyor. – MoreScratch

+0

Web sayfası URL'sini alabilir misiniz? –

+0

Cevabı güncelledim, bir kez daha kontrol et –