Hasat paketini kullanarak, CABI invasive species compendium numaralı istilacı bitki türleriyle ilgili verileri ayıklamaya çalışıyorum.Bir html tablosundan veri kazıma
Birkaç öğreticiye baktığımda, tablolardaki verileri kolayca kolayca çizebilmem gerektiğini anladım. Ancak, zorluklarla karşılaşmaya devam ediyorum.
Türler Brassica tournefortii için konum verileri istiyorum diyelim. Türün kaydedildiği yerlerin ayrıntılarını öğrenmek için outlined here tekniklerini kullanan bu kodu kullanabilmem gerekir.
library(rvest)
isc<-read_html("http://www.cabi.org/isc/datasheet/50069")
isc %>%
html_node("#toDistributionTable td:nth-child(1)") %>%
html_text()
Ancak bu kod çalıştıran hatası
Error: No matches
Ben webscraping tamamen yeni duyuyorum olsun. Korkunç bir şey mi yapıyorum?
Fantastik, teşekkür ederim: Aynı zamanda
xml2
paketini kullanarak anlamına gelir ele alınması gereken gömülü ad alanlarını kullanır! Bu, o siteden veri almak için iyi bir başlangıç yapmama yardımcı olmalı. Xml_find_all işlevinin xpath bölümüne gitmek için bilgileri nasıl edinirsiniz? –Sağ tıklatarak ve bu tabloda Eleman İncelemek'i seçtikten sonra Geliştirici Araçları'nda gösterilen yoldan eşleştirdim. Bunu CSS ile yeniden yapılandırabilirim, ancak bazı durumlarda biraz yardımcı olacağımı bilerek. – hrbrmstr