2013-03-31 18 views
5

İşte proje resmi "Belgeler" var: Bir html belgesindeki öğeleri ayrıştırmak için ScrapySharp nasıl kullanılır?

https://bitbucket.org/rflechner/scrapysharp/wiki/Home


olursa olsun ben denemek şeye ben kütüphane sorgulama işleri kolaylaştırmak eklemek gerekiyordu CssSelect() yöntemini bulamıyor. İşte denedim:

using ScrapySharp.Core; 
using ScrapySharp.Html.Parsing; 
using HtmlAgilityPack; 

HtmlWeb web = new HtmlWeb(); 
HtmlDocument doc = web.Load("http://www.stackoverflow.com"); 

var page = doc.DocumentNode.SelectSingleNode("//body"); 
page.CssSel??? 

Bu kitaplığı tam olarak nasıl kullanırım? Belgede, html türünün ne olduğu açık değildir.

+2

. https://bitbucket.org/rflechner/scrapysharp/wiki/Home Umarım kullanımı daha kolay olur. Hoşçakal – rflechner

cevap

7

bunu kaçırıyorsun gibi görünüyor

using ScrapySharp.Extensions; 

ekleyin. Bu CssSelect kullanılabilir yapmalıdır. bir örnek burada, yardımcı olur ne olmaz

Ben bir projede kullandıkları yanı, bir yöntem var: Ben sadece projenin Wiki güncelledik

private string GetPdfUrl(HtmlDocument document, string baseUrl) 
{ 
    return new Uri(new Uri(baseUrl), document.DocumentNode.CssSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString(); 
}