Bir web sitesi tarama, site URL'lerinin ve kaynak türlerinin bir listesini, içeriğini oluşturma yeteneğine sahip Groovy (Grails framework ve MongoDB veritabanı kullanarak) bir web tarayıcısı geliştirmek istiyorum yanıt süreleri ve ilgili yeniden yönlendirmelerin sayısı.Paletli
JSoup vs Crawler4j üzerinde tartışıyorum. Temel olarak ne yaptığını okudum ama ikisi arasındaki farkı açıkça anlayamıyorum. Yukarıdaki işlevsellik için hangisinin daha iyi olacağını öneren var mı? Yoksa ikisini karşılaştırmak tamamen yanlış mı?
Teşekkürler.
Tam olarak aynı şeyi düşündüm. Aslında hem bir tarayıcıya hem de ayrıştırıcıya ihtiyacım var. Paletli crawler4j olabilir ama ayrıştırıcı için şüpheliyim. JSoup diğer ayrıştırıcılardan çok "Groovier" dir. Htmlunit "önemsiz ötesinde bir şey" javascript olan birkaç durumda başarısız olur. Ayrıca, kullanıcı incelemelerinden, web sitelerinin <% 50'sinde çalıştığı anlaşılmaktadır. –
Belki webdriver. Kullanmamıştım ama mükemmel şeyler duydum. – alkis
Selenyum web sürücüsünü JSoup ile entegre etmeye çalışıyorum. Önerin için teşekkürler. –