Açık kaynak uygulaması tercih edilecektir.Belgeyi pdf'den html'ye dönüştürmek için herhangi bir java kütüphanesi var mı?
6
A
cevap
2
Açıkçası, PDF biçimlendirme HTML'ın olandan çok daha zengin olduğunu, kolay bir iş değildir (artı vb imajları ve bunları bağlamak gerekir).
Basit metin çıkarımı çok daha basit (önemsiz olmasa da ...).
Sorunuzun kenar çubuğunda benzer bir soru görüyorum: Converting PDF to HTML with Python bir kütüphaneye işaret ediyor (görünüşe göre C++ ile yazılmış poppler, belki de JNI/JNA ile erişilebilir) ve daha fazla cevap veren ilgili bir soruya.
1
Sadece bildiğimler için ödeme yapılması gerekiyor. JPedal
1
apache temelinden PDFBox kullanmayı deneyin.
Bunun için de bir çözüm bilmek isterim. PDFBox bunu yapabilir (http://java.dzone.com/articles/converting-pdf-html-using?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+javalobby%2Ffrontpage+%28Javalobby+%2F+Java+Zone%29), ancak çok sınırlı bir şekilde. – Alp