Ephesoft topluluğu sürüm 4.0.2.0'ı, ephesoft'un belirli görüntülerden gelen verileri sınıflandırabilen veya ayıklayabileceği sorunu olan e-maillerle (ephesoft tarafından test edilmiştir) kullanıyorum diğerleri dosyada hata mesajı olmadan yapamaz, şimdi neden yok. Ephesoft, belirli bir tif görüntüsünü öğrenemez veya çıkartamaz (tüm görüntülerde değil)
i bilgi dosyaları tıklayıp
HOCR ve HTML dosyaları sadece bu gibi meta veri içermeyen boş oluşturulan:Application_Checklist_HOCR.xml:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<HocrPages<HocrPage>
<Title></Title><Spans/>
<HocrContent></HocrContent>
</HocrPage></HocrPages>
Ancak ABD-invoice_HOCR için
. xml ephesoft öğrenebilir ve dosya şu şekilde görünebilir:<?xml version="1.0" encoding="UTF-8" standalone="yes"?><HocrPages><HocrPage>
<Title></Title><Spans><Span><Value>INVOICE</Value><Coordinates><x0>579</x0>
<y0>247</y0><x1>881</x1><y1>304</y1></Coordinates></Span><Span>
<Value>ACME</Value><Coordinates><x0>168</x0><y0>394</y0><x1>311</x1><y1>431</y1>
</Coordinates></Span><Span><Value>Company</Value><Coordinates><x0>329</x0>
<y0>395</y0><x1>541</x1><y1>442</y1></Coordinates></Span><Span>
<Value>lnvoice</Value><Coordinates>............
Yukarı ............ –
Tam olarak aynı pb var. Ama ben doğrudan komut satırında tesseract kullanırsanız, iyi çalışır. Bu komut satırı:> myfile.tif myfile hocr tesseract. Ancak Ephesoft'tan çalıştırıldığında işe yaramaz bir HOCR html dosyası üretilir. – ElArbi
tesseract yapılandırma dosyasını /Path-To-Ephesoft/Application/WEB-INF/classes/META-INF/dcma-tesseract/tesseract-reader.properties içinde düzenleyebilir ve bu satırı yorumlayın # tesseract.command_parameters = -psm 4 Varsayılan segmentasyonu kullanalım. –