2015-09-10 51 views
9

Ubuntu 14.04.x ​​Makinemde bir uygulamam var. Bu uygulama PDF dosyaları üzerinde metin madenciliği yapar. Ben Dosyada ayrıştırmada Ubuntu makinesinde yazı tipi sorunu PDF Dosyası

sorun

, onun okuma işlemi sırasında, aşağıdaki uyarıyı elde ediyoruz ... o Apaçi Tika vb kullandığını sanıyorum:

2015-09-10 14:15:35 [WARN] FontManager Font not found: CourierNewPSMT 
2015-09-10 14:15:36 [WARN] FontManager Font not found: CourierNewPSMT 
2015-09-10 14:19:33 [WARN] FontManager Font not found: Helvetica 
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica 
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica 
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica 
...... 

nasıl makinede bu fontları alabilirim? Yoksa yazı tipleri için eksik olduğum bir java lib mı?

+1

FontManager.java'nızı linux makinenizde kontrol ettiniz mi? – Jordon

+1

Neyi kontrol etmeliyim? – MaatDeamon

+0

Kodu değiştirebiliyor musunuz? Bu sizin uygulamanız mı yoksa sadece bu uygulamayı mı kullanıyorsunuz? – MQ87

cevap

4

Bu sorunu gidermek için üç adımlı bir yaklaşım yaparım.

  1. aranır ve yükleyin bu dosyalar paketin sağlanması için eksik paket

1.) strace takın

  • aramak için strace
  • kullanın apt-dosyası kullanılarak bulunmayan hangi dosyaların analiz Yüklü değilse sudo apt-get install strace

    Uygulamanız tarafından hangi dosyaların kullanıldığını kontrol edin:

    $> strace <your app> 2>&1 | grep open

    daha fazla ENOENT hatalar için bu filtreleyebilirsiniz:

    $> strace <your app> 2>&1 | grep open | grep ENOENT

    Artık dosyaların eksik bilmelidir.

    2.) Bu dosyayı hangi paketin verdiğini kontrol edin. Burada hiç Ubuntu ettik, ancak MS yazı denilen bir paket halinde mevcuttur "kullanarak o paket apt-get install <package>

    yüklemek)

    su 
    apt-get install apt-file 
    apt-file update 
    apt-file search <filename> 
    

    3. (-S dpkg yalnızca önceden yüklenmiş paketler için çalışır) mscorefont "veya benzer.