Πώς να χρησιμοποιήσετε το Tesseract OCR στην Java

Συγγραφέας: Judy Howell
Ημερομηνία Δημιουργίας: 25 Ιούλιος 2021
Ημερομηνία Ενημέρωσης: 12 Ενδέχεται 2024
Anonim
Πώς να χρησιμοποιήσετε το Tesseract OCR στην Java - Άρθρα
Πώς να χρησιμοποιήσετε το Tesseract OCR στην Java - Άρθρα

Περιεχόμενο

Οι βιβλιοθήκες οπτικής αναγνώρισης χαρακτήρων Tesseract προσφέρουν στους προγραμματιστές έναν τρόπο να σαρώσουν έγγραφα και κείμενο σε μια εικόνα. Χρησιμοποιούνται για την αποθήκευση εικόνων εγγράφων που δεν χρειάζεστε πλέον σε χαρτί. Μπορείτε να τα χρησιμοποιήσετε στην Java δημιουργώντας βρόχους ελέγχου για κάθε χαρακτήρα και γράφοντας κάθε ένα σε ένα αρχείο. Για να χρησιμοποιήσετε τις βιβλιοθήκες Tesseract, πρέπει να συμπεριλάβετε το "χώρο ονομάτων" Java για τις λειτουργίες OCR.


Οδηγίες

Οι βιβλιοθήκες Tesseract επιτρέπουν στους χρήστες να σαρώσουν τα έγγραφά τους (John Foxx / Stockbyte / Getty Images)
  1. Κάντε δεξιό κλικ στο αρχείο Java που θέλετε να χρησιμοποιήσετε για να δημιουργήσετε το έγγραφο OCR. Κάντε κλικ στο "Άνοιγμα με" και επιλέξτε τον επεξεργαστή Java της επιλογής σας.

  2. Προσθέστε το χώρο ονομάτων της βιβλιοθήκης OCR στο επάνω μέρος του αρχείου. Αντιγράψτε και επικολλήστε τον ακόλουθο κώδικα στο αρχείο προέλευσης:

    com.touch.robot.imagecomparison.tesseractocr

  3. Δημιουργήστε τον κώδικα που είναι υπεύθυνος για τη σάρωση χαρακτήρων για ένα αρχείο. Για παράδειγμα, ο ακόλουθος κώδικας δημιουργεί βρόχους μέσα από κάθε χαρακτήρα σε ένα αρχείο και τα γράφει σε ένα αρχείο εικόνας:

    (I = 1, {i} <{γραμμές} +1, i = {i}) είναι ένα σύνολο τιμών που ορίζονται ως: +1) {Τύπος "{_TOCR_LINE {i}}"}


  4. Κάντε κλικ στο κουμπί "Αποθήκευση" του επεξεργαστή και κάντε κλικ στην επιλογή "Εκτέλεση" για να εκτελέσετε τον κώδικα σε έναν μεταγλωττιστή Java.