OCR con Tesseract


Tesseract es un motor OCR gratuito creado por HP Labs entre el 1985 y 1995 y desarrollado actualmente por Google.

Es probablemente el más preciso OCR open source disponible actualmente. Combinado con "Leptonica Image Processing Library" puede leer una gran variedad de formatos de imagen y convertirlos a texto en 60 lenguajes. Se distribuye bajo licencia Apache 2.0.
Tesseract trabaja en Linux, Windows (con VC++ Express o CygWin) y Mac OS y puede ser compilado para otras plataformas como Android y IPhone.





Si el código en Delphi no os funciona comprobar en la unit UMainForm.pas que la ruta de los ficheros dll es la correcta en el evento Form.OnCreate
procedure TMainForm.FormCreate(Sender: TObject);
begin
  FCancelled := false;
  SetCurrentDir( ExtractFileDir( ParamStr( 0 ) ) );

  FTesseract := TTesseract.Create
  (
//COMPROBAR LA RUTA DE ABAJO
   ExtractFilePath(Application.ExeName)+'tesseract.dll',
   '..\'


  );

  {
//OTRA FORMA DE PONER LA RUTA
     (
    'tesseract.dll',
    '..\Tesseract\'
  );

}


  FTesseract.OnTaskCancel := TesseractCancel;
  FTesseract.OnTaskProgress := TesseractProgress;
  FTesseract.OnTaskEnd := TesseractTerminate;
  FTesseract.OnTaskError := TesseractError;




4 comentarios:

  1. does not work
    error
    http://smotr.im/bLyC

    ResponderEliminar
  2. Wtih Delphi 7 run fine.
    Be carefull with the next path (Maybe don't find the library tesseract.dll?)
    Check this in the unit UMainForm.pas
    ExtractFilePath(Application.ExeName)+'tesseract.dll',
    '..\'

    ResponderEliminar
  3. It compile, but i need the new version of tessaract... how do i get the new tessaract.dll?

    ResponderEliminar
  4. if you like tesseract ocr, you may like this free online ocr tool using tesseract ocr 3.02

    ResponderEliminar