본문 바로가기
프로그래밍

jTessBoxEditor 사용법

by TcTT 2017. 5. 29.
반응형

jTessBoxEditor 사용법입니다.

검색을해봐도 속시원한 사용법은없고..

유트부보고, 메뉴얼보고 맨땅에 이것저것 해딩하다가 느낀점들을 정리해서 포스팅한다.


이 포스팅은 내가원하는 글꼴의 한글 및 영문 숫자 데이터를 트레이닝시키기위해 작성한 포스팅이다.


jTessBoxEditor 다운로드경로

https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/


본인은 jTessBoxEditor-2.0-Beta.zip 버전을 사용했다.


우선 다운로드받으면 .zip 파일이며 압축을 해제하면 아래와같이 파일, 폴더가있다.

실행파일은 train.bat 파일이다.



만약 javaw 오류가 발생한다면, 

다운로드 url :

https://www.java.com/ko/

에 접속하여 자바를 다운받으면 된다.


프로그램을 실행시켜보자!

아래와같이 나올것이다..


위에 적었듯이 제일중요한 텍스트 트레이닝을 해보자... 

설명하는 재주가 부족하니 잘 따라와야한다..


상단 3가지탭 (Trainer , Box Editor, TIFF/Box Generator) 탭중에 TIFF/Box Generator를 클릭한다.

그럼 아래와 같은 화면이 나온다!


대부분의 사용자가 영문보단 한글에관심 있을거니 한글위주로 설명한다..

영문도 똑같으니 그대로 진행하면된다..


그럼 메모장을 연다! 메모장을열고 아래 첨부파일을 입력해준다.

완성형으로 만들 수 있는 모든 한글이 적혀있다.

ks완성형 한글모음.txt


여기서 중요한것!

파일을 저장할땐 꼭 다른이름으로 저장을 누른뒤..

원하는 텍스트이름.txt 로 저장한다.

아래에 인코딩(E) 가 기본 ANSI인데 꼭 UTF-8 로 변경해야한다...

이것때문에 1시간 삽질했다.

파일을 잘 저장했으면이제 box처리를 위한 txt를 tif로 변경 해보자..

여기서도 기존 블로그에 사기꾼이많아서 한참 삽질했다.


여기부턴 유튜브 영상을 참고하면된다!

여기 영상은 영문으로했지만, 한글도 동일하게하면된다.

중간에 eng 로 입력하는부분을 kor로 하면 된다





또한 자바 런타임은 7버전 이상이 필요하니 혹시나 위와같이 진행했음에도불구하고 예외처리 및 오류가 발생한다면 아래에있는 런타임을 다운받아서 최신으로 변경한다.


다운로드 경로:

http://www.oracle.com/technetwork/java/javase/downloads/index.html

반응형

'프로그래밍' 카테고리의 다른 글

HTML 소스코드  (0) 2017.06.08
WEB서버와 WAS 서버의 차이점  (0) 2017.05.31
CODE PROJECT License  (0) 2017.05.22
블록 암호 운용 방식 CBC ECB  (0) 2017.05.15
아스키코드 표  (0) 2017.04.10