jTessBoxEditor 사용법입니다.
검색을해봐도 속시원한 사용법은없고..
유트부보고, 메뉴얼보고 맨땅에 이것저것 해딩하다가 느낀점들을 정리해서 포스팅한다.
이 포스팅은 내가원하는 글꼴의 한글 및 영문 숫자 데이터를 트레이닝시키기위해 작성한 포스팅이다.
jTessBoxEditor 다운로드경로
https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/
본인은 jTessBoxEditor-2.0-Beta.zip 버전을 사용했다.
우선 다운로드받으면 .zip 파일이며 압축을 해제하면 아래와같이 파일, 폴더가있다.
실행파일은 train.bat 파일이다.
만약 javaw 오류가 발생한다면,
다운로드 url :
에 접속하여 자바를 다운받으면 된다.
프로그램을 실행시켜보자!
아래와같이 나올것이다..
위에 적었듯이 제일중요한 텍스트 트레이닝을 해보자...
설명하는 재주가 부족하니 잘 따라와야한다..
상단 3가지탭 (Trainer , Box Editor, TIFF/Box Generator) 탭중에 TIFF/Box Generator를 클릭한다.
그럼 아래와 같은 화면이 나온다!
대부분의 사용자가 영문보단 한글에관심 있을거니 한글위주로 설명한다..
영문도 똑같으니 그대로 진행하면된다..
그럼 메모장을 연다! 메모장을열고 아래 첨부파일을 입력해준다.
완성형으로 만들 수 있는 모든 한글이 적혀있다.
여기서 중요한것!
파일을 저장할땐 꼭 다른이름으로 저장을 누른뒤..
원하는 텍스트이름.txt 로 저장한다.
아래에 인코딩(E) 가 기본 ANSI인데 꼭 UTF-8 로 변경해야한다...
이것때문에 1시간 삽질했다.
파일을 잘 저장했으면이제 box처리를 위한 txt를 tif로 변경 해보자..
여기서도 기존 블로그에 사기꾼이많아서 한참 삽질했다.
여기부턴 유튜브 영상을 참고하면된다!
여기 영상은 영문으로했지만, 한글도 동일하게하면된다.
중간에 eng 로 입력하는부분을 kor로 하면 된다
또한 자바 런타임은 7버전 이상이 필요하니 혹시나 위와같이 진행했음에도불구하고 예외처리 및 오류가 발생한다면 아래에있는 런타임을 다운받아서 최신으로 변경한다.
다운로드 경로:
http://www.oracle.com/technetwork/java/javase/downloads/index.html
'프로그래밍' 카테고리의 다른 글
HTML 소스코드 (0) | 2017.06.08 |
---|---|
WEB서버와 WAS 서버의 차이점 (0) | 2017.05.31 |
CODE PROJECT License (0) | 2017.05.22 |
블록 암호 운용 방식 CBC ECB (0) | 2017.05.15 |
아스키코드 표 (0) | 2017.04.10 |