OCR 관련 논문

날짜
2023/06/08
태그
비대면
기타

easyOCR을 사용, 글자인식 결과

개선점을 찾고, 성능 비교의 준거를 제시해본다.

-개선 사항

0. 전체적인 개선 사항) 글자인식률 높이기

학습을 통한 easyOCR자체의 성능을 높이기
생리대 이미지의 전처리 과정이 필요함

0.1 성능비교

논문 내용은 TesseractOCR이긴 하지만 easyOCR과 유사하기 때문에 유의미한 결과를 도출할 것이라고 판단
easyOCR엔진만 사용했을 경우의 한글 인식 정확도 구하기
전처리 과정 + easyOCR모델을 함께 사용했을 경우의 한글 인식 정확도 구하기
참고 논문

1.불필요한 정보 제거 (영어→인식률 떨어짐, 소재지와 같은 불필요한 정보)

참고 논문
HSV
INVERSION
EROSION
CROP

2.손떨림으로 인한 촬영 시 글자 뭉개짐 현상 + 외적인 현상에 대한 글깨짐

easy OCR의 성능을 높이기 위해서는 사전에 이미지 전처리 과정이 필요하다
참고 논문
글자 후보 추출
이미지 노이즈 제거
easyOCR사용해서 이미지의 문자를 인식해 텍스트로 변환

3. 이외 문제가 될 수 있는 사항들

수평/수직 방향이 아닐 경우
촬영 각도 상 상품의 과반 이상이 보이지 않는 경우
생리대 폰트 스타일이 다르다면 인식을 못할 수 있음
→ 위의 사항들에 대해서는 easyOCR내에서는 해결방법을 찾지 못함