[융합연구] SW 중심대학 공동 AI 경진대회 본선 - OCR
작성자
차준영
학과 또는 소속(회사명)
소프트웨어융합학과
이메일
cjy8922@khu.ac.kr
조회수
9
평가(좋아요)수
0
댓글수
0
https://www.swuniv.kr/61/?q=YToxOntzOjEyOiJrZXl3b3JkX3R5cGUiO3M6MzoiYWxsIjt9&bmode=view&idx=13686962&t=board&category=85TqG78dF4
SW 중심 대학에서 주관한 공동 AI 경진대회에 팀 "경하예프"로 참여해 최종 5등으로 마무리하였습니다. 9월 8일 ~ 10월 7일 까지 약 한 달 동안 "광학 문자 인식 모델 개발" 이라는 주제로 발표 및 모델 성능 검증까지 마무리 한 끝에 좋은 성적으로 입상할 수 있었습니다.
저희가 해결한 문제의 핵심은 모델 일반화 성능 향상을 위한 "데이터 셋 품질 향상" 이었습니다. 데이터 셋의 품질을 향상 시키기 위해 저희는 다양한 방법을 사용했습니다.
1. data의 실제 label과 학습에 사용할 label 일치
2. 좋은 품질의 외부 데이터 셋 사용 (AIhub, 야외 실제 촬영 한글 이미지")
3. 어두운 환경에서도 좋은 feature map을 뽑기 위해, histogram equalization 기법 도입 (CLAHE, histogram clipping)
4. 가로형 간판과 세로형 간판, 모두 좋은 성능을 내기 위해 2D feature에서 문맥적 정보를 추출하는 딥러닝 모델 활용
5. 기울어진 문자에서도 인식을 잘 할 수 있도록 rotation augmentation 기법 사용
주어진 데이터를 9:1로 나누어 검증 데이터로 평가했을 때, 93.16%의 정확도, 1-NED 성능 (0~1 사이의 값을 가지며, 1에 가까울 수록 좋은 성능)에서는 0.9773 정도로 높은 성능을 보였으며, 테스트 데이터에서도 92.44%의 정확도를 얻을 수 있었습니다.
주어진 데이터를 분석하고 이를 확장하며 전처리하는 과정에서 알고리즘의 독창성과 문제해결 능력 부분에서 좋은 점수를 받았으나,
잘 구축된 OCR 모델을 활용할 뿐, OCR 모델의 문제를 개선하지 못해 그 부분에서 아쉽다는 평을 받았습니다.
SW 중심 대학에서 주관한 공동 AI 경진대회에 팀 "경하예프"로 참여해 최종 5등으로 마무리하였습니다. 9월 8일 ~ 10월 7일 까지 약 한 달 동안 "광학 문자 인식 모델 개발" 이라는 주제로 발표 및 모델 성능 검증까지 마무리 한 끝에 좋은 성적으로 입상할 수 있었습니다.
저희가 해결한 문제의 핵심은 모델 일반화 성능 향상을 위한 "데이터 셋 품질 향상" 이었습니다. 데이터 셋의 품질을 향상 시키기 위해 저희는 다양한 방법을 사용했습니다.
1. data의 실제 label과 학습에 사용할 label 일치
2. 좋은 품질의 외부 데이터 셋 사용 (AIhub, 야외 실제 촬영 한글 이미지")
3. 어두운 환경에서도 좋은 feature map을 뽑기 위해, histogram equalization 기법 도입 (CLAHE, histogram clipping)
4. 가로형 간판과 세로형 간판, 모두 좋은 성능을 내기 위해 2D feature에서 문맥적 정보를 추출하는 딥러닝 모델 활용
5. 기울어진 문자에서도 인식을 잘 할 수 있도록 rotation augmentation 기법 사용
주어진 데이터를 9:1로 나누어 검증 데이터로 평가했을 때, 93.16%의 정확도, 1-NED 성능 (0~1 사이의 값을 가지며, 1에 가까울 수록 좋은 성능)에서는 0.9773 정도로 높은 성능을 보였으며, 테스트 데이터에서도 92.44%의 정확도를 얻을 수 있었습니다.
주어진 데이터를 분석하고 이를 확장하며 전처리하는 과정에서 알고리즘의 독창성과 문제해결 능력 부분에서 좋은 점수를 받았으나,
잘 구축된 OCR 모델을 활용할 뿐, OCR 모델의 문제를 개선하지 못해 그 부분에서 아쉽다는 평을 받았습니다.
[융합연구] SW 중심대학 공동 AI 경진대회 본선 - OCR
조회수
9
평가(좋아요)수
0
댓글수
0
게시 : 2022년 11월 18일
차준영
소프트웨어융합학과
cjy8922@khu.ac.kr
[융합연구] SW 중심대학 공동 AI 경진대회 본선 - OCR
조회수
9
평가(좋아요)수
0
댓글수
0
게시 : 2022-11-18
Member
김민성, 박수용, 이상민, 차준영, 한주혁
Keyword
광학 문자 인식, OCR, 인공지능, AI, 딥러닝, Deep Learning, 컴퓨터 비전, Computer Vision
- 인공지능