장바구니에 상품이 없습니다.
home2 › 게시판 › Python, SQL 게시판 › 딥러닝을 시켜 이미지에서 한글 텍스트를 추출하고 싶은데
어떻게 가닥을 잡아야할지 모르겠습니다 데이터 찾기 - AI 데이터찾기 - AI-Hub (aihub.or.kr) 데이터는 위에 있는 곳에서 구하였는데 데이터 전처리는 어떻게 하며 모델은 어떻게 짜야 할지, 또한 Validation 또한 json 파일로 되어 있어 어떻게 해야할지도 모르겠습니다.
힌트를 주실 수 있을까요? 또한 현대 한글이 표현할 수 있는 글자 수가 11,172개라고 하는데 마지막 Dense를 11172로 잡아야 하는 걸까요?
이미지에서 문자부분만 잘라주는 모델도 필요하고 사진을 넣었을 때 문자를 뱉어주는 cnn + rnn이나 transformer 모델 만들면 되는데 ocr 같은거 한번 찾아보면 되겠습니다
ocr을 사용하지 않고서는 힘들까요?
이미지 전체를 때려넣고 문자로 뽑으라고하면 아마 결과는 별로 안좋을거같습니다