-
Notifications
You must be signed in to change notification settings - Fork 1
Naver Clova Ocr Document
shghdrl1234 edited this page Jun 14, 2023
·
1 revision
-
Clova OCR Document를 통하여 이미지 파일로 부터 OCR 데이터를 추출하는 로직은 구현하였습니다.
-
제공되는 API 중, 다양한 영수증 양식을 토대로 학습하여 만들어진 영수증 모델에 특화된 API를 사용하였습니다.
-
외부 API이므로 애플리케이션 내에서 API 요청을 해야했고, Docs 를 참고하여 요청 바디를 구성하고 api를 호출하는 메서드를 구현하였습니다
- 위의 요청을 진행하면 아래와 같은 JsonData를 받아오게 됩니다.
-
이러한 복잡한 구조의 Json 객체에서 원하는 값을 추출하기 위해 ObjectMapper과 JsonPath를 활용하여 값을 추출하고자 하였습니다.
-
각 계층의 객체별로 class를 선언하고, class의 하위 계층의 객체는 필드 변수로 선언하였습니다.
- 이미지를 추출하면 위 class 들을 통해 ObjectMapper과 JsonPath로 각 데이터를 읽어 오고,
영수증 데이터를 포괄할 수 있는 상위 class인 Receipt class에 저장합니다.
- 이후 생성된 값들에서 원하는 값만 얻기 위한 OCRResponse를 통해, 원하는 결과만 얻을 수 있도록 하였습니다.