Skip to content

Naver Clova Ocr Document

shghdrl1234 edited this page Jun 14, 2023 · 1 revision

Clova OCR API 연동

  • Clova OCR Document를 통하여 이미지 파일로 부터 OCR 데이터를 추출하는 로직은 구현하였습니다.

  • 제공되는 API 중, 다양한 영수증 양식을 토대로 학습하여 만들어진 영수증 모델에 특화된 API를 사용하였습니다.

  • 외부 API이므로 애플리케이션 내에서 API 요청을 해야했고, Docs 를 참고하여 요청 바디를 구성하고 api를 호출하는 메서드를 구현하였습니다




  • 위의 요청을 진행하면 아래와 같은 JsonData를 받아오게 됩니다.



  • 이러한 복잡한 구조의 Json 객체에서 원하는 값을 추출하기 위해 ObjectMapper과 JsonPath를 활용하여 값을 추출하고자 하였습니다.

  • 각 계층의 객체별로 class를 선언하고, class의 하위 계층의 객체는 필드 변수로 선언하였습니다.




  • 이미지를 추출하면 위 class 들을 통해 ObjectMapper과 JsonPath로 각 데이터를 읽어 오고,
    영수증 데이터를 포괄할 수 있는 상위 class인 Receipt class에 저장합니다.



  • 이후 생성된 값들에서 원하는 값만 얻기 위한 OCRResponse를 통해, 원하는 결과만 얻을 수 있도록 하였습니다.