Skip to content

Latest commit

 

History

History
103 lines (76 loc) · 3.7 KB

index.rst

File metadata and controls

103 lines (76 loc) · 3.7 KB

KOMORAN 문서

KOMORAN [1] 은 Java로 개발된 한국어 형태소 분석기입니다.

Note

KOMORAN은 Apache 2.0 License 로 배포되고 있습니다. 이는 누구나 자유롭게 다운로드 받아 부분 또는 전체를 개인적 또는 상업적 목적으로 이용할 수 있음을 뜻합니다. 더 자세한 내용은 Apache License 를 참고해주세요.


참고자료

KOMORAN 참고 자료

KOMORAN을 개발한 shineware에서 제공하는 참고자료입니다.

그 외 참고 자료

사용자 분들께서 만들어주신 참고자료입니다.

  • 간단히 실행해볼 수 있는 Simple API Server 를 사용해보실 수 있습니다.
  • Python 버전의 KOMORAN3Py 도 공개되어 있습니다.

개요

특징

  • Pure Java
    100% Java로만 개발되었기 때문에 자바가 설치된 환경이라면 어디서든지 사용 가능합니다.
  • 외부 라이브러리 독립적
    자체 제작한 Library들만을 사용하여 외부 Library와의 의존성 문제가 없습니다.
  • 경량화
    자소 단위 처리, TRIE 사전 등으로 약 50MB 메모리 상에서도 동작 가능합니다.
  • Easy to Use
    Library 적용 후 소스 코드 내 1줄만 추가하여 형태소 분석기를 사용할 수 있습니다.
  • 사전 관리 용이
    일반 텍스트 파일의 형태로 구성되어 가독성이 높으며 바로 편집이 가능합니다.
  • 새로운 분석 결과
    타 형태소 분석기와 달리 공백이 포함된 형태소 단위로 분석이 가능합니다.

분석 예시

  • 아래는 KOMORAN 데모 를 이용한 분석 예시입니다.
  • 입력 문장: 대한민국은 민주공화국이다.

KOMORAN 분석 예시 #1

  • 입력 문장: 대한민국의 주권은 국민에게 있고, 모든 권력은 국민으로부터 나온다.

KOMORAN 분석 예시 #2

.. toctree::
   :maxdepth: 2
   :caption: 시작하기
   :name: firststep

   /firststep/installation
   /firststep/tutorial
   /firststep/tutorial-java
   /firststep/postypes

.. toctree::
   :maxdepth: 2
   :caption: 사용 예시
   :name: examples

   /examples/analyze
   /examples/train-model
   /examples/spark2-scala


[1]한국어 형태소 분석기를 뜻하는 KOrean MORphical ANalyzer의 약자입니다.