-
Notifications
You must be signed in to change notification settings - Fork 5
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
사용자 사전의 단어 인식 문제 #56
Comments
안녕하세요, @ssongss1223님. 남겨주신 코드에서는 사용자 사전은 UTF-8 인코딩을 지원하고 있어, 아래와 같이 UTF-8로 저장하실 경우에는 정상적으로 동작합니다. 아래는 동일 코드에서 encoding만 UTF-8-SIG로 바꾼 결과입니다. 다른 궁금하신 점이 있으시다면 덧글 남겨주시기를 부탁드립니다. :) |
빠른 답변 감사합니다. print(komoran.get_plain_text("방향 통과시 플로워 와이어링과 L방향 간섭")) 방향/NNG 통과/NNG 시/XSN 플로워 와이어링/NNG 과/JC L/SL 방향/NNG 간섭/NNG 감사합니다. |
네 확인해보고 말씀드리겠습니다. 혹시 가능하시다면 사용자 사전 업로드 가능하실까요? |
안녕하세요, @ssongss1223 님. @shin285 님께서 확인해보니 core쪽에서는 해당 이슈가 발생하지 않아, 아래와 같이 현재 테스트 중인 버전에서는 별다른 이슈가 없어서 조금 더 테스트 후에 버전 릴리즈하고 다시 말씀드리도록 하겠습니다. |
안녕하세요, @ssongss1223 님. 조금 전 pypi에 PyKOMORAN 버전을 0.1.6으로 업데이트하였습니다. |
(위 코멘트에 이메일 주소가 포함되어 있어 삭제하였습니다) |
안녕하세요?
빠른 답변 감사드립니다.
아래와 같이 설치를 시도했는데, 에러가 발생하네요
제가 시스템쪽은 잘 알지 못해서 그러는데, 구글써치를 해봐도 원인을 찾기가 힘드네요
확인 부탁드립니다. 감사합니다!
…-----Original Message-----
From: "Junghwan ***@***.***>
To: ***@***.***>;
Cc: ***@***.***>; ***@***.***>;
Sent: 2021-05-04 (화) 20:48:03 (GMT+09:00)
Subject: Re: [shineware/PyKOMORAN] 사용자 사전의 단어 인식 문제 (#56)
안녕하세요, @ssongss1223 님.
조금 전 pypi에 PyKOMORAN 버전을 0.1.6으로 업데이트하였습니다.
설치된 PyKOMORAN을 업데이트(pip install -U PyKomoran) 후 확인 부탁드립니다.
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub, or unsubscribe.
|
안녕하세요, 에러 메시지를 공유해주실 수 있으실까요? |
어제 전달드렸는데, 잘 받으신지 몰라서 다시 첨부로 전달드립니다.
…-----Original Message-----
From: "Junghwan ***@***.***>
To: ***@***.***>;
Cc: ***@***.***>; ***@***.***>;
Sent: 2021-05-06 (목) 09:47:25 (GMT+09:00)
Subject: Re: [shineware/PyKOMORAN] 사용자 사전의 단어 인식 문제 (#56)
안녕하세요, 에러 메시지를 공유해주실 수 있으실까요?
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub, or unsubscribe.
|
안녕하세요, 혹시 이메일로 첨부해주셨는지요? |
업그레이드 실행시 아래와 같은 메세지가 나타납니다. (py37) C:\Windows\system32>pip install --upgrade PyKomoran |
네, 올려주신 에러를 통해 윈도우 환경에서 |
안녕하세요, @ssongss1223 님.
위 명령어는 정식 릴리즈 버전을 에러 없이 설치가 되시고, |
(py37) C:\Windows\system32>pip install --index-url https://test.pypi.org/simple/ PyKomoran
Looking in indexes: https://test.pypi.org/simple/
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1091)'))': /simple/pykomoran/
WARNING: Retrying (Retry(total=3, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1091)'))': /simple/pykomoran/
WARNING: Retrying (Retry(total=2, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1091)'))': /simple/pykomoran/
WARNING: Retrying (Retry(total=1, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1091)'))': /simple/pykomoran/
WARNING: Retrying (Retry(total=0, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1091)'))': /simple/pykomoran/
Could not fetch URL https://test.pypi.org/simple/pykomoran/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='test.pypi.org', port=443): Max retries exceeded with url: /simple/pykomoran/ (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1091)'))) - skipping
ERROR: Could not find a version that satisfies the requirement PyKomoran (from versions: none)
ERROR: No matching distribution found for PyKomoran
네이버 메일 앱에서 보냈습니다.
-----Original Message-----
보낸사람: "Junghwan Park" ***@***.***>
받는사람: "shineware/PyKOMORAN" ***@***.***>
참조: "ssongss1223" ***@***.***>,"Mention" ***@***.***>
날짜: 2021.05.11 오전 01:51:38 (GMT+09:00)
제목: Re: [shineware/PyKOMORAN] 사용자 사전의 단어 인식 문제 (#56)
안녕하세요, @ssongss1223 님.
제가 윈도우 환경을 구하지 못한 상태로 시간이 흐르고 있어, 혹시 아래와 같이 테스트를 부탁드려도 괜찮으실지요?
(어려우시다면 덧글 남겨주시면 제가 윈도우 환경을 구해서 테스트 후에 다시 알려드리겠습니다.)
기존 PyKomoran 삭제: pip uninstall PyKomoran
(TestPyPI에서) 새 PyKomoran 설치: pip install --index-url https://test.pypi.org/simple/ PyKomoran
위 명령어는 정식 릴리즈 버전을 pypi.org에서 받아오는 대신, 정식 릴리즈 전의 버전을 test.pypi.org에서 다운로드 받으실 수 있도록 하는 명령어입니다.
에러 없이 설치가 되시고, Successfully installed PyKomoran-0.1.6.post1이라는 메시지를 보신다면 성공하신 것입니다.
확인 부탁드립니다.
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub, or unsubscribe.
|
안녕하세요? 혹시 추가 업데이트 사항이 있을까요? |
안녕하세요?
파이코모란 설치는 정상적으로 작동합니다.
다만, 라이브러리 import 에서 아래와 같은 메세지가 나타는데, 제 환경 설정 문제일까요?
제 환경은
Python 3.7.9, PyKomoran 0.1.6.post1
jdk1.8.0_231
JPype1-1.2.0-cp37-cp37m-win_amd64.whl
입니다.
…---------------------------------------------------------------------------
ModuleNotFoundError Traceback (most recent call last)
<ipython-input-2-c21f77d69f4c> in <module>
1 #개발시작#개발시작#개발시작#개발시작#개발시작#개발시작
2 #개발시작#개발시작#개발시작#개발시작#개발시작#개발시작
----> 3 from PyKomoran import *
4 komoran = Komoran("STABLE")
5 # komoran.set_user_dic("C:/Users/2879019/project_text2103/user_dic/userdic_210402_utf8.txt")
~\AppData\Roaming\Python\Python37\site-packages\PyKomoran\__init__.py in <module>
2 from .__version__ import __author__, __author_email__, __license__, __version__
3
----> 4 from .jvm import init_jvm
5 from .type import Pair, Token, Pos, DEFAULT_MODEL
6 from .core import Komoran
ModuleNotFoundError: No module named 'PyKomoran.jvm'
-----Original Message-----
From: "Junghwan ***@***.***>
To: ***@***.***>;
Cc: ***@***.***>; ***@***.***>;
Sent: 2021-05-17 (월) 02:42:48 (GMT+09:00)
Subject: Re: [shineware/PyKOMORAN] 사용자 사전의 단어 인식 문제 (#56)
안녕하세요. pip install PyKomoran 명령어로 다시 설치해서 사용해보시겠어요?
0.1.6.post1 버전이 설치되면 정상입니다.
해당 버전에서 결과도 정상적으로 출력되고 있습니다.
테스트 환경은 Windows 10 (한글), Python 3.7.9, PyKomoran 0.1.6.post1 및 OpenJDK 11입니다.
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub, or unsubscribe.
|
메세지가 남겨지지 않아서 에러 메세지 텍스트만 다시 보내드립니다.
…---------------------------------------------------------------------------
ModuleNotFoundError Traceback (most recent call last)
<ipython-input-2-c21f77d69f4c> in <module>
1 #개발시작#개발시작#개발시작#개발시작#개발시작#개발시작
2 #개발시작#개발시작#개발시작#개발시작#개발시작#개발시작
----> 3 from PyKomoran import *
4 komoran = Komoran("STABLE")
5 # komoran.set_user_dic("C:/Users/2879019/project_text2103/user_dic/userdic_210402_utf8.txt")
~\AppData\Roaming\Python\Python37\site-packages\PyKomoran\__init__.py in <module>
2 from .__version__ import __author__, __author_email__, __license__, __version__
3
----> 4 from .jvm import init_jvm
5 from .type import Pair, Token, Pos, DEFAULT_MODEL
6 from .core import Komoran
ModuleNotFoundError: No module named 'PyKomoran.jvm'
-----Original Message-----
From: ***@***.******@***.***>
To: ***@***.***>; ***@***.***>;
Cc: ***@***.***>;
Sent: 2021-05-17 (월) 10:15:20 (GMT+09:00)
Subject: Re: [shineware/PyKOMORAN] 사용자 사전의 단어 인식 문제 (#56)
안녕하세요?
파이코모란 설치는 정상적으로 작동합니다.
다만, 라이브러리 import 에서 아래와 같은 메세지가 나타는데, 제 환경 설정 문제일까요?
제 환경은
Python 3.7.9, PyKomoran 0.1.6.post1
jdk1.8.0_231
JPype1-1.2.0-cp37-cp37m-win_amd64.whl
입니다.
---------------------------------------------------------------------------
ModuleNotFoundError Traceback (most recent call last)
<ipython-input-2-c21f77d69f4c> in <module>
1 #개발시작#개발시작#개발시작#개발시작#개발시작#개발시작
2 #개발시작#개발시작#개발시작#개발시작#개발시작#개발시작
----> 3 from PyKomoran import *
4 komoran = Komoran("STABLE")
5 # komoran.set_user_dic("C:/Users/2879019/project_text2103/user_dic/userdic_210402_utf8.txt")
~\AppData\Roaming\Python\Python37\site-packages\PyKomoran\__init__.py in <module>
2 from .__version__ import __author__, __author_email__, __license__, __version__
3
----> 4 from .jvm import init_jvm
5 from .type import Pair, Token, Pos, DEFAULT_MODEL
6 from .core import Komoran
ModuleNotFoundError: No module named 'PyKomoran.jvm'
-----Original Message-----
From: "Junghwan ***@***.***>
To: ***@***.***>;
Cc: ***@***.***>; ***@***.***>;
Sent: 2021-05-17 (월) 02:42:48 (GMT+09:00)
Subject: Re: [shineware/PyKOMORAN] 사용자 사전의 단어 인식 문제 (#56)
안녕하세요. pip install PyKomoran 명령어로 다시 설치해서 사용해보시겠어요?
0.1.6.post1 버전이 설치되면 정상입니다.
해당 버전에서 결과도 정상적으로 출력되고 있습니다.
테스트 환경은 Windows 10 (한글), Python 3.7.9, PyKomoran 0.1.6.post1 및 OpenJDK 11입니다.
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub, or unsubscribe.
|
안녕하세요, 혹시
혹시 다른 버전이 설치되셨다면 0.1.6.post1 버전 설치를, 그 외 PyKomoran은 JVM과 통신을 위해 JPype대신에 py4j라는 라이브러리를 사용하고 있는데요,
더불어, |
잘 설치하였습니다. |
잘 설치되셨다니 다행입니다. |
안녕하세요
pykomorran 의 사용자 사전을 이용하여 키워드 분석하고 있는데
특정 단어들이 인식이 안되는 경우에 대해서 문의드립니다.
인식이 안되는 단어는 다음과 같습니다.
"플로워 와이어링이 피더케이블 장착 홀을"
사용자 단어사전으로 "플로워 와이어링"이라고 등록하였는데
"플로워/NA 와이어링/NNG 이/JKS 피/XPN 더/NNG 케이블/NNG 장착/NNG 홀/NNG"
이런식으로 되어서 원하는 인식 "플로워 와이어링/NNG" 이렇게 잘 되지 않네요
혹시 이유를 알 수 있을까요?
현재쓰고 있는 코드 일부는 아래와 같으며
excel 파일을 불러서 > 사용자사전을 만들어 CSV 파일로 특정위치에 놓고 (tab으로 구분된 user dic) > 그것을 읽어서 작업합니다.
===============================
from PyKomoran import *
komoran = Komoran("STABLE")
fileName = "C:/Users/2879019/project_text2103/user_dic/userdic_input_210429.xlsx"
user_dic_excel = pd.DataFrame()
for i in range(0,4) :
tmp = pd.read_excel(fileName, names=['category', 'word','oriYn','no'], sheet_name=i, header=None )
user_dic_excel = user_dic_excel.append(tmp)
user_dic_excel.reset_index(inplace=True)
user_dic_excel['part'] = 'NNG'
user_dic_excel1 = user_dic_excel[['word','part']]
user_dic_path = 'C:/Users/2879019/project_text2103/user_dic/userdic_210415_utf8_test.txt'
user_dic_excel1.to_csv(user_dic_path,index=False, sep='\t', encoding='utf-8-sig', header = None)
#사용자 사전 등록
komoran.set_user_dic(user_dic_path)
user_dic = pd.read_csv(user_dic_path, sep='\t', names=['word', 'part'], header=None )
The text was updated successfully, but these errors were encountered: