From d290c52a499dcc7d2b0c05aa397cf16b381c1b14 Mon Sep 17 00:00:00 2001 From: sea-turt1e Date: Sun, 24 Nov 2024 09:27:40 +0900 Subject: [PATCH] =?UTF-8?q?README.md=E3=81=A8README=5Fja.md=E3=81=AEyougen?= =?UTF-8?q?=E3=82=AA=E3=83=97=E3=82=B7=E3=83=A7=E3=83=B3=E3=81=AE=E8=AA=AC?= =?UTF-8?q?=E6=98=8E=E3=82=92=E6=9B=B4=E6=96=B0=E3=81=97=E3=80=81=E7=94=A8?= =?UTF-8?q?=E8=A8=80=E3=81=8C=E8=A6=8B=E5=87=BA=E3=81=97=E8=AA=9E=E3=81=AB?= =?UTF-8?q?=E7=B5=B1=E4=B8=80=E3=81=95=E3=82=8C=E3=82=8B=E3=81=93=E3=81=A8?= =?UTF-8?q?=E3=82=92=E6=98=8E=E8=A8=98=E3=80=82=E3=83=90=E3=83=BC=E3=82=B8?= =?UTF-8?q?=E3=83=A7=E3=83=B3=E3=82=920.1.3=E3=81=AB=E6=9B=B4=E6=96=B0?= =?UTF-8?q?=E3=80=82?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 2 +- README_ja.md | 4 ++-- pyproject.toml | 2 +- 3 files changed, 4 insertions(+), 4 deletions(-) diff --git a/README.md b/README.md index c9c2437..05cf7ba 100644 --- a/README.md +++ b/README.md @@ -45,7 +45,7 @@ print(normalizer.normalize(text, config)) #### Configuration Details - unify_level (default="lexeme"): Flag to specify unification level. Default "lexeme" unifies based on lexeme number. "word_form" option unifies based on word form number. "abbreviation" option unifies based on abbreviation number. - taigen (default=True): Flag to include nouns in unification. Default is to include. Specify False to exclude. -- yougen (default=False): Flag to include conjugated words in unification. Default is to exclude. Specify True to include. +- yougen (default=False): Flag to include conjugated words in unification. Default is to exclude. Specify True to include. However, conjugated words are unified to the headword. - expansion (default="from_another"): Synonym expansion control flag. Default only expands those with expansion control flag 0. Specify "ANY" to always expand. - other_language (default=True): Flag to normalize non-Japanese languages to Japanese. Default is to normalize. Specify False to disable. - alias (default=True): Flag to normalize aliases. Default is to normalize. Specify False to disable. diff --git a/README_ja.md b/README_ja.md index 9f35e1e..86f8d59 100644 --- a/README_ja.md +++ b/README_ja.md @@ -46,8 +46,8 @@ print(normalizer.normalize(text, config)) #### 設定の詳細 - unify_level(default="lexeme"): 統一レベルを指定するフラグ。デフォルト"lexeme"はlexeme(語彙素)番号が同じもので統一。"word_form"オプションはwor_form(語形)番号が同じものでの統一。"abbreviation"オプションはabbreviation(略語)番号が同じものでの統一。 - taigen(default=True): 統一するのに体言を含むかどうかのフラグ。デフォルトは含む。含まない場合はFalseを指定。 -- yougen(default=False): 統一するのに用言を含むかどうかのフラグ。デフォルトは含まない。含む場合はTrueを指定。ただし用言は -expansion(default="from_another"): 同義語展開の制御フラグ。デフォルトは同義語辞書の展開制御フラグが0のもののみ展開。"ANY"を指定すると展開制御フラグが常に展開する。 +- yougen(default=False): 統一するのに用言を含むかどうかのフラグ。デフォルトは含まない。含む場合はTrueを指定。ただし用言は見出し語に統一されます。 +- expansion(default="from_another"): 同義語展開の制御フラグ。デフォルトは同義語辞書の展開制御フラグが0のもののみ展開。"ANY"を指定すると展開制御フラグが常に展開する。 - other_language(default=True): 日本語以外の言語を日本語に正規化するかどうかのフラグ。デフォルトは正規化する。正規化しない場合はFalseを指定。 - alias(default=True): 別称を正規化するかどうかのフラグ。デフォルトは正規化する。正規化しない場合はFalseを指定。 - old_name(default=True): 旧称を正規化するかどうかのフラグ。デフォルトは正規化する。正規化しない場合はFalseを指定。 diff --git a/pyproject.toml b/pyproject.toml index c3bf26a..14f84e0 100644 --- a/pyproject.toml +++ b/pyproject.toml @@ -1,6 +1,6 @@ [tool.poetry] name = "yurenizer" -version = "0.1.2" +version = "0.1.3" description = "A library for standardizing terms with spelling variations using a synonym dictionary." authors = ["sea-turt1e "] repository = "https://github.com/sea-turt1e/yurenizer"