-
Notifications
You must be signed in to change notification settings - Fork 205
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
追加: kana 型 #972
追加: kana 型 #972
Conversation
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
型導入良いですね!!
言葉がすごい難しいなと感じました。
Grapheme
という単語と、Kana
というプレフィックスは、可能なら避けられると語弊を避けられる気がしました!
まだ見きれてないのですが、とりあえず語句周りの提案と認識揃えを 🙇
私の認識としては「VOICEVOX ENGINE のコード向け規約として『"AquesTalk 風記法" は コード上で これに関する私の認識がズレている、あるいは規約側の方針変更があった、という感じでしょうか…? |
@tarepan 今までの 今回のprefixはobjectではなく領域を示すもので、ドメイン用語を使いたい範囲が変わったという認識です。 今までは |
👍 大きな論点としては次の2つが残っているかと思います:
前者について認識の相違が大きそうなので、まずこちらの認識合わせがしたいです。 用語
|
moras.append(_text2mora_with_unvoice[matched_text].copy(deep=True)) |
よって文字側(AquesTalk 風記法テキストの atom)を Grapheme と呼ぶのは自然と考えます。
その上で、Mora
という語彙についてです。
「ヒホ」は「『ヒ』モーラ+『ホ』モーラ」であり、同時に「『h-i』モーラ + 『h-O』モーラ」でもあります。
つまり Grapheme を指すことも、Phonemes を指すこともあります。
なので g2p モジュールで「モーラ」という語を使うと、どちらを指すかわからなくなります。
mora_list
と kana_converter
で「モーラの長さ単位で atoms を扱うよ」という prefix として mora という語を使うのには賛成です。一方で「コ → katakana_mora
, ko → mora
」という使い分けは(特に音声合成屋に)誤解を招くと感じます。
このような背景から「コ → katakana_mora
, ko → mora
」ではなく「コ ∈ Grapheme, ko ∈ Phoeneme (Vowel, Consonant)」という方向性の命名をしています。
上記に関して認識がズレていそうな点、上記を受けての命名の方向性についてお聞きできれば嬉しいです。
数点ありそうでした!
言葉の定義的にちょっと違和感あるかなと! もうひとつ、これは素人の感覚ですが、graphemeは自然言語に使う言葉で、記号列であるkanaには使わない気もします。
moraだとややこしいのは同意です。 自分の考えの根幹は「kanaはgraphemeじゃない気がする」でした! |
👍
MoraKatakana = Literal["ア", "イ", "ウ"]
moras: list[tuple[MoraKatakana, Consonant, Vowel]] = [
("ヴョ", "by", "o"),
("ヴュ", "by", "u"),
...
]
// or
KatakanaMora = Literal["ア", "イ", "ウ"]
moras: list[tuple[KatakanaMora, Consonant, Vowel]] = [
("ヴョ", "by", "o"),
("ヴュ", "by", "u"),
...
] 👍 |
上記議論を受け、「 @Hiroshiba |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
良い感じにまとまったように感じました!!!
いくつか細かい箇所のコメントを書いていますが、概ね良さそうかなと!!
Co-authored-by: Hiroshiba <hihokaruta@gmail.com>
Co-authored-by: Hiroshiba <hihokaruta@gmail.com>
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
LGTM!!!
1点だけ追加でコメントしています!
Co-authored-by: Hiroshiba <hihokaruta@gmail.com>
@Hiroshiba |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
LGTM!!
内容
AquesTalk 風記法音素に型を追加
VOICEVOX 音素の 型付け・validation にあたり、ドメイン相互変換先である AquesTalk 風記法 (kana) ドメインの型付けがまず必要である。
よって型付けをおこなった。
関連 Issue
ref #894