VOICEVOXにスタイル音声合成を追加する #229

Hiroshiba · 2021-09-14T16:26:38Z

VOICEVOXには四国めたん・ずんだもんの２キャラクターがいますが、実はそれぞれにちょっとスタイルの違う感情音声が３つずつあります。
その感情音声（スタイル）の、まあまあ良い機械学習モデルができたので、バージョン0.6.0か0.7.0のアップデートで迎えたいと思っています。

スタイル音声はこれくらい変わります。上から順に四国めたんのノーマル・あまあま・セクシー・ツンツン、ずんだもんのノーマル・あまあま・セクシー・ツンツンです。

output.mp4

（今のVOICEVOXの音声は四国めたん・ずんだもんのあまあまです。）

このタイミングで、ソフトウェア・エンジン・コアに散らばっているキャクター情報を、こうまとめていきたいです。

エンジンはキャラクター情報を一切持たず、コアの情報を素通りさせます
ソフトウェアは最低限の情報（名前やサムネ画像）だけを持ちます
コアが持つ情報とソフトウェアが持つ情報は、IDによって決定します

変更したい箇所は次のとおりです。

（見逃しがあればご指摘ください）

Hiroshiba · 2021-09-21T15:24:17Z

VOICEVOX 0.6.0から、speakers情報がこう変わっているはずです。

[
  {
    "name": "四国めたん",
    "styles": [{ "name": "ノーマル", "id": 0 }],
    "speaker_uuid": "7ffcb7ce-00ec-4bdc-82cd-45a8889e43ff",
    "version": "0.5.4"
  },
  {
    "name": "ずんだもん",
    "styles": [{ "name": "ノーマル", "id": 1 }],
    "speaker_uuid": "388f246b-8c41-4ac1-8e2d-5d79f3ff56d9",
    "version": "0.5.4"
  }
]

このspeaker_uuidをソフトウェア側にも持たせて、スタイル名などの対応を取るのが良いかなと思っています。

y-chan · 2021-09-23T16:13:27Z

情報をFastAPIのModelに入力していく（OpenAPI用の型付け）をとりあえず引き受けようかなと思います。

Hiroshiba · 2021-09-23T16:14:57Z

@y-chan ありがとうございます！よろしくおねがいします！！

Hiroshiba · 2021-10-08T19:15:53Z

今日10/9の昼頃にスタイル音声合成が含まれるバージョン（0.7.0）をプレリリースしたいのですが、必須のタスクが残っているので協力を仰ぎたいです。
（といってもありがたいことに残るタスクはマイグレーションだけです。実装してくださった方、本当にありがとうございます。）

0.7.0には必須ではないが必要なもの（0.8.0か0.7.1に含めたい）も0.7.0に近い日程で出したいのですが、まだできていないのでこちらも協力を仰ぎたいです。
こちらの機能を実装するのは、音声スタイルは面白いから使ってほしい機能である一方、過去のボイロなどを見るに利用率がものすごく低いのをなんとかしたいためです。
瞬間的に盛り上がるのはスタイル追加のタイミングだと思うので、近い日程で出せればより盛り上がると考えています。

Hiroshiba · 2021-11-02T21:56:39Z

タスクが残っていますが、これは次のマイルストーン

https://github.com/Hiroshiba/voicevox/issues/429

の CharactorInfoをエンジンから取って来るようにすると同じなので、こちらのissueは閉じたいと思います。
難しいタスクでしたが達成できてよかったです！また次も頑張りましょう・・・！

Hiroshiba added the 機能向上 label Sep 14, 2021

Hiroshiba pinned this issue Sep 14, 2021

Hiroshiba mentioned this issue Sep 16, 2021

Ubuntu 18.04ベースのDockerイメージ自動ビルドを追加 VOICEVOX/voicevox_engine#98

Merged

y-chan mentioned this issue Sep 23, 2021

スピーカーModelの更新とモック情報の更新・統一 VOICEVOX/voicevox_engine#117

Merged

aoirint mentioned this issue Sep 26, 2021

Windows用実行バイナリの自動ビルド (#219) #264

Merged

16 tasks

This was referenced Sep 29, 2021

AudioItemのcharaterIndexをspeakerに変更 #279

Merged

２キャラ×４スタイルに対応 #289

Merged

初回起動時にデフォルトのスタイル選択UIを表示したい #293

Closed

This was referenced Oct 8, 2021

speakerをspeakerUuidとstyleIdに変更 #312

Closed

キャラクター選択UIを、キャラクター選択してからスタイル選択するUIに変更 #313

Closed

raa0121 mentioned this issue Oct 9, 2021

0.7.0 へのマイグレーション追加 #314

Merged

Hiroshiba closed this as completed Nov 2, 2021

Hiroshiba unpinned this issue Nov 2, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

VOICEVOXにスタイル音声合成を追加する #229

VOICEVOXにスタイル音声合成を追加する #229

Hiroshiba commented Sep 14, 2021 •

edited

Loading

Hiroshiba commented Sep 21, 2021 •

edited

Loading

y-chan commented Sep 23, 2021

Hiroshiba commented Sep 23, 2021

Hiroshiba commented Oct 8, 2021 •

edited

Loading

Hiroshiba commented Nov 2, 2021

VOICEVOXにスタイル音声合成を追加する #229

VOICEVOXにスタイル音声合成を追加する #229

Comments

Hiroshiba commented Sep 14, 2021 • edited Loading

Hiroshiba commented Sep 21, 2021 • edited Loading

y-chan commented Sep 23, 2021

Hiroshiba commented Sep 23, 2021

Hiroshiba commented Oct 8, 2021 • edited Loading

Hiroshiba commented Nov 2, 2021

Hiroshiba commented Sep 14, 2021 •

edited

Loading

Hiroshiba commented Sep 21, 2021 •

edited

Loading

Hiroshiba commented Oct 8, 2021 •

edited

Loading