diff --git a/README_ja.md b/README_ja.md index a8a7c1c..2a45aa5 100644 --- a/README_ja.md +++ b/README_ja.md @@ -139,6 +139,7 @@ print(text) - `use_itn`:出力結果に句読点と逆テキスト正規化が含まれるかどうか。 - `batch_size_s`:動的バッチの使用を示し、バッチ内の音声の合計長を秒(s)で測定します。 - `merge_vad`:VADモデルによって分割された短い音声フラグメントをマージするかどうか。マージ後の長さは`merge_length_s`で、単位は秒(s)です。 +- `ban_emo_unk`:emo _ unkラベルを無効にする。 すべての入力が短い音声(30秒未満)であり、バッチ推論が必要な場合、推論効率を向上させるためにVADモデルを削除し、`batch_size`を設定できます。 diff --git a/README_zh.md b/README_zh.md index 7facbad..17568bb 100644 --- a/README_zh.md +++ b/README_zh.md @@ -143,6 +143,7 @@ print(text) - `use_itn`:输出结果中是否包含标点与逆文本正则化。 - `batch_size_s` 表示采用动态batch,batch中总音频时长,单位为秒s。 - `merge_vad`:是否将 vad 模型切割的短音频碎片合成,合并后长度为`merge_length_s`,单位为秒s。 +- `ban_emo_unk`:禁用emo_unk标签,禁用后所有的句子都会被赋与情感标签。 如果输入均为短音频(小于30s),并且需要批量化推理,为了加快推理效率,可以移除vad模型,并设置`batch_size`