Initial commit: Qwen3-TTS Console Assistant implementation
This commit is contained in:
38
config.yaml
Normal file
38
config.yaml
Normal file
@@ -0,0 +1,38 @@
|
||||
# config.yaml
|
||||
storage:
|
||||
# Базовый путь для хранения моделей.
|
||||
# Если папки не существует, она будет создана.
|
||||
model_path: "./models"
|
||||
|
||||
# Папка для записанных сэмплов голосов
|
||||
sample_dir: "./samples"
|
||||
|
||||
# Папка для результатов синтеза (история)
|
||||
output_dir: "./out"
|
||||
|
||||
models:
|
||||
# Идентификаторы моделей.
|
||||
# Логика:
|
||||
# 1. Если путь абсолютный (начинается с / или C:/) -> используется он.
|
||||
# 2. Иначе ищет в storage.model_path/<name>.
|
||||
# 3. Если не находит -> качает с HuggingFace в storage.model_path/<name>.
|
||||
base: "Qwen/Qwen3-TTS-12Hz-1.7B-Base"
|
||||
voice_design: "Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign"
|
||||
custom_voice: "Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice"
|
||||
|
||||
generation:
|
||||
default_language: "Russian"
|
||||
default_speaker: "Chelsie"
|
||||
device: "auto"
|
||||
dtype: "bfloat16"
|
||||
|
||||
recording:
|
||||
sample_rate: 16000
|
||||
channels: 1
|
||||
# Чувствительность тишины (0.0 - 1.0).
|
||||
# Чем меньше число, тем тише звук считается тишиной.
|
||||
silence_threshold: 0.015
|
||||
# Длительность тишины в секундах для автоматической остановки
|
||||
silence_duration: 1.0
|
||||
# Минимальная длительность записи (защита от случайного клика)
|
||||
min_duration: 2.0
|
||||
Reference in New Issue
Block a user