Initial commit: Qwen3-TTS Console Assistant implementation

This commit is contained in:
2026-03-23 15:27:57 +03:00
commit 5b79cfeb71
5 changed files with 592 additions and 0 deletions

38
config.yaml Normal file
View File

@@ -0,0 +1,38 @@
# config.yaml
storage:
# Базовый путь для хранения моделей.
# Если папки не существует, она будет создана.
model_path: "./models"
# Папка для записанных сэмплов голосов
sample_dir: "./samples"
# Папка для результатов синтеза (история)
output_dir: "./out"
models:
# Идентификаторы моделей.
# Логика:
# 1. Если путь абсолютный (начинается с / или C:/) -> используется он.
# 2. Иначе ищет в storage.model_path/<name>.
# 3. Если не находит -> качает с HuggingFace в storage.model_path/<name>.
base: "Qwen/Qwen3-TTS-12Hz-1.7B-Base"
voice_design: "Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign"
custom_voice: "Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice"
generation:
default_language: "Russian"
default_speaker: "Chelsie"
device: "auto"
dtype: "bfloat16"
recording:
sample_rate: 16000
channels: 1
# Чувствительность тишины (0.0 - 1.0).
# Чем меньше число, тем тише звук считается тишиной.
silence_threshold: 0.015
# Длительность тишины в секундах для автоматической остановки
silence_duration: 1.0
# Минимальная длительность записи (защита от случайного клика)
min_duration: 2.0