(Основано на тестах с ассетом THE_MONARCH)
| Проблема / Задача | ❌ Неправильный Подход (Ведет к Провалу) | ✅ Правильный Подход (Совет и Рекомендация) | Связанный Урок / Принцип |
|---|---|---|---|
| 1. Добиться чистого, неискаженного голоса | Описывать персонажа в шлеме или с закрытым лицом. | Избегать любых визуальных преград. Описывать голову как "энергетический конструкт" или нематериальную сущность. Чем меньше у модели "физических" причин приглушить голос, тем чище он будет. | Мета-Принцип: "Взаимозависимость Категорий" |
| 2. Сохранить уникальность персонажа во время диалога | Перегружать сцену сложным фоном или действием. | Максимально упрощать все, кроме голоса. Помещать говорящего персонажа в минималистичную среду (наш EMPTY_HANGAR) и давать ему минимальное действие (стоять на месте). |
Урок №113: "Визуальный Бюджет" |
| 3. Передать сложную эмоцию (например, "холодная ярость") | Просить несколько эмоций сразу или сочетать эмоцию со сложным действием. | Фокусироваться на одной эмоции за шот. Давать очень точное, поэтическое описание этой эмоции в [SOUND_MAP] и делать ее единственной "сложной" задачей в промпте. |
Урок №109: "Одна Сложная Задача" |
| 4. Управлять ритмом и паузами в речи | Использовать абстрактные указания типа [long pause]. |
Использовать [SHOT_TIMELINE] для по-секундного контроля. Четко прописывать, на какой секунде начинается и заканчивается фраза, и какой длительности должна быть тишина. |
Урок №111: "Сценарный Таймлайн" |
| 5. Избежать "проглатывания" начала фразы | Начинать диалог с самого начала (Second 0). |
Всегда начинать диалог с искусственной микро-паузы. Например, [SHOT_TIMELINE]: - Seconds 0-1: [short pause] - At approx. Second 2: He speaks... Это дает модели "пространство для разгона". |
Урок №110: "Аудио-зазор" |
| 6. Избежать появления субтитров | Использовать кавычки или скобки в блоке [Dialogue]. |
Писать диалог чистым текстом, без знаков препинания по краям. Кавычки могут быть техническим триггером для автоматической генерации субтитров. | Урок №118: "Анти-Субтитры" |
| 7. Избежать сбоев из-за "осознания" модели | Использовать в промпте слова, описывающие сам процесс генерации. | Соблюдать "семантическую гигиену". Никогда не использовать в творческих промптах слова звук, генерация, движок, баг, ограничение и т.д. |
Урок №208: "Семантические Мины" |
| 8. Гарантировать стабильность голоса в каждой генерации | Надеяться, что модель "запомнила" голос из предыдущего кадра. | Практиковать "постоянный контроль". В каждом новом промпте с диалогом заново прописывать полное описание Voice Quality в [SOUND_MAP], даже если оно не меняется. |
Урок №196: "Обязательного Описания" |