https://youtu.be/FuFM7T6LU2c

Рекомендации по Работе с Голосом на Veo Fast

(Основано на тестах с ассетом THE_MONARCH)

Проблема / Задача ❌ Неправильный Подход (Ведет к Провалу) ✅ Правильный Подход (Совет и Рекомендация) Связанный Урок / Принцип
1. Добиться чистого, неискаженного голоса Описывать персонажа в шлеме или с закрытым лицом. Избегать любых визуальных преград. Описывать голову как "энергетический конструкт" или нематериальную сущность. Чем меньше у модели "физических" причин приглушить голос, тем чище он будет. Мета-Принцип: "Взаимозависимость Категорий"
2. Сохранить уникальность персонажа во время диалога Перегружать сцену сложным фоном или действием. Максимально упрощать все, кроме голоса. Помещать говорящего персонажа в минималистичную среду (наш EMPTY_HANGAR) и давать ему минимальное действие (стоять на месте). Урок №113: "Визуальный Бюджет"
3. Передать сложную эмоцию (например, "холодная ярость") Просить несколько эмоций сразу или сочетать эмоцию со сложным действием. Фокусироваться на одной эмоции за шот. Давать очень точное, поэтическое описание этой эмоции в [SOUND_MAP] и делать ее единственной "сложной" задачей в промпте. Урок №109: "Одна Сложная Задача"
4. Управлять ритмом и паузами в речи Использовать абстрактные указания типа [long pause]. Использовать [SHOT_TIMELINE] для по-секундного контроля. Четко прописывать, на какой секунде начинается и заканчивается фраза, и какой длительности должна быть тишина. Урок №111: "Сценарный Таймлайн"
5. Избежать "проглатывания" начала фразы Начинать диалог с самого начала (Second 0). Всегда начинать диалог с искусственной микро-паузы. Например, [SHOT_TIMELINE]: - Seconds 0-1: [short pause] - At approx. Second 2: He speaks... Это дает модели "пространство для разгона". Урок №110: "Аудио-зазор"
6. Избежать появления субтитров Использовать кавычки или скобки в блоке [Dialogue]. Писать диалог чистым текстом, без знаков препинания по краям. Кавычки могут быть техническим триггером для автоматической генерации субтитров. Урок №118: "Анти-Субтитры"
7. Избежать сбоев из-за "осознания" модели Использовать в промпте слова, описывающие сам процесс генерации. Соблюдать "семантическую гигиену". Никогда не использовать в творческих промптах слова звук, генерация, движок, баг, ограничение и т.д. Урок №208: "Семантические Мины"
8. Гарантировать стабильность голоса в каждой генерации Надеяться, что модель "запомнила" голос из предыдущего кадра. Практиковать "постоянный контроль". В каждом новом промпте с диалогом заново прописывать полное описание Voice Quality в [SOUND_MAP], даже если оно не меняется. Урок №196: "Обязательного Описания"