Как сделать AI cover? Полный гайд (Ultimate Vocal Remover + RVC)
Добро пожаловать на мой канал! В этом видео я поделюсь подробной инструкцией по созданию AI кавер-версии песни, тренировке модели голоса на вашем компьютере и отделении инструментала от акапеллы.
Вы узнаете, как использовать программу RVC (Realtime Voice Conversion) для создания потрясающего AI кавера песни. Я покажу вам шаг за шагом, как загрузить и обработать аудиофайл, применить алгоритмы голосового преобразования и получить потрясающий результат.
Кроме того, вы узнаете, как тренировать модель голоса на вашем компьютере. Я расскажу о необходимых инструментах, данных и процессе обучения модели, чтобы вы смогли достичь максимального качества и достоверности голосового вывода.
В видео также будет продемонстрировано, как использовать программу UVR (ultimate vocal remover), чтобы отделить инструментал от акапеллы. Я расскажу о принципе работы программы и покажу вам, как легко и быстро получить инструментальную версию песни для дополнительного творчества и монтажа.
Не пропустите этот увлекательный урок, полный ценной информации и основанный на проверенных практических методах. Присоединяйтесь ко мне прямо сейчас и освойте современные возможности AI для музыкального творчества!
Не забудьте подписаться на мой канал, чтобы быть в курсе новых уроков и интересных тем. Оставляйте комментарии с вопросами и отзывами, и я с радостью на них отвечу.
Спасибо за просмотр!
Ссылки из видео:
RVC - huggingface.co/lj1995/VoiceCo...
Ultimate Vocal Remover - ultimatevocalremover.com/
Отделение голоса и акапеллы онлайн - vocalremover.org/ru/
Ссылка на telegram канал: t.me/ba1yya
Можете поддержать мой контент тут: boosty.to/ba1yya
теги-
ai cover, ai, so vits svc, cover, ai cover tutorial, how to ai cover, kanye west, нейросеть, how to make an ai cover, make ai cover, how to make ai cover, artificial, tutorial, how to make an ai cover tutorial, how to make a cover with ai, intelligence, how to make a song with ai, so-vits-svc, tutorial how to make an ai cover, ai voice, sovitssvc, модель голоса, vits svc, делаем модель голоса, как сделать голос colab, so-vits-svc 4.0, модель голоса google colab, делаем ai cover, своя модель голоса, mashup, so-vits-svc туториал, sovitssvc tutorial, so vits svc туториал, so-vits-svc google colab, so vits svc на андроид, мешап, как сделать модель голоса, so-vits-svc модель, so-vits, so-vits-svc как сделать свою модель, модель голоса сделать, мэшап, как сделать свою модель голоса, how to make kanye's voice, как сделать ai cover, how to make ai cover songs, кавер, ии, tinybunny, нейромэшап, aicover, нейрокавер, remix, искусственный интеллект, ai music, mashup.hk, mashup hk, lil t4k, music, #mashup, ai song tutorial, ai cover songs, how to ai cover tutorial, how to ai voice cover, ремикс, so vits svc tutorial, soviets svc tutorial, ai vocal tutorial, lil uzi vert ai, diff svc, sovits, how to use so vits svc, rvc, rvc tutorial, rvc ai, how to use rvc, new ai, how, bts, rvc ai cover, ghost, gotye, to, create, make, error google colab ai, спела, поет, за деньги да, кавер куплинов, ai нейросеть, винни пух, курт кобеин, kuplinov, best ai voice generator, аи кавер, как сделать кавер, ai мэшапы, как делать нейромэшапы?! / как сделать голос моргенштерна? | ai cover, musicfy ai, ai cover song, голоса знаменитостей, голос моргенштерна, как делать мэшапы, нейромешапы, как делать нейромэшапы, как, голоса артистов, remov, ai cover songs drake, rap, chatgpt, open ai, хип хоп, ai art, миджорни, нейросети, канье уэст, ai covers, ai generated music, скам, trends, ai rap, моргенштерн мэшап, мэшапы это, как сделать кавер найросетью, где взять модели для ai cover?, что сейчас популярно на ютубе, anighost, анигост, нейросеть моргенштерн, моргенштерн нейросеть слив трека, , оксимирон мэшапы, мэшапы, мэшап с нейросетью, мэшапы слушать, оксимирон нейросеть, трек с нейросетью, куплинов cover, нейросеть поет, нейросеть - за деньги да (слив трека), ai cover kai angel, ai cover morgenstern, how make ai cover, нейронные сети, канал, что делать если нету файла config.json?, ai voice changer, best ai voice changer, best ai voice clone, ai voice clone tutorial, ai voice cloning, best ai music generator 2023, best ai music tools, ai music michael jackson, ai music cover, ai music how to, ai music how to make, best ai music generator, ai voice cloning software, how to, ai generated vocals, ai generated cover song, voice to voice, ai voice to voice, quick, best ai cover tutorial, ai tutorial, how to make ai kanye, drake, rihow
СТАС АЙ КАК ПРОСТО УЧИТЬ ДЕЛАТЬ AI COVER 😱😱😱
Стас Ай Как Кавер
Стас Ай как узко
Тоже так подумал)) только без каламбурчиков)
Зеленского
что делать, если я вставляю путь и ничего не выходит?
Это очень круто! Спасибо за видео)
Автор делится полезной информацией, без воды и лишней духоты. Так-же автор поясняет за каждый ползунок, каждое поле в каждой программе. Рекомендую к просмотру
подскажи за что отвечает ползунок searcj feature ratio и куда его крутить что меняеться если не 0.75 а допустим 0.10 ?
автор говна пожрал, вместо того чтобы показать куда кидать уже готовые модели, мусолит какую-то хуйню про каверы из своих моделей,
Просто огромное спасибо за гайд
Спасибо мужик, от всего сердца.
Это бомба, очень рад что встретил ваш канал!)
Низкий поклон за такую инфу. Очень понятная подача.
блин я в восторге от этого парня очень понятно все объясняет и все получается, уже который гайд смотрю
Спасибо, всё получилось)
Вау, я думал это намного сложнее, спасибо
Ты просто лучший! Не знаю как и описать мои эмоции, целый день убил на способы других блогеров, зашел к тебе и с первого раза получилось. Спасибо тебе огромное!
Плюсую
11:50 что делать, если я вставляю путь и ничего не выходит?
Чувак, ты реально крут) Очень классный гайд!
на самом деле, спасибо огромное за гайд, было очень полезно.
Один из лучших гайдов, мне например больше всего помог блок с настройкой пресетов в UVR, спасибо большое! А насчет создания самого аи кавера скажу что лучше поставить в дополнение mangio-crepe, по мне он гораздо лучше и реалистичнее конвертит голос нежели pm или harvest
11:50 что делать, если я вставляю путь и ничего не выходит?
Спасибо что объяснил
Отличный гайд,спасибо что научили делать ai каверы!!!
Дружище, ты - лучший, спасибо тебе большое! Настройка пресетов в UVR - это вообще золото!
Спасибо ☺️ Скоро по нему дополнение выйдет. Чтобы еще лучше голос отделить, новые фишки откапал)
Буду тоже ждать@@ba1yya
@@ba1yya топ!!!
@@ba1yya Классно, классный!!!:))).
11:50 что делать, если я вставляю путь и ничего не выходит?
Спасибо большое) У меня всё получилось) Теперь Ариана Гранде будет петь песни, которые я захочу)
Часа 3 ушла разобраться, потому что иногда вылезали какие-то ошибки, но я смог, гайд хороший, спасибо!
очень подробный и понятный гайд, спасибо!
Спасибо, объяснил все без воды и по факту! Хороший гайд, лайк однозначно!
Спасибо вам за уроки! Обьясняете кратко и понятно) Возникла одна проблема в UVR - при создании акапеллы при помощи метода MDX-Net появляется неприятный шум. Пробовал много чего, но итог такой же. Не подскажете, как исправить эту проблему?
Есть видео на канале с обновленной инструкцией отделения
Благодарю!
Тоесть полезный видос)
8:52 Вы можете переименовать файл с названием RU по пути RVC-beta0717\i18n в en_US и тогда весь интерфейс будет на русском
Привет, вот мучаюсь уже два дня на своем не самом мощном компьютере. Какие облачные сервисы можешь посоветовать для тренировки?
Тестил в сервисе, качество поразило просто, искусственный интеллект делает свое дело, честно в одном вокале я даже услышал чуточку больше, чем с музыкой. Эта же программа так же качественно все делает?
Привет, а если хочешь наложить свой голос, на определённую песню, т.е. есть возможность записать голос, определённым образом, есть ли какие то советы какой должна быть запись? Нужно ли напевать прям текст песни, на которую потом хочешь наложить голос, или наоборот это может навредить только? Если песня будет на английском, есть ли смысл начитывать текст или напевать на английском? Если нет музыкальных данных, нужно ли записывать специально низкий голос и высокий, или тихий и громкий, даже если это будет неумело?
Голос должен быть как написал, и высокий и низкий и тихий и громкий, как можно более широкий диапазон. Можно и попеть, можно и по английски, если будешь на нем песни делать потом, в русском некоторых звуков нет. Что в английском есть. В общем как можно разнообразнее все делай
четкий вопрос
Спасибо огромное за подробный разбор! А в какой из программ лучше получится изменить голос по обученной модели? Сделать convert в RVC, либо загрузить модель в AI Voice Changer и там сделать преобразование?
Разобрался) В RVC у меня качественней выходная запись получилась. Если я правильно понял, то Voice Changer больше подходит для разговоров в прямом эфире и сохранение готовой записи в нем проблематичнее. А в RVC с сохранением проблем нет. К тому же прослушивать варианты с разными настройками также лучше в RVC. В общем, в моем случае, когда нужен именно измененный аудио файл, а не прямой эфир, то лучше RVC. Может быть я что-то и упустил в настройках Voice Changer, но пока остановился на RVC.
Возможно ли поделиться своей моделью с другими людьми? Если да, то где можно найти файлы своей модели?
Видео здоровское. Всё сработало, уже какой месяц пользуюсь. Будет ли что-то похожее с TTS?
Выглядит очень впечатляюще! Сам я вообще ноль в работе с AI (даже как запустить на компе Stable Diffusion не понял), но сейчас вроде даже всё понял. Надеюсь моя 1050 справится...
Если не справится, на канале есть вторая часть этого видео. Где не на своем железе это делаем все)
@@ba1yya Спасибо большое!
1050 справилась?
@@user-ty1rw3xd4p Мне совестно признаться в этом, но как-то ещё не успел попробовать - всё никак не дохожу(
вчерa 2 чaсa не мог рaзобрaться, a сегодня после роликa нa изи сделaл) спaсибо!
Спасибо за видео. Подскажите, а обязательно закачивать нарезанные куски голоса или можно одной дорожкой длинной загружать?
Можно одной длинной. rvc сам нарежет все равно как ему надо
@@ba1yya а сильно ли это влияет на время? У меня просто около 50 файлов разной длинны(но не более 40 секунд) и 1 эпоха проходит в течении 4 с лишним минут...
@@Multiki228 на время только влияет твой датасет. Чем он больше, тем дольше будет одна эпоха делаться. 15 минут датасета 30 секунд эпоха. Дальше по аналогии можешь посчитать сколько у тебя эпоха +- будет делаться
Спасибо!
Привет. Что делать если при дообучении модели почему то время тренировки каждой эпохи увеличилось в 2.5 раза?
На шаге 2а в RVC переработка файлов сначала стартует, затем завершается и сразу же возникает Error: Connection errored out. Соответственно, во всех последующих шагах то же самое. RVC скачивал по всем приведённым ссылкам.
Что делать, если после нажатия "train model" выскакивает вот этот текст "训练结束, 您可查看控制台训练日志或实验文件夹下的train.log" и дальше ничего больше не происходит?
Пните, пожалуйста, когда найдете ответ...
У вас в консоли (которая черное окно в самом начале запуска программы) пишется ошибка, но скорее всего вам не нужно ее читать и там банальное - вы попробовали дважды обработать проект с одинаковым название. Нужно удалить в папке программы logs все кроме папки mute и заново проделать все шаги. Если не поможет - смотреть что выводит в консоли и гуглить.
Здравствуйте , нашли причину?
@@user-fy9fv3oj2d Нет, использовал другую нейронку
@@user-fy9fv3oj2d Причиной оказалась видеокарта. До этого у меня была rx 5600 xt, сейчас rtx 4070 ti и все заработало. амд не подходит для работы, они заточены исключительно под игры
Спасибо большое, а где лежит ptx и index файлы?
Спасибо за гайд! Если кто-то сталкивался, подскажите, пожалуйста, для каверов на песни обучать лучше по спокойному голосу или так же по пению?
Что делать, если загрузил аудиофайл формата mp3 весом 14 мегабайт в RVC (сайт Gradio) и при нажатии Process Data аутпут окно пустует или выдаёт ошибку (рамка загорается)? В кодовой строке выписывает в конце Failed. Feature Extraction также пустует, но рамка горит и в кодовой строке происходит нарезка. При нажатии на Train Model также выдаёт ошибку. Перезагружать пробовал, менять расположение файла, а также избавлялся разным путём от кириллицы в пути к файлу.
Супер! Хотел всегда скопировать голос "Человека в черном" - Уильяма - персонажа из сериала мир дикого запада, которого озвучивает Станислав Концевич. Вот бы научиться
Бог храни тебя! Мне седня счетчик времени на Кагле сбросили, шикааарно !
Отличный гайд! Есть возможность вернуть в RVC возможность выбора Target sample rate 48k? Добавить 88.2к, 96к? Или 40к изменить на аудиостандартные 44.1к? Так как 40к приходится конвертировать в DAW под аудиостандарты, а это привносит искажения.
еще очень не хватает метода манго-крип
11:50 что делать, если я вставляю путь и ничего не выходит?
Добрый день, отличное видео, подскажите как остановить тренировку чтобы сохранилась модель последняя эпоха сохранённая
Она сама останавливается и сохраняет конечную версию, когда все эпохи пройдут
А сколько примерно памяти нужно для программ?
хороший гайд, ставьте 250 эпох и 5 голосовых для тренировки
Спасибо за видео. Скажите, я правильно понимаю, что модель сохраняется на пк под своим id? Я смогу через три месяца (к примеру) не обучая заново её юзать?
Спасибо за туториал. Кстати, в Windows 11 если нажать на файле ПКМ есть пункт "Копировать как путь", чтобы не заморачиваться с переименованием (на Windows 10 такой же пункт есть, если нажать Shift+ПКМ). По поводу сервиса vocalremover, то через прокси можно таки несколько раз в день файл разделять, возможно просто тебе попался адрес, с которого уже работали с таким сервисом
спасибо, подписался лайк поставил😀
Хотел бы вернуться с обратной связью по гайду: это действительно самая понятная и подробная инструкция на русском языке! В качестве датасета использовал два альбома моего любимого исполнителя, вырезал вокал с помощью uvr и ещё вручную через Audacity почистил каждую запись от остатков инструментала - чтобы нейросеть не училась на музыке. На выходе получил свыше получаса чистого вокала. Поставил обучение на 250 эпох, но у меня на 4060ti одна эпоха занимала 3-5 минут: то ли я что-то не так настроил, то ли дело в датасете, то ли для моей видеокарты это было тяжеловато. В итоге после 12 часов тренировки я не выдержал и прекратил на 210 эпохе. Тем не менее, результат поражает - модель действительно реалистичная и почти идентична оригиналу. Дорожки сводил при помощи вышеупомянутого Audacity, там это делается в 2 нажатия. Хочу дотренировать модель до 250 эпох и сравнить результат. Но он и так потрясающий! С меня лайк и подписка на канал. Спасибо, Андрей!
Большое спасибо за развернутую обратную связь. Да, время обработки зависит от длинны датасета, чем его больше чем дольше обработка)
Кстати реально странно, у меня на 2060 Super одна эпоха проходит за 35 сек. p.s. перепроверил, с 25 эпохи сейчас за 25 секунд проходит, пока что я на 29, посмотрим как будет.
Я кажется понял, может дело в том, что у меня файлов меньше чем у автора? Скорее всего..
@@hagaroma3D да, чем меньше длительность файлов для тренировки. Тем она быстрее. 10-15 минут оптимально, и чтобы качество норм было и чтобы не так долго тренилось)
@@ba1yya Речь о длительности каждого файла? У меня всего 30 файлов гс. примерно от нескольких секунд до пару минут.
Здравствуйте, спасибо , что помогли разобраться давно хотел попробовать это , но есть один вопрос , я записал аудио на секунду этот бот же не сможет обучится по такому материалу? Если это так то , скажите пожалуйста 🙏)
Лучший
А что если я не извлек и не продублировал папку с голосом, модель все равно куда нибудь сохранится?
Привет отличное видео, а как сделать голос двух человек одного а потом другого на определенном отрывке или вместе то есть коллаборацию или как там это называют?))) Не могли бы вы сделать об это видео с примером если потребуется
а как разделить несколько дорожок. например басс или гитара. на uvr5
У меня есть готовая модель, я жму рефреш и ничего не происходит . Что я делаю не так? В модели есть pth и index файлы, а в списке моделей ее не видно. Я может где-то путь не указал? Или эта нейронка видит модели, тренированные только непосредственно внутри нее?
Чувак спасибо за гайд, все получилось, конечно немного у меня коряво получилось, так как вместо 200 прогонов сделал 160 для теста, но куплеты пел неплохо и это всего с одного вокала, проблема была в самой песни там, где припев песня(Charlie Scene Pray for me) исполнил вокал пивец (Deuce) Дуся хD На моей карте 3060 gaming x заняло где то 15 минут, память выставлял все 12гб, но почему то только 8192 взяла как то странно, но да ладно остальное проверю потом, так как поздно ночью решил проверить! С меня лайк!
у меня почему-то во время тренировки модели загружено только 10-12% видеокарты, можно как-то увеличить нагрузку, чтобы видеокарта не простаивала и процесс ускорить? Одна эпоха занимает 25-30 секунд, но видеокарта может быстрее
Медаль этому мужчине! Я чуть башку не сломал.
Скажите, автор. Нужен совет. А можно ли нейросетью воссоздать голос одного юнита (танкиста) из старой игры? Чтоб он именно этим голосом именно с этими радиопомехами мог произносить реплики, которые написал и придумал лично я?
Попробуй, скорее всего можно
11:50 что делать, если я вставляю путь и ничего не выходит?
@@ba1yya11:50 что делать, если я вставляю путь и ничего не выходит?
Вылетает ошибка - Connection errored out и на этом всё. P.S. Отвечаю сам себе - ошибку вызывает Касперский, пока не отключишь так и будет глючить.
Приветствую, спасибо за информацию! Вопрос: а можно ли дотренить частично? То есть, сначала, допустим, 300 сделать, а потом по 100 два раза? Оно суммируется?
Можно. Но не 100 а 400 ставь. Если первая тренировка до 300 была
Привет, слушай, подскажи пожалуйста, это нормально что у меня каждая эпоха по минуте создается?
Привет очень классно объяснил. Скажи пожалуйста как дообучить модель ? Куда нужно кликать ?
Нужен где то уже отвечал на этот вопрос)
@@ba1yya сПАСИБО НАШЕЛ !
Доброй ночи. Все сделал как рассказано в видосе и получилось, но когда попробовал повторить все время вылезает ошибка "AttributeError: 'NoneType' object has no attribute 'dtype'", в чем может быть проблема?
в названии файла с вокалом не дописал .wav
Спасибо за гайд! а как делают металл версии каверов щас чуть ли ни у каждого такие есть, неужели они сами музыку пишут?
Хороший ролик, качественный. Материал в целом понятен, как и алгоритм действий. Однако остались некоторые вопросы. Возможно сможет ответить не автор ролика, но кто-то другой, кто уже успел поработать. 1. В ролике фигурировало упоминание CUDA-ядер. Это технология NVIDIA. На видеокартах от AMD как работает представленный метод? 2. можно ли до тренировать уже натренированную модель? Допустим натренировалось 200 эпох, но результат не очень понравился и хочется еще до тренировать эту же модель еще на условные 100 эпох, не начиная все заново. В теории должно быть возможно, а как на практике? 3. Что влияет на качество тренировки? Количество эпох, количество исходников с голосом, все вместе, что-то еще? Надеюсь на чей-то ответ. Спасибо!
Чтобы дотренировать, нужно поставить то же самое имя модели и поставить нужное кол-во эпох. Например ты обучил на 200. Но хочешь еще дообучить до 300. Ставь 300 эпох (а не 100), оно продолжит с 200. Звук заново загружать не нужно, просто жми тренировать. Там в логах сохраняются прошлые обучения.
Привет, после конвертации вместо голоса какие-то чисто странные звуки появляются)) Что при 20, что при 200 эпохах. Как быть?
Cделай пожалуйста гайд как дотренировать какую-то из эпох или напиши в коменты. Многим тут актуально будет. Если допустим произошла ошибка или резко вырубился свет. Заранее спасибо
А если готовые паки голосов (pth.) кидать в папку weights получится? Или обязательно тренить самому? Пробовал готовые модели голосов подставлять, что-то не вышло...
Да pth в вейтс, а индекс файл в logs/папка как модель называется
лучший брат!
Советую batch size per GPU не трогать, а оставить, как есть, потому что программа определяет вашу видеокарту. Если выставить слишком много, то либо упадет ошибка, либо эпохи будут идти слишком долго, так как будет задействована оперативная память вместо видеопамяти. Плюс вы заметите по температуре, что видеокарта загружена не полностью. Изначально ставил, как было сказано в ролике, мол сколько гигабайт видеопамяти. У меня RTX 2060 и ставил 6, в итоге эпохи шли по 7 минут, что очень долго. Оставил по умолчанию 3, и они стали идти по 1 минут 20 секунд, что в масштабах 200-300 эпох уже намного лучше. А так большое спасибо за ролик!
Спасибо! Видяха 3070ti ставил 8 и каждая эпоха занимала 1:30 минуты, поставил 4 и теперь всего 37 секунд
@@lamer8716 как остановить процесс? Или можно просто поменять цифру не останавливая?
Ох, хороший вопрос. Я обычно дожидался сохранения и закрывал консоль. Потом просто выбирал последнее сохранение и менял настройки@@skeptikteam8539
4090 с установкой на 12, одна эпоха 2,89 сек
так видеопамяти на самом деле меньше без округления, типо карта на 4 гига например а памяти там 3.84 + винда сьедает, можно просто -1 или -2 поставить от колва памяти
Будет ли программа на видеокарте амд работать (rx 6600)?
Вроде как нет. Там просто процессор будет в сотку долбиться вместо видеокарты. Через кагл или колаб делать разве только
Ну поотделял я голоса от музыки, скажу в принципе, что классно получилось, все очень реалистично звучит. Но вот вопрос, если у меня видеокарта AMD всего лишь - то смогу ли я заняться тренировкой голосов?
На облачных серверах рекомендую лучше)
@@ba1yya а для колаба есть?
Вот до чего техника дошла)) Старина, а такой вопрос. Мне хватит моего компутатера: I7 10700k, 64 гб оперативы и видеокарта Inno3D GeForce RTX 4060 TWIN X2?
Здравствуйте, подскажите пожалуйста, аудиофайлы только в вав формате грузить или мр3 тоже подойдут, и можно ли использовать две видеокарты в сли режиме для ускорения обработки, заранее спасибо.
Топ.
А что бы дообучить модель, действия с выгрузкой файла, разделением его на несколько vav`ов не нужны? в том случае просто пишем нужную модель, и кол-вл эпох и начинаем процесс?
Чтобы дотренировать только имя пишем и количество эпох да. И он по старым все параметрам будет тренировать
@@ba1yya а где именно писать имя?
@@Multiki228 где модель тренировал
Привет .Установил твою сборку с неи проще. Получается все конечно классно , но подскажи, как получше схожесть сделать- тренировать больше ? не 200 а к примеру 400 и это влияет на качество ?(а то процентов на 15 -20 не дотягивает схожесть) . Или более важно качество источника - я брал сразу кучу записей одного голоса .Подскажи добрый человек ?)) Или уже в адоб аудишине докручивать в фильтрах остатки . Подписался и лайк поставил ) с меня пиво .
да он чето пропал либо либо) нужен новый урок просто от А до Б) полный и подробный и будет топчик!...ждемс...
@@K-A_Z_A-K_S_URALA Пропал , даже интересно куда и почему .
Сколько примерно минут голоса друга тебе потребовалось для 200 эпох?
Здоров! Слушай вот эта настройка в обработке - Resample output audio in post_processinh.... это что за настройка? её нужно выкручивать? если в максимум например выкрутить? что изменится? да и по другим настройкам бы понять что это и нужно ли их шевелить, это - search feature ratio и project voiceless constants
Здравствуйте, у меня вопрос, сколько минут или часов голоса надо скормить нейросети, для обучения?
15-20 минут достаточно
@@ba1yya благодарю!
Автор, здравствуйте. А если я уже загрузил готовые модели голоса(например, певца), у меня два файла: файл1.index и файл2.pth. Как мне сразу начать обработку "вокала" песни без тренировки ? Возможно, я пропустил это в видео, спасибо.
привет, спасибо за гайд. у меня модель натренировалась, но после того как начинаю заменять голос у меня выдает такую ошибку if data.dtype in [np.float64, np.float32, np.float16]: AttributeError: 'NoneType' object has no attribute 'dtype'. подскажи пожалуйста, что можно сделать? я пробовал менять файл из mp3 в wav - не помогло, пробовал ставить .wav в путь к аудио, тоже не помогло, будто тупо какого-то файла не хватает
Получил решить проблему???
@vvitchwest с толкнулся с такой же проблемой (
Спасибо! Как дотренировать модель!?🙃
Автор отвечал в комментах, нужно написать то же самое имя модели и поставить большее количество эпох. (напр. было 200, вы ставите теперь 300). Заново аудио загружать не нужно, оно в логах все сохраняется.
А можно ли использовать эту нейросеть в качестве фан озвучки? Ну просто мы хотим сделать дубляж одного старого фильма. У него есть дубляж но он очень не точный и кривой. А мы хотим озвучить фильм такими же голосами, но с точным переводом. Настоящих актёров давно уже нет в живых, именно по этому нам нужна нейросеть что смогла бы уловить интонации актёров и ТД.
Можно. Главное датасет хороший голосов собрать из фильма и каждый из них обучить. Ну и обработать предварительно его хорошо бы, но если фильм старый нужна прям хорошая обработка и восстановление дорожек, компрессор там докинуть, с эквалайзером поиграть
ахаха я в восторге + угаре, это супер угар, у меня власть которая и не снилась моему отцу
Отличное видео, все доступно объяснили, спасибо большое)
ValueError: 40000 SR doesn't match target 48000 SR в чем проблема может быть кто знает??
А что если скачал уже натренированную модель? Можно ли её как-то вставить в model inference?
Индекс файл в папку логс/папка как модель называется Pth в вейтинг
Можно пожалуйста увеличить максимальное кол-во эпох до 2х-3х тысяч? Просто я хочу сделать более реалистичную модель.
Посмотри другие его видео, поймёшь почему это бесполезно, притом максимально
при запуске в консоли пишет нажмите любую клавишу и после нажатия консоль закрывается и ничего не происходит(( ЧТО ДЕЛАТЬ???
Надо не с архива открывать, а извлечь файлы
сейчас делаю через колаб, но там ограничения временные на использование сервиса. я так понимаю, если скачать RVC как в гайде, то таких ограничений не будет? а сам тутор топ )
почитал комменты, нашел ответ, спасибо =D
Верно ли я понимаю, что radeon (TM) RX 480 graphics не тянет тренировку, если в информации о видеокарте написано "К сожалению у вас нету видеокарты, которая поддерживает тренировку модели."?
Подскажите почему нету ничего в inferencing voice?
Думал результат будет лучше( но все равно спасибо. Может надо и правда 1000 эпох сделать. Еще вопрос, а много ли нужно примеров голоса? Сколько файлов желательно по колличеству и длинне?
чем больше тем лучше и не супер длинные
Все сделал по гайду, и в конце узнал что на амд надо другую версию, щас попробую
Пошел на стареньком хсеоне 1155 и рх580 китайскаЯ чую 200 эпох, так глядишь через 200 эпох закончит тренить)) ошибка была какие-то папки не видел я их с папки логс/mute скопировал в папку под названием голоса и пошел 58 секунд 1эпоха, за исключением некоторых по 1'5 -2 минуты в голос закинул, где то 7 файлов в месте протяженностью 4 минуты, отпишусь что там стало даст Бог
Подскажите, пожалуйста! Есть старая музыка с плохим качеством. Можно ли обработать AI Cover и улучшить качество?
Системе не удаётся найти указанный путь к питону, как указать ему?
Хрен знает. Та же проблема...