Всем привет. Существует очень интересная задача, по созданию голоса из текста и редактированию одинаковых по структуре аудиодорожек по эталону. Аудио дорожки создаются нейронной сетью по тексту, причем текст переводится на разные языки, например - оригинал на русском, а еще переводится текст на английский и испанский, поэтому дикторы говорят несколько по разному. Необходимо создать ПО, которое бы позволил делать следующее: - взаимодействовать с внешней БД (гугл-таблицей); - взаимодействовать с API генераторов голоса (Microsoft, Google, Yandex и Zvukogram); - править на уровне исходника лишние паузы; - делать на уровне исходника паузы между сегментами; - делать подгонку аудио дорожек подражателей под эталон; - делать проверку правильности структуры аудио дорожек подражателей; - стабилизировать скорость аудиоряда под эталон, согласно понятного скрипта; - стабилизировать скорость сегмента аудио ряда под эталон; - получать обработанные (исправленные) аудио дорожки подражатели в нужную папку. Бюджет на задачу: 32 000 рублей. Оплата происходит ТОЛЬКО через данный фриланс-сайт, комиссию беру на себя. Прошу писать кодеров с нормальными аккаунтами, где есть какая-то репутация. Подробное ТЗ можно почитать тут: docs.google.com/document/d/1sXKIQZrqagsGIg6g_GPUP7nN434vMm7KKNFrMVjYCeA Бюджет: 32000 руб. Адрес в интернете: https://www.guru.markets/ Город: Нью-Йорк Компания: GURU.Markets Вид предложения: Удаленная работа (разовый заказ) Оплата: безопасная сделка Категория: Программирование Добавлено: 16.03.2023 в 15:23 |
|