Нужна помощь с неожиданной стороны — ищем владельцев GeForce GTX или RTX.

Это действительно неожиданный ход с нашей стороны, но у нас возникла необходимость протестировать одну довольно новую технологию шумоподавления — с использованием нейронной сети. Для этого мы ищем владельцев определенного рода «железа» в их компьютерах, которое помогло бы нам провести эксперимент c реальными задачами. Поэтому этот пост будет немного техническим и интересным далеко не всем.

Итак, предыстория.

Я продолжаю выискивать способы реставрации записей уроков, и вопрос шумоподавления стоит там особенно остро. Традиционные технологии, удаляя шумы, оставляют артефакты. Так, что ты всегда стоишь перед выбором — или удалять их очень умеренно, или давить их, но поступаться качеством звука. Идеального решения нет. Но тут вроде бы просвистела серебряная пуля.

Совсем недавно я наткнулся на такую новость: Google представила технологию, которая повышает разрешение изображений до 16 раз без потери качества. Демка потрясает: на твоих глазах из никакущего «пикселизированного» изображения с почти полным отсутствием информации вырисовываются детальные портреты.

Было--стало

Как обычно, нейро-сеть сперва обучается на огромном количестве материала, прежде чем у нее появляется способность что-то воспроизводить. И я подумал, что по тому же принципу могли бы работать и технологии шумоподавления. И оказался прав!

Год с небольшим назад компания nVidia, которая выпускает видеокарты, выпустила приложение RTX Voice, которое умеет удалять фоновый шум с такой потрясающей воображение эффективностью и с полным отсутствием артефактов, что это просто шокирует (можно посмотреть пример такого шумоподавления).

Это приложение в своей работе использует вычислительные ядра видеокарты. И обнаружилось, что оно может работать даже со старыми 3D-акселераторами 10-летней давности — лишь бы в его названии имелись слова «Geforce GTX». Они сами заявляют об этом на своем сайте: «RTX Voice is now enabled for any NVIDIA GeForce, Quadro or TITAN GPU»

Поверив этому заявлению, я тут же помчался на другой конец города и по объявлению купил такую карточку 15-летней давности по бросовой цене в 500 рублей. Провозившись с ней полночи, я понял, что вопреки заявлениям, далеко не все карточки с таким названием позволяют использовать эту новую технологию шумоподавления.

Вот такое вот чудо теперь валяется у меня на полке.

GeGorce 8080 GTX

Совместимыми оказались только те карточки, которые выпущены после 2012 года — 10-е поколение и выше (серия GeForce 650 GTX и далее). А такие карточки, даже совсем древние и совсем с базовой комплектацией, стоят уже от пяти тысяч рублей и выше.

И — вы не поверите! — до двухсот тысяч. 😮

NVIDIA GeForce RTX 3080TI, 12GB

Существует альтернативный способ опробовать эту технологию — программа Krisp. Она в своей работе использует ту же технологию искусственного интеллекта, но задействует мощности центрального процессора — ей не нужно никакое дополнительное оборудование. Я поигрался с ней. И оказалось, что для сильно зашумленных записей с низким битрейтом, как наши первые уроки, качество ее работы весьма невысоко — оно не лучше традиционного шумоподавления, и кроме того, в ней нет абсолютно никаких настроек — только вкл./выкл., нельзя даже выбрать степень шумоподавления.

Эксперименты с Krisp’ом несколько охладили мой пыл и подорвали веру в саму эту технологию (надо признать, что с теми задачами, на которые Krisp рассчитана — подавление посторонних шумов во время сеансов в Zoom’e/Skype, — она справляется неплохо). Но у меня остается надежда, что программа RTX Voice от nVidia может показать заметно лучший результат уже хотя бы потому, что для своей работы задействует ядра графического акселератора, а это гораздо более серьезные вычислительные мощности по сравнением с возможностями центрального процессора (надо понимать, что обе эти программы работают в реальном времени, то есть удаляют шумы на лету).

Пожертвовать пять тысяч на эксперимент с сомнительным результатом я не готов. Но попробовать, чтобы понять, не окажется ли эта технология более совершенным решением для моих задач по сравнению с ныне существующими, очень хочется. И поэтому, собственно, и сабж — нет ли среди вас (или ваших детей, может быть?) счастливого обладателя такой карточки? Напомню: это nVidia GeForce 650 GTX (10-е поколение) или более старшие модели. На сайте nVidia описаны требования по совместимости: To use RTX Voice, you must be using an NVIDIA GTX or RTX graphics card, update to Driver 410.18 or newer, and be on Windows 10.

Это геймерские карточки, изначально недешевые, поэтому если у кого такая в компьютере стоит, тот точно об этом знает. Признавайтесь, ребята, можете помочь с нашим экспериментом? Уж очень соблазнительно использовать l’intelligence artificielle в деле улучшения качества наших записей. :)

GTX 1660 Super устроит? На десятой винде, вестимо.

ColorFermat: GTX 1660 Super устроит?

Супер! Более чем.

Для того, чтобы провести эксперимент, нужно установить само приложение RTX Voice (скачать). Если что, вот их Setup Guide

Желательно проапдейтиться до последней версии драйверов — NVIDIA STUDIO DRIVER или GEFORCE GAME READY DRIVER. Разницу они описывают так.

  • Драйверы Game Ready обеспечивают лучшие игровые возможности во всех популярных играх.
  • Драйверы Studio обеспечивают лучшие возможности для работы с графикой в популярных творческих приложениях.

Короче, они их тестируют в том или ином режиме, как я понял.

Полое описание двух версий — под спойлером.

“GRD”Драйверы Game Ready обеспечивают лучшие игровые возможности во всех популярных играх. Разработчики драйверов NVIDIA тщательно тестируют как игры на этапе раннего доступа, так и весь дополнительный контент, чтобы оптимизировать производительность, стабильность и функциональность. Эти драйверы сертифицированы лабораторией Microsoft Windows Hardware Quality Labs (WHQL).

“SD” Драйверы Studio обеспечивают лучшие возможности для работы с графикой в популярных творческих приложениях. NVIDIA проводит тщательное тестирование во всех основных приложениях, чтобы обеспечить высочайший уровень производительности, стабильной работы и функциональности. Эти драйверы сертифицированы лабораторией Microsoft Windows Hardware Quality Labs (WHQL).

Главное требование — версия драйвера должна быть выше 410.18. Те, на которые дал ссылку я, имеют версию 471.96, апдейт был в этом августе.

Само по себе приложение рассчитано на подавление шума из микрофона. Поэтому проверить его на наших записях в лоб не выйдет. Чтобы осуществить задуманное, нужно немного схитрить. Способов хитрить несколько. Самый простой — использование виртуального аудио-кабеля.

Логика простая. Этот аудио-кабель имеет вход и выход. То есть после его установки в системе появится соответственно два аудио-устройства. Нам надо будет в качестве стандартного устройства вывода звука назначить вход этого «кабеля».

Вход виртуального аудио-кабеля в качестве стандартного устройства воспроизведения в системе Output device

Так мы все звуки в системе направим в этот кабель.

А в настройках RTX Voice надо будет «слушать» другой конец этого кабеля, соответственно, CABLE Output.

У меня не установлена сама эта программа, но у меня стоит Krisp, который по нехитрым настройкам аналогичен приложению от nVidia.

Настройки в Krisp

То есть в качестве «микрофона» мы ему подсовываем этот наш виртуальный кабель, в который с другой стороны «вдуваем» наш звук.

После этого нужно будет открыть любую программу для записи звука и в ее настройках указать в качестве источника звука нашу программу RTX Voice. У меня на скриншотах ее роль играет, опять же, Krisp, но идея абсолютно идентичная.

В приложении «слушаем» KRISP

Теперь если включить в приложении запись, мы будем записывать сигнал, пропущенный через шумодав.

Это техническая сторона.

Мне хотелось бы получить образцы записей 6-го, 35-го (или 35+) и чего-нибудь из 70+, например, сотых уроков (чашечек/билетиков я закинул, так что записи будут доступны; если понадобятся еще — не вопрос). В RTX Voice есть полозок, позволяющий регулировать уровень шумоподавления. Если можно, во время записи поиграться этим полозком.

Я протестировал два приложения, Krisp и RNNoise VST-плагин. Они дают примерно одинаково неудовлетворительный результат. Хочется понять, насколько RTX Voice их обгоняет на некачественной записи. НО он интересен уже потому, что у него есть полозок — и вохможно, его можно использовать в связке с остальными инструментами по реставрации записей. Поэтому варианты записей с разным положением этого полунка очень интересны (скажем, 100%, 80%, 60% etc.).

Это выполнимая задача, я не слишком тут намудрил?

Нет, я не могу мимо этого пройти! :))

На озоне увидел видеокарту со скидкой за 240 т.р. (первоначальная цена 300+)

qqq

И как обычно, к ней отзывы и несколько вопросов. Среди прочих — такой. :))))

Вопрос по видеокарте

Ну… (безотносительно качества товара) : кому-то доходы позволяют, кому-то хочется хуже, чем болит))

Vicolette Latarte: кому-то хочется хуже, чем болит))

Да уж, охота пуще неволи. Когда-то и я гонялся за модным железом. Это оно сейчас более-менее стабильно, моральное старение не такое стремительное. А прежде же год-два — и на свалку. А в таких условиях еще пуще хочется. :) Я на этой почве в конце 90-х даже магазин компьютерный замутил — так тема пробрала.

А цены-то на видеокарты, я думаю, вздуты майнерами крипты. Но реакция вопрошающего повеселила.

Alors, Ilya! Приветствую! Вообщем после нескольких часов различных установок драйверов и программ, у меня получилось записать кусочек 35 урока с помощью RTX Voice. Если качество устраивает, то поставлю записывать весь урок.

Только не пойму, как прикрепить файл.

Виталий: о поставлю записывать весь урок.

Спасибо огромное, Виталий!
Мне пока весь урок не нужен, достаточно по минуте из нескольких уроков. Их номера выбраны потому, что качество записи (техническое) улучшалось — как минимум, битрейт рос. И очень важно посмотреть с разными установками степени шумоподавления. Потому что, боюсь, на 100% это будет нерабочий вариант.

Я так понимаю, пока я раскачивался, моя помощь не потребовалась :) Халява. В рабочие дни был занят, а в выходные надо отнимать компьютер у сына. В следующий раз буду молчать. А то на работе тоже предложил, типа, как правильно. Теперь все делают, а я часто забываю. Таких, как я, канделябрами бьют.

ColorFermat: Я так понимаю, пока я раскачивался, моя помощь не потребовалась :) Халява.

Увы, у нас ничего не получилось. Мы провозились пару часов в попытке заставить эту связку работать, но без результата. Тогда я, снедаемый распаленным любопытством, купил по сходной цене GeForce 650 с неработающим кулером. Результат тот же — не работает. Стоит включить шумоподавление, звук пропадает. Два часа прободался со службой поддержки — и тоже без результата. Они посоветовали мне снять на видео, что я делаю и что у меня не получается, и засабмитить разработчикам. Между тем по всему интернету народ пишет, что с 600-й и 700-й сериями не работает — несмотря на все их заявления.

Уже вторая бесполезная плата теперь у меня лежит на полке.

Пока я возился, перетыкая платы в компьютере, накрылся жесткий диск. Перестал определяться в системе. Это вот из серии «работает — не трогай». Полез в потроха — и приплыли. Все выходные реанимировали. Задышал, отделавшись парой битых кластеров. Сегодня весь день делаю бэкапы чувствительных данных на запасной диск и в облако.

Так что вопрос открытый, хотя даже при появлении позитивного результата купить себе работающий вариант в ближайшее время вряд ли смогу. Но по крайней мере, смогу мечтать. :)

Ну а просто записать по новой — не вариант ?

Alex784: Ну а просто записать по новой — не вариант ?

Неожиданный вопрос, который ставит меня в тупик.
Даже не знаю, что и ответить…

ILYA DUMOV: Неожиданный вопрос, который ставит меня в тупик.

Это не моя песочница, но я бы просто заново переписал весь курс с Анастасией, добавив небольшие лекции про происхождение слов, немного юмора, интересные выражения, trucs et astuces как проще запомнить то или иное правило, объяснений контекста употребления, разборами текста известных песен, интересными фактами, культурными особенностями, без посторонних шумов, без нижегородского и т.д., ну и возможно склепал бы приложение типа Flowkey, где что-то бесплатное, ну а что-то — нет. Другими словами, перешёл бы от живого концерта к студийной записи.

Alex784: Другими словами, перешёл бы от живого концерта к студийной записи.

Всему своё время ;)) У нас с Настей большие планы.

Но в какой студии мы бы ни проводили эти записи и о чем бы мы ни говорили, мы не сделаем эти уроки лучше. Об этом можно много говорить. Вам не понять этого, потому что Вы знаете язык и не можете залезть в шкуру новичка, как бы ни разжигали свое воображение. И я не могу — уже не могу. Я даже не могу восхищаться красотой французского языка, потому что за французской речью часто уже стоит смысл, язык перестал быть просто музыкой.

Когда я говорю «лучше», я вкладываю в это довольно непростой смысл. Те, кто здесь учится — они меня поймут. Главный критерий — способность уроков творить маленькое чудо, за которое — несмотря на качество записи и «нижегородский», как Вы говорите — их любят и по-настоящему ценят. Что бы и кто бы ни говорил о них, они работают, работают хорошо, вдохновляют, заряжают позитивом, хорошо мотивируют и помогают двигаться вперед, не терять интереса ни к языку, ни к процессу его изучения. И этим они отличатся от сотен и тысяч других курсов, которых полно на просторах инета. Которые, наверное, тоже работают. Но не так эффективно.

Можно сделать что-то другое, конечно! Но невозможно на бис повторить роды.

Честно говоря, эти мои объяснения напоминают глупую ситуацию, когда приходится объяснять соль анекдота. Да он после этого перестает быть смешным. :(

À toutes à tous: вопрос с видеокарточкой GeForce GTX или RTX по-прежнему актуален.

 
Зарегистрируйтесь или войдите чтобы оставить сообщение.