Новый ИИ от производителя ChatGPT настолько хорош, что вам нельзя доверять (пока)

Новый ИИ от производителя ChatGPT настолько хорош, что вам нельзя доверять (пока)

В прошлом месяце OpenAI, создатели ChatGPT, представили впечатляющую модель преобразования текста в видео под названием Sora. Однако это было не единственное их заявление. Ближе к концу марта они также представили новую модель преобразования текста в речь.

В недавнем сообщении в блоге была представлена ​​новая модель под названием Voice Engine, которая может воспроизводить реалистичную речь на основе всего лишь 15-секундного аудиоклипа в качестве источника.

Вместо некачественного и неправильного вывода, типичного для многих инструментов преобразования текста в речь, Voice Engine обеспечивает результаты, которые вызывают у вас трепет. В этом блоге вы найдете несколько удивительных примеров, которые действительно стоит послушать.

Голосовой движок: что он может?

С конца прошлого года OpenAI тестирует свой Voice Engine, находя различные приложения для своей технологии преобразования текста в речь посредством сотрудничества с избранной группой доверенных партнеров.

Компания смогла поделиться рядом примеров раннего использования, в том числе:

  • Помощь при чтении: Voice Engine может взять короткий 15-секундный ролик восторженного и энергичного читателя и применить его практически к любому фрагменту текста, причем учебники и образовательные материалы особенно пригодятся таким людям. кто испытывает трудности с чтением или быстро создает закадровый контент для учебных материалов.
  • Перевод. Модель Voice Engine также может обеспечить впечатляюще точную имитацию голосов, даже при разговоре на иностранных языках. Это может оказать огромное влияние на средства массовой информации, поскольку дублированный или переведенный контент больше не требует второго трека или озвучки. Используя Voice Engine, оригинальный голос говорящего (вместе с его естественным акцентом) можно свободно перевести на любой язык по вашему выбору.
  • Поддержка невербальных людей. Благодаря мощным и естественным звучащим возможностям преобразования текста в речь Voice Engine способен дать голос тем, кто может быть невербальным, в менее роботизированном и другом формате. путь, чем синтетические голоса прошлого. Это открывает фантастический канал для тех, кто пострадал от этого, и позволяет им взаимодействовать с другими так, чтобы они чувствовали себя более комфортно и обретали уникальную индивидуальность.
  • Восстановление голоса. Люди, страдающие дегенеративными нарушениями речи, часто могут чувствовать, что у них украли голос. Однако, используя возможности Voice Engine (а ранее всего лишь 15-секундный аудиосэмпл своего голоса), пострадавшие могут восстановить свои голоса в записях до более знакомых другим и себе, что дает им возможность вернуть часть своего голоса. свою индивидуальность, которую они, возможно, почувствовали, они внезапно потеряли.

Это здорово, но ты не можешь этого получить (и ты знаешь почему)

К сожалению, представленная технология является передовой и имеет большой потенциал для полезного использования. Однако мы не можем игнорировать возможность того, что он может быть использован во вредных целях, если он станет доступен широкой публике.

В прошлом году Meta столкнулась с аналогичной проблемой, когда представила свою модель преобразования текста в речь на базе искусственного интеллекта — Voicebox. Они признали значительный риск неправильного использования и потенциального непреднамеренного вреда, что заставило их скрыть окончательную версию от публичного использования.

В сегодняшнем мире, основанном на технологиях, возможность создать аутентичную аудиокопию любого человека, используя всего лишь 15-секундный семпл, представляет собой значительный риск. Злонамеренное использование этой технологии может привести к серьезным последствиям для отдельных лиц, потенциально нанести ущерб их репутации или даже подвергнуть их опасности. Более того, манипулирование такими записями может послужить мощным оружием на политической арене, вызывая хаос и замешательство, если слушатели считают, что аудиозапись подлинная.

Что касается использования синтетических голосов, OpenAI выразила намерение инициировать обсуждение этического применения этой технологии и необходимых корректировок, которые должно внести общество. Они имеют встроенные функции безопасности, такие как водяные знаки для идентификации источника звука, создаваемого Voice Engine, а также для активного мониторинга его использования.

Несмотря на это улучшение, его может быть недостаточно. Voicebox компании Meta включал в себя сложный «классификатор», который мог идентифицировать реальную и искусственную речь, но из-за его нестабильности они решили не делать его общедоступным.

Проще говоря, голосовой движок OpenAI вызывает обеспокоенность, поскольку люди могут доверять ему и реагировать на него только на основании его существования, независимо от инструментов проверки. Несмотря на его огромный потенциал, который может принести нам пользу, некоторые на данный момент могут счесть его возможности подавляющими.

Другие материалы из журнала Laptop Mag

  • Что такое ИИ? Объяснения LLM, GPT и чат-ботов
  • 5 самых тревожных способов использования ИИ в настоящее время
  • ИИ — это скучно — как сделать джейлбрейк ChatGPT

Смотрите также

2024-04-02 15:44