Я сломал функцию Live Captions в Copilot+, задав простой вопрос.

🎉 🎮 Привет! Тебе что, совсем нечем заняться? Идеально! Присоединяйся к нашему телеграм-каналу Roblox, где мы веселимся больше, чем в бочке с виртуальными обезьянками. Приходи за кубиками, оставайся, чтобы подшутить. Ты не пожалеешь об этом... наверное. Увидимся в чате! 🕹️ 🚀 👇

Roblox Telegram


Я сломал функцию Live Captions в Copilot+, задав простой вопрос.

Как аналитик с опытом работы в области языковых исследований и технологий, я был заинтригован демонстрацией перевода Live Captions во время презентации Microsoft Copilot+ на Computex. Изучая на протяжении всей своей академической карьеры различные языки, в том числе испанский, немецкий, польский, китайский и латынь, я оказался в уникальной возможности протестировать эту функцию.


В этом месяце на Computex я опробовал живую демонстрацию Microsoft Copilot+, в частности протестировав их функцию перевода Live Captions с помощью простого запроса. Однако я получил неожиданно недоуменный ответ.

На Computex, как и на любой другой технологической выставке, у посетителей было много возможностей увидеть демонстрации. Они проходили не только на выставочном зале, но и за его пределами, в гостиничных номерах и конференц-залах. Qualcomm представила несколько демонстраций, чтобы подчеркнуть возможности искусственного интеллекта ноутбуков Snapdragon X, которые являются частью инициативы Microsoft Copilot+. Некоторые из этих демонстраций включали спорную функцию Recall, Co-Creator для создания изображений и Live Captions.

Как исследователь, изучающий последние предложения Qualcomm, я остановился на Co-Creator, который представляет собой расширенный вариант типичного инструмента для создания изображений. Из-за опасений, связанных с последствиями для безопасности и долгосрочным использованием Recall, я посвятил свое расследование в первую очередь демонстрации перевода Live Captions во время моей работы в Qualcomm.

На Microsoft Surface Pro 11 я провел демонстрацию с помощью встроенного микрофона, записывающего и переводящего звук. Чтобы проверить функциональность, я задал общеязыковый запрос. Вот результат.

Методика тестирования Live Captions

Я настроил Live Captions для отображения английских переводов, фактически исключив другие языки из моих опций. Мои языковые навыки распространяются только на элементарный испанский, несколько фраз на немецком, польском и китайском языках. Выучив латынь в средней и старшей школе, я считаю себя ценным ресурсом в исторических музеях, но почти нигде больше.

Во время демонстрации на Computex в Тайбэе мои мысли были заняты другими вещами, а не латинскими речами, которые я старательно заучивал в старшей школе. Я не уверен, что Microsoft будет уделять приоритетное внимание оптимизации программного обеспечения для перевода для умершего языка к 2024 году.

Окруженный китайскими иероглифами Ханзи на Тайване, я внезапно вспомнил о своем опыте изучения японского языка в колледже. Хотя эти знания не пригодились во время моего пребывания, я вспомнил, что японская система письма включает ханзи (известный как кандзи) наряду с хираганой и катаканой. Следовательно, я мог разобрать значение случайных знаков, лишенных английского перевода поблизости.

Как языковому аналитику, мне иногда бывает сложно генерировать тестовые предложения прямо на месте. Чтобы обойти эту проблему, я выбрал известную фразу на другом языке, в частности японском. Фраза «図書館 は どこ ですか (тошокан ва доко десу ка)» переводится как «Где библиотека?» по-английски. Такой подход позволяет мне составить точное и содержательное тестовое предложение, не полагаясь на свою способность придумать случайное предложение.

Live Captions не удалось или нет?

Я заметил, что, к несчастью для Copilot+, Live Captions неправильно интерпретировали вопрос «Где библиотека?» как «Где это?» в их переводе.

Некоторые элементы вашего ответа могут быть вызваны сложностями при переводе с японского на английский или помехами от находящихся рядом микрофонов. Несмотря на то, что демо-пространство не было слишком переполненным, множество людей разговаривали и записывали поблизости, что потенциально затрудняло микрофону различение каждого слова в вашем запросе из-за его краткости.

Чтобы окончательно подтвердить это, нам нужны более последовательные условия и возможность воспроизвести результаты. Этого можно будет достичь только после того, как первые ноутбуки Copilot+ станут доступны после их запуска 18 июня во вторник. Кроме того, я воспользуюсь этим временем, чтобы сформулировать более полное и красноречивое исследование.

БОЛЬШЕ ОТ НОУТБУКА MAG

  • macOS Sequoia: поддерживаемые компьютеры Mac, функции и ожидаемая дата выпуска
  • Обзор док-станции Razer Thunderbolt 4 Chroma: Цвет меня впечатлил
  • У планов Apple в области искусственного интеллекта есть потенциально тревожный недостаток

Смотрите также

2024-06-12 07:44