ГлавнаяРазноеПрорыв: адаптивные алгоритмы ЭМГ и бесшумная речь нейросетей

Прорыв: адаптивные алгоритмы ЭМГ и бесшумная речь нейросетей


Прорыв: адаптивные алгоритмы ЭМГ и бесшумная речь нейросетей-0
Источник: naked-science.ru

Электромиография — это регистрация электрической активности мышц при сокращении. Ее проводят с помощью датчиков и электродов. Например, когда человек шевелит пальцами, мышцы предплечья создают сигнал, сенсоры его улавливают, а программа преобразует в команды для устройств. Такие технологии позволяют управлять протезами, дронами, виртуальной или дополненной реальностью.

Преимущества ЭМГ-технологий

Регистрирующие датчики плотно прилегают к телу. Поэтому, в отличие от камер, лидаров, систем отслеживания взгляда и т.п., ЭМГ-устройства успешно работают в темноте, не требуют прямой видимости, не страдают от перекрытий одеждой или другими предметами. Также они обеспечивают высокую разрешающую способность, улавливая мельчайшие движения мышц.

Вызов для нейросетей

Сегодня в распознавании ключевую роль играют нейросетевые алгоритмы. Они преобразуют мышечную активность в команды. Однако исследования показали, что современные нейросети без предварительной калибровки не могут одинаково точно распознавать жесты разных людей. Причина этого ограничения — в биологической уникальности каждого человека.

Результаты тестирования

В ходе эксперимента было протестировано более десяти нейросетевых архитектур. Модели обучали на данных группы, а затем проверяли на новых испытуемых. Ни одна программа не показала приемлемого качества распознавания. Лучшие модели достигли точности около 35%. Ученые также не обнаружили значимой разницы между нейросетевыми и классическими подходами.

Проблема межсубъектной вариативности

Главным препятствием для моделей стала межсубъектная вариативность. Сигнал одного и того же жеста отличается от человека к человеку сильнее, чем модель может обобщить.

Например, научные данные показывают: при одинаковых задачах у женщин активность мышц предплечья в 1,3 до 2,8 раза выше, а из-за усталости точность распознавания снижается в среднем на 7%. Температура тела тоже влияет на спектр — остывание руки изменяет сигнал на 2,8 Гц на каждый градус Цельсия.

Сила адаптивных алгоритмов

Исследование подтвердило, что даже мощные нейросети бессильны против индивидуальных различий. Мышечный почерк каждого человека уникален настолько, что теоретически может служить паролем. Ни одна протестированная модель не смогла распознать его правильно с первого раза. Поэтому ключевое значение приобретают адаптивные алгоритмы.

Путь к универсальным устройствам

Путь к массовым ЭМГ-устройствам лежит через комбинацию предобученных базовых моделей и алгоритмов быстрой калибровки. Эти алгоритмы за секунды усваивают основные жесты пользователя и продолжают дообучаться.

Применение и перспективы

Сейчас самые развитые ЭМГ-технологии используются в сфере смарт-протезов и телеуправления роботами. Основные коммерческие приложения — устройства дополненной и виртуальной реальности, а также носимые гаджеты. В перспективе ЭМГ-приборы могут найти применение в медицине: для реабилитации после инсульта, диагностики нейромышечных заболеваний или контроля эффективности тренировок спортсменов.

Также ведутся интересные разработки устройств безмолвной речи. Они смогут регистрировать активность артикуляционных мышц лица и шеи, преобразуя ее в слова.

Источник: naked-science.ru

Познавательное