Не успел ещё мир осознать такую сущность как распознавание лиц, как технологические компании начали развивать искусственный интеллект, читающий по губам. Уже сейчас ряд проектов используется в больницах, общественном транспорте и тд.
Исследователи десятилетиями работали над тем, чтобы обучить компьютеры чтению по губам, но это оказалось сложной задачей даже с учетом успехов в сфере глубокого обучения.
В основе исследования лежит широкий спектр возможных коммерческих приложений - от инструментов слежения до приложений для бесшумной связи и более совершенной работы виртуальных помощников.
Многие технологические гиганты работают над ИИ, который умеет читать по губам - Google, Huawei, Samsung и Sony.
Также есть стартапы в этой сфере, например, мобприложение SRAVI, созданное стартапом Liopa - большой прорыв в области визуального распознавания речи (VSR).
Liopa уже в августе может получить сертификат, характеризующий его мобприложение, как медицинское устройство класса I в Европе, после чего компания сможет продавать свои услуги.
У Liopa есть ещё проект, который финансируется за счёт британского оборонного исследовательского агентства - их проект может позволить правоохранительным органам искать в беззвучных записях с камер видеонаблюдения и определять, что люди говорят.
Motorola Solutions также занимается видеонаблюдением и у компании есть патент на систему чтения по губам, предназначенную для работы правоохранителей.
Skylark Labs - стартап, финансируемый DARPA, тоже владеет своей ИИ-системой чтения по губам, которая тестируется в некоторых частных домах и государственной энергетической компании в Индии для выявления нецензурной лексики.