Пятница, 29 марта 2024 года

Иорданский ученый научил компьютер читать по губам

А. Хассанат, ученый из Иордании, разработал и реализовал концепцию компьютерной программы, которая способна фиксировать движения губ пользователя и распознавать произносимый текст.

На сегодняшний день эффективность данной программы составляет порядка 76 %. По словам разработчика, наибольшую сложность могут вызвать оставшиеся 24 %, так как могут возникнуть определенные трудности, при «обучении» компьютера необходимо учитывать индивидуальную специфику мимики разных людей.

Хассанат признает, что на данной стадии разработки основополагающий алгоритм является, в некоторой степени, упражнением на догадливость компьютера, тогда как основная цель ученого – это реализация полноценного способа распознавания. Разумеется, подобное открытие не могло остаться незаметным. Некоторые крупные компании уже выразили заинтересованность в этой программе.

Человеческая речь включает в себя порядка 50 различных звуков, из которых формируются слова. Однако при воспроизведении устной речи количество форм, которые могут принимать язык и губы, существенно сокращается. Так, при разговоре насчитывается около 14 положений.

Похожими разработками занималась корпорация Microsoft. Ею была представлено программное обеспечение, позволяющее распознавать и переводить в устную речь язык глухонемых людей. Творение инженеров Microsoft отличается высокой эффективностью: программа способна фиксировать и преобразовывать жесты при стандартном разговоре, когда руки двигаются достаточно быстро.