Разделы

Искусственный интеллект готовится к вечеринкам

Американская компания из Сан-Диего разработала специальное программное обеспечение с элементами искусственного интеллекта, способное по лицу определить пол человека и выделить отдельный голос из шумного разноголосья. Сферы применения нового ПО разнообразны, оно может использоваться в самых серьезных приложениях.
Коктейльные вечеринки и неизменно связанное с ними общение с противопожным полом - вот два истинно человеческих занятия, которым в предпраздничный сезон предается немалая часть прогрессивного человечества. Компьютерам же до всего этого долгое время не было никакого дела: специалистам в области искусственного интеллекта никак не удавалось в полной мере дублировать человеческие способности по лицу определять пол человека и выделять отдельный голос из общего звукового фона. Теперь же, по утверждению исследователей компании HNC Software из Сан-Диего, персональные компьютеры можно научить такого рода распознаванию образов. Разработчики называют полученную технологию значительным шагом в развитии искусственного интеллекта как в области теории, так и для практических задач.

Система, получившая название Cortronics, использует нейронные соединения кольцевой сети ПК на платформе Pentium для сравнения входных данных с ранее полученными и хранимыми в памяти и поиска совпадений как во времени, так и в пространстве. Объекты, воспринимаемые сетью - а это могут быть слова, изображения, финансовая информация и вообще что угодно, что можно выразить в цифровом формате, - разбиваются на символы, сохраняемые в базе данных. Символы группируются по общим временным или пространственным координатам, и постепенно сеть выстраивает целую иерархию, показывающую взаимосвязи уже между группами сходных объектов. Когда объекты всегда появляются вместе, система определяет, что группа сама по себе и есть объект, и со временем может выстраивать подкатегории такого объекта, к примеру, лицо может быть женским и мужским. Эту информацию программа использует для распознавания новых объектов, содержащих сходные наборы символов.

Георгий Джабиев, T1 Cloud: «Отчуждаемое» облако — новая модель аренды ИТ-инфраструктуры для крупного бизнеса и государства
Маркет

Система отмечает, когда каких-либо символов в группе не хватает, и уделяет пристальное внимание поиску других, дополняющих картину. То есть процесс распознавания усложняется и расширяется, если некоторые объекты, к примеру, представлены отчасти неполно. Точно также, когда система распознает отрывок фразы в шуме вечеринки, она пытается определить, какие слова, вероятнее всего, последуют дальше. Если одно из таких заранее угаданных слов действительно прозвучит дальше, то программа поймет, что это произнес один и тот же человек, и сконцентрируется на нем.

По словам разработчиков, поведение программы во многом совпадает с человеческим восприятием происходящего в реальном мире, и полученная технология обладает коллосальным потенциалом для распознавания изображений, для использования в автоматических справочных службах для клиентов (так называемых "электронных секретарях"), системах беопасности и так далее. Однако просто так расставаться со своим детищем компания не согласна: заказчики, желающие использовать технологию, должны прислать на трехнедельное обучение своих сотрудников, которых за $50 тыс. специалисты HNC научат основам работы с системой и методам ее интегрирования.