Ученые из Калифорнийского университета в Беркли сравнили возможности компьютера и людей в распознавании изображений человека на примере картин испанского художника Пабло Пикассо (Pablo Picasso). Результаты исследований ученых доступны в препринте на ресурсе arXiv.org.

Человеческое зрение способно увидеть людей в самых неожиданных формах. Специалисты решили выяснить пределы этого навыка на примере кубизма — одного из самых влиятельных художественных направлений первой половины XX века. Основной чертой кубизма является представление трехмерных объектов на двумерной плоскости. При таком подходе цельный объект распадается на фрагменты, и его восприятие зрителем сводится к «синтезу примитивов». Своего расцвета искусство достигло в картинах Пикассо, Жоржа Брака (Georges Braque) и Хуана Гриса (Juan Gris).

Ученые попросили группу из 18 человек оценить по шкале от единицы до пяти степень абстрактности 218 изображений из картин Пикассо. Каждому человеку при этом доставались 146 случайно выбранных картин из 218, так что каждая их них была оценена 14 или 15 раз.

Также специалисты просили испытуемых очертить прямоугольниками границы изображений человека и сравнивали таковые с результатами, получаемыми при помощи четырех компьютерных алгоритмов. Самые старые алгоритмы, Dalal и Triggs, производят оценку фотографий по ориентации краев изображений. Данные подходы имеют недостатки, связанные с возникновением ошибок при изменениях в человеческой позе.

С целью их устранения ученые придумали третий алгоритм, который разбивает исходный прямоугольник с изображением на части и следит за возможным изменением их взаимного расположения. Это позволяет учитывать разные положения человеческой позы. Последний алгоритм, созданный учеными, основан на применении теории искусственных нейронных сетей. Он использует подходы, аналогичные применяемым для распознавания человеческих лиц.