ИИ не может воспроизвести человеческое зрение

Когда человек замечает знакомое лицо или приближающийся автомобиль, мозгу требуется всего 100 миллисекунд (около одной десятой секунды), чтобы идентифицировать его и, что более важно, поместить его в правильный контекст, чтобы его можно было понять, и человек может реагировать соответствующим образом.

Неудивительно, что компьютеры могут делать это быстрее, но так ли они точны, как люди в реальном мире ? Не всегда, и это проблема, согласно исследованию, проведенному западным экспертом по нейровизуализации Марике Мур.

Компьютеры можно научить обрабатывать входящие данные, такие как наблюдение за лицами и автомобилями, с помощью искусственного интеллекта, известного как глубокие нейронные сети или глубокое обучение . Этот тип процесса машинного обучения использует взаимосвязанные узлы или нейроны в многоуровневой структуре, напоминающей человеческий мозг.

Ключевое слово — «напоминает», поскольку компьютеры, несмотря на мощь и перспективы глубокого обучения, еще не освоили человеческие вычисления и, что особенно важно, связь и связь между телом и мозгом, особенно когда речь идет о визуальном распознавании.

«Несмотря на то, что глубокие нейронные сети многообещающи, они далеки от идеальных вычислительных моделей человеческого зрения», — сказал Мур, западный профессор, совместно работающий на кафедрах психологии и компьютерных наук.

Предыдущие исследования показали, что глубокое обучение не может идеально воспроизвести человеческое визуальное распознавание, но немногие пытались установить, какие аспекты человеческого зрения глубокое обучение не может эмулировать.

Команда использовала неинвазивный медицинский тест под названием магнитоэнцефалография (МЭГ), который измеряет магнитные поля, создаваемые электрическими токами мозга. Используя данные МЭГ, полученные от людей-наблюдателей во время просмотра объекта, Мур и ее международные сотрудники обнаружили один ключевой момент отказа. Они обнаружили, что легко именуемые части объектов, такие как «глаз», «колесо» и «лицо», могут объяснить различия в динамике нейронов человека сверх того, что может дать глубокое обучение.

«Эти результаты показывают, что глубокие нейронные сети и люди могут частично полагаться на различные характеристики объекта для визуального распознавания и дают рекомендации по улучшению модели», — сказал Мур.

Исследование показывает, что глубокие нейронные сети не могут полностью учитывать нейронные реакции, измеренные у людей-наблюдателей, когда люди просматривают фотографии объектов, включая лица и животных, и имеет серьезные последствия для использования моделей глубокого обучения в реальных условиях, таких как самоанализ. вождение транспортных средств.

«Это открытие дает представление о том, что нейронные сети не могут понять в изображениях, а именно о визуальных особенностях, которые указывают на экологически значимые категории объектов, такие как лица и животные», — сказал Мур. «Мы предполагаем, что нейронные сети можно улучшить как модели мозга, дав им опыт обучения, более похожий на человеческий, например режим обучения, в котором более сильно подчеркивается поведенческое давление, которому люди подвергаются во время развития».

Например, людям важно быстро определить, является ли объект приближающимся животным или нет, и если да, то предсказать его следующее последовательное движение. Интеграция этих факторов во время обучения может принести пользу способности подходов глубокого обучения моделировать человеческое зрение.