Нейронная сеть превосходит алгоритмы

Нейронные сети с искусственным интеллектом, обученные изображениям и видео, доступным в Интернете, могут распознавать лица, объекты и многое другое. Но есть серьезный недостаток. Обучение алгоритмов машинного обучения тому, как идентифицировать людей или предметы, полагаясь исключительно на визуальную библиотеку лиц и объектов, найденных в Интернете, недостаточно отражает социально-экономические и демографические группы.

Исследователь машинного обучения из Гарвардского университета и сотрудники MLCommons и Coactive AI создали более разнообразный набор данных, используя изображения объектов, найденных в домашних хозяйствах по всему миру, и обучили нейронную сеть сортировать объекты на основе этого набора данных. Их результаты, представленные на конференции по нейронным системам обработки информации, показывают, что использование изображений из групп населения с низкими ресурсами может значительно повысить эффективность распознавания объектов системами машинного обучения.

«Пока еще не было сильного стимула для обеспечения равенства и равного представительства в системах машинного обучения», — говорит Виджай Джанапа Редди, доцент Гарвардской школы инженерии и прикладных наук имени Джона А. Полсона (SEAS) и старший автор. бумаги. «Это общая картина, которую мы пытаемся запечатлеть в этом исследовании».

Редди, который также является вице-президентом и членом правления ML Commons, консорциума академических и отраслевых лидеров искусственного интеллекта, объединился с коллегами для обучения нейронной сети, используя набор данных из 38 479 изображений предметов домашнего обихода. Коллекция фотографий, сделанных в 404 домах в 63 странах Африки, Америки, Азии и Европы, известна как «Долларовая улица» и впервые была разработана фондом Gapminder. Шведская организация отправила фотографов по всему миру, чтобы собрать изображения зубных щеток, туалетов, телевизоров, плит, кроватей, ламп и других предметов, найденных в домах семей с ежемесячным доходом от 26,99 до 19 671 долларов США.

«Нам нужно осознавать более глубокие предубеждения в наших системах машинного обучения», — говорит Редди. «Одно и то же слово можно использовать для описания печей по всему миру, но если вы посмотрите на то, что называется печкой в недостаточно представленных районах, и на то, что можно найти в богатых домах, эти объекты могут выглядеть и функционировать совершенно по-разному».

В своей статье исследователи описывают еще один яркий пример: в некоторых бедных домах по всему миру человек может чистить зубы рукой. Таким образом, в наборе данных Dollar Street изображение чьей-то руки может быть помечено как «ладонь руки», так и «зубная щетка».

Используя коллекцию изображений Dollar Street, которая была преобразована MLCommons в надежный набор данных , содержащий имена/теги объектов, географические данные и ежемесячный доход домохозяйства, команда обнаружила, что их обученная нейронная сеть работает значительно лучше, чем передовые системы, при точной классификации домохозяйств. предметы, особенно предметы, найденные в домах с более низкими доходами. Их алгоритм машинного обучения правильно идентифицировал объекты на 65% чаще, чем широко используемые нейронные сети, включая ImageNet и Open Images, обученные на менее разнообразных наборах данных, полученных из Интернета.

«Удивительно видеть, что современные модели машинного обучения считают само собой разумеющимся и как плохо они работают при правильной идентификации объектов в условиях ограниченных ресурсов», — говорит Редди.

Поскольку промышленность и правительство все больше полагаются на системы машинного обучения для обработки информации и принятия решений, Редди говорит, что это исследование, подтверждающее концепцию, демонстрирует опасность нейронных сетей, обученных без инклюзивных данных, представляющих население с низкими ресурсами.

«Долларовая улица стала мощным инструментом для борьбы с человеческими заблуждениями и предубеждениями , и мы считаем, что она может сделать то же самое с машинами», — говорит Коди Коулман, соавтор статьи, генеральный директор и соучредитель Коактивный ИИ.

«Доллар-стрит демонстрирует важность данных в машинном обучении в общем смысле и, в частности, способность тщательно отобранных данных оказывать огромное влияние на предвзятость», — говорит Дэвид Кантер, соавтор статьи, основатель и исполнительный директор. директор MLCommons. «Я надеюсь, что, размещая и поддерживая Dollar Street, мы дадим исследовательскому сообществу и промышленности возможность разрабатывать методы, чтобы машинное обучение приносило пользу всем во всем мире, особенно в менее развитых регионах».

«Искусственно интеллектуальные системы, если они не будут построены справедливо и инклюзивно, ускорят разрыв между сообществами с высокими ресурсами и сообществами с низкими ресурсами», — говорит Редди. «Когда вы создаете наборы данных для обучения систем машинного обучения, и вы создаете эти данные из места с высокими ресурсами и не пытаетесь получить и включить данные из областей с меньшими ресурсами, последствия для обучения предвзятости становятся еще больше. Ответственный искусственный интеллект означает, что машинное обучение станет доступным во всем мире и репрезентативным во всем мире».