Эксперты рассказывают об опасностях неграмотности в отношении данных и предлагают меры

Прочитано: 125 раз(а)


В этом отрывке из своей новой книги «Грамотность данных» ведущие эксперты по управлению данными Питер Эйкен и Тодд Харбор описывают новый способ оценки усвоения данных.

В книге Data Literacy (2021, Technics) специалист по управлению данными Питер Эйкен и Тодд Харбор, директор по данным в штате Нью-Йорк, описывают уровни и типы знаний о данных, которые нужны обществу и его гражданам для процветания сегодня, а также опасности неграмотности в отношении данных.

Примечание редактора: нижеследующее сокращено из оригинала, чтобы лучше соответствовать этому формату.

В этой главе описывается необходимость того, чтобы обычные граждане стали грамотными в отношении данных. Во-первых, мы будем использовать пандемию COVID-19 в качестве коллективного фокуса для тех проблем, которые возникают, когда лица, принимающие решения, не понимают данные. Затем мы определим грамотность данных посредством серии сравнений с аналогичными навыками, иллюстрируя необходимость стандартизированной шкалы грамотности данных. Мы опишем проблему долга данных и опасность матрицы данных для рядового гражданина.

Мощная техника машинного обучения позволяет биологам анализировать огромные массивы данных

Пандемия иллюстрирует проблемы информационно неграмотного общества

Мы начали эту книгу в начале 2020 года, когда COVID-19 поставил большую часть нашего мира под строгий карантин. Было много путаницы, страха, мнений, неповиновения, истерии… и ошибок. Большая часть страха и замешательства возникла из-за неспособности понять то, что мы называем математикой пандемии . Это звучит так: если спрос на койки в больнице на 48 коек удваивается каждый день, в какой момент кто-нибудь заметит, что коек становится не хватать?

  • День 1: 3 койки были заняты.BB
  • День 2: 6 коек были заняты.
  • День 3: три четверти коек были свободны.
  • День 4: половина коек была свободна.
  • Сегодня: свободных мест нет.
  • Что больница должна делать завтра?

Рассмотрим следующую аналогию. Общества контролируют пандемии, сглаживая кривую , связанную со скоростью заражения. Однако, если люди не понимают, что такое выравнивание или удвоение дневных объемов, следовать обоснованию решений о пандемии будет сложно. Пандемия показала нам, что данные безграмотные граждане не могут понять последствия своих действий в обществе.

Различные должностные лица здравоохранения пытались использовать комбинации данных для управления ожиданиями на протяжении всей пандемии [но в 2020 году возникли проблемы, связанные с] стандартизацией сбора и анализа данных по всей стране. Способность распознавать изменения имеет важное значение, если государство рассчитывает улучшить свою способность измерять явлений реального мира и принимать правильные политические решения. Все участники должны понимать данные и информацию, полученную из данных, чтобы справляться с кризисами и расти во времена процветания.

Мы начали эту книгу с шокирующей идеи о том, что 2020 год будет известен как год алгоритмов AI/ML [то есть набора инструкций или правил, которые, особенно если их дать компьютеру, попытаются помочь вычислить ответ на проблему]. закончились данные, подходящие для целей обучения ИИ! В частности, значимые достижения в области искусственного интеллекта (ИИ) зависят от алгоритмов обучения, построенных с использованием реальных данных. В своей влиятельной книге «Большая девятка » футуролог Эми Уэбб утверждает, что лишь горстка компаний обрабатывает данные достаточно хорошо, чтобы проводить обучение программам ИИ. Она утверждает, что США должны быть лидером в области национальной безопасности. Обеспокоенность Уэбба подчеркивает настоящий кризис, заключающийся в том, что алгоритмы ИИнуждаются в данных достаточного качества для проведения желаемого обучения. Следовательно, потребности в данных препятствуют необходимому обучению алгоритмов и препятствуют новым возможностям ИИ.

Использование тестовых данных помогает решить некоторые проблемы, но история показывает, что тестовые данные неадекватны, неполны и ненадежны. Мы наблюдали это в первой половине 2020 года. Затем исследователи представили преувеличенные прогнозы, и им пришлось скорректировать свои модели, чтобы они соответствовали реальным измерениям. Никогда страны не использовали модели для определения национальной и международной политики в таком масштабе. Что многие узнали, так это то, что математика не была проблемой. Данные были проблемой.

Оглядываясь назад, становится ясно, что исследователи могли бы построить гораздо лучшие модели, используя высококачественные обучающие данные. Однако этих активов данных не существовало. Почему? Конфликт между наукой и личной свободой разыгрывался в битве за данные. Эта ситуация не позволяла людям последовательно и беспристрастно оценивать различные подходы. Это показывает, что политика и социальные проблемы портят каждую меру (больше данных), которую мы идентифицируем.

Неудивительно, что многие предлагали разные прогнозы. Пока не появился коронавирус COVID-19, эти модели были просто моделями. Проблемы возникли, когда неграмотные в данных СМИ, политическое руководство и частные лица не смогли разобраться в вопросах и данных, связанных с различными моделями. Мы утверждаем, что повышение грамотности населения в отношении данных, особенно лиц, занимающих руководящие должности, предотвратит недоразумения, основанные на данных, подобные тем, которые произошли во время пандемии.

Реальность такова, что большинство граждан мало что понимают в данных. Они слышат, как люди говорят о данных в новостях, но не знают, откуда берется информация и как с ней работают системы. Как люди используют данные? Почему это должно меня беспокоить? Что еще более важно, граждане не понимают, как данные влияют на них на индивидуальном уровне. Без этого понимания граждане не могут начать задавать вопросы о данных, не говоря уже о том, чтобы найти ответы на свои вопросы.

Одним из важных следствий этого является узкое место в коммуникациях. Многие не в состоянии рассмотреть огромные суммы хранения, обработки, интерпретации и многого другого. Может быть сложно вести предметный разговор о данных с кем-то, кто должен принимать важные решения, но неграмотен в отношении данных.

Если человеку не хватает фундаментального понимания темы и данных, общение может потребовать огромных усилий. Грамотные в данных участники должны преобразовывать свои идеи в простую и понятную форму для лица, принимающего решения, которое также должно участвовать. Грамотный в данных человек должен сделать дополнительный шаг и предложить больше информации, чтобы помочь другим понять данные. В конце концов, дополнительные усилия могут привести к эффективному общению, а могут и не привести. Отсутствие эффективной коммуникации часто сводит на нет политические усилия. Эта задача по преобразованию или переводу информации полностью ложится на (всегда слишком) немногочисленных экспертов по данным. Например, предположим, что эксперт по данным видит, что в их организации плохая « гигиена данных»..» Если начальство человека не разбирается в данных, попытка убедить его в необходимости изменить процессы обработки данных может оказаться слишком сложной.

Грамотность данных — это диапазон (в отличие от бинарной меры)

Общество вкладывает значительные ресурсы в повышение грамотности. Системы образования разрабатывают программы, чтобы убедиться, что наши дети умеют читать и писать. Однако мы еще не инвестировали аналогичные ресурсы в грамотность данных. Чтобы стать более грамотными в области данных, граждане должны понимать ценность данных и замечательных вещей, которые мы можем с ними делать.

Что такое грамотность?

Проект грамотности данных показывает, что сотрудники с высокой грамотностью данных приносят:

  • 3-5% большая рыночная капитализация
  • $320-$534 млн в более высокой стоимости предприятия
  • положительное влияние на маржу, рентабельность активов, рентабельность собственного капитала и рентабельность продаж [согласно Проекту грамотности данных].

Но что влечет за собой информационная грамотность и как она измеряется?

Кембриджский словарь английского языка определяет термин literate как обозначение человека, умеющего читать и писать. Оценивая традиционную грамотность, мы можем говорить о ком-то, имеющем «уровень чтения двенадцатого класса» или «уровень чтения второго класса». Это создает диапазон, а не бинарное условие. То же самое должно быть верно и при описании грамотности данных. Мы считаем, что должна быть стандартная шкала, обозначающая прогресс в грамотности данных. Без этих мер мы не можем точно измерить знания, навыки и способности человека в отношении данных в обществе. Мы определяем [далее в этой книге] структуру, которая позволяет объективно определять знания о данных, оптимизированные для различных потребностей граждан в грамотности данных. Эти [области знаний о гражданах] просты и объективны.

Родственный термин — компьютерная грамотность . Люди применяют этот термин для описания того, кто использует электронные устройства, такие как компьютеры, планшеты и смартфоны. Применение этого термина быстро расширилось, включив в него другие виды деятельности, в том числе обработку текстов, серфинг в Интернете и посещение онлайн-конференций. Например, рассмотрим, как мы применяем термин «компьютерная грамотность» для описания кого-либо. Компьютерно-грамотный человек может включить компьютер, планшет или смартфон, использовать его для обработки слов, серфинга в Интернете и звонка в Zoom.

Проблема с использованием этого определения заключается в том, что компьютерная грамотность изначально отражала необходимые операционные навыки, но не более того. Например, компьютерно-грамотный человек, вероятно, понятия не имеет, что оставленное оборудование, подключенное к Интернету, делает его уязвимым для взлома .

Иностранные субъекты регулярно присваивают компьютеры граждан и перепрофилируют их для гнусной деятельности, в то время как граждане становятся невольными агентами иностранных преступников. Тот же «компьютерно грамотный» человек может не знать, что машина принимает участие в гнусных действиях, таких как распределенные атаки типа «отказ в обслуживании» на вооруженные силы страны. Но, как мы видели, общественность часто не осознает, что их поведение подвергает их риску получить все более широкий спектр травм. Это настолько серьезная проблема, что ФБР было разрешено напрямую удалять вредоносное ПО с общедоступных и частных серверов MS Exchange после взлома SolarWinds.

Еще один скандал: данные пользователей Facebook снова оказались под угрозой

Как насчет финансовой грамотности?

Концепция финансовой грамотности достигла более целостного понимания благодаря скоординированным усилиям профессиональных обществ и существенному финансированию. Типичное определение финансовой грамотности – это понимание и эффективное использование различных финансовых навыков, включая управление личными финансами, составление бюджета и инвестирование. Этот термин хорошо понимается в профессии и обычно рассматривается как полезная общественная цель. Певец и автор песен в стиле кантри Чарли Лувен однажды хорошо сказал, описывая сценические костюмы своего брата как налоговый вычет: «Конечно, они подлежат вычету, но прежде чем вы сможете вычесть их из своих налогов, вы должны вычесть их из ваш доход».

Если вы не понимаете мудрости этого утверждения, вы можете извлечь пользу из повышения собственной финансовой грамотности. Очевидно, что Чарли Лувен был финансово грамотным!

Как и финансовая грамотность, информационная грамотность включает в себя как практические, так и теоретические соображения.

Подумайте о вождении. Большинство людей согласны с тем, что если кто-то знает только, как пользоваться зажиганием автомобиля, он не может безопасно управлять транспортным средством на дороге общего пользования. Включение зажигания автомобиля необходимо для управления автомобилем, но этого недостаточно для безопасного вождения автомобиля на дорогах общего пользования. Перед выездом транспортного средства на дороги общего пользования человек должен доказать знание правил дорожного движения. Однако этого еще недостаточно. Студенты-водители также должны сдать практический экзамен.

Этот тест доказывает, что учащийся может управлять автомобилем в реальных условиях. Вместе эти тесты дают правительству и обществу уверенность в том, что водители знают, как безопасно управлять своими транспортными средствами. Успешная сдача экзамена по вождению является объективным уровнем водительских качеств. Такой же уровень производительности будет служить водителю всю жизнь. Это не означает, что нельзя улучшить свои навыки вождения — повышение грамотности вождения до сообразительности вождения может улучшить структуру дорожного движения.

Как и в приведенных выше случаях, грамотность в отношении данных требует знания основных функций (что такое данные) и способности использовать эти знания для защиты себя и других.

Нужны ли нам «уровни» грамотности данных? Да — пять штук!

Все производят данные. Сегодня граждане разделяют аспекты своей жизни со многими другими. Тем не менее, немногие граждане разбираются в данных. Данные неграмотные граждане не понимают последствий своих действий в обществе. Таким образом, общество превратилось в двухуровневую систему: 1) граждане, заинтересованные и становящиеся более грамотными в отношении данных, и 2) неграмотные граждане. Хотя они представляют собой конечные точки диапазона, мы считаем, что эта социальная динамика будет играть ключевую роль в будущем. Трудно представить, что капиталисты-наблюдатели найдут выгодное будущее, если менее половины населения попадет в категорию 2 — это нецелесообразно, если в нем участвует меньше граждан. Капитализм наблюденияимеет личную заинтересованность в поддержании низкого уровня грамотности в отношении данных, цель, которая является прямой атакой на наших сограждан. Повышение грамотности граждан в отношении данных позволит гражданам бороться за сохранение и монетизацию своих собственных данных, а не за то, чтобы другие получали от них прибыль.

Легко объявить кого-то грамотным в области данных, но совсем другое — доказать это. Это связано с попыткой точно определить единый термин грамотность данных . Обычная интерпретация предполагает, что грамотность в отношении данных — это тот, кто способен [читать, анализировать и использовать данные]. К сожалению, он бесполезен в качестве меры, поскольку ему не хватает объективных стандартов. В результате граждане сами оценивают свою информационную грамотность, и у общества нет возможности подтвердить или опровергнуть эти утверждения. Это контрастирует с другими дисциплинами, такими как чтение, в которых у нас есть способы измерить компетентность человека с помощью объективных показателей.

Мы считаем, что доказательство чьей-либо грамотности в области данных не является бинарным утверждением — либо грамотным, либо неграмотным. Вместо этого мы должны измерять грамотность данных по диапазону, отражающему объективно измеримые аспекты. Диапазон меняется от грамотности данных к навыкам работы с данными , а затем  к проницательности в данных , точно так же, как дети переходят от написания слов «кошка» и «собака» на уровне детского сада к написанию многостраничных исследовательских эссе в двенадцатом классе.

Каждый уровень ранжирования представляет собой объективно более высокий уровень владения данными. Мера позволяет нам делать объективные утверждения о чьей-либо компетентности в отношении данных в каждой точке шкалы. Этот вид инструмента имеет множество различных применений. Например, это позволит работодателям различать соискателей, адаптировать описания должностей и сравнивать соискателей.

[Позже в этой книге мы] опишем эти уровни более точно в контексте концепции цифрового гражданского общества. На данный момент достаточно понять, что эти пять уровней более точно и объективно отражают задачу, связанную с повышением грамотности граждан в области данных и достижением более управляемого понимания фактов (значений данных).

Данные, генерируемые средствами управления освещением, могут способствовать экономии энергии и комфорту жильцов



Новости партнеров