Что такое целостность данных?

Прочитано: 67 раз(а)


Поддержание целостности данных за счет улучшения связи и грамотности данных имеет первостепенное значение для организаций на предприятии, стремящихся обеспечить качество данных и доверие.

Кевину Куинну, старшему директору по управлению данными и бизнес-аналитике в Медицинском центре Университета Питтсбурга, было сложно обеспечить целостность и качество данных в своей организации.

За последние пять лет его команда поняла, что партнерство между отделами и руководителями в вашей организации имеет решающее значение для создания достоверных данных . Хотя не каждая команда имеет дело с данными напрямую, клиницисты и администраторы должны чувствовать себя комфортно с процессами и языком. Создание таких доверительных отношений и коммуникации в масштабах всего предприятия помогло сохранить целостность данных для UPMC.

Организациям необходимо корректировать свои процессы, задействовать различные части организации и инвестировать в повышение грамотности сотрудников в отношении данных , чтобы поддерживать целостность и качество данных.

Что такое целостность данных?

Целостность данных — это поддержание точности и непротиворечивости данных на протяжении всего их жизненного цикла. Это ключевой элемент реализации и использования любой системы, которая хранит данные или использует их. Организации стали больше зависеть от данных в процессе принятия решений, что еще больше повышает важность целостности данных.

«Целостность данных — это один из аспектов общего качества данных, — говорит Мелоди Чиен, старший директор по исследованиям в Gartner.

В целом цель целостности данных состоит в том, чтобы гарантировать, что данные записываются и извлекаются, как предполагалось, и что на результаты не влияют непреднамеренные изменения на протяжении всего жизненного цикла данных.

Целостность данных можно условно разделить на две категории:

  • Физическая целостность. Обеспечение физической целостности связано с трудностями, связанными с хранением и извлечением данных. Эти проблемы включают перебои в подаче электроэнергии, коррозию хранилищ и стихийные бедствия.
  • Логическая целостность. Обеспечение логической целостности означает устранение программных ошибок, недостатков проектирования и человеческих ошибок. Логическая целостность также фокусируется на правильности части данных в конкретном контексте.

Гипермасштабируемый центр обработки данных

Целостность данных и качество данных

Целостность данных связана с повышением качества данных в вашей организации, и ее может быть трудно измерить.

«Просматривая таблицы, просматривая источник данных, чтобы увидеть, что происходит», — сказал Чиен. «Это то, что мы называем измерением качества данных».

Чиен сказал, что организации могут использовать инструменты качества данных, чтобы облегчить это бремя и найти любые проблемы в наборе данных. Любые изменения в данных по мере их ввода или вывода могут иметь серьезные последствия для результатов и выводов, приводя к принятию ошибочных решений.

Построение связи для лучшей целостности данных

Чтобы предотвратить проблемы с целостностью данных, лучше всего убедиться, что разные области организации находятся на одной странице. Поощрение надлежащего общения и сотрудничества между отделами может быть трудным переходом для организаций. Это было особенно сложно в прошлые годы, поскольку команды, которые фокусировались на данных и аналитике, были менее распространены.

Теперь, когда создана инфраструктура, Куинн и его команда работают с руководителями организаций и поощряют их задавать вопросы о результатах и ​​обработке данных. Любые странные результаты или странные выводы могут быть доведены до соответствующей группы, чтобы они могли проверить целостность данных. Он развивался с течением времени, чтобы убедиться, что задаются правильные вопросы и все участники довольны процессом.

«Часто люди не знают, на какие вопросы можно ответить с помощью данных», — сказал Куинн. «Мы слушаем вопросы и стараемся изо всех сил отвечать на них, используя то, что мы знаем на данный момент».

Лучшие вопросы возникают при повышении грамотности данных в организации . Установление линий связи между отделами — важная часть, но без грамотности в отношении данных разговоры не могут проходить так эффективно, как должны. Проблемы и ошибки не могут быть легко объяснены, если одна сторона не понимает процесс одинаково.

«Я склонен думать об этом почти с точки зрения грамотности данных», — сказал Куинн. «Люди не знают, что доступно, что существует или что можно сделать».

Инвестиции в обучение менее технических отделов позволяют этим командам лучше понять, чего следует ожидать и чего можно достичь. Это также позволяет большему количеству проверок между отделами увеличить количество проверок в системе, зависящей от технических знаний.

«Очень важно, чтобы у вас была согласованность, у вас были соглашения о ваших правилах и политиках в отношении качества данных », — сказал Чиен. «Чтобы люди могли сесть вместе и договориться о том, чего можно ожидать от определенных объектов данных».

Советы по поддержанию целостности данных

Вот несколько советов по поддержанию целостности данных:

  • Профилирование данных . Это процесс изучения доступных данных из источника и создания профилей этих данных. Просматривая и узнавая больше об отдельных частях большого набора данных, организация может убедиться, что их данные без проблем, прежде чем использовать их.
  • Каталогизация данных . Организуйте инвентаризацию активов данных вашей организации. Это позволяет лучше понять атрибуты ваших данных и может не допустить, чтобы некачественные данные мешали бизнес-операциям.
  • Повышение грамотности данных. Бизнес-часть организаций стала большей частью процесса обработки данных и аналитики. Это повысило важность обеспечения того, чтобы все сотрудники были знакомы и чувствовали себя комфортно, когда дело доходит до обсуждения данных и общих вопросов.

Терпение может улучшить целостность данных

Чтобы согласовать различные отделы и повысить грамотность данных, организации должны знать об успехах и неудачах своих конкурентов и проявлять терпение в своем внутреннем развитии. Для Куинна и UPMC переход, возможно, был трудным, но со временем они увидели преимущества.

«Вы почти узнаете, чего не следует делать, и как в других отраслях и других организациях есть точки срабатывания — и вы учитесь на этом», — сказал Куинн.

Другие подразделения UPMC, такие как группа клинической аналитики, имели опыт работы с данными UPMC, что помогло Куинну. Его команда сделала еще один шаг вперед, попытавшись использовать те же данные с более комплексным подходом.

«Теперь эта тяжелая работа полностью окупается, потому что у нас есть много таких процессов», — сказал Куинн. «Пять лет назад можно было подумать: «Давайте рассмотрим просто ежемесячный сбор данных».

Со временем это превратилось из ежемесячного в еженедельное, а теперь и в ежечасное. Команде Куинна нужно было понять, что можно сделать с технологической точки зрения, уравновешивая комфортный бизнес в целом с процессом. Обработка огромных объемов данных стала проще, но при этом появилось больше возможностей для нарушения целостности данных. Медленный подход позволил его команде браться за более простые задачи, не перегружаясь.

Организации необходимо обеспечить целостность данных, чтобы доверять своим данным и своим решениям. Терпение и общение могут помочь, но если организация стремится к успеху, должна быть культурная приверженность поддержанию целостности данных.

Как аналитика на основе данных может повысить безопасность на рабочем месте



Новости партнеров