В условиях больших объемов мобильных данных о местоположении новая структура снижает риск для конфиденциальности потребителей и сохраняет полезность для рекламодателей

Прочитано: 305 раз(а)


Использование мобильных технологий для сбора и анализа информации о местоположении отдельных лиц привело к получению огромных объемов данных о местоположении потребителей, что привело к созданию сложной многомиллиардной системы, в которой потребители могут обмениваться личными данными в обмен на экономические выгоды. Но преобладают риски конфиденциальности.

В новом исследовании исследователи использовали машинное обучение, чтобы создать и протестировать структуру , которая количественно определяет персонализированные риски конфиденциальности; выполняет запутывание персонализированных данных; и учитывает различные риски, полезности и приемлемые уровни компромисса между риском и полезностью. Эта структура превзошла предыдущие модели, значительно снизив риск для конфиденциальности потребителей, сохранив при этом полезность для рекламодателей.

Исследование было проведено учеными из Университета Карнеги-Меллона (CMU), Университета Вирджинии и Нью-Йоркского университета. Он опубликован в журнале Information Systems Research .

« Глобальный рынок только геолокационной аналитики, по прогнозам, достигнет 25,5 млрд долларов к 2027 году», — отмечает Бейбей Ли, доцент кафедры информационных технологий и менеджмента в колледже Хайнца КМУ, соавтор исследования. «Поскольку отрасли все больше раскрывают возможности больших данных о местоположении, наше исследование предлагает столь необходимую основу для баланса рисков конфиденциальности и полезности данных, а также для поддержания безопасной и самоуправляемой экосистемы местоположения стоимостью в несколько миллиардов долларов».

Огромные объемы мобильных данных о местоположении генерируются ежедневно с помощью сервисов, основанных на местоположении смартфонов (например, навигация, совместное использование поездок, службы доставки еды). Такие данные отслеживают поведение потребителей — где они едят и делают покупки, какие продукты покупают, — чтобы сделать возможными приложения, имеющие коммерческую ценность (например, рекомендации ресторанов, реклама на основе местоположения, исследования рынка). Рекламодатели, которые получают доступ к данным о местоположении через агрегаторы данных, могут предсказать следующее местоположение потребителей с 25%-ым успехом и следующее действие и время с 26%-ым успехом.

Но существуют значительные риски для потребителей при обмене данными о местоположении, которые включают личную информацию, такую ​​как имена и домашние адреса. Некоторые рекламодатели могут осуществлять злонамеренные действия с использованием данных, как правило, для получения краткосрочной прибыли. Поэтому агрегаторам данных нужна персонализированная и гибкая структура, чтобы сбалансировать различные типы рисков и полезностей для разных типов потребителей и рекламодателей.

В этом исследовании исследователи разработали платформу, основанную на машинном обучении, которая количественно оценивает риск конфиденциальности отдельных потребителей, количественно оценивает полезность рекламодателей и имеет персонализированную и гибкую схему запутывания. Схема подавляет подмножество мест, посещаемых потребителем, на основе его или ее персонализированного параметра подавления, пропорционального индивидуальному уровню риска; он также учитывает различные типы и различные допустимые уровни рисков и полезностей.

Чтобы протестировать свою структуру, исследователи объединились с ведущим агрегатором данных, который объединяет данные о местоположении из более чем 400 часто используемых мобильных приложений (например, новостей, погоды, карт, фитнеса) от четверти населения США, которые соблюдают правила конфиденциальности. Данные, собранные за пять недель с сентября по октябрь 2018 года, являются репрезентативными для населения США, а проанализированная выборка охватывает крупный мегаполис США. Исследователи проверили структуру на миллионе траекторий (куда и когда двигаются потребители), созданных 40 000 потребителей в крупном мегаполисе США.

По словам авторов, структура исследования учитывает различные характеристики данных о местоположении на индивидуальном уровне и превосходит несколько контрольных методов из недавних исследований.

По словам авторов, используя предложенную структуру, агрегатор данных может эффективно ограничить потенциальное вторжение в частную жизнь потребителей, выполняя запутывание персонализированных данных, не жертвуя полезностью запутанных данных для рекламодателя. Агрегатор также может выполнять индивидуальные и разнообразные требования как потребителей, так и рекламодателей, гибко адаптируя несколько типов рисков и полезностей, а также широкий набор приемлемых уровней определенного риска, полезности и компромисса между риском и полезностью.

«Маркетинг на основе местоположения быстро становится основным местом для планирования маркетинговых кампаний и ориентации на потребителей, обогащая как традиционные, так и цифровые маркетинговые стратегии», — объясняет Меганат Маха, выпускница колледжа Хайнца при CMU, которая руководила исследованием. «Наша структура заполняет критическую пустоту и предлагает важный инструмент для обеспечения конфиденциальности приложений и услуг на основе определения местоположения больших данных, обеспечивая баланс между рисками конфиденциальности и полезностью данных».

Среди ограничений исследования авторы отмечают, что данные, которые они использовали, не содержат информации о демографических характеристиках отдельных потребителей, что позволило бы лучше понять вопросы конфиденциальности . Кроме того, предложенная ими структура учитывала только одноразовый обмен данными с рекламодателем; он не рассматривал более сложные сценарии с множеством рисков или полезностей, а также то, что происходит, когда рекламодатель объединяет несколько пакетов или источников общих данных.

В условиях больших объемов мобильных данных о местоположении новая структура снижает риск для конфиденциальности потребителей и сохраняет полезность для рекламодателей



Новости партнеров