Why are we being followed in social networks and who is selling our data?

root · Feb 14, 2020

Зачем за нами следят в соц.сетях и кто продает наши данные?

Сегодня мы будем разговаривать про Big Data. Вот ссылка на википедию для того, чтобы вы понимали о чем идет речь
Специалист по Big Data, Артур Хачуян, рассказал, как соц.сети могут читать наши сообщения, как наш телефон нас подслушивает, и кому все это нужно.

Каждый день мы что-то пишем, разыскиваем и выкладываем в интернете, и каждый день кто-то следит за нами по ту сторону экрана. Специальные программы сканируют фото, лайки и тексты, чтобы продать наши данные рекламным компаниям или полиции. Можно назвать это паранойей или научной фантастикой, но телефон, круг общения, переписка или ориентация — больше не секрет.

Зачем приложение Facebook запрашивает доступ к нашей камере, микрофону и контактам
Интервьюер: – Приведу небольшой пример. На что мы соглашаемся, когда ставим на смартфон приложение «Фейсбук». Итак, оно имеет доступ к данным: о контактах, о запущенных приложениях, о файлах на usb-накопителях, имеет неограниченный доступ к интернету, может запускаться при включении смартфона, менять обои, скачивать файлы, по запросу просматривать смс, снимать видео, звонить, записывать звук. Зачем всё это нужно?

Артур Хачуян: – Ну, на самом деле под каждой этой функцией есть реальная функция «Фейсбука», под каждым из этих запросов. И «Фейсбук» скажет, что, конечно же, всё это нужно для улучшения взаимодействия с приложением. Но мы-то с вами понимаем, что это делается для сбора данных.

Записывают ли приложения наши разговоры
На самом деле здесь тоже есть такая тонкая грань – сейчас вам приведу пример: есть люди, которые сильно очень сильно «паранойят» из-за того, что «Я что-то сказал, «Яндекс»-навигатор это услышал, я начал получать рекламу» или, условный «Фейсбук» (неважно) – «Я где-то говорил, у меня приложение лежало на столе»…

Здесь есть три пути развития, так сказать… вот этой параноидальной истории. Первый – людям просто показалось, они забыли, что какой-то контент потребляли где-то когда-то, либо они просто попали в статистическую выборку, что люди их возраста, интересов и их паттерна поведения вот в этот момент должны заинтересовать курсами английского языка. Они что-то там говорили и им кажется, что кто-то за ними следит.

Читаются ли наши сообщения в соц.сетях

Но есть на самом деле вторая история, я много раз проводил такие эксперименты: делаются два чистых аккаунта в соц.сетях, с одного в другой пишется сообщение, типа «друг поехали в Сыктывкар» (я всё это в шутку рассказываю, я в жизни не знаю, где Сыктывкар), но через два-три дня начинаешь получать рекламу о турах туда. То есть соц.сеть сканирует личные сообщения, что вроде как и нарушает соглашение с ней, но ты это никак не докажешь. А запущенные мобильные приложения очень часто собираются, чтобы понять на самом деле доход этого человека. Очень много делали таких исследований ребята: знаете, вызываете такси с одного и того же места с «Айфона» и «Андроида», и разный ценник даёт таксопарк, потому что они определяют платформу, определяют запущенные приложения… Окей, сначала определяют платформу и понимают, кому нужно какую стоимость для платформы.

Как приложения могут рассказать все о человеке

Запущенные приложения – это вообще такая фишка, которая позволяет о человеке много чего сказать. Как понимаем, кто он? По контенту, который он потребляет. Мы можем по установленным приложениям понять всё, вплоть до сексуальной ориентации. Какие приложения установлены – это, соответственно, реальные интересы этого человека. То есть если у него установлена какая-нибудь «приложуха» для фрахтования самолётов частных – окей. Если установлен «Букинг» какой-нибудь, «Авиты», прочие приложения для продажи или есть очень много приложений для каких-то дешёвых покупок и скидок, кэшбеков – в общем, сами понимаете. Если вы сами сейчас посмотрите свои приложения…

Как не выкладывать ничего в интернет и все равно там оказаться

Артур Хачуян далее А.Х.
Интервьюер далее И.

И.: – Или он игроман, предположим…

А. Х.: – Да, конечно, можно сразу же понять. Элементарно, в каком банке у него счёт.

И.: – Слушай, для начала давай откроем секрет для всех о том, что когда человек что-то пишет в своей социальной сети или публикует фотографию, это видят не только его подписчики.

А. Х.: – Да, это верно. Я всегда показываю такую, большую картинку, где есть портрет среднестатистического российского пользователя социальных сетей. Там он, его друзья, друзья друзей, друзья друзей до третьего колена. Это огромный объём аудитории, порядка восьмисот тысяч пользователей, которые видят иногда случайным образом контент этого человека (из-за современных интегральных лент в социальных сетях), но самая здесь большая ошибка новичка в том, что у человека может вообще не быть аккаунта в социальных сетях, но он куда-то пришёл на какое-то мероприятие, его «сфоткали», он там что-то сделал, потом это выложили, и, соответственно, некие знания попали в эту огромную базу открытых источников.

И.: – То есть он может сидеть в ресторане или быть на митинге, будучи на заднем плане какой-то фотографии – его опознает система…

А. Х.: – Спереди какая-нибудь молодая девушка сделает селфи на свою 6-мегапиксельную фронтальную камеру и, собственно, всё…

Какие данные собираются по моим фото в соц.сетях

То есть мы, опять же, в данном случае с фотографией извлекаем знания об этом человеке, а потом эти знания будем сравнивать с другими полученными фотографиями, то есть «машина эта – ваша или не ваша», то есть если вы её года за полтора публиковали минимум раз пять, был один и тот же номер, марка, цвет… Она при этом не была ни на «Авто.ру», «Дром.ру», нет её среди ваших друзей – тогда мы этот автомобиль присвоим к вам.

И.: – И поймёте мой примерный достаток?

А. Х.: – Да. Или потом, когда вы поедете по МКАДу и вас встретит такой большой «диджитал-суперсайд» (большой телевизор), на которых почти на всех стоит распознавание номеров автомобилей. Они за триста метров распознают номер вашего автомобиля, передадут нам, а мы скажем, какую рекламу вам показывать.

И.: – Вы получаете данные с каждого билборда, в котором встроена камера?

А. Х.: – Нет, у нас есть партнёр, один из крупнейших поставщиков наружной рекламы, у нас есть API, они передают нам номер автомобиля – мы говорим, каким контентом этот человек интересовался. То есть здесь с точки зрения бизнеса – решение двух задач: чтобы не показывать рекламу чего-то, с чем человек уже столкнулся; ну и, соответственно, в потоке выбрать процентов 80–90 людей со схожими интересами и показать им какой-то определённый контент.

Как и зачем компании вычисляют мое местоположение
Сейчас самая живая история (не наша) – она связана с анализом «вай-фая». Во всех торговых центрах, когда человек приходит, подключается к «вай-фаю», соответственно, его mac-адрес отслеживается – мы можем понять, как человек перемещался. Это очень специфическая такая тёмная материя, потому что вроде поставщики оборудования ввели новые протоколы, которые мешают такому отслеживанию, а вроде как Apple не очень-то хорошо реализовал этот протокол, и всё равно можно эти mac-адреса реально получать – соответственно, отслеживать, как человек перемещался.

Как по моему местоположению можно вычислить мою зарплату

А потом, условно, этот торговый центр «Метрополис», в котором стоит эта система, делится данными с условным «инпо-аналитикс» (условно, оператор всех этих данных в метро). И мы можем понимать, на какой станции вы сели, на какой вышли. Соответственно, собирая о вас данные несколько дней, можно понять, где вы живёте, где вы работаете – практически для всех: то, что ближе – работа, то, что дальше – это дома. Соответственно, можно понять, живёте вы рядом с «Метрополисом» или нет, как часто перемещаетесь. Вообще, по времени захода и выхода человека в метро можно понять его стиль поведения – рабочего, студента, приезжих, мам с детьми… Ну, реально есть статистические зависимости. И, соответственно, уточняя эту выборку, мы можем понять, где какой человек работает. Плюс, ещё добавить туда его фотки с соцсетей. Потом, как только мы поймём, где он работает, можно понять примерно его должность по каким-то там параметрам; соответственно, потом сравнить это с «Хедхантером», «Суперджобом», понять среднюю зарплату для этого места, для этой должности. Таким образом, соответственно, набираются знания.

И.: – Предложить ему кредит на определённых условиях.

А. Х.: – Да-да. Потом он поедет в какую-то страну, зачекинится там где-то, сфотографируется в том же «Фейсбуке» – «Я из Шереметьево лечу в Панаму». Можно посмотреть по «Скайсканер», сколько стоят билеты в эту дату по количеству запросов людей в место назначения, сколько стоит отель – ну и, соответственно, понять, сколько люди тратят на отпуск, как часто они путешествуют, какие у них есть свободные средства и, собственно, на основании этого делать прогнозы и так далее.

И.: – Продавать коммерческие продукты, банковские продукты.

А. Х.: – Да. Либо банковский продукт, либо управление финансами, либо в налоговую его сдать, потому что у индивидуального предпринимателя карточка привязана к юрлицу, и он налоги сдаёт, скажем, на 100 тысяч, а тут новую тачку себе купил. Вот. Такое тоже есть.

Как искусственный интеллект «читает» наши фото в соцсетях и какие делает выводы
И.: – Я выкладываю в «Инстаграм» фотографию. На ней я, скажем, изображён на фоне автомобиля, около какого-то дома, я одет в определённую одежду. Как эти искусственные алгоритмы начинают смотреть на меня и что они начинают понимать?

А. Х.: – Окей, мы зашли на страницу, собрали эту фотографию. Первое, что делается – это выделяется ваше лицо, для того чтобы понять – вы это или не вы, ваш ли это аккаунт. Может, это кто-то другой сделал фотографию или вы кого-то сфотографировали. Следующий шаг – собственно, «свёрточные» сети для распознавания образов (компьютерное зрение). Наша задача понять, что есть на фотографии? Большого количества вещей понять нельзя. Нам нужно понять автомобиль, цвет, марку, ну и, соответственно, распознать номер. Можно понять цвет верхней, нижней одежды; возможно, фасон; возможно, с точностью 70–80% стиль причёски. Как-то так. Если это селфи сделал человек, то можно цвет глаз определить.

И.: – А причёску как мы можем использовать?

А. Х.: – Ну, длину волос… Ой, вы знаете, «бьюти»-бренды с ума сходят по этому. Шампуни какие-то продают определённым женщинам, с определённым цветом волос.

И.: – Название бренда шампанского на столе можно определить?

А. Х.: – Да. Можно не только бренд шампанского определить. Можно определить, что это за алкоголь. То есть бокал вина можно определить. Если бутылки нет – марку не определить. Но для большинства алкоголя бутылки специфические – там, «Джек Дэниелс» с определённой формой… и так далее. По образам можно понять, что это такое было и составить выборку о том, что люди пьют. Есть очень много коммерческих клиентов, которые просят найти людей, которые любят устраивать вечеринке дома с «Кока-Колой» и «Джеком Дэниелсом», например; а потом что-то с ними делают. Как-то так.

То есть человеку бренд дарит какой-то подарок. Он думает: «О, как круто! Меня случайно выбрали»! А на самом деле всё это было не случайно. Был оценен его потенциал привлечь новую аудиторию, связи, скорость распространения контента, 50 разных метрик.

Что искусственный интеллект думает о достатке Тимати, глядя на его фото с Lada Priora
И.: – Слушай, я предлагаю тебе небольшую игру. Я тебе покажу популярных, или типичных для «Инстаграма» фотографии, а ты расскажешь, что может увидеть искусственный интеллект на них и какие выводы сделать. Начнём: первая.

А. Х.: – Я думаю, стиль одежды, марку автомобиля, место можно понять. Тут, я вижу, есть огнетушитель. Можно понять 100 %, что это парковка. Парковка супермаркета, судя по фотографии, судя по пакету. Я бы на месте искусственного интеллекта 100% его записал бы в таксисты. Но, «смэтчив», скажем так, его внешний вид (имеется в виду одежда), марку автомобиля и синие пакетики, он бы попал в определённый класс населения с доходами 50–80 тысяч…

И.: – Микрокредиты, автомобиль недорогой…

А. Х.: – Да-да-да.

Как можно собирать данные о человеке, который еще не родился
И.: – Одна из самых популярных в «Инстаграме» фотографий – она была первой до прошлого года, когда появилось ещё что-то более популярное.

А. Х.: – Ну, здесь всё понятно. Здесь главный вывод, который будет сделан – это беременность. Алгоритм оценит месяц этой девушки либо по фотографии, либо скорее всего по… Беременные хоть раз делают текст типа «Ребята, мы на третьем месяце» или «Ждём чуда». Но то же самое можно сделать по фотографии.

И.: – По тексту или объёму живота можно определить месяц?

А. Х.: – Да-да. Да. Есть очень небольшая выборка медицинская, сделанная… Для чего это делается: мы определяем дату предполагаемых родов. Соответственно, мы будем знать, когда ребёнку будет полгода, восемь месяцев, год, два, три, пять…

И.: – И двадцать пять!

А. Х.: – Да-да. И в каждый из этих моментов маме будет предлагаться определённый материал: детская одежда, памперсы для двухлетних, для двухмесячных и так далее, и тому подобное. Но что самое главное, некий задел на будущее, мы уже будем знать дату рождения ребёнка. Сначала плюс-минус, но затем, если сделают уточняющую дополнительную публикацию – мы уже начали собирать данные об этом ребёнке. Он ещё не родился, а у нас уже появились на него некие знания. Это на самом деле, конечно, ужасающая история с точки зрения, не знаю… чёрного зеркала.

После прочтения интервью невольно вспоминается сериал — Person of Interest. Рекомендуем всем его к просмотру.

Быть может будущее уже наступило и мы все в поле зрения, подозреваемые.

Зачем за нами следят в соц.сетях и кто продает наши данные.jpg

Источник

Search

Search

Why are we being followed in social networks and who is selling our data?

root

Similar threads

Share this page