- Joined
- Feb 17, 2007
- Messages
- 678
- Reaction score
- 1,026
- Points
- 93
Browser fingerprint. Part I
What are browser fingerprints?
This is the method used by sites and services to track visitors. Users are assigned a unique identifier (fingerprint). It contains a lot of information about the settings and capabilities of the user's browser, which is used to identify them. In addition, browser fingerprint allows sites to track behavioral patterns in order to further identify users more accurately.The uniqueness is about the same as that of real fingerprints. Only the latter are collected by the police to search for suspected crimes. Browser fingerprint technology is not being used to track criminals at all. We're not criminals here, are we?
What data does browser fingerprint collect?
We knew that a person can be tracked by IP since the dawn of the Internet. But in this case, everything is much more complicated. The browser fingerprint includes the IP address, but this is far from the most important information. In fact, you don't need an IP to identify you.According to research EFF (Electronic Frontier Foundation) The browser fingerprint includes:
- User-agent (including not only the browser, but also the OS version, device type, language settings, toolbars, etc.).
- Timezone.
- Screen resolution and color depth.
- Supercookies.
- Cookie settings.
- System fonts.
- Browser plugins and their versions.
- Visit log.
According to another one study , the accuracy of user identification using the browser fingerprint is 99.24%. Changing one of the browser settings reduces the accuracy of user identification by only 0.3%. There are browser fingerprint tests that show how much information is collected.
How browser fingerprint works
Why is it even possible to collect information about the browser? It's simple - your browser communicates with the web server when you request a website address. In a normal situation, sites and services assign a unique identifier to the user.For example, "Gh5d443ghjflr123ff556ggf" ...
This string of random letters and numbers helps the server know you, associate your browser and your preferences with you. Actions that you take online will be assigned approximately the same code.
So, if you went to Twitter, where there is some information about you, all this data will be automatically associated with the same identifier.
Of course, this code will not be with you for the rest of your days. If you start surfing from a different device or browser, the identifier will most likely change too.
How do sites collect user data?
It is a two tier process that works on both the server and client side.Server side
Site access logs
In this case, we are talking about the collection of data sent by the browser. At least this:
- The requested protocol.
- The requested URL.
- Your IP.
- Referer.
- User-agent.
Headings
The web servers receive them from your browser. Headers are important because they make sure the requested site works with your browser.For example, header information lets the site know if you are using a PC or mobile device. In the second case, there will be a redirect to the version optimized for mobile devices. Unfortunately, the same data will end up in your fingerprint.
Cookies
Everything is clear here. Web servers always exchange cookies with browsers. If you specify the ability to work with cookies in the settings, they are stored on your device and sent to the server whenever you visit a site that you have already visited before.Cookies help you surf more comfortably, but they also reveal more information about you.
Canvas Fingerprinting
This method uses the HTML5 canvas element, which WebGL also uses to render 2D and 3D graphics in the browser.This method usually "forces" the browser to process graphical content, including images, text, or both. This process is invisible to you, since everything happens in the background.
Once the process is complete, canvas fingerprinting turns the graphics into a hash, which becomes the unique identifier we talked about above.
This method allows you to get the following information about your device:
- Graphics adapter.
- Graphics adapter driver.
- Processor (unless there is a dedicated graphics chip).
- Installed fonts.
Client side logging
This assumes that your browser is exchanging a lot of information thanks to:Adobe Flash and JavaScript
According to the FAQ AmIUnique , if you have JavaScript enabled, then data about your plugins or hardware specifications are transmitted outside.If Flash is installed and activated, this provides the outside observer with even more information, including:
- Your time zone.
- OS version.
- Screen resolution.
- Complete list of fonts installed on the system.
Cookies
They play a very important role in logging. So, you usually need to decide whether to allow the browser to process cookies or delete them completely.In the first case, the web server receives just a huge amount of information about your device and preferences. If you do not approve of using cookies, sites will still receive some data about your browser.
Why is browser fingerprint technology needed?
Basically, in order for the user of the device to receive a website optimized for his device, regardless of whether he went to the Internet from a tablet or smartphone.In addition, the technology is used for advertising. It's just the perfect data mining tool.
So, having received the information collected by the server, suppliers of goods or services can create very finely targeted advertising campaigns with personalization. Targeting accuracy is much higher than using just IP addresses.
For example, advertisers can use browser fingerprints to get a list of site users whose screen resolutions can be called low (for example, 1300 * 768) who are looking for better monitors in the seller's online store. Or users who just surf the site without intending to buy anything.
This information can then be used to target ads for high-quality, high-resolution monitors to users with small and obsolete displays.
In addition, browser fingerprint technology is also used to:
- Detection of fraud and botnets. This is a really useful function for banks and financial institutions. They allow you to separate user behavior from the activity of attackers.
- Definition of VPN and proxy users. Intelligence agencies can use this method to track Internet users with hidden IP addresses.
Ultimately, even if browser fingerprints are used for legitimate purposes, it still has a very negative impact on user privacy.
Plus, browser fingerprints can be a hacker's best friend. If they know the exact details of your device, they can use special exploits to compromise your device. There is nothing difficult about this - any cybercriminal can create a fake site with a fingerprint script.
Recall that this article is only the first part, there are two more ahead. They address the issues of the legality of the collection of personal data of users, the possibility of using this data and methods of protection against too active "collectors".
A source
Original message
Отпечаток браузера. Часть I
Что такое отпечатки браузера?
Это метод, используемый сайтами и сервисами для отслеживания посетителей. Пользователям присваивается уникальный идентификатор (отпечаток). Он содержит много информации о настройках и возможностях браузера пользователей, что используется для их идентификации. Кроме того, отпечаток браузера позволяет сайтам отслеживать поведенческие паттерны, чтобы впоследствии еще точнее идентифицировать пользователей.Уникальность примерно такая же, как у реальных отпечатков пальцев. Только последние собирает полиция для поиска подозреваемых в совершении преступлений. А вот технология отпечатка браузеров применяется вовсе не для отслеживания преступников. Ведь мы же здесь не преступники, верно?
Какие данные собирает отпечаток браузера?
О том, что человека можно отследить по IP, мы знали еще на заре существования интернета. Но в данном случае все гораздо сложнее. Отпечаток браузера включает IP-адрес, но это далеко не самая важная информация. На самом деле, для того, чтобы идентифицировать вас, IP не нужен.Согласно исследованию EFF (Electronic Frontier Foundation), отпечаток браузера включает в себя:
- User-agent (включая не только браузер, но и версию ОС, тип устройства, языковые настройки, панели инструментов и т.п.).
- Часовой пояс.
- Разрешение экрана и глубину цвета.
- Supercookies.
- Настройки куки.
- Системные шрифты.
- Плагины к браузеру и их версии.
- Журнал посещений.
Согласно еще одному исследованию, точность идентификации пользователя при помощи отпечатка браузера составляет 99,24%. Изменение одного из параметров браузера снижает точность идентификации пользователя лишь на 0,3%. Существуют тесты на отпечаток браузера, которые показывают, насколько большой объем информации собирается.
Как работает отпечаток браузера
Почему вообще возможен сбор информации о браузере? Все просто — ваш браузер обменивается данными с веб-сервером, когда вы запрашиваете адрес сайта. В обычной ситуации сайты и сервисы присваивают пользователю уникальный идентификатор.Например, «gh5d443ghjflr123ff556ggf».
Эта строчка из случайных букв и цифр помогает серверу узнать ваc, ассоциировать ваш браузер и ваши предпочтения с вами. Действиям, которые вы совершаете онлайн, будет присвоен примерно тот же код.
Так, если вы зашли в Twitter, где есть какая-то информация о вас, все эти данные будут автоматически связаны с тем же идентификатором.
Конечно, этот код не будет с вами до конца ваших дней. Если вы начнете серфить с другого устройства или браузера, то идентификатор, скорее всего, тоже поменяется.
Как сайты собирают пользовательские данные?
Это двухуровневый процесс, который работает как на стороне сервера, так и на стороне клиента.На стороне сервера
Логи доступа к сайту
В этом случае речь идет о сборе данных, отправляемых браузером. Как минимум это:
- Запрошенный протокол.
- Запрошенный URL.
- Ваш IP.
- Referer.
- User-agent.
Заголовки
Веб-серверы получают их от вашего браузера. Заголовки важны, поскольку они позволяют быть уверенным, что запрошенный сайт работает с вашим браузером.Например, информация в заголовке позволяет сайту узнать, используете ли вы ПК или мобильное устройство. Во втором случае произойдет редирект на оптимизированную для мобильных устройств версию. К сожалению, эти же данные попадут в ваш отпечаток.
Куки
Здесь все понятно. Веб-серверы всегда обмениваются куки с браузерами. Если вы в настройках указываете возможность работы с куки, они сохраняются на вашем устройстве и отправляются на сервер, когда бы вы ни зашли на сайт, который уже посещали прежде.Куки помогают серфить более комфортно, но они же открывают и больше информации о вас.
Canvas Fingerprinting
В этом методе используется элемент холста (canvas) HTML5, который WebGL также использует для визуализации 2D- и 3D-графики в браузере.Этот метод обычно «заставляет» браузер обрабатывать графический контент, включая изображения, текст или то и другое разом. Для вас этот процесс незаметен, поскольку все происходит в фоне.
Как только процесс завершен, canvas fingerprinting превращает графику в хэш, который становится тем самым уникальным идентификатором, о котором мы говорили выше.
Этот метод позволяет получать следующую информацию о вашем устройстве:
- Графический адаптер.
- Драйвер графического адаптера.
- Процессор (если нет выделенного графического чипа).
- Установленные шрифты.
Логирование на стороне клиента
Здесь подразумевается, что ваш браузер обменивается большим количеством информации благодаря:Adobe Flash и JavaScript
Согласно FAQ AmIUnique, если у вас активирован JavaScript, то вовне передаются данные о ваших плагинах или спецификациях железа.Если установлен и активирован Flash, то это предоставляет стороннему «наблюдателю» еще больше информации, включая:
- Ваш часовой пояс.
- Версию ОС.
- Разрешение экрана.
- Полный список установленных в системе шрифтов.
Куки
Они играют очень важную роль в логировании. Так, вам обычно нужно решить, позволить ли браузеру обрабатывать куки или полностью удалить их.В первом случае веб-сервер получает просто огромное количество информации о вашем устройстве и предпочтениях. Если вы не одобрите работу с куки, сайты все равно получат кое-какие данные о вашем браузере.
Зачем нужна технология отпечатка браузера?
В основном для того, чтобы пользователь устройства получил оптимизированный для его устройства сайт, вне зависимости, зашел он в интернет с планшета или смартфона.Кроме того, технология используется для рекламы. Это просто идеальный инструмент дата-майнинга.
Так, получив собранную сервером информацию, поставщики товаров или услуг могут создавать очень тонко нацеленные рекламные кампании с персонализацией. Точность таргетирования гораздо выше, чем если использовать просто IP-адреса.
Например, рекламщики могут использовать отпечатки браузеров для того, чтобы получить список пользователей сайта, разрешение экрана которых можно назвать низким (например, 1300*768), кто ищет более качественные мониторы в интернет-магазине продавца. Или же пользователей, которые просто серфят по сайту без намерения что-либо купить.
Затем полученную информацию можно использовать для таргетирования рекламы качественных мониторов с высоким разрешением на пользователей с небольшим и устаревшим морально дисплеем.
Кроме того, технология отпечатка браузера используется еще и для:
- Обнаружения фрода и ботнетов. Это реально полезная для банков и финансовых организаций функция. Они позволяют отделить поведение пользователя от активности злоумышленников.
- Определение VPN и proxy пользователей. Разведслужбы могут использовать этот метод для отслеживания интернет-пользователей со скрытыми IP-адресами.
В конечном счете, даже если отпечатки браузера используются в законных целях, это все равно очень плохо сказывается на конфиденциальности пользователей.
Кроме того, отпечатки браузера могут быть лучшим другом хакера. Если им известны точные данные о вашем устройстве, они могут использовать специальные эксплойты для взлома устройства. В этом нет ничего сложного — любой киберпреступник может создать поддельный сайт со скриптом снятия отпечатков пальцев.
Напомним, эта статья — только первая часть, впереди еще две. В них рассматриваются вопросы законности сбора персональных данных пользователей, возможности использования этих данных и методы защиты против слишком уж активных «собирателей».
Источник