- Inscrit
- 24 Juin 2010
- messages
- 687
- Score de réaction
- 5
- Points
- 18
- Age
- 40
Google is the largest and most popular search engine in the world. More than 50 million search queries are logged daily on Google sites, available in approximately 200 languages, and, according to Alexa, Google.com's main site is the most popular Internet resource. However, despite worldwide recognition and undoubted success, Google is far from being as good as a search engine as it might seem.
It's all about universality: it is impossible to search equally well in blogs and in scientific articles, in digital images and recipes. That is why there are many not so well-known specialized search engines that work exclusively with any one category of data, but do it at the highest level. Moreover, much of what such search engines find is generally impossible to find using Google and other universal systems: they simply do not see such information, which is also often intentionally closed to such "web spiders." Let's talk about a few of these "narrow professionals" who are able, perhaps, to open for you that side of the Internet, about which you did not even suspect.
1. Search among deleted from Google and blocked pages
It is no secret that the governments of many countries are trying to influence what kind of network content is available on the territory of their states. This can be explained both by purely political considerations, and by the requirements of the law on countering terrorism and child pornography, and, of course, the influence of lobbyists of large copyright holders. Criteria for prohibitions can be either quite reasonable or completely arbitrary: it all depends on the general state of legal awareness in the country, and on the sanity of law enforcement agencies themselves.
In most cases, the Google search engine meets the motivated requirements of national governments and removes sites and pages from search results that cannot be accessed through localized versions of the search engine. Meanwhile, removing the address from Google search results and even blocking the URL and IP address at the local provider level does not mean that such a resource has disappeared from the Internet or is no longer available.
A classic workaround for such restrictions is the browser Tor based on a system of alternative conventional onion routing. One of the newest packages, including the Tor client (Vidalia) and the Firefox Portable browser with the foxyproxy extension, bears the quite “talking” name PirateBrowser.
It differs from other similar packages in that it is not intended for completely anonymous surfing: Piratebrowser uses the Tor network exclusively to bypass local blocking of certain pages and sites, substituting arbitrary IP addresses instead of real ones. With it, you can go to a blocked page if you already know its address, or search for it, for example, through the main website Google.com or some other local versions of it.
PirateBrowser already has built-in settings for several countries, including Iran, North Korea, and (surprise!) The UK, the Netherlands, Belgium, Finland, Denmark, Italy and Ireland. Of course, nothing prevents you from adding your own settings to the system. Unfortunately, unlike the "full" Tor, PirateBrowser is available only in the version for Windows.
2. Search among non-existent versions of pages
Many of us used the cache of Google or Yandex to view a recently modified or deleted page in the form in which it was originally published on the Web. Usually, such a cache is available in search results for a rather short time, because the search robot is configured to track and take into account all changes in order to display the most current version of the Internet resource.
Therefore, if you want to know what a particular site looked like a month, a year, and even more so a few years ago, you have to use another tool, namely the Internet Archive web service, which is called Wayback machine , that is, something like “Time Machine”. Since 1997, the non-profit organization Internet Archive has been collecting copies of web pages, multimedia content, and software posted on the Web, and makes these copies available free of charge to everyone. With the help of Wayback Machine you can find not only a version of a site you know many years ago, but even those pages that have not existed for a long time and which are simply removed from the "normal" Internet. Today, the archive contains about 366 billion pages, and it is very likely that among them will be what you need.
3. Image Search
The most common way to find a picture is, of course, to use Google images . But what if you still could not find a suitable image with the usual means? You can, for example, try a specialized service Picsearch , in which, according to its creators, more than three billion digital images are indexed.
Picsearch has not only a multilingual user interface, but also a full multilingual search, as well as several useful filters, including searching only black and white or color images, images with a predominance of a particular color, searching for “wallpapers” for the desktop, as well as faces or animated images.
The Everystockphoto search engine boasts a much smaller declared index base: it contains more than 20 million images stored on online photo sites, including Flickr, Fotolia and Wikimedia Commons. Nevertheless, the results of her work are very impressive. Most of the images found can be used free of charge, but subject to the name of the photographer or copyright holder.
4. Computer search engine
As you know, the Google search system can perform simple calculations, convert from one unit to another and do some other useful things that are not directly related to the search. However, if you need answers to really complex questions in the field of mathematics, physics, medicine, statistics, history, linguistics and other areas of science, then you can not do without a “computer search engine” WolframAlpha able to offer the user almost encyclopedic answers to the most unusual questions.
In fact, it’s not even quite a search engine, but a huge database, part of which is converted to computational algorithms, which allows you to get ready-made information about how many grams of protein are contained in a dozen M & M's sweets, what is the expected average life expectancy in the USA, Sweden and Japan in current year or how the algebraic equation is solved.
Instead of describing the functionality of WolframAlpha for a long time, we suggest you go to the examples page, which contains samples sorted by area of knowledge of what kind of questions this system can answer and what the results will look like.
Unfortunately, WolframAlpha only works with English, and to use it you will need a fairly confident knowledge of it. In addition, you should not blindly trust the results that the system calculates according to your requests, since the slightest error in the database leads to a complete inaccuracy of the issue, and this happens periodically (just search on the Web).
5. Search for people
It would seem that finding a person on the Internet, knowing his name and surname, is simple. Yes, if it's some kind of celebrity, movie star, athlete or regular user of social networks. Then the very first page of Google search results will give you almost exhaustive information about who he is and what he has been doing lately. If the person you are looking for does not crave wide popularity and is not interested in network exhibitionism, finding information about him on the Internet will not be so simple.
In this case, you can try the Pipl search engine, which searches for people in a number of public registries, online databases, services, and yet in social networks, including professional ones. Unlike most similar services, Pipl It works with the Cyrillic alphabet, so it is quite functional with Russian-speaking surnames.
Domestic service SpravkaRU.NET helps to find the address and home phone number of a resident of Russia, Ukraine, Belarus, Kazakhstan, Latvia and Moldova. This site is an electronic telephone directory of some major cities of these countries, but, alas, far from complete. More likely to find residents of Moscow or St. Petersburg, and only those who have a home number. Unlike alternative services, SpravkaRU.NET contains quite up-to-date databases, and if you have at least some information about relatives or the approximate place of residence of the wanted person, then he can help you establish his phone number and address.
6. Search for scientific information
If you are engaged in science and want to find the latest scientific publications on your topic on Google, then you urgently need to forget about discoveries and do something less intellectual. In Google, you can only find links to individual works published on some public sites like Wikipedia. In fact, almost all scientific articles are stored on web servers belonging to the category of the so-called deep Web, which for various reasons is not available for universal search engines.
The whole point is the compulsory ban on indexing any data that, although not classified as secret, constitutes some kind of official information or is not of interest to the general public. These are library catalogs, medical or transport databases, and catalogs of various industrial products. Spiders cannot get around the system of compulsory registration or restriction of access; therefore, you rarely see scientific materials in Google’s results that are simply incomprehensible to people who don’t do similar research.
A specialized search engine can open the door to the scientific “deep web” CompletePlanet having access to more than 70,000 scientific databases and highly targeted search engines.
Another excellent scientific search engine Scirus Unfortunately, the last weeks are going through: at the beginning of 2014 it will cease to exist, and regular users are invited to find an alternative (which, alas, is not clear) in the remaining time. In the meantime, Scirus has access to many archives of scientific articles and allows you to search for information on 575 million problems, including publications in highly specialized and popular science journals, patent texts and information from digital archives.
The existence of specialized search engines does not at all negate the merits of the same Google, Yandex, and other universal search engines: we can’t do without them anyway. But a true professional does not use a hammer where a screwdriver or knife is needed, where a scalpel is appropriate. Special systems allow a finer search and are therefore able to give more accurate and reliable answers. Take, for example, the most popular type of special search engines - search and search engines like Yandex.Market and Price.Ru. Yes, we can find the same products in universal Yandex or Google, but here we immediately get structured and systematic information about the availability and price of goods, sellers and their location, payment and delivery methods. We do not just save time: more accurate and complete data appear at our disposal, which can be sorted in a certain order and compared with each other. This simple example is a clear indication of how valuable specialized search engines are and why in a number of cases they are much better than Google.
Source: computerra.ru
[DLMURL="https://anbr.ru/press/blog/?page=post&blog=cblog&post_id=118"] https://anbr.ru/press/blog/?page=post&bl ... ost_id = 118 [/ DLMURL]
It's all about universality: it is impossible to search equally well in blogs and in scientific articles, in digital images and recipes. That is why there are many not so well-known specialized search engines that work exclusively with any one category of data, but do it at the highest level. Moreover, much of what such search engines find is generally impossible to find using Google and other universal systems: they simply do not see such information, which is also often intentionally closed to such "web spiders." Let's talk about a few of these "narrow professionals" who are able, perhaps, to open for you that side of the Internet, about which you did not even suspect.
1. Search among deleted from Google and blocked pages
It is no secret that the governments of many countries are trying to influence what kind of network content is available on the territory of their states. This can be explained both by purely political considerations, and by the requirements of the law on countering terrorism and child pornography, and, of course, the influence of lobbyists of large copyright holders. Criteria for prohibitions can be either quite reasonable or completely arbitrary: it all depends on the general state of legal awareness in the country, and on the sanity of law enforcement agencies themselves.
In most cases, the Google search engine meets the motivated requirements of national governments and removes sites and pages from search results that cannot be accessed through localized versions of the search engine. Meanwhile, removing the address from Google search results and even blocking the URL and IP address at the local provider level does not mean that such a resource has disappeared from the Internet or is no longer available.
A classic workaround for such restrictions is the browser Tor based on a system of alternative conventional onion routing. One of the newest packages, including the Tor client (Vidalia) and the Firefox Portable browser with the foxyproxy extension, bears the quite “talking” name PirateBrowser.
It differs from other similar packages in that it is not intended for completely anonymous surfing: Piratebrowser uses the Tor network exclusively to bypass local blocking of certain pages and sites, substituting arbitrary IP addresses instead of real ones. With it, you can go to a blocked page if you already know its address, or search for it, for example, through the main website Google.com or some other local versions of it.
PirateBrowser already has built-in settings for several countries, including Iran, North Korea, and (surprise!) The UK, the Netherlands, Belgium, Finland, Denmark, Italy and Ireland. Of course, nothing prevents you from adding your own settings to the system. Unfortunately, unlike the "full" Tor, PirateBrowser is available only in the version for Windows.
2. Search among non-existent versions of pages
Many of us used the cache of Google or Yandex to view a recently modified or deleted page in the form in which it was originally published on the Web. Usually, such a cache is available in search results for a rather short time, because the search robot is configured to track and take into account all changes in order to display the most current version of the Internet resource.
Therefore, if you want to know what a particular site looked like a month, a year, and even more so a few years ago, you have to use another tool, namely the Internet Archive web service, which is called Wayback machine , that is, something like “Time Machine”. Since 1997, the non-profit organization Internet Archive has been collecting copies of web pages, multimedia content, and software posted on the Web, and makes these copies available free of charge to everyone. With the help of Wayback Machine you can find not only a version of a site you know many years ago, but even those pages that have not existed for a long time and which are simply removed from the "normal" Internet. Today, the archive contains about 366 billion pages, and it is very likely that among them will be what you need.
3. Image Search
The most common way to find a picture is, of course, to use Google images . But what if you still could not find a suitable image with the usual means? You can, for example, try a specialized service Picsearch , in which, according to its creators, more than three billion digital images are indexed.
Picsearch has not only a multilingual user interface, but also a full multilingual search, as well as several useful filters, including searching only black and white or color images, images with a predominance of a particular color, searching for “wallpapers” for the desktop, as well as faces or animated images.
The Everystockphoto search engine boasts a much smaller declared index base: it contains more than 20 million images stored on online photo sites, including Flickr, Fotolia and Wikimedia Commons. Nevertheless, the results of her work are very impressive. Most of the images found can be used free of charge, but subject to the name of the photographer or copyright holder.
4. Computer search engine
As you know, the Google search system can perform simple calculations, convert from one unit to another and do some other useful things that are not directly related to the search. However, if you need answers to really complex questions in the field of mathematics, physics, medicine, statistics, history, linguistics and other areas of science, then you can not do without a “computer search engine” WolframAlpha able to offer the user almost encyclopedic answers to the most unusual questions.
In fact, it’s not even quite a search engine, but a huge database, part of which is converted to computational algorithms, which allows you to get ready-made information about how many grams of protein are contained in a dozen M & M's sweets, what is the expected average life expectancy in the USA, Sweden and Japan in current year or how the algebraic equation is solved.
Instead of describing the functionality of WolframAlpha for a long time, we suggest you go to the examples page, which contains samples sorted by area of knowledge of what kind of questions this system can answer and what the results will look like.
Unfortunately, WolframAlpha only works with English, and to use it you will need a fairly confident knowledge of it. In addition, you should not blindly trust the results that the system calculates according to your requests, since the slightest error in the database leads to a complete inaccuracy of the issue, and this happens periodically (just search on the Web).
5. Search for people
It would seem that finding a person on the Internet, knowing his name and surname, is simple. Yes, if it's some kind of celebrity, movie star, athlete or regular user of social networks. Then the very first page of Google search results will give you almost exhaustive information about who he is and what he has been doing lately. If the person you are looking for does not crave wide popularity and is not interested in network exhibitionism, finding information about him on the Internet will not be so simple.
In this case, you can try the Pipl search engine, which searches for people in a number of public registries, online databases, services, and yet in social networks, including professional ones. Unlike most similar services, Pipl It works with the Cyrillic alphabet, so it is quite functional with Russian-speaking surnames.
Domestic service SpravkaRU.NET helps to find the address and home phone number of a resident of Russia, Ukraine, Belarus, Kazakhstan, Latvia and Moldova. This site is an electronic telephone directory of some major cities of these countries, but, alas, far from complete. More likely to find residents of Moscow or St. Petersburg, and only those who have a home number. Unlike alternative services, SpravkaRU.NET contains quite up-to-date databases, and if you have at least some information about relatives or the approximate place of residence of the wanted person, then he can help you establish his phone number and address.
6. Search for scientific information
If you are engaged in science and want to find the latest scientific publications on your topic on Google, then you urgently need to forget about discoveries and do something less intellectual. In Google, you can only find links to individual works published on some public sites like Wikipedia. In fact, almost all scientific articles are stored on web servers belonging to the category of the so-called deep Web, which for various reasons is not available for universal search engines.
The whole point is the compulsory ban on indexing any data that, although not classified as secret, constitutes some kind of official information or is not of interest to the general public. These are library catalogs, medical or transport databases, and catalogs of various industrial products. Spiders cannot get around the system of compulsory registration or restriction of access; therefore, you rarely see scientific materials in Google’s results that are simply incomprehensible to people who don’t do similar research.
A specialized search engine can open the door to the scientific “deep web” CompletePlanet having access to more than 70,000 scientific databases and highly targeted search engines.
Another excellent scientific search engine Scirus Unfortunately, the last weeks are going through: at the beginning of 2014 it will cease to exist, and regular users are invited to find an alternative (which, alas, is not clear) in the remaining time. In the meantime, Scirus has access to many archives of scientific articles and allows you to search for information on 575 million problems, including publications in highly specialized and popular science journals, patent texts and information from digital archives.
The existence of specialized search engines does not at all negate the merits of the same Google, Yandex, and other universal search engines: we can’t do without them anyway. But a true professional does not use a hammer where a screwdriver or knife is needed, where a scalpel is appropriate. Special systems allow a finer search and are therefore able to give more accurate and reliable answers. Take, for example, the most popular type of special search engines - search and search engines like Yandex.Market and Price.Ru. Yes, we can find the same products in universal Yandex or Google, but here we immediately get structured and systematic information about the availability and price of goods, sellers and their location, payment and delivery methods. We do not just save time: more accurate and complete data appear at our disposal, which can be sorted in a certain order and compared with each other. This simple example is a clear indication of how valuable specialized search engines are and why in a number of cases they are much better than Google.
Source: computerra.ru
[DLMURL="https://anbr.ru/press/blog/?page=post&blog=cblog&post_id=118"] https://anbr.ru/press/blog/?page=post&bl ... ost_id = 118 [/ DLMURL]
Original message
Google — это самая крупная и самая популярная в мире поисковая система. Ежедневно на сайтах Google, доступных примерно на 200 языках, регистрируется более 50 миллионов поисковых запросов, при этом, под данным Alexa, основной сайт Google.com является самым популярным ресурсом интернета. Однако, несмотря на всемирное признание и несомненный успех, Google далеко не так хороша в качестве поисковой системы, как может показаться.
Всё дело в универсальности: невозможно одинаково хорошо искать в блогах и в научных статьях, в цифровых изображениях и кулинарных рецептах. Именно поэтому существует множество не столь известных специализированных поисковых систем, которые работают исключительно с какой-то одной категорией данных, но делают это на высочайшем уровне. Более того, многое из находимого такими поисковиками вообще невозможно отыскать при помощи Google и других универсальных систем: они просто не видят такую информацию, которая к тому же нередко умышленно закрыта для подобных «веб-пауков». Поговорим о нескольких таких «узких профессионалах», способных, возможно, открыть для вас ту сторону интернета, о которой вы и не подозревали.
1. Поиск среди удалённых из Google и заблокированных страниц
Не для кого не секрет, что правительства многих стран пытаются повлиять на то, какой сетевой контент доступен на территории их государств. Это может объясняться как чисто политическими соображениями, так и требованиями законодательства о противодействии терроризму и детской порнографии и, конечно же, влиянием лоббистов крупных правообладателей. Критерии запретов могут быть как вполне разумными, так и совершенно произвольными: всё зависит и от общего состояния правосознания в стране, и от вменяемости самих правоохранителей.
Поисковая система Google в большинстве случаев идёт навстречу мотивированным требованиям национальных правительств и удаляет из результатов поисковой выдачи сайты и страницы, доступ к которым через локализованные версии поисковика должен быть запрещён. Между тем удаление адреса из результатов поиска Google и даже блокировка URL и IP-адреса на уровне местного провайдера вовсе не означает, что такой ресурс исчез из интернета или больше недоступен.
Классическое средство обхода подобных ограничений — браузер Tor, основанный на системе альтернативной обычной «луковой» маршрутизации. Один из новейших пакетов, включающих в себя клиент Tor (Vidalia) и браузер Firefox Portable c расширением foxyproxy, носит вполне «говорящее» название PirateBrowser.
От других подобных пакетов он отличается тем, что не предназначен для полностью анонимного сёрфинга: PirateBrowser использует сеть Tor исключительно для обхода местных блокировок тех или иных страниц и сайтов, подставляя произвольные IP-адреса вместо настоящих. С его помощью вы можете зайти на заблокированную страницу, если уже знаете её адрес, либо поискать её, например, через основной сайт Google.com иликакие-то другие его локальные версии.
В PirateBrowser уже встроены настройки для некоторых стран, включая Иран, Северную Корею, а также (сюрприз!) Великобританию, Нидерланды, Бельгию, Финляндию, Данию, Италию и Ирландию. Разумеется, ничто не мешает внести в систему и собственные настройки. К сожалению, в отличие от «полноценного» Tor, PirateBrowser доступен только в версии для Windows.
2. Поиск среди несуществующих версий страниц
Многие из нас пользовались кешем Google или «Яндекса», чтобы посмотреть недавно изменённую или удалённую страницу в том виде, в каком она была изначально опубликована в Сети. Обычно такой кеш доступен в поисковой выдаче довольно короткое время, ведь поисковый робот настроен на отслеживание и учёт всех изменений, чтобы выдавать наиболее актуальную версию интернет-ресурса.
Поэтому, если вы хотите знать, как выглядел тот или иной сайт месяц, год, а тем более несколько лет назад, вам придётся воспользоваться другим средством, а именно веб-сервисом «Архива Интернета», который носит название Wayback Machine, то есть что-то вроде «Машины времени». Некоммерческая организация «Архив Интернета» с 1997 года собирает копии веб-страниц, мультимедийный контент и программное обеспечение, размещаемое в Сети, и делает эти копии доступными бесплатно для всех желающих. При помощи Wayback Machine вы сможете найти не только версию знакомого вам сайта многолетней давности, но и даже те страницы, которых давно не существуют и которые попросту удалены из «обычного» интернета. На сегодня в архиве присутствует около 366 миллиардов страниц, и очень велика вероятность того, что среди них окажется та, что нужна именно вам.
3. Поиск изображений
Самый распространённый способ найти какую-то картинку — это, конечно же, воспользоваться Google Images. А как быть, если вы всё-таки не смогли найти подходящее изображение привычными средствами? Можно, к примеру, попробовать специализированный сервис Picsearch, в котором, как утверждают его создатели, проиндексировано больше трёх миллиардов цифровых картинок.
У Picsearch есть не только многоязычный пользовательский интерфейс, но и полноценный многоязычный поиск, а также несколько полезных фильтров, включая поиск только чёрно-белых или цветных изображений, картинок с преобладанием какого-то конкретного цвета, поиск «обоев» для рабочего стола, а также лиц или анимированных изображений.
Гораздо меньшим объёмом заявленной проиндексированной базы может похвастаться поисковая система Everystockphoto: она содержит более 20 миллионов изображений, хранящихся на онлайновых фотосайтах, включая Flickr, Fotolia и Wikimedia Commons. Тем не менее результаты её работы весьма впечатляют. Большинство из найденных снимков можно использовать бесплатно, но с условием указания имени фотографа или правообладателя.
4. Вычислительно-поисковая система
Как известно, поисковая система Google умеет проводить несложные вычисления, конвертировать из одних единиц в другие и делать некоторые другие полезные вещи, не связанные непосредственно с поиском. Однако если вам нужны ответы на действительно сложные вопросы в области математики, физики, медицины, статистики, истории, лингвистики и других областей науки, то вам не обойтись без «вычислительно-поисковой системы» WolframAlpha, способной предложить пользователю чуть ли не энциклопедические ответы на самые необычные вопросы.
Фактически это даже не совсем поисковая система, а огромная база данных, часть которой преобразована в вычислительные алгоритмы, что и позволяет получать готовые сведения о том, сколько граммов протеина содержится в десятке конфеток M&M’s, какова ожидаемая средняя продолжительность жизни в США, Швеции и Японии в текущем году или как решается алгебраическое уравнение.
Вместо того чтобы долго описывать функциональность WolframAlpha, предлагаем зайти на страницу примеров, где содержатся рассортированные по областям знания образцы того, на вопросы какого рода может дать ответ эта система и как будут выглядеть результаты выдачи.
К сожалению, WolframAlpha работает только с английским языком, и для её использования потребуется его довольно уверенное знание. Кроме того, не стоит слепо доверять тем результатам, которые рассчитывает система по вашим запросам, поскольку малейшая ошибка в базе данных приводит к полной недостоверности выдачи, и такое периодически случается (достаточно поискать в Сети).
5. Поиск людей
Казалось бы, найти человека в интернете, зная его имя и фамилию, проще простого. Да, если это какая-то знаменитость, кинозвезда, спортсмен или постоянный пользователь социальных сетей. Тогда первая же страница результатов поиска Google даст вам практически исчерпывающую информацию о том, кто это такой и чем занимался в последнее время. Если же тот, кого вы ищете, не жаждет широкой популярности и не увлекается сетевым эксгибиционизмом, найти информацию о нём в интернете будет не так просто.
В этом случае можно попробовать поисковую систему Pipl, которая осуществляет поиск людей в целом ряде публичных реестров, онлайновых баз данных, служб и всё-таки в социальных сетях, в том числе и профессиональных. В отличие от большинства подобных сервисов, Pipl работает и с кириллицей, так что он вполне работоспособен и с русскоязычными фамилиями.
Отечественный сервис SpravkaRU.NET поможет обнаружить адрес и домашний телефон жителя России, Украины, Беларуси, Казахстана, Латвии и Молдовы. Этот сайт представляет собой электронный телефонный справочник некоторых крупных городов перечисленных стран, но, увы, далеко не полный. Больше шансов найти жителей Москвы или Санкт-Петербурга, причём только тех, на кого оформлен домашний номер. В отличие от альтернативных сервисов, SpravkaRU.NET содержит вполне актуальные базы, и если вы располагаете хотя бы некоторой информацией о родственниках или примерном месте проживания разыскиваемого, то он способен помочь вам установить его телефон и адрес.
6. Поиск научной информации
Если вы занимаетесь наукой и хотите найти свежие научные публикации по вашей теме в Google, то вам нужно срочно забыть об открытиях и заняться чем-то менее интеллектуальным. В Google вы сможете обнаружить лишь ссылки на отдельные работы, опубликованные на каких-то общедоступных сайтах вроде Википедии. В действительности практически все научные статьи хранятся на веб-серверах, относящихся к категории так называемого глубокого Веба, который по различным причинам недоступен для универсальных поисковых систем.
Всё дело в принудительном запрете на индексацию каких-либо данных, которые хотя и не относятся к секретным, но составляют некую служебную информацию или не представляют интереса для широкой публики. Это и библиотечные каталоги, и медицинские или транспортные базы данных, и каталоги всевозможной промышленной продукции. «Пауки» не могут обойти систему обязательной регистрации или ограничения доступа, поэтому в результатах выдачи Google вы редко увидите научные материалы, попросту непонятные людям, которые не занимаются аналогичными исследованиями.
Приоткрыть дверь в научный «глубокий веб» способен специализированный поисковик CompletePlanet, имеющий доступ более чем к 70 000 научных баз данных и узконаправленных поисковых систем.
Ещё один превосходный научный поисковик Scirus, к сожалению, доживает последние недели: в начале 2014 года он прекратит своё существование, и постоянным пользователям предлагается за оставшееся время найти альтернативу (какую — увы, непонятно). Пока же Scirus имеет доступ ко множеству архивов научных статей и позволяет искать сведения по 575 миллионам проблем, включая публикации в узкоспециализированных и научно-популярных журналах, тексты патентов и сведения цифровых архивов.
Существование специализированных поисковых систем нисколько не отменяет достоинств тех же Google, «Яндекса» и других универсальных поисковиков: обойтись без них мы всё равно не сможем. Но настоящий профессионал не использует молоток там, где нужна отвёртка или нож, где уместен скальпель. Специальные системы позволяют осуществлять более тонкий поиск и поэтому способны давать более точные и достоверные ответы. Возьмём, к примеру, самый популярный тип спецпоисковиков — торгово-поисковые системы вроде «Яндекс.Маркета» и Price.Ru. Да, те же самые товары мы можем найти и в универсальном «Яндексе» или Google, но здесь мы сразу получаем структурированную и систематизированную информацию о наличии и цене товара, продавцах и их местонахождении, способах оплаты и доставки. Мы не просто экономим время: в нашем распоряжении появляются более точные и полные данные, которые можно сортировать в определённом порядке и сравнивать друг с другом. Этот простой пример — наглядное свидетельство того, насколько ценны специализированные поисковики и почему в целом ряде случаев они намного лучше Google.
Источник: computerra.ru
[DLMURL="https://anbr.ru/press/blog/?page=post&blog=cblog&post_id=118"]https://anbr.ru/press/blog/?page=post&bl ... ost_id=118[/DLMURL]
Всё дело в универсальности: невозможно одинаково хорошо искать в блогах и в научных статьях, в цифровых изображениях и кулинарных рецептах. Именно поэтому существует множество не столь известных специализированных поисковых систем, которые работают исключительно с какой-то одной категорией данных, но делают это на высочайшем уровне. Более того, многое из находимого такими поисковиками вообще невозможно отыскать при помощи Google и других универсальных систем: они просто не видят такую информацию, которая к тому же нередко умышленно закрыта для подобных «веб-пауков». Поговорим о нескольких таких «узких профессионалах», способных, возможно, открыть для вас ту сторону интернета, о которой вы и не подозревали.
1. Поиск среди удалённых из Google и заблокированных страниц
Не для кого не секрет, что правительства многих стран пытаются повлиять на то, какой сетевой контент доступен на территории их государств. Это может объясняться как чисто политическими соображениями, так и требованиями законодательства о противодействии терроризму и детской порнографии и, конечно же, влиянием лоббистов крупных правообладателей. Критерии запретов могут быть как вполне разумными, так и совершенно произвольными: всё зависит и от общего состояния правосознания в стране, и от вменяемости самих правоохранителей.
Поисковая система Google в большинстве случаев идёт навстречу мотивированным требованиям национальных правительств и удаляет из результатов поисковой выдачи сайты и страницы, доступ к которым через локализованные версии поисковика должен быть запрещён. Между тем удаление адреса из результатов поиска Google и даже блокировка URL и IP-адреса на уровне местного провайдера вовсе не означает, что такой ресурс исчез из интернета или больше недоступен.
Классическое средство обхода подобных ограничений — браузер Tor, основанный на системе альтернативной обычной «луковой» маршрутизации. Один из новейших пакетов, включающих в себя клиент Tor (Vidalia) и браузер Firefox Portable c расширением foxyproxy, носит вполне «говорящее» название PirateBrowser.
От других подобных пакетов он отличается тем, что не предназначен для полностью анонимного сёрфинга: PirateBrowser использует сеть Tor исключительно для обхода местных блокировок тех или иных страниц и сайтов, подставляя произвольные IP-адреса вместо настоящих. С его помощью вы можете зайти на заблокированную страницу, если уже знаете её адрес, либо поискать её, например, через основной сайт Google.com иликакие-то другие его локальные версии.
В PirateBrowser уже встроены настройки для некоторых стран, включая Иран, Северную Корею, а также (сюрприз!) Великобританию, Нидерланды, Бельгию, Финляндию, Данию, Италию и Ирландию. Разумеется, ничто не мешает внести в систему и собственные настройки. К сожалению, в отличие от «полноценного» Tor, PirateBrowser доступен только в версии для Windows.
2. Поиск среди несуществующих версий страниц
Многие из нас пользовались кешем Google или «Яндекса», чтобы посмотреть недавно изменённую или удалённую страницу в том виде, в каком она была изначально опубликована в Сети. Обычно такой кеш доступен в поисковой выдаче довольно короткое время, ведь поисковый робот настроен на отслеживание и учёт всех изменений, чтобы выдавать наиболее актуальную версию интернет-ресурса.
Поэтому, если вы хотите знать, как выглядел тот или иной сайт месяц, год, а тем более несколько лет назад, вам придётся воспользоваться другим средством, а именно веб-сервисом «Архива Интернета», который носит название Wayback Machine, то есть что-то вроде «Машины времени». Некоммерческая организация «Архив Интернета» с 1997 года собирает копии веб-страниц, мультимедийный контент и программное обеспечение, размещаемое в Сети, и делает эти копии доступными бесплатно для всех желающих. При помощи Wayback Machine вы сможете найти не только версию знакомого вам сайта многолетней давности, но и даже те страницы, которых давно не существуют и которые попросту удалены из «обычного» интернета. На сегодня в архиве присутствует около 366 миллиардов страниц, и очень велика вероятность того, что среди них окажется та, что нужна именно вам.
3. Поиск изображений
Самый распространённый способ найти какую-то картинку — это, конечно же, воспользоваться Google Images. А как быть, если вы всё-таки не смогли найти подходящее изображение привычными средствами? Можно, к примеру, попробовать специализированный сервис Picsearch, в котором, как утверждают его создатели, проиндексировано больше трёх миллиардов цифровых картинок.
У Picsearch есть не только многоязычный пользовательский интерфейс, но и полноценный многоязычный поиск, а также несколько полезных фильтров, включая поиск только чёрно-белых или цветных изображений, картинок с преобладанием какого-то конкретного цвета, поиск «обоев» для рабочего стола, а также лиц или анимированных изображений.
Гораздо меньшим объёмом заявленной проиндексированной базы может похвастаться поисковая система Everystockphoto: она содержит более 20 миллионов изображений, хранящихся на онлайновых фотосайтах, включая Flickr, Fotolia и Wikimedia Commons. Тем не менее результаты её работы весьма впечатляют. Большинство из найденных снимков можно использовать бесплатно, но с условием указания имени фотографа или правообладателя.
4. Вычислительно-поисковая система
Как известно, поисковая система Google умеет проводить несложные вычисления, конвертировать из одних единиц в другие и делать некоторые другие полезные вещи, не связанные непосредственно с поиском. Однако если вам нужны ответы на действительно сложные вопросы в области математики, физики, медицины, статистики, истории, лингвистики и других областей науки, то вам не обойтись без «вычислительно-поисковой системы» WolframAlpha, способной предложить пользователю чуть ли не энциклопедические ответы на самые необычные вопросы.
Фактически это даже не совсем поисковая система, а огромная база данных, часть которой преобразована в вычислительные алгоритмы, что и позволяет получать готовые сведения о том, сколько граммов протеина содержится в десятке конфеток M&M’s, какова ожидаемая средняя продолжительность жизни в США, Швеции и Японии в текущем году или как решается алгебраическое уравнение.
Вместо того чтобы долго описывать функциональность WolframAlpha, предлагаем зайти на страницу примеров, где содержатся рассортированные по областям знания образцы того, на вопросы какого рода может дать ответ эта система и как будут выглядеть результаты выдачи.
К сожалению, WolframAlpha работает только с английским языком, и для её использования потребуется его довольно уверенное знание. Кроме того, не стоит слепо доверять тем результатам, которые рассчитывает система по вашим запросам, поскольку малейшая ошибка в базе данных приводит к полной недостоверности выдачи, и такое периодически случается (достаточно поискать в Сети).
5. Поиск людей
Казалось бы, найти человека в интернете, зная его имя и фамилию, проще простого. Да, если это какая-то знаменитость, кинозвезда, спортсмен или постоянный пользователь социальных сетей. Тогда первая же страница результатов поиска Google даст вам практически исчерпывающую информацию о том, кто это такой и чем занимался в последнее время. Если же тот, кого вы ищете, не жаждет широкой популярности и не увлекается сетевым эксгибиционизмом, найти информацию о нём в интернете будет не так просто.
В этом случае можно попробовать поисковую систему Pipl, которая осуществляет поиск людей в целом ряде публичных реестров, онлайновых баз данных, служб и всё-таки в социальных сетях, в том числе и профессиональных. В отличие от большинства подобных сервисов, Pipl работает и с кириллицей, так что он вполне работоспособен и с русскоязычными фамилиями.
Отечественный сервис SpravkaRU.NET поможет обнаружить адрес и домашний телефон жителя России, Украины, Беларуси, Казахстана, Латвии и Молдовы. Этот сайт представляет собой электронный телефонный справочник некоторых крупных городов перечисленных стран, но, увы, далеко не полный. Больше шансов найти жителей Москвы или Санкт-Петербурга, причём только тех, на кого оформлен домашний номер. В отличие от альтернативных сервисов, SpravkaRU.NET содержит вполне актуальные базы, и если вы располагаете хотя бы некоторой информацией о родственниках или примерном месте проживания разыскиваемого, то он способен помочь вам установить его телефон и адрес.
6. Поиск научной информации
Если вы занимаетесь наукой и хотите найти свежие научные публикации по вашей теме в Google, то вам нужно срочно забыть об открытиях и заняться чем-то менее интеллектуальным. В Google вы сможете обнаружить лишь ссылки на отдельные работы, опубликованные на каких-то общедоступных сайтах вроде Википедии. В действительности практически все научные статьи хранятся на веб-серверах, относящихся к категории так называемого глубокого Веба, который по различным причинам недоступен для универсальных поисковых систем.
Всё дело в принудительном запрете на индексацию каких-либо данных, которые хотя и не относятся к секретным, но составляют некую служебную информацию или не представляют интереса для широкой публики. Это и библиотечные каталоги, и медицинские или транспортные базы данных, и каталоги всевозможной промышленной продукции. «Пауки» не могут обойти систему обязательной регистрации или ограничения доступа, поэтому в результатах выдачи Google вы редко увидите научные материалы, попросту непонятные людям, которые не занимаются аналогичными исследованиями.
Приоткрыть дверь в научный «глубокий веб» способен специализированный поисковик CompletePlanet, имеющий доступ более чем к 70 000 научных баз данных и узконаправленных поисковых систем.
Ещё один превосходный научный поисковик Scirus, к сожалению, доживает последние недели: в начале 2014 года он прекратит своё существование, и постоянным пользователям предлагается за оставшееся время найти альтернативу (какую — увы, непонятно). Пока же Scirus имеет доступ ко множеству архивов научных статей и позволяет искать сведения по 575 миллионам проблем, включая публикации в узкоспециализированных и научно-популярных журналах, тексты патентов и сведения цифровых архивов.
Существование специализированных поисковых систем нисколько не отменяет достоинств тех же Google, «Яндекса» и других универсальных поисковиков: обойтись без них мы всё равно не сможем. Но настоящий профессионал не использует молоток там, где нужна отвёртка или нож, где уместен скальпель. Специальные системы позволяют осуществлять более тонкий поиск и поэтому способны давать более точные и достоверные ответы. Возьмём, к примеру, самый популярный тип спецпоисковиков — торгово-поисковые системы вроде «Яндекс.Маркета» и Price.Ru. Да, те же самые товары мы можем найти и в универсальном «Яндексе» или Google, но здесь мы сразу получаем структурированную и систематизированную информацию о наличии и цене товара, продавцах и их местонахождении, способах оплаты и доставки. Мы не просто экономим время: в нашем распоряжении появляются более точные и полные данные, которые можно сортировать в определённом порядке и сравнивать друг с другом. Этот простой пример — наглядное свидетельство того, насколько ценны специализированные поисковики и почему в целом ряде случаев они намного лучше Google.
Источник: computerra.ru
[DLMURL="https://anbr.ru/press/blog/?page=post&blog=cblog&post_id=118"]https://anbr.ru/press/blog/?page=post&bl ... ost_id=118[/DLMURL]
Dernière modification par un modérateur: