Кейс. Восстановление быстро стертой информации, почти исчезнувшей из кэша поисковиков.
Источник
Ситуация интересная. До сих пор, мне не приходилось таким образом восстанавливать удаленные из интернета тексты, поэтому расскажу подробнее. Тем более, что автор материала, который я восстанавливал, не возражает.
Итак, в блоге Платона Маматова (kaisi) я увидел текст недельной давности, с названием: "Тут был текст про политоту, но я его стер, ибо надоело".
Обычно в подобных случаях достаточно просто забраться в кэш Яндекса или Гугла, чтобы прочитать удаленный материал. Однако в данном случае, автор настолько быстро его удалил, что это не сработало.
"Насколько быстро стер - не помню. Четко помню что перечитал свой блог, подумал "заебало, тошнит", и стер", - рассказал мне Платон.
Ситуация в кэше Яндекса сложилась любопытная. При запросе
' inurl:kaisi.livejournal.com/783970.html '
картинка в основной выдаче Яндекса была такой:
Я взял из полученного текста фразу "Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами" и далее стал работать с ней.
Основная выдача Яндекса, при запросе по этой точной фразе, сниппеты показала:
А основная выдача Гугла - нет:
Выдача Яндекса по блогам - показала, но очень своеобразно.
Сниппеты были видны:
Но вот при попытке раскрыть, и посмотреть полный текст - выскакивала уже новая версия поста, хотя и со старым (первоначальным) заголовком:
Попытка открыть из поиска по блогам Яндекса "сохраненную копию" выдавала уже измененный текст:
И попытка открыть сохраненную копию из основной выдачи Яндекса давала такой же отрицательный для меня результат:
Не буду делать скриншотов, а просто скажу, что остальные известные, и не очень известные поисковики, в которые я раздавал этот запрос, не смогли справиться с задачей - они вообще не видели этого текста. В базу данныз Айкубаз этот текст также не успел попасть - ни в новом, ни в старом виде.
Тогда я сделал запрос в Гугл не по точной фразе, а с помощью оператора inurl. Результат получился любопытный. Страница нашлась.
При этом, кэш Гугла, как и кэш в Янлексе, содержал новую версию страницы и ничем помочь мне не мог:
Но у Гугла была еще и нетекстовая информация - скриншот поста, сохраненного в его кэше. И этот скриншот был явно сделан с первоначального текста:
(Вот ссылка на саму картинку - даю ее, потому что она важна именно в правой части, которая не влазит здесь на экран:
https://pics.livejournal.com/yushchuk/pic/001st9bq.jpg )
Качество изображения там, однако, таково, что разобрать весь текст не представляется возможным. Но отдельные слова, все же, читабельны.
Получается, что Гугл имеет скриншот первоначального текста и показывает его пусть и трудночитаемым, но зато целиком.
В то же время, Яндекс хранит и умеет показывать весь первоначальный текст и готов показывать его в виде сниппетов, но только не весь одновременно.
Я провел эксперимент, который оказался удачным: стал брать по одному-два слова из каждого абзаца на скриншоте и ставить их в поиск по блогу kaisi через расширенный поиск.
Вот как это выглядело.
Первый абзац и так показан Яндексом - его не надо было восстанавливать:
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Второй абзац был восстановлен по слову "рулит":
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Третий абзац - по слову "письма":
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Четвертый абзац - по слову "Крашенинников":
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Пятый абзац состоит из одного слова "Охуеть", которое и так видно.
Шестой абзац восстановлен по слову "особенности":
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Седьмой абзац читабелен на скриншоте Гугла: "Ох, отцы иезуиты. Как красиво. Мне очень нравится"
Восьмой абзац - восстановлен по слову "сном":
Пойду, забудусь сном.
Итак, текст, который в данный момент выглядит вот так:
Тут был текст про политоту, но я его стер, ибо надоело
Тезисно: Федя - мудак, кто ему верит - наивные кретины
Восстановлен в первоначальном виде:
Отцы иезуиты
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Охуеть
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Ох, отцы иезуиты. Как красиво. Мне очень нравится
Пойду, забудусь сном.
Полагаю, что специалистам Конкурентной разведки, равно как и юристам, собирающим уничтоженные улики в Интернете, такой способ однажды может пригодиться.
И еще раз подтвердилась идея о важности сочетания текстовой, и нетекстовой информации при поиске в Интернете.
Источник
Ситуация интересная. До сих пор, мне не приходилось таким образом восстанавливать удаленные из интернета тексты, поэтому расскажу подробнее. Тем более, что автор материала, который я восстанавливал, не возражает.
Итак, в блоге Платона Маматова (kaisi) я увидел текст недельной давности, с названием: "Тут был текст про политоту, но я его стер, ибо надоело".
Обычно в подобных случаях достаточно просто забраться в кэш Яндекса или Гугла, чтобы прочитать удаленный материал. Однако в данном случае, автор настолько быстро его удалил, что это не сработало.
"Насколько быстро стер - не помню. Четко помню что перечитал свой блог, подумал "заебало, тошнит", и стер", - рассказал мне Платон.
Ситуация в кэше Яндекса сложилась любопытная. При запросе
' inurl:kaisi.livejournal.com/783970.html '
картинка в основной выдаче Яндекса была такой:
Я взял из полученного текста фразу "Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами" и далее стал работать с ней.
Основная выдача Яндекса, при запросе по этой точной фразе, сниппеты показала:
А основная выдача Гугла - нет:
Выдача Яндекса по блогам - показала, но очень своеобразно.
Сниппеты были видны:
Но вот при попытке раскрыть, и посмотреть полный текст - выскакивала уже новая версия поста, хотя и со старым (первоначальным) заголовком:
Попытка открыть из поиска по блогам Яндекса "сохраненную копию" выдавала уже измененный текст:
И попытка открыть сохраненную копию из основной выдачи Яндекса давала такой же отрицательный для меня результат:
Не буду делать скриншотов, а просто скажу, что остальные известные, и не очень известные поисковики, в которые я раздавал этот запрос, не смогли справиться с задачей - они вообще не видели этого текста. В базу данныз Айкубаз этот текст также не успел попасть - ни в новом, ни в старом виде.
Тогда я сделал запрос в Гугл не по точной фразе, а с помощью оператора inurl. Результат получился любопытный. Страница нашлась.
При этом, кэш Гугла, как и кэш в Янлексе, содержал новую версию страницы и ничем помочь мне не мог:
Но у Гугла была еще и нетекстовая информация - скриншот поста, сохраненного в его кэше. И этот скриншот был явно сделан с первоначального текста:
(Вот ссылка на саму картинку - даю ее, потому что она важна именно в правой части, которая не влазит здесь на экран:
https://pics.livejournal.com/yushchuk/pic/001st9bq.jpg )
Качество изображения там, однако, таково, что разобрать весь текст не представляется возможным. Но отдельные слова, все же, читабельны.
Получается, что Гугл имеет скриншот первоначального текста и показывает его пусть и трудночитаемым, но зато целиком.
В то же время, Яндекс хранит и умеет показывать весь первоначальный текст и готов показывать его в виде сниппетов, но только не весь одновременно.
Я провел эксперимент, который оказался удачным: стал брать по одному-два слова из каждого абзаца на скриншоте и ставить их в поиск по блогу kaisi через расширенный поиск.
Вот как это выглядело.
Первый абзац и так показан Яндексом - его не надо было восстанавливать:
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Второй абзац был восстановлен по слову "рулит":
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Третий абзац - по слову "письма":
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Четвертый абзац - по слову "Крашенинников":
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Пятый абзац состоит из одного слова "Охуеть", которое и так видно.
Шестой абзац восстановлен по слову "особенности":
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Седьмой абзац читабелен на скриншоте Гугла: "Ох, отцы иезуиты. Как красиво. Мне очень нравится"
Восьмой абзац - восстановлен по слову "сном":
Пойду, забудусь сном.
Итак, текст, который в данный момент выглядит вот так:
Тут был текст про политоту, но я его стер, ибо надоело
Тезисно: Федя - мудак, кто ему верит - наивные кретины
Восстановлен в первоначальном виде:
Отцы иезуиты
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Охуеть
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Ох, отцы иезуиты. Как красиво. Мне очень нравится
Пойду, забудусь сном.
Полагаю, что специалистам Конкурентной разведки, равно как и юристам, собирающим уничтоженные улики в Интернете, такой способ однажды может пригодиться.
И еще раз подтвердилась идея о важности сочетания текстовой, и нетекстовой информации при поиске в Интернете.