Гугл помнит всё!...

Автор: Александр Солодовников

Должность: Шеф

20.04.18

Как веб-архив хранит копии сайтов и почему в интернете ничего нельзя скрыть, сколько бы законов о забвении и им подобных ни принималось.

Пока суть да дело и народ переживает или не очень за Телеграм, хочу поговорить о другом. Многие в курсе, а для тех кто нет или уже забыли, напомню, что нашей компании в прошлом году стукнуло 25 лет. Да и я сам, глядя на себя в зеркало, вспоминаю проходивших под окнами динозавров. Короче, давно живу, давно в ИТ, несколько больше 30 лет, поэтому помню то, что трудно теперь себе представить. И…. нет, я не про мобилы/смартфоны. Я вот о чём. К нам периодически обращаются разные органы и просто “обеспокоенные граждане” с вопросами типа: “А было ли “это” опубликовано в интернете?” И с требованиями: “Уберите это немедленно!” 

Ну да по порядку и не касаясь конкретных дел, а так, на обобщённых примерах. Начну с того, что если вы хотите что-то из Сети убрать и подаёте в суд, заявляя что вас обидели, будьте готовы к тому, что теперь об этой обиде узнают все. Такое явление имеет специальное название - Эффект Стрейзанд. Почитайте по ссылке, если не в курсе. Это происшествие с замечательной (без иронии) певицей и актрисой наглядно показывает, что происходит в случае запретов/блокировок/удалений. Прямо сейчас мы наблюдаем рост популярности Telegram и Zello на волне запретов. Правильно же говорят, - “Любое упоминание в прессе полезно, если это только не некролог.” Понятно же, что широкая общественность, никогда не обсуждавшая мессенджеры как таковые, теперь вовлечена в дискуссию во много раз больше. И даже те, кому на самом деле всё равно, тоже нынче сформировали свою позицию. А до первого наезда и мы не писали ни о Zello, ни о Telegram, а теперь следим за их судьбами и постоянно информируем о том, как развиваются события. Почему? Потому что это напрямую касается доступности сервисов в Интернет и комфорта для наших абонентов. Мы для вас и есть та самая “связующая нить” и “форпост Сети” в вашем доме. Если абонент с чем-то не может соединиться, куда он идёт? Правильно! К провайдеру: “Что же ты такой-сякой, немазаный-сухой связность не обеспечиваешь?” Поневоле приходится решать, а в нынешней ситуации переадресовывать к настоящим “виновникам торжества”. Отсюда и бОльшая информированность простых пользователей. Хм… хороший маркетинговый ход, однако :) Кстати, этому тоже определение есть - вирусный маркетинг

А ещё, помните, такой закон наша Госдума приняла, О забвении его называют? Как вы думаете, работает? Да в общем-то нет, не работает. От слова “совсем”. Причины две. Первая, упомянутый выше “Эффект Стрейзанд”. А вторая укладывается в мем: ”Гугл помнит всё!" Гугл, конечно, здесь упомянут в широком смысле, также можно сказать и о Яндексе и о других поисковиках. Примерчик? Вот на скриншоте поисковая выдача Гугла по запросу “Компания Март”. Видите, выделено - “сохранённая копия”. Т.е. если сайт вдруг станет недоступен, вы сможете посмотреть его копию из кеша поисковика. Яндекс тоже это умеет.

А теперь минутка ностальгии, вот смотрите версии сайта mart.ru.  1998 год, жаль картинки не сохранились.Но! Поисковики хранят у себя не очень глубокую историю, в принципе это копия сделанная в момент последнего обхода сайта поисковым роботом. Так что отсюда можно выцепить сравнительно немного. Тем не менее Интернет помнит сильно больше и никто не в силах отбить эту память. Почему? Потому что Сеть состоит из большого количества действующих лиц и узлов, а “на каждый роток не накинешь платок”.

 

А вот 2000 год, сам сайт не поменялся, но движуха другая.

 

 

В 2001 -  другой дизайн, робот его немного покоцал, но в целом всё понятно.

 

 

Кстати, вы можете глянуть на тарифы в нашей оптической сети в 2006 и сравнить с текущими.

 

 

В 2007 году опять новый дизайн.

 

 

Сайт почти прежний, а набор сервисов в 2011 уже другой, и номера телефонов поменялись.

 

Извините за #многаскриншотов, ностальгия же. Можно было бы и ещё, но не буду больше картинками утомлять, текущий вариант нашего сайта вы и так видите :)

Так откуда весь этот музей? Нет, мы не храним всё у себя, это ВебАрхив (The Wayback Machine). В нём лежит история 325 млрд. сайтов. Это огромный архив почти за всё время существования Интернета. Конечно, там есть изъяны, робот не обходит все сайты каждый день, кое что сохраняется без картинок, кое-что рассыпается, но ВебАрхив помнит то, что кое-кто забыл или хочет забыть. Кстати, РКН его не блокирует. Почему? Не в курсе дела, наверное :)

С точки зрения долговременной памяти Интернет не уникален. Хорошая память вообще свойственна любым сетевым структурам. Большое количество акторов и социальных цепочек с разными интересами и целями сохраняют всё. В том числе и знания и умения из разных сфер науки и жизни.

И, в нашей истории уже были попытки изменить воспоминания о ходе событий и действующих лицах. Совсем в духе “1984” Оруэла, нас пытались заставить забыть то, что на самом деле было. Люди просто, без всякого Photoshop-а, при помощи сермяжной ретуши, исчезали с фотографий, но частные архивы остались и истина проявилась.

 Теперь вы понимаете моё “слишком ироничное” отношение ко всем этим запретам, забвениям, запросам разных органов. Всё, что хотят запретить или запрещают, найдётся. Всё, о чем хотят заставить забыть, вспомнится. Архив нынче публичен и легко доступен. Даже если кто-то об этом не осведомлён, каждый всё равно может зайти и посмотреть! И “рукописи не горят”, как известно, а цифровые следы тем более. Интернет экстерриториален и многосвязен, в нём нельзя ничего сокрыть. А стоит лишь помнить: “Ищущий да обрящет!”

Несколько пафосно заканчиваю, но вывод очевиден по-моему.