Карта интернета.
Аналогично любой другой карте, Карта Интернета это схема, показывающая взаимное расположение объектов. Но, в отличие от реальных карт (карта Земли) или виртуальных карт (карта Мордора), на Карте Интернета показаны объекты, не лежащие на поверхности. Говоря математическим языком, Карта Интернета ― это двумерное отображение связей между сайтами в интернете. Каждый сайт ― это круг на карте, его размер определяется посещаемостью сайта. Выше посещаемость ― больше круг. Переходы пользователей между сайтами образуют связи, чем сильнее связь ― тем ближе сайты «хотят» расположиться друг к другу.
Заряды и пружины
Если провести аналогию из классической физики, то можно сказать что сайты ― это заряженные шарики, а связи ― это пружины. Пружины притягивают похожие сайты, а одинаковый заряд не дает шарикам соприкасаться и отталкивает их ― если между ними нет связи. Изначально все шарики-сайты случайным образом разбросаны по поверхности карты. Пружины натянуты, энергия отталкивания высока ― система далека от равновесия. Затем сайты начинают перемещаться под действием приложенных сил и через некоторое время останавливаются ― силы притяжения стали равны силам отталкивания, система достигла своего равновесия. Именно это состояние показано на Карте Интернета.
Также можно провести очень грубую аналогию из квантовой физики. В этом случае, сайт ― это материальное тело имеющее массу, отдельный пользователь это квант массы ― тот самый [пока] не найденный бозон Хигса, а акт перехода пользователя между сайтами это квант гравитации ― гипотетическая частица гравитон.
Так или иначе, реальный алгоритм построения Карты Интернета довольно далек от аналогий приведенных выше. Для интересующихся, самое близкое описание математической модели можно найти в [1], а инженерное решение очень похоже на то, что описано в [2]. В качестве платформы для отображения использован движок google maps.
Семантический веб
Карта Интернета это снимок глобальной сети состоянию на конец 2011 года. Она охватывает более 350 тысяч сайтов из 196 стран и все доменные зоны. Информация о более чем 2 миллионах связей между сайтами объединила их в тематические кластеры. Как и можно было ожидать, самые крупные кластеры образованы национальными сайтами, т.е. сайтами принадлежащими одной стране. Для удобства, сайты относящиеся к одной стране показаны одинаковым цветом. Например, красная область вверху соответствует Рунету, желтая слева ― китайскому сегменту сети, фиолетовая справа ― Японии, обширная светло-голубая область в центре это американский сегмент и т.д.
Важно отметить, что кластеры несут семантическую нагрузку, т.е. объединяют сайты согласно их содержанию. Например, можно увидеть обширный кластер порно сайтов между Японией и Бразилией, а также множество мелких кластеров объединяющих сайты одной отрасли или похожей направленности.
Феномен Интернета
Глобальная сеть Интернет ― это феномен технологической цивилизации, ее исключительная сложность превышает все, когда-либо созданное человеком. Это огромное количество практически несистематизированной информации. Карта Интернета ― это попытка заглянуть в скрытую структуру сети, оценить ее колоссальный масштаб, рассмотреть то, что невозможно увидеть из сухих цифр статистики.