Журнал «Компьютерра» № 34 от 18 сентября 2007 года - Журнал Компьютерра 📖 Читаем онлайн книгу ❗ бесплатно. Страница 18

То есть "заполнение разрывов" остается делом тех, кто ставит ссылки, а также самих серферов-читателей. И для тех, и для других – базовых техник "борьбы со Временем" всего две: архивирование и использование "ассоциативных ссылок" вместо гиперссылок (но лучше – вместе с ними).

Архивирование. Архивы «всего» Интернета можно найти в кэше поисковиков (Google, Yahoo, MSN) или в специализированном Internet Archive; крупные участки Веба сохраняются также в некоторых региональных поисковиках или национальных архивах. Кэши поисковых машин, как правило, содержат более-менее актуальные копии страниц (навсегда «умершие» сайты из кэша исчезают) и оттого пригодны лишь для «добычи» временно недоступного контента (сайт упал, а статья нужна сегодня). Зато Internet Archive (archive.org) и его Wayback Machine (web.archive.org) позволяют получить «снимки» почти любого сайта за почти любой период его существования – «снимки» делаются примерно раз в полгода. Самое интересное, что все ссылки, ведущие со страницы, приведут тоже на заархивированные копии сайтов – таким образом, становится доступен целый "временной срез" Веба.

К сожалению, далеко не все сайты и страницы доступны таким образом. Internet Archive "не любит" страниц с "динамическими адресами" ("example.com/index.php?articleId=…"), ему недоступен Deep web (часть Веба, закрытая от индексации поисковиками), наконец, он вынужден уважать права авторов и удалять из архива копии сайтов по первому требованию владельца [А иногда и не владельца. Известен случай, когда множество антисайентологических сайтов исчезло из Internet Archive (а также из кэша Гугла) по требованию Церкви Сайентологии]. Схожие проблемы и у локальных (национальных и тематических) архивов.

Впрочем, если архивированием того-на-что-ссылка своевременно озаботится автор ссылающегося материала, ему станут доступны еще некоторые техники "архивирования по требованию". В частности, такими методами пользуются ученые, у которых научные ссылки в работах все чаще ведут в Веб, а не в статьи бумажных журналов. Автор может, во-первых, сохранить все материалы, на которые сослался, в специальном месте – например, у себя на сайте (что, впрочем, может быть чревато копирайтными трудностями) или в специализированном сервисе (знающем, как с такими трудностями справиться) [Самый популярный из такого рода архивов – WebCite (webcitata.org) – на момент написания статьи был недоступен (sic!)].

ПРОРОЧЕСТВО

Пожнут твои плоды потомки.

Публий Вергилий

Кроме того, можно не трогать залинкованные материалы, зато поставить на них ссылки в одном из "адресо-независимых форматов" – PURL (Persistent URL) или DOI (digital object identifier). Этот способ основан на том, что для каждой статьи, ссылку на которую необходимо сохранить доступной, ссылающийся заводит запись на специальном сервере (PURL-сервере или DOI-сервере соответственно), в которой и поддерживает лично актуальность ссылки (по необходимости изменяя ее адрес, перенаправляя ее в какой-нибудь архив и т. п.). Читатели же его работы вводят идентификатор ссылки на том же сервере и сразу попадают на ее «живую» версию (если сославшийся не забывает обновлять ее – что при наличии десятков работ и сотен ссылок весьма сомнительно). Впрочем, понятно, что журналисты популярных веб-изданий, блоггеры и прочие "простые смертные писатели" к столь сложным способам "обеспечения доступности" не склонны [Интересно, кстати, как решен этот вопрос в «народной» Википедии. Можно заметить, что актуальные и часто обновляемые статьи в последнее время для указания источников информации переходят с привычных для Веба ссылок из текста к более формальной системе нумерованных сносок, в каждой из которых лежит ссылка и запись вида "доступность проверена тогда-то". Такая система требует дополнительного труда и внимания, зато позволяет обновлять «протухшие» ссылки на источники фактов, не трогая основной текст].

Ассоциативные ссылки. Менее надежный, зато более человечный способ сохранить связь-ссылку (и найти ее, если очень понадобится) – ориентация на ключевые слова, информацию, лежащую «вокруг», или "характерную фразу" (fingerprint phrase – буквально "фраза – отпечаток пальца") ссылаемой статьи. Применимость таких эрзац-ссылок (или супер-ссылок – как посмотреть) довольно широка – автор статьи для объяснения какого-либо понятия или упоминания не-всем-известного анекдота может поставить ссылку на поиск ключевой фразы в Гугле; может записать ключевые слова рядом со ссылкой, если боится ее протухания [Кстати, сюда же примыкает понятие memomark – "ссылки в будущее", когда для описания новопридуманной концепции используют еще несуществующее слово/словосочетание, а спустя некоторое время ищут слово в поисковиках, отслеживая распространение и обсуждение концепции (ну, или воровство текста). Кстати, слово «memomark» само по себе является memomark’ом – любой русскоязычный поисковик немедленно выдаст, у кого я позаимствовал это понятие]. А если этого не сделал автор, читатель, наткнувшийся на что-нибудь вроде "кое-что по этой теме можно найти здесь" (с неживой ссылкой за "здесем"), может поискать другие упоминания той же ссылки, собственноручно вычленить из них ключевые слова, пройтись по поисковикам…

Понятно, что и от автора, и от читателя использование такого рода «косвенных» ссылок требует некоторых усилий и внимания к тексту несколько выше уровня "написал и забыл"/"прочитал и забыл". И все же такой способ "обеспечения связности" менее формален и назойлив, нежели ориентированные на ученых решения вроде PURL и архивирования-по-запросу.

Итого

Дырки в Паутине есть, и с каждым днем их все больше; никакой панацеи от протухших ссылок, изменившейся структуры сайтов, перехваченных доменов человечество пока не придумало (и сомнительно, что придумает). Кружева Паутины эфемерны, но во многих случаях разрывы можно заштопать или предотвратить. Вопрос лишь в том, сколько усилий это потребует – и готовы ли читатель, перегруженный информацией, и автор, перегруженный буквами, прилагать эти усилия для восстановления в принципе не таких уж и важных звеньев цепочки рассуждений.

Проблема заимствования

Один неописанный в статье случай «ссылки» – прямое включение контента с одного сайта в контент на другом.

В современном Вебе такое «заимствование» проявляется в основном в форме вставки картинок, лежащих на других серверах, но шумиха вокруг Web 2.0 и «помесей» сайтов (mash-ups) дает надежду, что в Вебе появится-таки самый настоящий «transclusion» – термин Теда Нельсона, означающий специальный тип гиперссылок, которые не «указывают» на какую-то статью, а физически включают ее (или ее часть) в ссылающийся текст.

С одной стороны, это позволит создавать "еще более гипер"-тексты, с другой же – включение в свой сайт чужих изображений – техника весьма спорная. Это считается плохим тоном по двум причинам: "воровство трафика" (сервер, на котором лежит картинка, испытывает дополнительную нагрузку из-за ваших читателей) и копирайтные трудности (рядом с картинкой далеко не всегда пишут, кому она принадлежит) – поэтому на подобные запросы с чужих адресов многие «шутники» возвращают вместо запрошенной картинки «заглушку» с нравоучительной надписью (вроде "Не воруй").

При этом включенная таким образом картинка может дать «продвинутому» серферу и полезную информацию: посмотрев на адрес интересующего рисунка, можно пойти на сайт, с которого он был «позаимствован». Есть надежда, что вскоре мы увидим также, какие проблемы и преимущества принесет заимствование текста.

Но, возвращаясь к основной теме статьи, отметим, что здесь же лежит очередная "опасность разрыва" – если заимствованные материалы вдруг исчезнут с источника, для заимствующего это чревато уже не просто неработающими ссылками, а "черными дырами" в теле статьи.

Перейти на страницу:

Изменить размер шрифта: