Оценить возможности автоматического сбора, анализа и публикации фидов можно на примере новостных порталов, аггрегирующих данные с сотен и тысяч сайтов. Самые яркие примеры — Google News (четыре с половиной тысячи источников) и «Яндекс.Новости» (почти 1400 источников).
Приятно, что «Яндекс» интенсивно развивает разнообразные сервисы, связанные с RSS. Отметим, например, недавно появившийся индекс популярности темы в блогах. Сейчас вы легко можете получить список наиболее обсуждаемых в блогосфере новостей и прочесть мнения блоггеров.
Очень долго RSS и Atom имели еще один огромный плюс, который, впрочем, был и их минусом: в потоках не было рекламы. На подавляющем большинстве блогов и форумов вы увидите контекстную рекламу, не важно, будет это AdSense или, скажем, «Бегун». Зачастую это основной источник финансирования проекта. До прошлого года в RSS нельзя было показывать контекстную рекламу: размещением ее просто-напросто никто не занимался. Так что многие сайты использовали, да и сейчас используют RSS и Atom лишь как средство извещения о появлении новых материалов на сайте, а не как средство для их передачи пользователю. Подписчик в таком случае получает только вводную часть материала или, что еще хуже, несколько первых символов и вынужден за полным текстом отправляться на сайт.
Со временем ситуация изменилась, и сейчас несколько западных компаний занимаются размещением рекламы в фидах. Это и Google (правда, его программа пока находится в стадии закрытого бета-тестирования), и уже упоминавшийся FeedBurner, и Kanoodle… Российские компании, занимающиеся контекстной рекламой, пока эту нишу игнорируют [На самом деле, не совсем игнорируют: в компании «Бегун» нам ответили, что соответствующая технология уже разработана и ждет лишь критической массы спроса со стороны рынка. — И.Щ.].
Поиск по фидам — довольно интересная ниша. Данные в поисковой базе обновляются очень быстро (скажем, заявленная частота обновления в «Яндекс.Блогах» — 5 минут), так что результаты запроса показывают актуальную картину.
Поиском по RSS занимаются очень многие. Назовем лишь нескольких -Feedster,BlogPulse, Technorati, Google Blog Search и «Яндекс». Интересной возможностью, предоставляемой некоторыми из таких сервисов, является подписка на RSS-фид с результатами поиска. Например, вы подписываетесь на канал с результатами поиска по запросу «Компьютерра». Теперь каждый раз, когда кто-то упоминает журнал в своем блоге или форуме, вы получаете сообщение об этом.
Рассказать обо всех существующих на сегодня аггрегаторах невозможно. Они многочисленны и многообразны. Аггрегатор может скрываться в вашем любимом браузере, работать на КПК или настольном компьютере, открываться в качестве домашней страницы… Открытость стандартов синдикации и их популярность привели к появлению огромного числа приложений, работающих с потоками на различных платформах.
Сейчас RSS стремительно превращается из экзотики в привычную технологию. Вы можете использовать RSS и даже не знать об этом. Скажем, список новостей при загрузке VisualStudio 2005 поставляется именно через RSS. Практически все скрипты для создания блогов и CMS поддерживают этот стандарт.
Также вполне возможно, что у вас на компьютере уже есть аггрегатор, который входит в состав какой-нибудь программы. Вы можете увидеть RSS-ленты на панельке Google Desktop, в «живых закладках» Mozilla Firefox, виджетах Opera…
В этом разделе мы упомянем наиболее популярные аггрегаторы и расскажем об онлайновых русскоязычных сервисах по работе с фидами. Желающие посмотреть огромную таблицу со сравнением англоязычных офлайновых аггрегаторов могут посетить сайт www.aggcompare.com
Первым российским онлайновым аггрегатором является Kanban.ru, которому недавно исполнился год. Его возможности стандартны для подобных приложений: сортировка и отображение фидов по категориям, импорт и экспорт списков фидов через OPML. К сожалению, содержание сообщений выводится только в сокращенном виде, с удаленными картинками и форматированием. Зато Kanban прост, быстр, понятен и не показывает рекламы. В составе сервиса работает огромный каталог русскоязычных фидов, разбитый на категории. Кроме того, есть дочерний сервис rss2email, позволяющий получать фиды в виде электронных писем.
Проект RSSReader.ru стартовал в конце прошлого года. Схема приложения напоминает обычный почтовый клиент — слева выводится список подписок, которые можно распределять на категории, справа — сообщения выбранной ленты. Сообщения, как и в Kanban, показываются без форматирования и графики. Имеется возможность импорта и экспорта OPML-файлов. Конечно же, есть и свой каталог фидов, ленты в котором можно фильтровать по категории, популярности и новизне.
«Закладки» — русскоязычная «домашняя страница», позволяющая собрать на экране сразу несколько фидов. Ленты выводятся в независимых блоках. В настройках ленты можно указать режим отображения — только заголовки или же заголовки и сокращенный текст, а также указать количество выводимых сообщений. Правда, текст и тут передается без графики и форматирования. Из дополнительных возможностей есть блок поиска в «Яндексе», Yahoo и Google, блок закладок для вывода ссылок, которыми вы часто пользуетесь; кроме того, на страницу можно добавить модуль «электропочта», который выводит заголовки новых сообщений практически из любого сервиса e-mail (поддерживаются POP3 и IMaP4).
«Яндекс.Лента» — пожалуй, самый функциональный и удобный русскоязычный аггрегатор. Его главное и очень важное преимущество — он позволяет читать полный текст сообщения. При большом количестве фидов сервис может немного притормаживать, но все равно остается довольно удобным. Очень функциональна форма добавления нового фида. Вы можете не только непосредственно ввести адрес ленты, но и просто ввести имя пользователя LiveJournal, поисковый запрос к blog.yandex.ru или «Яндекс.Новости».
За последний год даже в Рунете RSS перестал быть диковинкой. Оранжевая кнопка и надпись RSS/Atom появились на многих сайтах. Сейчас редко встретишь свежезапущенный проект, который не использовал бы эти технологии. Появление поддержки RSS в Windows и Internet Explorer лишь еще больше увеличит популярность синдикации.
Это может показаться странным, но одним из факторов, способствующих распространению RSS, стал спам. Действительно, об обновлениях на сайте можно сообщать и по e-mail — и многие ресурсы предоставляли и до сих пор предоставляют такую возможность. Но чтобы получать уведомления по почте, нужно сначала сообщить свой адрес — а делать это по понятным причинам хочется не всегда. Даже если компания, стоящая за веб-ресурсом, дорожит своей репутацией и не будет отправлять непрошеную рекламу, нет гарантии, что база адресов случайно не «уплывет» не в те руки. И вообще, раскрытие своего адреса — операция необратимая.
В случае с RSS эта проблема не возникает — ведь здесь не сайт отправляет пользователю письмо, а сам пользователь (точнее, его аггрегатор) скачивает обновленный поток. Если хочет. А если не хочет — то и не скачивает. Никакого раскрытия личных данных не происходит, и контроль за подписками остается целиком в руках пользователя.
Впрочем, если вдруг спамеры захватят контроль над популярной RSS-лентой, взломав соответствующий сайт, проблем тоже будет предостаточно. Как говорилось на конференции Black Hat, многие онлайновые RSS-аггрегаторы полагаются на чистоплотность источника и не проверяют html-код, включенный в поток на предмет потенциально опасного содержимого типа Java-скриптов.