Поиск в Гугле

Гугл становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по словам инженера по программному обеспечению Гугла Мэта Катса, уже в 2002 году каждые 28 дней эта поисковая система индексировала 3 миллиарда веб-документов, в том числе более 3 миллионов новых страниц каждый день.

Гугл в чем-то проигрывает Яндексу, а в чем-то выигрывает у него. Поскольку об операторах Яндекса читатель уже знает, то для удобства при рассказе об операторах Гугла будем в ряде случаев проводить их сравнение.

Основы поиска. Чтобы ввести запрос, напечатайте ключевые слова и нажмите Enter либо щелкните кнопку «Поиск в Google».

Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого он анализирует не только ту страницу, которая соответствует запросу, но и те, что на нее ссылаются, чтобы определить ценность этой страницы для целей вашего запроса. Кроме того, Гугл предпочитает страницы, на которых ключевые слова, введенные вами, расположены недалеко друг от друга.

Показ ключевых слов в результатах. Первый способ увидеть ключевые слова заключается в том, что каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в этом отрывке ключевые слова. Тем самым облегчается обнаружение ключевых слов в тексте. Второй способ – загрузить страницу по ссылке «Сохранено в кэше». Недостаток этого способа (конкурентная разведка нередко это рассматривает как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а ту, которая сохранена в базе Гугла. Изначально эта опция была придумана для того, чтобы сохранить возможность просмотра страницы даже в тех случаях, когда сервер, на котором эта страница расположена, недоступен.

Третий способ – традиционный для просмотра текста в браузере – использовать сочетание клавиш CTRL+F. Появится окно «Найти», в которое вводятся искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.

Логическое «И». В отличие от Яндекса, в Гугле всего одно логическое «И», оно наиболее близко к оператору Яндекса && в сочетании с оператором «плюс», поставленным перед каждым словом запроса. Это логическое «И» позволяет выдавать документы, которые принудительно содержат ключевые слова в любом месте текста. По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса.

ПРИМЕР

Запрос: [литейщик провизор стоматолог маркшейдер]

Результат поиска: 1–10 из примерно 37 для литейщик провизор стоматолог маркшейдер.

В выдаче: Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв…

Примеры профессий, входящих в данную базовую группу: Фармацевт Провизор Базовая… Вальцовщик гидроизоляционных материа лов Литейщик облицовочных плиток… www.magister.msk.ru/library/economic/work/ok010.txt – 952k -

Поиск вакансии

…ВРАЧ-РЕНТГЕНОЛОГ, ВРАЧ-СТОМАТОЛОГ, ВРАЧ-СТОМАТОЛОГ-ХИРУРГ, ВРАЧ-ТЕРАПЕВТ… НА МАШИНАХ ДЛЯ ЛИТЬЯ ПОД ДАВЛЕН, ЛИТЕЙЩИК САНИТАРНО-СТРОИТЕЛЬНЫХ ИЗДЕЛИЙ…

d37.chtts.ru/vac/edrd.asp – 63k

Интересно, что Гугл может показать и те страницы, на кoтopыx нет ключевых слов, но эти слова содержатся в ссылках на показанную страницу. В таком случае при просмотре страницы с помощью ссылки «Сохранено в кэше» будет видна надпись: «Эти слова присутствуют только в ссылках на эту страницу».

Логическое «ИЛИ». Пишется с помощью оператора OR, либо, как и в Яндексе, с помощью символа вертикальной черты | Обратите внимание, что оператор OR должен быть написан заглавными буквами и отделен пробелами с обеих сторон от слов, расположенных перед ним и после него.

Важно знать, что, в отличие от Яндекса, Гугл не поддерживает такой оператор, как скобки.

ПРИМЕР

Запрос: [литейщик OR провизор OR стоматолог OR маркшейдер], либо [литейщик | провизор | стоматолог | маркшейдер]

Результат поиска: 1–10 примерно из 2 330 000 для литейщик | провизор | стоматолог | маркшейдер либо

1–10 примерно из 2 330 000 для литейщик OR провизор OR стоматолог OR маркшейдер.

Заглавные буквы или прописные? Гугл, в отличие от Яндекса, не чувствителен к регистру. Все буквы воспринимаются как прописные, вне зависимости от того, как их вводили в поисковую строку. Запросы [Эйфелева Башня], [Эйфелева башня] и [эйфелева башня] дадут одинаковые результаты.

ПРИМЕР (результат на момент написания книги)

Результат поиска: 1–10 примерно из 511 000 для Эйфелева Башня.

Результат поиска: 1–10 примерно из 511 000 для эйфелева башня.

Стоп-слова. В хэлпах (так часто называют раздел «Помощь» в онлайновых сервисах) написано, что Гугл, подобно большинству поисковых машин, игнорирует стоп-слова. Кроме того, хэлпы говорят о том, что, как и многие другие поисковые машины, Гугл имеет механизм принудительного включения стоп-слов в результаты поиска. К стоп-словам относятся большинство артиклей английского языка, а также союзов и предлогов русского языка. В реальности ситуация, похоже, изменилась.

ПРИМЕР

Запрос 1: [в]

Результат поиска: 1–10 примерно из 619 000 000 для в.

Запрос 2: [the]

Результат поиска: 1–10 из примерно 5 620 000 000 для the.

Оператор «плюс» (+). Тем не менее бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву I (Ай).

ПРИМЕР

Запрос 1: [Star Wars Episode I]

Результат поиска: 1–10 примерно из 3 150 000 для Star Wars Episode I.

В том числе в выдаче появятся слова «Episode II», «Episode IV» и т. п.

Запрос 2: [Star Wars Episode +I]

Результат поиска: 1–10 примерно из 2 810 000 для Star Wars Episode +I.

И в него войдут только тексты, содержащие слово «Episode I».

Морфология слов. Гугл официально подтвердил, что поддерживает морфологию русского языка. Правда, делает он это не так, как многие другие поисковые машины. С одной стороны, алгоритм поддержки русского языка Гуглом дает возможность видеть не только словоформы, но и другие части речи, а с другой стороны, не все словоформы редких слов поддерживаются на практике. О плюсах этого алгоритма сотрудник Гугла Александр Грушецкий на официальном блоге заявил следующее.

Сейчас… мы умеем обращаться с морфологией и знаем другие особенности русского. Поэтому когда это нужно, мы ищем не только слова из вашего запроса, но и их различные формы. Реализовать морфологию было довольно просто, но традиционные подходы имеют множество недостатков. Мы же выбираем алгоритмы, которые в первую очередь улучшают качество результатов реальных пользовательских запросов и избавляют вас как от необходимости набирать различные варианты одного запроса, так и от просмотра множества не интересующих вас страниц. Мы постоянно изменяем и совершенствуем наши алгоритмы и пополняем арсенал трюков по обработке слов. Например, традиционная реализация русской морфологии не поддерживает множество других полезных преобразований слов. Теперь же, например, для запроса как лечить ожог будут также найдены страницы, содержащие лечение ожогов, для звон колокола – колокольный звон, для футбол английский чемпионат – чемпионат Англии по футболу, а для русификация ICQ – русификатор ICQ.

Также чрезмерное увлечение морфологией чаще вредит, чем помогает. Поэтому мы стараемся использовать словоформы там и тогда, где это действительно нужно, и делать это как можно аккуратнее. Например, «готов к войне» не имеет отношения к запросу «война с готами», ответом на вопрос кто такие таты будет явно не тату, а для запроса мыть кошку больше подойдет мытье кошек, чем моя кошка. Кстати, вы всегда можете полностью отключить использование форм слова, поставив оператор «+» перед словом или взяв его в кавычки. Например, для запроса звон + колокола или звон «колокола», будет найдено только точное вхождение слова колокола, а вот колокольный звон найден не будет.

Но на самом деле вам не нужно знать все эти тонкости. Вам просто нужно искать, как вы обычно это делаете, а мы найдем то, что вам нужно.


Перейти на страницу:
Изменить размер шрифта: