Главная » Статьи » Книги » Интернет Ваш выход! Евгений Финкель

Интернет. Ваш выход! Евгений Финкель
     Поиск информации


 Поиск информации

В этой главе Вы познакомитесь с некоторыми стандартными схемами поиска
полезной информации, прочитаете краткие описания основных современных
поисковых систем в Сети Интернет. От Вас не требуется заучивать термины и
алгоритмы. Среди множества поисковых машин (Search Engines) остановите свой
выбор на двух-трех, коими и пользуйтесь, пока не столкнетесь с задачей,
непосильной для Ваших избранниц. Только тогда советую Вам пополнять список
более мощными системами поиска.
 Не стоит искать "на авось" или, следуя лишь интуитивным импульсам.
Помните: интуиция - лишь мутное зеркало знаний, накопленных до нас.


Постановка задачи

Не имеет смысла перечислять различные объекты поиска в Интернете. Они могут
быть самыми разнообразными. Отличия в схемах поиска научной статьи и
детской игрушки могут оказаться совсем незначительными.
 Представьте себе, что Вы - посетитель огромной библиотеки, хранящей многие
тысячи томов. Вы оказываетесь на распутье, от которого (по традиции) ведут
три дороги:
 1)  отправиться на поиск по известным Вам ключевым словам,
 2)  полистать предлагаемые тематические каталоги,
 3)  обратиться в специальную службу по поиску информации.
 Прежде, чем решиться на окончательный выбор пути, попытайтесь зримо
представить себе объект поиска. Помните, - чтобы грамотно задать вопрос,
надо знать большую часть ответа.
 Если Вам удается определить искомый объект несколькими признаками (словами
или числами), - решайтесь на самостоятельный поиск с помощью специальных
поисковых машин. Кстати, не пренебрегайте возможностью проверить наличие
искомого адреса прямой подстановкой ключевого слова в URL. Например,
очевидно, что при поиске сайта компании Intel, было бы разумным проверить
адреса www.intel.com [http://www.intel.com] или www.intel.org.
 В случае, если Ваш интерес имеет весьма размытые границы и определяется
лишь некой областью человеческих знаний, - обратитесь к тематическому
каталогу (в книге он представлен как Каталог Web-ресурсов).
 Допустим, Вы не решаетесь положиться на удачу, поскольку от точности
добытой информации зависит успех Вашего предприятия. В этой ситуации можно
разместить заказ в компании, которая осуществляет коммерческий поиск.
Постарайтесь найти такую компанию в собственной территориальной зоне.







                         Внешние поисковые системы

Внешние поисковые системы


Универсальный Сетевой Сыщик? Именно так. Не то, чтобы отличающийся от своих
коллег какими-то особыми умениями, но удачно компилирующий уже накопленную
информацию. Речь не пойдет о классических метапоисковых системах,
паразитирующих на чужих информационных базах. Предметом разговора будут
внешние программы, запускаемые на компьютере пользователя и специально
разрабатываемые для поиска информации в Интернете. Им несть числа. Далеко
не полный список можно найти здесь. Я бы выделил две программы: Inforian
Quest
  98 [http://www.inforian.com] , поскольку уж больно много шума
вокруг своего детища устроили разработчики еще в прошлом году (лидер
рейтинга PC World), и Copernic 98 [http://www.copernic.com] , признанную на
сегодняшний день сетевой общественностью лучшей программой в своем классе
(первое место в чемпионате Tucows).



Inforian Quest 98 [http://www.inforian.com] (IQ - удачная аббревиатура, не
правда ли?). Продукт компании Inforian [http://www.inforian.com] , плод
коллективных усилий японских, китайских и американских программистов.
Вес около 3.5Mb, требует до 5Mb свободного дискового пространства.
Стоимость полной версии 25 долларов США, shareware - 1 месяц.
Использует два стиля: Essence, для опытных пользователей, и Wizard, для
начинающих. Оба стиля отличает чрезвычайная простота. Inforian Quest 98
позволяет осуществлять быстрый метапоиск по семи наиболее популярным
серверам (Yahoo!, Altavista, InfoSeek, Excite, HotBot, OpenText,
WebCrawler), обращаться дополнительно почти к 200 поисковым серверам
Америки, Европы, Японии и Китая, плюс производить опрос внутри этих баз
данных по семи тематическим разделам Искусство и Развлечения (Arts &
Entertainment), Новости и Бизнес (News & Business), Компьютеры и Интернет
(Computers & Internet), Программное обеспечение и файлы (Software & FTP),
Группы новостей (Usenet (Discussion Group)), Научные технологии
(Technology), Адреса и телефоны (Yellow Pages). Есть надежда на включение в
ближайшее время в список "обыскиваемых" серверов израильских и российских
клиентов.
В зависимости от степени Вашего долготерпения рекомендуется настроить время
ожидания (wait for...) выдачи результатов поиска (минимум - 1 секунда,
максимум - почти 4 месяца, рекомендовано - 1-2 минуты) и указать предельное
количество сообщений от каждого найденного сайта (links per site) (по
умолчанию, 10). Если Вы хотите получать исключительно свежую информацию и
готовы ради этого немного пожертвовать скоростью поиска, - откажитесь от
использования proxy-сервера. При желании можно легко изменить язык
интерфейса с английского на немецкий, французский или испанский, если же
Ваш компьютер не только собран, но и начинен программным обеспечением
дальневосточными умельцами, - можно попробовать японский или китайский
интерфейс. Поражает великолепно исполненный "подсказчик", перейти к
которому можно, нажав на клавиатуре клавишу F1 или по сценарию Help -->
Help Topics.



Не меньшей популярностью на сегодняшний день пользуется и Copernic
  98
[http://www.copernic.com] - метапоисковая система от ATC (Agents
Technologies Corporation). Главное достоинство программы - отсутствие
необходимости платить за основную версию, время пользования не ограниченно.
Данная программа превосходит своего конкурента как легкостью (около 2.5Mb),
так и объемом опрашиваемого при поиске информационного пространства. В
обойму основных поисковых серверов добавлены, по сравнению с конкурентом,
NetFind, LookSmart, Lycos, Magellan, хотя и забыт весьма перспективный
OpenText. Примечательно, что разыскивая с помощью Copernic 98 кого-либо из
Ваших знакомых в Сети, Вы используете не только ресурсы традиционных Who
Where?, BigFoot, Four11, но и базу данных "героя нынешнего сезона",
компании Mirabilis. Тематическим каталогом, содержащим около 20 разделов и
аккумулирующим информацию свыше 100 поисковых систем, можно пользоваться,
если Вы избрали версию "plus" (30 дней бесплатно, понравится, доплатите 30
долларов США). На сегодняшний день в разработке находится так называемый
Channel Development Kit, который позволит Вам самостоятельно добавлять к
списку любую поисковую систему. Если при этом Copernic не будет считать
ошибочной поисковую фразу на русском или иврите, - в нашей стране этому
направлению обеспечена немалая популярность.
При каждой поисковой операции Вы можете изменять максимальные значения
общего числа результатов поиска и количества сообщений в отдельном
поисковом канале (Search --> New --> Parameters --> Custom Search). Можно
подключить к работе proxy-сервер (View --> Options --> Connection -->
Proxies).






Итак, конкурсанты представлены. Проверим их в деле. Основной критерий
оценки прост: достоверность поиска. По другим параметрам сравнивать
довольно трудно, поскольку скорость поиска в наибольшей степени зависит от
способа доступа в Интернет, а результативность, как было сказано выше,
можно регулировать настройками поисковой программы. Так вот, встроенной
системы отбраковки заведомо ложных результатов мне не удалось обнаружить ни
в Quest, ни в Copernic. Скажем, по запросу в Web "best search machine"
попадались и "превосходная стиральная машина-автомат", и "карта Северной
Ирландии", и "девушка без комплексов", вечная спутница любой поисковой
процедуры. Возможно, ключевая фраза была выбрана неудачно. Но все-таки...
Более серьезные многочасовые испытания показали, что первое впечатление
было верным. Quest вроде бы шустрее и продуктивней, Copernic внешне
основательней и скрупулезней. Вполне удовлетворительного результата удается
достигнуть при поиске конкретных людей или фирм, а также при тематическом
поиске. Но добиться нормальной (стабильной, разумной и т.п.) реакции
различных поисковых систем на произвольную ключевую фразу пока никому не
удалось. До идеала еще очень далеко. Перспективные, симпатичные игрушки. Не
более.





                              Поисковые машины

Поисковые машины


Все поисковые машины, предназначенные для сети Интернет, имеют более или
менее схожие принципы работы. Компактные копии документов, известных
серверам поисковых систем, хранятся на локальном диске. Каждая из "искалок"
опрашивает свой внутренний каталог по ключевым словам или фразам, которые
Вы указываете при определении сценария поиска. Различие состоит лишь в
объеме просматриваемой информации и алгоритме поиска, плюс, в наличии
дополнительных сервисов (например, встроенных тематических каталогов).
Невероятно распространено заблуждение, что во время поиска по Вашему
запросу избранная "искалка" обходит миллионы известных ей адресов и сверяет
соответствие ключевых слов содержимому "свежих" гипертекстов. Не так! Поиск
ведется в базе локальной машины, а в ответ на Ваш запрос выдаются
подходящие адреса во всех концах Паутины. Безусловно, поисковая машина
ведет постоянный опрос узловых адресов в Сети, пополняя собственную базу
данных. Однако, не огорчайтесь, если любимая поисковая машина не обнаружила
свежей информации, о существовании которой Вам достоверно известно, или
выдала устаревший несуществующий адрес. Ведь, если бы "искалка" при каждом
запросе опрашивала всю Сеть, боюсь, Вы никогда бы не получили результата
поиска. В значительной степени, доступность документа для поисковой системы
зависит от его автора. В его власти использовать в гипертексте наиболее
запрашиваемые ключевые слова и разместить документ на доступном для
основных поисковых машин сервере.
 Поскольку поисковые машины существуют в Интернете, в основном, за счет
публикуемой рекламы, как правило, самые популярные системы поиска могут
предоставить Вам наилучшие возможности. Для рядового юзера услуги поисковых
серверов, как правило, предоставляются бесплатно. Достаточно лишь указать
адрес поисковой системы в рабочей строке браузера или обратиться к ней
через каталог закладок.
 В данном разделе Вы прочитаете о некоторых наиболее известных
международных поисковых системах, а также о ряде российских и израильских
поисковых машин. Более полный список адресов поисковых систем (Search
Engines) Вы сможете найти в Главе 6 "Мои закладки", раздел "Поиск в
Интернете" (Search in Internet).


<font COLOR="#330033" face="Arial" size="3">Yahoo!</font><font

COLOR="#330033" size="1" face="Arial"><br>
  <br>
  <img SRC="pic31.GIF"
HEIGHT="330" WIDTH="514"><br>
  <br>
  </font> [http://www.yahoo.com]
Рис.3.1. Рабочее окно Yahoo!

Американский поисковый сервер (рис.3.1). Первая публикация в Сети: апрель
1994 года. Разработчики Дэвид Фило (David Filo) и Джерри Янг (Jerry Yang),
Стенфордский Университет (США).
 Имя "Yahoo!" можно перевести как "ура!" или как аббревиатуру "Yet Another
Hierarchical Officious Oracle" (в свою очередь переводимую, например, как
"иная иерархия назойливой истины"). Тем, кому особо интересна этимология
слова "yahoo", рекомендую перечитать Джонатана Свифта "Путешествие
Гулливера" на языке оригинала. Сами разработчики, поясняя происхождение
имени своего любимца, отсылают нас к истории древней японской борьбы сумо.
В современном английском языке этим словом иногда именуют существо со
скверным или просто грубым характером.
 Не смотря на довольно странное название (или благодаря именно ему), до
сегодняшнего дня Yahoo остается безусловным лидером по популярности среди
поисковых систем Интернета. Основным достоинством, по моему мнению,
является наличие встроенного многоступенчатого тематического каталога
(рис.3.2), опрашивающего крупнейшую в Сети базу данных. Недаром среди
персональных закладок многих пользователей можно обнаружить ссылки на
подразделы каталога Yahoo. При опросе поисковая машина Yahoo обращается не
только к собственному списку сетевых ресурсов, но и к серверам поисковой
машины Alta Vista. Среди существенных недостатков Yahoo  можно отметить
игнорирование многих российских и израильских серверов, плюс, обилие
устаревших ссылок.



Рис.3.2. Тематический каталог Yahoo!

Интерфейс поисковой системы Yahoo постоянно модифицируется и
усовершенствуется, зона поиска все время расширяется. Возникают новые
версии поисковой машины для людей различных возрастов. Создано множество
национальных Yahoo-серверов. Печатается даже специальный журнал как в
виртуальной, так и в глянцево-бумажной версиях. Однако основные методы
поиска остаются неизменными: Вы или шаг за шагом уточняете область поиска,
следуя указателям тематического каталога, или вписываете ключевые слова по
стандартной схеме, указанной ниже.
 Для полноценного поиска по ключевым словам необходимо выбрать меню Options
(Возможности). После клика в данном меню перед Вами возникает поисковое
окно (рис.3.3), в котором Вы можете выбрать ареал поиска: по ресурсам Web
(Yahoo!), среди групп новостей (Usenet) или по электронному адресу (E-mail
addresses).



Рис.3.3. Поисковое окно Yahoo!

Вы можете определить и само исследуемое пространство: внутренний каталог
Yahoo (Yahoo Categories) или Мировую Паутину (Web Sites). Поиск по
внутреннему каталогу будет сильно ограничен. Так, например, по ключевому
слову "israel" внутри каталога Yahoo мною было найдено около 30 сообщений,
в то время, как по всемирному поиску - свыше 1500. Однако, по умолчанию,
поиск ведется по внутреннему каталогу, вероятно, для того чтобы не утомлять
неквалифицированного пользователя лишней информацией.
 Кроме всего прочего Вы можете запросить отображать среди результатов
поиска информацию за определенный промежуток времени и установить
порционность выводимых сообщений.
 Вам также предоставляется возможность выбрать метод поиска:
 1)  "разумный" поиск (Intelligent default),
 2)  по точному соответствию фразы (An exact phrase match),
 3)  по соответствию всех слов (Matches on all words (AND)),
 4)  по соответствию одного из слов (Matches on any word (OR)),
 5)  по имени человека (A person's name).
 Наибольшие затруднения, как правило, представляет "разумный" поиск.
Поэтому уделим этому методу особое внимание. Необходимо уяснить лишь
десяток несложных правил:
 1)  для начала поиска, после указания ключевого слова (на английском
языке) необходимо нажать на меню Search (Поиск) или на клавишу Enter
(Ввести) на клавиатуре,
 2)  если поиск ведется по одному ключевому слову, пробел после слова
ставится лишь в том случае, если Вы желаете исключить из вероятного списка
те документы, в которых к ключевому слову примыкают дополнительные знаки
(например, знаки препинания),
 3)  при поиске по соответствию хотя бы одного из перечисленных слов
достаточно отделить слова пробелами (например, best provider),
 4)  при поиске по соответствию всех слов необходимо перед вторым, третьим
и т.д. словами поставить знак "" (например, best provider),
 5)  при необходимости исключить из общего списка документы содержащие
некое слово, нужно использовать знак "-" (например, best -provider),
 6)  при поиске фразы рекомендуется использовать кавычки (например, "best
provider"),
 7)  если Вы ищете слово, начинающееся с заглавной буквы, - возьмите его в
кавычки (например, "Provider"),
 8)  для поиска по известному заголовку можно использовать дополнительный
ключ "t:" (например, t:best),
 9)   для поиска слова среди доменных имен (URL) желательно указать
дополнительный ключ "u:" (например, u:best),
 10)  если Вы сомневаетесь в правильности написания того или иного слова, -
используйте значок "*" (например, pr*v*der).
 Вы спросите меня: "И это все?" Я отвечу: "Нет. Но хватит надолго."
 Одно несомненно: разобравшись со спецификой поиска в одной системе, Вы без
труда освоите любую другую поисковую машину.


<font size="3">AltaVista</font><font
  size="1"><br>
  <br>
  <img
SRC="pic34.GIF" HEIGHT="334" WIDTH="518"><br>
  <br>

[http://www.altavista.digital.com] Рис.3.4. Рабочее окно AltaVista

Лидер проката 1995-96 годов. Была выпестована в лабораториях одной из
крупнейших компьютерных компаний Digital Equipment Corporation (DEC). В
вольном переводе с итальяно-американского сленга имя AltaVista звучит, как
"там-за-горизонтом". С первых дней своего существования эта поисковая
система была заявлена как безусловно наилучшая: использующая все
безграничные ресурсы Web и позволяющая достичь максимальных скоростей
поиска.
 AltaVista представляет настоящий интерес для высокопродуктивного поиска
(www.altavista.com) (рис.3.4). 25 языков - не шутка! Среди них и иврит, и
русский. Поиск может вестись как на просторах Web, так и среди Usenet.
Существуют простой и усложненный методы поиска. Боюсь, что именно
усложненность нестандартной поисковой процедуры привела к потере былой
популярности AltaVista. Данная поисковая машина не предлагает Вам
"прокатиться" по тематическому каталогу. Вы можете использовать стандартные
процедуры поиска, уже описанные для системы Yahoo, и не морочить себе
голову дополнительной информацией, или изучить дополнительные команды
(недаром AltaVista славится самой длинной командной строкой).
 По сути, к уже знакомым операциям добавляются несколько логических и
синтаксических операций. Некоторые из них дублируют более простые (но,
поговаривают, - менее надежные) операции. Лично мне удобство поиска
представляется более важным параметром, нежели мнимая надежность. Тем
более, что уже привычные значки (пробел, "" и "-") работают в AltaVista
замечательно, а многие новшества не работают вовсе. Тем, кого интересует
полный список операций поиска в AltaVista советую просто кликнуть на значок
Help (Помощь) в основном окне поисковой системы.


<font size="3">Excite</font><font size="1"><br>
  <br>
  <img
SRC="pic35.GIF" HEIGHT="289" WIDTH="479"><br>
  <br>

[http://www.excite.com] Рис.3.5. Рабочее окно Excite

Название этого поискового механизма имеет неоднозначный перевод с
английского: на слух "экс-сайт" может быть воспринято как "terra incognita"
(неведомое пространство) Интернета, с другой стороны, точный перевод таков
- "возбудись!". За время жизни в Паутине с октября 1995 года, завоевал
немалую популярность за счет совершенно нового подхода к алгоритму поиска.
Шесть парней (из все того же Стенфордского Университета) решили максимально
упростить поисковую процедуру, доверив основные логические операции
собственному компьютеру. Пользователю достаточно грамотно набрать
произвольную ключевую фразу по-английски и нажать на кнопку "Search"
(рис.3.5).
 Далее поисковая машина Excite, полагаясь лишь на собственный интеллект,
отыскивает Вам необходимую информацию. Она сама разбирается с путаницей
слов: синонимов и омонимов, контекстов и скрытых смыслов. При выдаче
результатов поиска Excite сопровождает их комментариями о точности
совпадения с начальным запросом (до 100%). Однако, если подобная концепция
поиска Вас не удовлетворяет, можно воспользоваться обычной схемой поиска по
ключевым словам.
 Показательно, что за последний год Excite очень сильно изменил
пользовательский интерфейс: появился прекрасный тематический каталог,
предоставлена возможность обращения к локальным серверам Excite в странах
Европы, при обращении к ссылке Power Search (Усиленный Поиск) Вы с
удивлением обнаруживаете, что по умолчанию теперь предлагается поиск по
ключевым словам, а не по фразам. Вероятно, алгоритм концептуального поиска,
долгое время скрываемый от пользователей и конкурентов, не до конца
оправдал себя. Тем не менее, при поиске научных статей по заранее
известному названию или заголовку, я чаще всего прибегаю именно к этой
поисковой машине.


<font size="3">HotBot</font><font size="1"><br>
  <br>
  <img
SRC="pic36.GIF" HEIGHT="273" WIDTH="527"><br>
  <br>

[http://www.hotbot.com] Рис.3.6. Рабочее окно HotBot

Зеленый плод любви программисткой компании Inktomi и мультимедийного
интерактивного журнала HotWired. Основной идеей системы HotBot (рис.3.6)
является достижение максимального удобства при поиске информации за счет
изначального определения ареала и метода поиска (рис.3.7). На этапе
подготовки к поиску Вы можете определить временной промежуток для искомой
информации (от недели до двух лет со дня опубликования в Сети), континент и
тип домена, установить режим вывода результатов поиска и многое другое.
Однако, эти достоинства могли бы остаться незамеченными, если бы на сервере
HotBot не был размещен лучший на сегодняшний день тематический каталог
сетевых ресурсов, позволяющий Вам воспользоваться услугами представленных в
нем компаний.



Рис.3.7. Выбор области и метода поиска в HotBot

Подробные комментарии и объяснения по работе с сервером HotBot можно найти
по адресу help.hotbot.com.


<font size="3">Infoseek<br>
  </font><font size="1"><br>
  <img
SRC="pic38.GIF" HEIGHT="395" WIDTH="479"><br>
  <br>

[http://www.infoseek.com] Рис.3.8. Рабочее окно Infoseek

Надежная система как для любительского, так и для профессионального поиска.
Поисковый сервер Infoseek (можно перевести как "ищущий информацию")
существует с 1994 года (рис.3.8). На сегодняшний день используются две
версии: для глобальных и для локальных сетей. Поиск осуществляется по
ключевым словам (фразам) или по тематическому каталогу. Инициализация
системы производится нажатием клавиши "Seek" (Найти). Основные достоинства:
самая крупная база данных, собирающая информацию с локальных серверов от
Бразилии до Голландии, плюс удачно реализованная возможность уточнять ареал
поиска после получения результата добавлением новых ключевых слов (рис.3.9).



Рис.3.9. Уточнение области поиска в Infoseek

Я, обычно, использую Infoseek как последнее средство поиска, в случае, если
другие поисковые системы не обнаружили нужной информации по интересующему
вопросу. Почему? Потому что по стандартным запросам Infoseek выдает на
несколько порядков больше информации, чем любая другая "искалка". Например,
по запросу best provider (при поиске в Web-пространстве) я получил свыше 5
миллионов ссылок, в то время, как Yahoo по внутреннему каталогу обнаружила
120 ссылок, а по базе данных AltaVista - около 300 тысяч.


<font size="3">Lycos</font><font size="1"><br>
  <br>
  <img
SRC="pic310.GIF" HEIGHT="295" WIDTH="400"><br>
  <br>

[http://www.lycos.com] Рис.3.10. Рабочее окно Lycos

Еще одна прекрасная поисковая система (рис.3.10), дающая Вам возможность
без труда находить не только документы с упоминанием ключевых слов, но и
графические и звуковые файлы по фрагменту имени файла. Позволяет также
предельно локализовать область поиска и обладает хорошо структурированным
каталогом.



<font size="3">Filez</font><font size="1"><br>
  <br>
  <img
SRC="pic311.GIF" HEIGHT="367" WIDTH="532"><br>
  <br>

[http://www.filez.com] Рис.3.11. Рабочее окно Filez

Специализированная машина для поиска файлов в Интернете (рис.3.11).
 Для поиска того или иного файла достаточно ввести его имя (с указанием
типа файла или без оного) и нажать на кнопку Find (Найти) в окне браузера
или на клавишу Enter (Ввести) на клавиатуре. При получении результатов
поиска Вы видите не только имена искомых файлов, но и адрес FTP-сервера, на
котором данный файл хранится, с указанием конкретной папки. Это позволяет
Вам воспользоваться для перекачки файла специально предназначенной для
этого программой (например, CuteFTP).

Хотелось бы также упомянуть такие чудесные "искалки", как OpenText
[http://www.opentext.com] , WebCrawler, WhoWhere [http://www.whowhere.com]
и многие другие. Однако, боюсь, что у моего читателя уже возник вопрос:
"Зачем мне все это знать?" Справедливо. Всего в Мире Интернета существует
свыше 200 поисковых систем. Невозможно (да и не имеет смысла) изучить
каждую из них до мелочей. Уже прочитанной информации достаточно для
начального поиска. Кроме того, на диске, прилагаемом к книге, есть файл
bookmark.htm, в котором, помимо прочего, есть каталог адресов более, чем 50
поисковых серверов, в том числе, специфически израильских и российских.
 Впрочем, о российских поисковых системах хотелось бы сказать несколько
слов отдельно.

Категория: Интернет Ваш выход! Евгений Финкель | Добавил: svv (16.08.2008)
Просмотров: 776