Если сеть гипертекстовых документов справедливо называют "мировой паутиной",
то работу элементов поисковой системы скорее можно сравнить с большим
муравейником, где все куда-то спешат, сталкиваются, взаимодействуют. При
этом, наблюдая со стороны, трудно понять общую логику. Однако, несомненно, она
присутствует и не так сложна, как это может показаться на первый взгляд.
Я умышленно не привожу сразу структурную схему
реализованной поисковой системы, чтобы в процессе рассуждений наблюдать, как
она изменяется в зависимости от промежуточных результатов анализов.
Не надо быть специалистом в области поиска, чтобы определить 3 важнейшие функции жизнедеятельности поискового движка Web-документов. Ими являются:
- Извлечение и накопление данных документов.
- Обработка этих данных и создание данных, пригодных для поиска.
- Поиск по созданным данным.
Существует масса других функций, о которых будет в дальнейшем рассказано, однако их назначение заключается главным образом именно в эффективной поддержке этих трех базовых.