В работу алгоритма поисковой машины
заложено отбрасывание, т.е. исключение из индексирования, определённых
слов, которые часто называют "шумовыми словами" ("стоп-слова"). Такими
словами могут быть предлоги, суффиксы, причастия, междометия и частицы, и целый ряд других слов. Их конкретный перечень может состоять от
нескольких сот до нескольких тысяч слов и различен для разных поисковых
машин.
Абсолютных шумовых слов, т.е. тех, которые
можно отбросить из текста без потери его смысла, вне зависимости от
контекста, не существует.
|