Технологии, стоящие за алгоритмом Google
7/16/2008
В моей предыдущей статье я описал философию, лежащую в основе ранжирования Google. В рамках нашего разговора о качестве поиска я бы хотел подробнее рассказать вам о технологиях, на которых основан соответствующий алгоритм. Поисковая технология Google базируется на академической дисциплине под названием «информационный поиск» (ИП), разрабатываемой научным сообществом уже почти 50 лет. Подход предполагает использование статистических сигналов, таких, например, как частота употребления того или иного слова, для конечного ранжирования страниц по тому или иному запросу (для быстрого ознакомления с дисциплиной см. «Современный информационный поиск: краткий обзор» ). ИП выступило в роли фундамента, на котором была построена огромная система, использующая ссылки, структурный анализ страниц и множество других поисковых инноваций.
Читать статью целиком »
