,
Новости от наших партёнров
Иран просит ОПЕК+ не наращивать добычу нефти
Иран призвал страны—участницы соглашения ОПЕК+ не соглашаться на увеличение объема добычи нефти.
Зачем нам повышают пенсионный возраст
Правительство поставило точку в многолетней дискуссии о пенсионном возрасте.
«    Июнь 2018    »
ПнВтСрЧтПтСбВс
 123
45678910
11121314151617
18192021222324
252627282930 
Архив новостей сайта
Ноябрь 2017 (3)
Сентябрь 2017 (1)
Май 2017 (1)
Март 2017 (2)
Январь 2017 (2)
Декабрь 2016 (1)
25-01-2013, 16:15 - Каким образом ПС собирают свои БД

Изначально может показаться, что индексация веб-страниц (документов) является довольно простым делом. Однако здесь имеется масса деталей, которые нужно использовать при SEO (поисковой оптимизации) веб-ресурсов. Индексация документов осуществляется программой, называемой ботом (поисковым роботом). Робот берет от ПС первоначальный перечень адресов веб-страниц (документов), которые нужно посетить, создать копию контента вебстраниц и отдать контент на последующую переработку ПС. Любому сайту требуется хорошая перелинковка страниц.
Поисковый робот двигается не лишь по заданному списку вебстраниц (документов), но и перемещается по гиперссылкам с данных страниц (документов) и индексировать документы, на которые указывают ссылки. Этим самым робот ПС ведет себя наподобие человека, который ходит по сети с использованием ссылок. Получается, что таким образом, робот обойдет все страницы, которые может обойти обычный человек при серфинге в сети.
Какие же есть особенности, которые связаны с индексацией документов на просторах всемирной паутины. Первая особенность - кроме обратного индекса, ПС сохраняет и копию документа, другими словами в базе находится обратный и прямой индекс документов. Зачем? Ответ прост: для составления снипетов.



Интересные записи: