|
|||||
|
СОДЕРЖАНИЕ
|
создать сайт // раскрутка сайта // релевантность
Управление работой поисковых роботовУправлять работой поисковых роботов можно с помощью двух способов:
Далее мы рассмотрим оба этих способа:
Файл robots.txt предназначен для управления поисковыми роботами. На сайте может сущестовать только один robots.txt файл. Как правило, он должен находиться в корневой директории сайта, например: www.domen.com/robots.txt. Название файла должно быть написано маленькими буквами. В файле robots.txt содержится перечень инструкций, с помощью которых пользователь может в некоторой степени управлять действиями поисковых роботов. Этот файл сообщает роботам (паукам-индексаторам), какие файлы они могут индексировать, а какие нет. Например, ваш сайт еще находится в тестовой стадии и вы бы не хотели, чтобы он в таком виде был проиндексирован роботами или в каких-то директориях существует закрытая для широкой публики информация. Для этого в этот файл надо поместить следующую запись: User-agent: * Для того, чтобы исключить ваш веб-сайт от индексирования только определенной поисковой системой, например AltaVista, вам надо сначала узнать имя поискового робота, который использует AltaVista (она использует поисковый робот под названием "Scooter") и подставить его в строчку "User-agent:". В данном случае запись будет выглядеть следующим образом: User-agent: scooter Более полный перечень названий роботов разных поисковых систем вы можете найти ЗДЕСЬ(правда на английском языке). Часто названия роботов отображают названия поисковых систем, например поисковый робот Ramblera носит название "StackRambler". Вы также можете исключить от индексирования роботами определенную директорию вашего сайта. Например, вам надо исключить из индексирования директорию "/personal/secrets/" и директорию "/cgi-bin/" для всх роботов. Для этого вам надо добавить следующую строчку: User-agent: *
В отличие от предыдущего способа, данный способ управляет поведением роботов для данной, конкретной странички. Даный механизм является более гибким, чем через файл robots.txt, так как позволяет не только запретить индексацию страниц но и запретить переход по имеющимся ссылкам внутри страницы. Инструкции индексации записываются в поле content и могут принимать следующие значения:
По умолчанию установлено значение тэга:
Например:
Имена тэгов и значения полей нечуствительны к регистру. Дублирование инструкций в поле content не допускается. Правила описания файла robots.txt и мета-тэга Robots - httр://www.yаndex.ru/info/webmaster2.html
|
|
|||
|
|
|||||