Главная FDMua.com :: Разработка сайтов, дизайнов, систем управления контентом (CMS) и продвижение сайта (SEO). Поддержка сайта в процессе его развития. Разработка сайтов, дизайнов, CMS. Написать письмо Translate a Web page . English

Разработка сайтов, дизайнов, систем управления контентом (CMS) и продвижение сайта (SEO)!
Наши услуги по разработке и созданию сайтов

Проверка индексации сайта в поисковиках

Система управления сайтом

CMS-SEO-FDMua

О нас

Cтатьи:  веб-мастеру
Создание корпоративного сайта на заказ
Адресована эта статья прежде всего руководителям различных уровней, которые пришли к выводу, что их компании (фирме, подразделению, филиалу, отделу и так далее) требуется свое веб-представительство, однако у них в настоящий момент нет никакого понимания о том, как это вообще все будет выглядеть, а главное – кому это все заказать и что в конце концов они хотят получить.
Регистрация на поисковиках – через тернии к звездам
Перед тем как приступить к регистрации ваших веб-страниц на поисковых машинах, очень важным является качество вашего сайта. Его степень определяют несколько разнородных факторов. Одним из таких факторов является полнота веб-проекта, наличие и готовность всех предусмотренных по плану страниц. Для проверки целостности сайта пройдитесь по всем ссылкам на всех страницах (это весьма реально даже для сайта величины 50-100 страниц). Убедитесь в том, что ...
Оптимизация для Яндекс.Картинок: зачем это нужно?
Для большинства искушенных интернет-пользователей поиск среди изображений – не более, чем забавное развлечение, полезность которого в практическом применении, как многие считают, стремится к нулю. В особенности это касается сервиса Яндекс.Картинки, алгоритм ранжирования изображений которого, по мнению многих специалистов, уступает аналогичному поиску от Google и периодически даже выдает неожиданные результаты.
Архив статей веб-мастеру
Cтатьи:  веб-дизайнеру
Логотипы как это делается. Ч.3
Не является ни для кого секретом, что каждый человек имеет индивидуальное, субъективное мировосприятие. Одни и те же знаки у разных людей, в силу различного опыта, образования, круга общения и пр. и пр. могут вызывать абсолютно разные (зачастую противоположные по своему значению) ассоциации, а значит - и разные эмоции. Казалось бы, невозможно предугадать "уровень распущенности" миллионов потребителей.
Логотипы как это делается. Ч.2
Покончив с анализом, приступим к более творческому процессу - собственно созданию (ваянию, клепанию, рисованию, и т.д.) логотипа.
Архив статей по дизайну


Код нашей кнопки:
Направления работы
Поиск по сайту fdm-design:
 найти: 

Статьи веб-мастеру & веб-дизайнеру

Рубрики:

Составление файла robots.txt

Рубрика: Поисковики
[Просмотров: 3105] [Рейтинг: 4.00]
Комментарии

Автор - Владимир Чернышов aka Cherny
Как известно, файл robots.txt используется для запрета индексации части или всего сайта всевозможными роботами. Правильное составление этого файла позволит избежать индексации документов, для индексации не предназначенных.

Формат файла robots.txt

Robots.txt — простой текстовый файл1, который должен находиться в корневой директории сервера. Имя файла должно быть в нижнем регистре (ROBOTS.TXT, Robots.txt — неправильно).

В файле содержатся записи, отделяемые одной или несколькими пустыми строками (разделяемыми CR, CRNL, NL или r, rn, n). Каждая запись, в свою очередь, состоит из строк следующего вида:

имя_поля[необязательные пробелы]:[необязательные пробелы]значение[необязательные пробелы]

Поле является нечувствительным к регистру (case insensitive).

Каждая запись начинается одной или несколькими строками, где имя_поля=User-agent, после чего следует одна или несколько строк, где имя_поля=Disallow, имена полей, которые отличаются от двух указанных, игнорируются2.

Знак «#» означает, что пробелы перед ним и все символы до конца строки являются комментарием. Строки, содержащие только комментарий, игнорируются и не могут использоваться для разделения записей.
User-agent

* Значением этого поля является имя робота, к которому применяются правила доступа;
* Если строк с User-agent несколько, то для всех роботов применяются одинаковые правила, которые содержаться в текущей записи;
* Если значение поля равно «*», то правила применяются к любому роботу, для которого нет отдельной записи. В файле robots.txt может быть только одна запись с User-agent: *.

Disallow

* В записи должно быть хотя бы одно поле Disallow;
* в поле Disallow указывается частичный или полный путь (URL), который не будет посещен;
* пустое значение (Disallow: ) интерпретируется как разрешение на посещение любой страницы;
* регулярные выражения и символы подстановки запрещены3.

 

Практика

В процессе обработки сайта роботы имеют массив ссылок для посещения и набор правил исключения из файла robots.txt. Для каждой ссылки выделяется путь (http://www.site.com/path/to/file.html), после чего к этому пути применяются по очереди правила исключения. Пусть в файле есть строка Disallow: /path/to, она сравнивается с соответствующей подстрокой ссылки:

http://www.site.com/path/to/file1.html — посещение запрещено;
http://www.site.com/path/to/file2.html — посещение запрещено;
http://www.site.com/path/file3.html — посещение разрешено.

 

Чтобы запретить роботу посещение динамических страниц, можно использовать частичный путь. Например, чтобы запретить посещение страниц для печати вида http://www.site.com/index.php?action=print&id=1, но разрешить посещение страниц вида http://www.site.com/index.php?action=view&id=1, необходимо в robots.txt написать следующее:

Disallow: /index.php?action=print
Однако следует учитывать порядок параметров в ссылке. Так, следующие страницы робот посетит: http://www.site.com/index.php?id=1&action=print http://www.site.com/?action=print&id=1

Пример файла robots.txt

User-agent: *
Disallow: /news
# запретить всем роботам индексировать ссылки,
#которые начинаются с /news

User-agent: StackRambler
User-agent: Aport
Disallow: /eng
Disallow: /news
#Рамблеру и Апорту запретить индексацию ссылок,
#которые начинаются с /news и /eng

User-agent: Yandex
Disallow:
#Яндексу разрешить все.

Следует заметить, что файл robots.txt не является панацеей, так как его правила исключения используют только «культурные» роботы, а наряду с ними существует целый список роботов, сервисов и программ, которые не следуют правилам исключения, либо игнорируют существование файла robots.txt на сайте.

Кроме этого в файл исключений не стоит добавлять пути к файлам, о существовании которых не следует знать посторонним людям. Файл robots.txt доступен всем, поэтому присутствие там строк, вроде Disallow: /admin, только подзадорит некоторых посетителей к совершению вредоносных действий.

Примечания

1. В некоторых случаях используется динамическое формирование файла robots.txt, для сайтов с зеркалами.

2. Некоторые системы поддерживают дополнительные поля. Яндекс, например, использует поле Host для определения основного зеркала сайта.

3. Некоторые системы разрешают использование регулярных выражений. Так Гугл, который имеет поиск по изображениям, файлам PDF и другим, поддерживает в поле Disallow символы «*» (любая последовательность символов) и «$» (окончание строки ссылки). Это позволяет запретить индексирование определенного типа файлов:
User-agent: Googlebot
Disallow: *.pdf$
#Запрет индексации файлов PDF

По мнению автора это избыточное расширение, так как с тем же успехом можно вынести все документы PDF в отдельный каталог и запретить его индексирование:
User-agent: *
Disallow: /pdf/

Источник: www.searchengines.com.ua
К сожалению, не все проекты по поисковой оптимизации сайтов заканчиваются успехом: достижением высокой видимости сайтов и поисковых системах, и, как следствие, повышением продаж. Любая компания, профессионально занимающаяся продвижением, имеет в своей истории несколько проектов, которые завершились неудачно по нескольким причинам, которые часто и не зависят от профессионализма самих компаний. В этом цикле статей будут разобраны “трюки” - приемы дизайна страниц, которые используются или использовались в прошлом, для улучшения положения страниц в поисковиках. Небольшое предупреждение - я не собираюсь рекомендовать эти трюки к использованию.







FDMua.com предлагает полный сервис по разработке сайтов, систем управления контентом за приемлемую цену.  Web-дизайн и создание сайта любой сложности (веб-дизайн сайтов, разработка сайтов, web программирование), поддержка сайта.
© 2005 - 2010 FDM-Design.
Создание сайтов, дизайнов, систем управления сайтами CMS.
E-mail: Заполнить форму заказа услуг
Яндекс цитирования Rambler's Top100
Кодекс оптимизатора
Render time: 0.218 sec