Главная FDMua.com :: Разработка сайтов, дизайнов, систем управления контентом (CMS) и продвижение сайта (SEO). Поддержка сайта в процессе его развития. Разработка сайтов, дизайнов, CMS. Написать письмо Translate a Web page . English

Разработка сайтов, дизайнов, систем управления контентом (CMS) и продвижение сайта (SEO)!
Наши услуги по разработке и созданию сайтов

Проверка индексации сайта в поисковиках

Система управления сайтом

CMS-SEO-FDMua

О нас

Cтатьи:  веб-мастеру
Яндекс 2007: Но пасаран? (Или хроники одного события)
В последний день августа на forum.searchengines.ru появилась тема «Операторы link и anchor отменяются». Возможно, топикстартер и ожидал, что коротенькое сообщение повлечет за собой словесный..хм, короче, обсуждение заинтересовавшихся на двести с лишком страниц, а может быть и нет. Но не об этом речь.
«Поисковые технологии» дадут каждому юзеру персональный поисковик
Систему можно использовать различным образом. Можно организовать полнотекстовый поиск по собственному сайту. Можно организовать полнотекстовую «слежку» за избранными сайтами. Например, таким способом удобно отслеживать форумы, частные объявления, сайты конкурентов, блоги. Выбранные ресурсы будут автоматически индексироваться каждый день, а вы по электронной почте получаете сообщения в случае изменения информации (результаты выполнения сохраненного поискового запроса). И, наконец, можно открыть специализированный поисковик по сайтам определенной тематики.
Раскрутка и оптимизация сайта - краткий курс
Данный курс предназначен для авторов и владельцев сайтов, желающих более подробно заняться вопросами поисковой оптимизации и раскрутки своего ресурса. Рассчитан он в основном на начинающих, хотя и опытный вебмастер, надеюсь, почерпнет из него что-то новое. В Интернете можно найти большое количество статей по теме поисковой оптимизации, в данном учебнике сделана попытка объединить всю информацию в виде единого, последовательного курса.
Архив статей веб-мастеру
Cтатьи:  веб-дизайнеру
Логотипы как это делается. Ч.3
Не является ни для кого секретом, что каждый человек имеет индивидуальное, субъективное мировосприятие. Одни и те же знаки у разных людей, в силу различного опыта, образования, круга общения и пр. и пр. могут вызывать абсолютно разные (зачастую противоположные по своему значению) ассоциации, а значит - и разные эмоции. Казалось бы, невозможно предугадать "уровень распущенности" миллионов потребителей.
Логотипы как это делается. Ч.2
Покончив с анализом, приступим к более творческому процессу - собственно созданию (ваянию, клепанию, рисованию, и т.д.) логотипа.
Архив статей по дизайну


Код нашей кнопки:
Направления работы
Поиск по сайту fdm-design:
 найти: 
Идеал - туристическая компанияУправление разделом - Добавить статьи
Создаем веб-сайты - приемлемая цена, эксклюзивный дизайн, удобное управление сайтом (CMS), качественное программирование.

Статьи веб-мастеру & веб-дизайнеру

Рубрики:

Архитектура метапоисковых систем

Рубрика: Поисковые машины
[Просмотров: 1655] [Рейтинг: 4.00]
Комментарии
Автор - Gray
16.12.2001 @ 03:06

(С) Вячеслав Тихонов
Metaping & Topping

1. Введение

В данной статье на примере метапоисковой системы MetaPing рассматривается архитектура метапоисковых систем и основные принципы их работы и построения.

2. Что такое метапоисковая система?

Ни для кого не секрет, что всемирная сеть Интернет, содержащая постоянно растущий огромный объем динамически изменяющейся информации, развивается небывало бурными темпами. Для того, чтобы как-то упорядочить этот непрерывный поток данных, а самое главное, дать возможность пользователям Сети находить нужную информацию, были созданы специальные поисковые системы. Каждая такая система имеет индекс, несущий служебную информацию о содержимом проиндексированных документов, где каждому слову текста соответствует частота его употребления и координаты данного слова в тексте.
Каждая поисковая система имеет только свое собственное, ограниченное ее ресурсами, множество документов, которые доступны для поиска. Ни одна из подобных систем не сможет охватить всех ресурсов Интернет, поэтому в любой момент может возникнуть ситуация, когда информационные потребности пользователя не смогут быть удовлетворены. Как правило, в этом случае пользователь переходит на другую поисковую систему и пытается искать то, что ему нужно, там.
Для решения данной проблемы и расширения возможности поиска, были созданы системы, названные метапоисковыми. Они не имеют собственных поисковых баз данных, не содержат никаких индексов и при поиске используют ресурсы множества поисковых систем. За счет этого полнота поиска в таких системах максимальна и вероятность нахождения нужной информации очень высока.

3. Принципы работы метапоисковых систем

При проектировании метапоисковой системы нужно решить ряд проблем.
Прежде всего, из полученного от поисковых систем множества документов необходимо выделить наиболее релевантные, то есть соответствующие запросу пользователя. Как правило, создатели метапоисковых систем не совсем оправданно надеются, что поисковые системы, которые они используют, возвращают релевантные результаты поиска, и слишком полагаются на позицию, на которой в данной поисковой системе находится документ.
Этот стандартный подход представлен на рис. 1. В таких системах анализ полученных описаний документов не производится, что может поставить нерелевантные документы, идущие первыми в одной поисковой системе, выше релевантных в другой, чем существенно понизить качество самого поиска. Этот принцип оказался хорошим при создании автором анализатора позиции сайта в поисковых системах, но в целом для систем метапоиска оказался неудовлетворительным.

Стандартная метапоисковая система

Рис.1 Стандартная метапоисковая система

При разработке следующего поколения метапоисковых систем были учтены недостатки, присущие стандартным метапоисковым системам. Были созданы системы с возможностью выбора тех поисковых машин, в которых, по мнению пользователя, он с большей вероятностью может найти то, что ему нужно (рис. 2)

Следующее поколение метапоисковых систем

Рис. 2. Следующее поколение метапоисковых систем

Кроме этого, такой подход позволяет уменьшить используемые вычислительные ресурсы метапоискового сервера, не перегружая его слишком большим объемом ненужной информации и серьезно сэкономить трафик. Здесь нужно отметить, что в любой системе метапоиска наиболее узким местом в основном является пропускная способность канала передачи данных, так как обработка страниц с результатами поиска, полученными от нескольких десятков поисковых серверов не является слишком трудоемкой операцией, потому что затраты времени на обработку информации на порядки меньше времени прихода страниц, запрошенных у поисковых серверов.
Как пример систем, имеющих подобную организацию, можно назвать Profusion, Ixquick, SavvySearch, MetaPing.

4. Как же все это работает?

Ниже будет описан принцип работы метапоисковой системы MetaPing, разработанной автором этой статьи, однако общие принципы будут верны и для остальных систем этого класса (см. рис. 2).
Начнем со стартовой страницы данной метапоисковой системы. Обычно интерфейс такой системы предельно упрощен и сразу же позволяет понять, что, где и как здесь можно искать. В нашем случае (MetaPing) поиск возможен по трем областям поиска: по России, по Украине и по всему миру, при этом имеется возможность искать все, отметив поиск по интернету, или сузить область поиска и искать конкретно объявления, новости, файлы и рефераты (рис. 3).

Рис.3 Стартовая страница MetaPing

Пользователь выбирает, скажем, поиск по России, и вводит, например, такой запрос: “лучшие поисковые системы” (рис. 4).

Рис. 4 Страница MetaPing с результатами поиска

После этого запрос ретранслируется указанным российским поисковым системам (в нашем случае это Рамблер, Апорт, Lycos и Google). Следует отметить, что Google, хотя и не является российской поисковой системой, в настоящее время успешно с ними конкурирует как по полноте баз, так и по качеству поиска, и именно поэтому он здесь оказался. Кстати, внимательный читатель наверняка отметил отсутствие самой крупной российской поисковой системы Яндекс. На момент запуска MetaPing Яндекс тоже здесь тоже присутствовал, но после известного скандала его пришлось убрать.
Для передачи запроса к поисковой системе используется специальный метапоисковый агент, который отвечает не только за процесс ретрансляции запроса и приема страниц, но и за то, чтобы запрос был передан в правильной кодировке, принятой в каждой из выбранных поисковых систем, иначе будет получен совершено другой набор описаний документов или не будет получен вовсе, что негативно скажется на качестве поиска.
После обработки полученного запроса каждая система возвращает метапоисковому агенту множество описаний и ссылок на документы, которые считает релевантными данному запросу.
Как среди этого множества выбрать именно то, что нужно пользователю?
В начале этой статьи уже упоминался стандартный подход, который используется большинством систем метапоиска и состоит в том, чтобы просто расположить полученные ссылки по порядку их следования в результатах поиска каждой из поисковых систем. При этом, если в разных поисковых системах был найден один и тот же сайт, то ценность его для пользователя, естественно, существенно повышается.
Подход, безусловно, правильный, но что делать в том случае, если одна система, к примеру, индексирует динамически генерирующиеся страницы, а другая нет? У них различные множества проиндексированных документов, различная полнота баз, следовательно, запрошенная пользователем информация может быть найдена в одной системе и может быть не найдена в другой. В этом случае пользователь может получить несколько действительно релевантных ссылок от одной системы, которые будут перемешаны с абсолютно нерелевантными из другой (например, в случае, когда фраза целиком не найдена, поиск идет по одному из ключевых слов запроса). В результате, пользователю вручную приходится отбирать релевантные ссылки и велика вероятность того, что покопавшись в подобном “винегрете”, он попросту уйдет и уже никогда не вернется.
Есть ли какой-либо способ решить эту проблему? Конечно есть. Нужно с полученным от поисковых систем множеством описаний документов сделать то же, что делают они сами с этими документами, то есть определить частоты ключевых слов в каждом заголовке и описании и попытаться самостоятельно определить рейтинг каждого из них.
Именно по такому принципу построена метапоисковая система MetaPing, где реализован смешанный алгоритм обработки информации. Автором были разработаны специальные программы для анализа полученных данных, благодаря которым на первом этапе происходит ранжирование множества описаний полученных документов, на втором ранг дополнительно корректируется согласно месту, на котором находится документ, и общему количеству документов, найденных по запросу (это позволяет оценить полноту поисковых баз конкретной системы).
Подобная обработка позволяет не только убирать документы, в описании которых вообще нет ключевых слов как потенциально нерелевантные запросу, но и находить строгое соответствие в том случае, если все ключевые слова встречаются в описании документа полностью, что неизмеримо повышает качество и точность поиска.

5. Заключение

Данная статья, естественно, не претендует на полноту изложения, в ней рассмотрены лишь основные принципы построения метапоисковых систем. Поэтому если после ее прочтения у Вас возникли какие-либо вопросы, Вы можете задать их по e-mail: tikhonov@ukr.net.

Литература

1. Eric J. Glover, Steve Lawrence, Michael D. Gordon, William P. Birmingham, C. Lee Giles - “Web Search - Your Way”

2. Adele E. Howe Daniel Dreilinger - “SavvySearch: A MetaSearch Engine that Learns which Search Engines to Query”

3. Вячеслав Тихонов - “Поисковые системы в сети Интернет

4. Weiyi Meng, Clement Yu, King-Lup Liu - “Building Efficient and Effective Metasearch Engines”

5. Zonghuan Wu, Weiyi Meng, Clement Yu, Zhuogang Li - “Towards a HighlyScalable and Effective Metasearch Engine”

6. Swathi Chiteddi - “Meta Search Engine For NWRC”

Источник: www.searchengines.com.ua
Вы когда-нибудь задумывались над тем, что видят поисковые системы при индексации сайта? Знаете ли вы, что поисковик не различает дизайн сайта и графику - видит лишь html-код, "скелет" сайта? Конкуренция захватывает Интернет. Чтобы не отстать в борьбе за потребителей фирмы создают сайты и при помощи них привлекают новых клиентов. Для достижения успеха сайту необходимо выделиться в информационной среде, занять свое место, стать известным среди потребителей и легко находимым в поисковых системах.







FDMua.com предлагает полный сервис по разработке сайтов, систем управления контентом за приемлемую цену.  Web-дизайн и создание сайта любой сложности (веб-дизайн сайтов, разработка сайтов, web программирование), поддержка сайта.
© 2005 - 2009 FDM-Design.
Создание сайтов, дизайнов, систем управления сайтами CMS.
E-mail: Заполнить форму заказа услуг
Яндекс цитирования Rambler's Top100
Кодекс оптимизатора
Render time: 0.138 sec