Что понимают под поисковой системой перечислите популярные русскоязычные поисковые системы
Обзор русских поисковых систем
Итак, для чего нужны поисковые системы?
В Сети огромное количество разнообразной информации, и если бы не поисковые системы, то, наверное, вы толком никогда не смогли бы найти то, что вам нужно. Первоначальная задача раскрутки сайта состоит в регистрации на поисковых системах, чтобы пользователи, вводя ключевые слова, соответствующие теме вашего сайта в строке запроса, могли легко его найти. Но тут не все так просто, т.к. скорее всего сайтов на такую же тему, что и ваш, уже большое количество. Если вы просто зарегистрировали свой сайт, не проделав с ним соответственных «операций» заранее, то считайте, что вы выполнили просто формальность и о каком-либо притоке посетителей с поисковиков можете забыть. Но, к счастью, можно сделать так, чтобы посетители оттуда приходили в достаточно большом количестве. Этот процесс называется веб-оптимизацией или SEO (сокр. от англ. Search Engine Optimization). Но об этом чуть позже.
Сегодня не-американские и не-англоязычные сегменты всемирной паутины переживают подъем, благодаря массовому распространению компьютеров и удешевлению доступа к Интернету. Американская часть всех пользователей сети, составляющая когда-то более девяноста процентов, сегодня составляет менее четверти, в то время как количество не-англоязычных пользователей Интернета неуклонно растет.
Азиатско-Тихоокеанский регион занимает первое место по масштабам увеличения численности пользователей, но русскоговорящий Интернет демонстрирует не менее стремительные темпы развития.
Давайте рассмотрим главные поисковые средства Рунета, их требования и особенности.
На сегодняшний день самой популярной русскоязычной поисковой системой является Яндекс (http://www.yandex.ru). Регистрация проводится по адресу http://yandex.ru/addurl.html. У Яндекса достаточно быстрый поисковый робот. Благодаря ему регистрируемая страница появится в поисковых результатах в течении 2-4 часов. Но это значит, что страница прошла лишь первичную индексацию. После полной индексации, она может исчезнуть из поисковых результатов, если поисковый робот сочтет ее за спам. Поэтому положение веб-страницы в результатах поиска нужно отслеживать до тех пор, пока не пройдет полная индексация. Кроме того, список результатов может меняться в зависимости от загруженности серверов. Поскольку база данных Яндекса имеет кластерную структуру и разнесена на несколько серверов.
Ключевые слова в мета-тэгах и не особенно помогают достигать хороших позиций. Здесь стоит употреблять слова, которые встретятся в тексте страницы.
Для определения релевантности Яндекс использует Взвешенный Индекс Цитирования (Page Rank). Обычный Индекс Цитирования (Link Popularity) используется только при сортировке сайтов в каталоге Яндекса. Влияние на положение в результатах поиска оказывает ВИЦ.
Следующая по популярности поисковая система в Рунете — Рамблер (http://www.rambler.ru). По оценкам SpyLog Рамблер обрабатывает около 20% всех поисковых запросов Рунета. На Рамблере реализована умная система, которая позволяет выдавать в результатах поиска слова, которые являются синонимами запроса. Еще одной функцией этой умной системы является выдача контекстной рекламы не только по конкретным ключевым словам, но и по фразам, которые тесно связаны с ними.
Рамблер (в отличие от других поисковиков) умеет извлекать гиперссылки из объектов Macromedia Flash. Если сайт имеет заставку или навигационные панели, выполненные c использованием этой технологии, Рамблер обработает их, найдет адреса всех страниц сайта и проиндексирует весь сайт. Однако, сами тексты flash-объектов не индексируются. Для сайтов, которые целиком состоят из flash-объектов, рекомендуется создать HTML-копию и зарегистрировать ее в поисковой машине.
, , , .
Роботы Рамблера также справляются с конструкциями фреймов. Максимальный размер документа для роботов составляет 200 килобайт. Документы большего размера усекаются до указанной величины.
Следующая по популярности – поисковая машина Апорт (http://www.aport.ru/). Регистрация сайта в Апорте производится со страницы http://www.aport.ru/addurl.asp. Эта страница доступна почти с любой страницы Апорта, например, с главной страницы Апорта. Добавлять в поисковую систему Апорт следует русскоязычные сайты, а также сайты имеющие непосредственное отношение к российскому Интернету. В случае отказа в автоматическом добавлении сайта можно обратиться с просьбой о добавлении сайта по addurl-nr@название.зона.
С момента добавления сайта в Апорт до момента его появления в поисковой базе проходит от двух-трех дней до двух недель.
При просмотре содержимого сервера для индексирования Апорт обязательно проверяет файл ROBOTS.TXT. Так что можно использовать его, чтобы ограничить «деятельность» Апорта на своем сервере. Апорт по умолчанию не индексирует динамические документы, в адресах которых встречается символ «?».
Апорт предлагает несколько вариантов направленной рекламы http://www.aport.ru/adv, однако нет возможности купить более высокое место для своего сайта в результатах поиска.
Ключевые слова не имеют определяющего значения при определении релевантности документа. Но разумное использование этого тэга рекомендуется.
В отличие от многих других поисковых систем, Апорт не применяет каких-либо специальных санкций к сайтам, пытающимся обмануть поисковую систему с помощью спама, однако добиться подобным способом желаемого результата не получится. Поэтому не стоит писать невидимые тексты, вбивать сотни ключевых слов, не имеющих никакого отношения к содержанию документа и т.д.
Вот перечень основных критериев, которые Апорт учитывает при сортировке сайтов: густота ключевых слов, расстояние между ключевыми словами в тексте документа, место, где встречаются поисковые слова (заголовок, описание, мета-тэг и т.п.), внешний вид шрифта, которым набраны ключевые слова (размер, жирность, цвет), количество ссылок из Интернета на данный документ, использование ключевого слова в тексте ссылок из Интернета на данный документ. Окончательный процент соответствия документа запросу строится как некая функция от всех этих показателей.
Конечно нельзя оставить без внимания Google.com.ru (Google на русском). Несмотря на то, что Google все еще отстает от русских поисковых машин по количеству пользователей, он становится все более и более популярным. Некоторые опросы общественного мнения указывают на 3-9% поискового трафика в Рунете, но большинство аналитиков полагают, что его доля в поиске русских сайтов составляет не менее 10%. Google применяет общие правила индексирования к любому веб-содержанию, независимо от того принадлежит ли доменное имя к Рунету или нет. Это является большим преимуществом перед русскими конкурентами, которые не так дружелюбны с веб-сайтами с доменным именем типа «yoursite.com», «yoursite.org», и т.д. и требуют от них подавать заявки на включение по электронной почте. Однако, скорее всего Google не будет иметь существенных претензий на лидерство в Рунете, пока не усовершенствует свой алгоритм на основе морфологии русского языка.
Мы охарактеризовали далеко не все поисковики Рунета, а только самые главные из них. Теперь рассмотрим популярные веб-каталоги.
Каталоги — это такие места, где пользователи могут находить нужные им сайты, точно также как они находят их с помощью поисковых серверов. Но есть существенные различия между каталогами и поисковыми серверами. В то время как поисковые машины принимают почти любые сайты, без требований к качеству, каталоги же, как правило, предъявляют требования к качеству и содержанию сайта. Исходя из этого можно сделать вывод, перед тем как регистрировать свой сайт в каталогах, убедитесь, что он готов, или другими словами, качественно оптимизирован. В каталогах регистрируют, обычно, только главную страницу сайта (еще одно отличие от поисковиков).
Как правильно зарегистрироваться? На самом деле это достаточно просто. Все каталоги имеют древовидную структуру. То есть, существуют главные разделы, которые включают в себя подразделы и т.д. Нужно найти тот раздел, который максимально подходит для темы вашего сайта. Это часто проще всего сделать, введя в строку поиска ключевое слово по вашей теме, и вы получите список сайтов, где будет указано из каких они разделов.
…Как правильно зарегистрироваться?
На самом деле это достаточно просто. Все каталоги имеют древовидную структуру. То есть, существуют главные разделы, которые включают в себя подразделы и т.д. Нужно найти тот раздел, который максимально подходит для темы вашего сайта. Это часто проще всего сделать, введя в строку поиска ключевое слово по вашей теме, и вы получите список сайтов, где будет указано из каких они разделов.
Итак, главные каталоги Рунета.
Один из самых популярных проектов Яндекса – Народ.Ру (http://narod.yandex.ru/) – служба бесплатного хостинга, а также мастерская для создания сайтов. С помощью инструментов Народа любой человек, совершенно незнакомый с интернетовскими языками разметки, может легко создать свое Web-представительство за 60 секунд.
Рамблер (http://www.rambler.ru), в свою очередь, имеет две каталожные рейтинговые системы. Первая, Rambler’s Top 100 (http://top100.rambler.ru/)- самый популярный русскоязычный рейтинг. Он действительно является очень хорошим траффикогенератором, но только если сайт попадет на первую страницу популярной категории. Если сайт имеет несколько крупных разделов, то имеет смысл регистрировать их отдельно, Рамблер это позволяет.
Если сайт подходит сразу в две и более категории, то скорее всего сначала лучше зарегистрироваться в той, где нужно меньше посетителей, чтобы попасть на первую страницу.
Результаты поиска по Топ 100 подмешиваются в основной поиск, если суммарная посещаемость ресурса (с момента регистрации счетчика), достигла некоторого порога. Попасть на первые позиции в Рамблере легче всего через примесь результатов из Топ 100. Главное иметь хорошую посещаемость.
Вторая, рейтинговая каталожная система Рамблера — Rambler’s TopShop (http://topshop.rambler.ru/). Хотя TopShop и основан на технологии рейтинга Rambler’s Top100, он является отдельным и независимым сервисом. Rambler’s TopShop предназначен только для интернет-магазинов, то есть сайтов, на которых выставлены предложения товаров или услуг, а также предусмотрена возможность заказа товара или услуги онлайн или по электронной почте. Владельцы интернет-магазинов могут разместить ссылку на свой магазин в любом из разделов или подразделов рубрикатора Rambler’s TopShop — при условии, что этот раздел (подраздел) соответствует «профилю» магазина. На каждой странице интернет-магазина может быть установлен только один счетчик, и она может быть зарегистрирована только в одном разделе (подразделе). Однако: владельцы магазина могут поставить счетчики на нескольких его страницах (например, представляющих разные товары) и зарегистрировать их в разных разделах.
Следует также отметить интересный Интернет-проект KM.RU (http/www.km.ru/), разработанный компанией «Кирилл и Мефодий». Этот портал известен в Рунете как справочно-энциклопедический ресурс, предложивший пользователям сети интернет электронную версию энциклопедий «Кирилла и Мефодия» (MEGABOOK.ru — http://www.megaboobk.ru/).
Сегодня KM.RU – это универсальный интернет-портал, предоставляющий своим пользователям всевозможные сервисы: почту, поиск по интернет-ресурсам; каталог, рейтинг, открытки, возможность размещения личной информации, участия в розыгрыше призов, обсуждения актуальных тем (в том числе — с известными людьми политики и шоу-бизнеса), и многое другое. Мультипортал КМ.RU включает в себя разнообразные тематические порталы, которые охватывают самые разные сферы человеческих интересов (бизнес, автомобили, компьютеры, здоровье, спорт, туризм, образование, работа, литература, искусство, музыка, кино, досуг и многие другие). Ежедневно KM.RU посещает более 70 тысяч человек. Добавить ресурс можно по адресу http://search.km.ru/index.asp.
И еще один каталог Mail.Ru (бывший List.ru) – один из самых известных в Рунете (благодаря очень популярной бесплатной почтовой службе). Компания Mail.ru владеет порталом — Mail.ru, самым популярным аукционом Molotok.ru (http://www.molotok.ru/), интернет-магазином Torg.ru (http://www.torg.ru/) и другими проектами. В начале 2004 года была закончена интеграция каталога Mail.ru в поисковую систему http://go.mail.ru/. Теперь вместе с результатами поисковых запросов пользователи будут получать ссылки на разделы каталога, в которых зарегистрированы найденные сайты.
Теперь, когда мы рассмотрели главных поисковые средства Рунета, возникает логичный вопрос: «Какой поисковик или каталог лучше?». Любого, кто занимается раскруткой и рекламой сайта, поисковые системы интересуют как источники притока целевых посетителей. Ответ один: лучше та поисковая система, которая дает больше посетителей.
А для того, чтобы все они приносили целевой трафик на ваш сайт, он должен быть качественно оптимизирован. Нужно будет поработать над ключевыми словами, мета-тэгами, усовершенствовать содержание, структуру сайта и многое другое.
Для достижения оптимального результата лучше всего воспользоваться программами по оптимизации и регистрации. Я уже много писал о программах, которые помогут вам оптимизировать сайт и зарегистрировать его в базах данных поисковых машин. В глобальной сети существует множество таких автоматических помощников, но на данный момент только один из них поддерживает кириллицу и разработан специально для Рунета – PagePromoter (http://net-promoter.com/ru). Такая программа позволяет автоматизировать процессы регистрации, проверки положения сайта в поисковых системах, а также другие задачи по оптимизации сайта. Это особенно заметно, если вы раскручиваете несколько сайтов.
Также анализируйте ваших конкурентов, которые имеют более высокие позиции в поисковых системах. И учитесь у них, используйте такие же методы. И не забывайте постоянно следить за изменениями и новшествами поисковых машин.
Информация об авторе: Юрий Коберский — автор курса «Оптимизация и продвижение сайта» в IREX/IATP, Москва, специалист по оптимизации и автор многочисленных статей для русскоязычных и англоязычных периодических IT-изданий. В программе затронуты следующие вопросы: что такое веб-оптимизация, для чего она нужна, ее основные приемы, действительно ли она может приносить ощутимую пользу для владельца веб-сайтов, как раскрутить свой сайт «с нуля» и добиться успеха. В основу курса был положен многолетний опыт компании в области оптимизации, ставший основой для создания программы Page Promoter, а также пакета NetPromoter. На конкретных примерах рассмотрены основные оптимизационные приемы и способы повышения рейтинга на поисковых машинах с помощью флагманской программы компании NetPromoter — Page Promoter.
Самые популярные поисковые системы в интернете
Сейчас трудно представить свою жизнь без поисковых систем. Абсолютно все пользователи сети интернет ежедневно ищут информацию в таких поисковиках, как Яндекс и Google. Но помимо известных поисковых систем существуют и другие достойные кандидаты.
На данный момент в России наибольшей популярностью пользуются всего два поисковика – Google и Яндекс. Однако помимо них существуют и другие всемирно известные системы поиска, которым два упомянутых лидера в чем-то даже уступают. Но прежде, чем рассматривать все существующие варианты, стоит понять, как вообще развивались поисковые системы.
Поисковики в интернете — краткая история
В начале 90-х годов, когда об интернете знали далеко не все люди, поисковики отсутствовали вовсе. Доступа к интернету у большей части населения не было, а сайтов было всего несколько сотен. В связи с этим было вполне достаточно обычных каталогов. Но позже количество сайтов начало стремительно увеличиваться и поиск в интернете стал затруднительным. Проблему нужно было как-то решать, поэтому начали появляться первые поисковые системы.
Кто был первопроходцем? Первая поисковая система — Wandex
Первой более-менее удобной и полезной поисковой системой стала разработанная в 1993 году платформа Wandex. Первый поисковик был далеко не идеален, так как в поисковую выдачу попадало все подряд. Ни о каких алгоритмах ранжирования речи не шло.
Сайтов в то время было немного больше, чем 600. В связи с этим не было необходимости в мощных серверах и каких-то сложных алгоритмах. Результаты поиска были очень неточными, поэтому каталоги составляли Wandex существенную конкуренцию.
Самые популярные поисковые системы в России и мире
Ответить на вопрос о том, какие поисковые системы наиболее популярны в России и мире сможет практически каждый человек. Их всего две – Google и Яндекс. Многие любят поспорить на тему о том, какой поисковик лучше, но в этом нет смысла, так как каждый из них имеет свои преимущества и недостатки.
Яндекс — самый популярный поисковик в России
Яндекс – это поисковая система, которая принадлежит одноименной российской корпорации и является ее основным продуктом. Одним из главных преимуществ российского поисковика является возможность осуществления поиска по конкретным регионам. В топ поисковой выдачи попадают те сайты, которые больше всего подходят каждому конкретному пользователю исходя из его местоположения. Также стоит отметить хорошую скорость работы службы поддержки.
К недостаткам относится контекстная реклама, которую вставляют куда только можно. Еще один недостаток – это капча, которая демонстрируется при большом количестве запросов, поступивших за короткий промежуток времени.
Google – самая крупная поисковая система в мире, которая была основана еще в конце 90-х годов. Она обрабатывает порядка 42 миллиардов пользовательских запросов в месяц и занимает более 90% мирового рынка. К преимуществам данной поисковой системы можно отнести:
Однако и здесь без недостатков не обошлось:
Другие поисковые системы
На Яндекс и Google поисковые системы не заканчиваются. Многие будут удивлены, когда узнают, что существует еще 14 поисковых систем. Они, конечно, не так популярны, но некоторые из них имеют очень даже весомые преимущества.
Mail.ru
Мало кто знает, но на портале Mail.ru есть не только сервис «Ответы», почта и «Мой мир», но и поисковая система, которая работает на собственном движке. Ее характерная особенность заключаются в возможности поиска по социальным сетям.
Преимущество заключается в том, что прямо из поисковика вы можете перейти к сервису «Ответы». Из недостатков стоит отметить сравнительно небольшой поисковый индекс.
Rambler
Многие считают, что Rambler чуть ли не одна из худших поисковых систем, но на самом деле все иначе. К ее преимуществам стоит отнести продвинутую систему ассоциаций. К недостаткам можно отнести то, что в ленту часто попадают новости, которые абсолютно не интересны пользователю. Также есть некоторые проблемы с работой службы поддержки.
Данная поисковая система существует чуть больше 10 лет. Чаще всего она используется в качестве основного поисковика владельцами смартфонов, работающих на базе операционной системы Windows. Большая часть пользователей Bing – это граждане США.
Nigma
Данная поисковая система ищет информацию по индексам трех крупных поисковиков – Google, Яндекс и Bing, а также применяет свои собственные поисковые алгоритмы. Благодаря этому результаты поиска получаются наиболее релевантными. Большим плюсом является то, что прямо в этом поисковике можно решать задачи по математике и химии. Среди недостатков стоит выделить отсутствие отображения иконок сайтов, низкая скорость загрузки и пользовательский интерфейс, в котором можно легко запутаться.
WebAlta
Данная поисковая система относительно молодая, поэтому о ней слышали далеко не все.
Но есть и недостатки, которые куда более весомее преимуществ:
Yahoo
Yahoo – это один из наиболее старых поисковиков. Данная поисковая система использует те же алгоритмы поиска, что и Bing, поэтому претензий к поисковой выдаче нет. Среди недостатков стоит отметить большое количество рекламы, а также относительно низкую скорость поиска.
DuckDuckGo
Разработчики сделали все возможное, чтобы обеспечить своим пользователям максимальную приватность и конфиденциальность. В этом и заключается основное преимущество – в отсутствии сбора и хранения пользовательских данных. Также здесь минимум рекламы. Среди недостатков стоит отметить отсутствие голосового поиска и поиска по изображениям.
Not Evil
Данный поисковик осуществляет поиск по анонимной сети Tor. К его преимуществам можно отнести уникальность найденной информации и интуитивно понятный пользовательский интерфейс. Ключевой недостаток заключается в том, что этот поисковик можно использовать только в рамках браузера Tor.
Данная пусковая система является свободно распространяемой. Ее ключевая особенность заключается в отсутствии центрального сервера. YaCy не подвергает результаты поиска какой-либо цензуре, что для многих является важным преимуществом. Из недостатков стоит отметить относительно низкую скорость поиска, а также то, что этот поисковик не ищет различные словоформы.
Данная поисковая система позволяет искать информацию о людях и справляется с этим намного лучше других поисковиков. Среди недостатков стоит отметить ограниченные возможности этой поисковой системы на территории России. Пока что полноценно использовать ее можно только на территории США.
FindSounds
Эта поисковая система специализируется на поиске конкретных звуков в открытых источниках. Она уникальна в своем роде, поэтому пользуется большой популярностью. К ее недостаткам можно отнести перегруженный пользовательский интерфейс, а к преимуществам — возможность настроить качество звука и скачать найденное аудио.
WolframAlpha
Данный поисковик подойдет тем, кто профессионально занимается различными вычислениями. В ответ на конкретный вопрос эта поисковая система выдаст вам массу графиков, таблиц, диаграмм и т.д. В ней удобно искать информацию об известных личностях, работать с датами и проводить сравнительный анализ. К сожалению, поисковик полностью на английском языке.
Dogpile
Dogpile работает с индексами сразу нескольких поисковых систем, что улучшает качество предоставляемых результатов. Иногда с ее помощью можно найти то, чего не нашлось в том же Яндексе. К преимуществам этой платформы можно отнести минимум рекламы. Недостатком является то, что Dogpile не исключает повторы в предоставляемой поисковой выдаче.
BoardReader
С помощью этого поисковика удобно искать информацию в социальных сетях, на форумах и сервисах вроде «Ответы» от Mail.ru. Результаты поиска можно фильтровать по различным критериям. Такая система поиска подойдет далеко не всем, но будет настоящим кладом для людей, которые работают в сфере SMM.
Советы и выводы
На сегодняшний день в мире существует 16 действующих поисковых систем, и каждая из них предназначена для каких-то определенных задач. Нельзя однозначно сказать, какая из них самая лучшая. Среднестатистическому пользователю наиболее удобным поисковиком покажется Яндекс или Google, а некоторые предпочтут DuckDuckGo из-за ее приватности.
Пожалуйста, оставляйте свои отзывы по текущей теме материала. За комментарии, отклики, подписки, дизлайки, лайки низкий вам поклон!
Пожалуйста, оставьте ваши мнения по текущей теме материала. Мы очень благодарим вас за ваши комментарии, дизлайки, отклики, лайки, подписки!
Поисковые системы
Поисковые системы (ПС) уже давно являются обязательной частью интернета и нашей повседневной жизни. Сегодня они громадные и сложнейшие механизмы, которые представляют собой не только инструмент для нахождения любой необходимой информации, но и довольно увлекательные сферы для бизнеса.
Функции и понятие ПС
Поисковая система – это аппаратно-программный комплекс, который предназначен для осуществления функции поиска в интернете, и реагирующий на пользовательский запрос который обычно задают в виде какой-либо текстовой фразы (или точнее поискового запроса), выдачей ссылочного списка на информационные источники, осуществляющейся по релевантности. Самые распространенные и крупные системы поиска: Google, Bing, Yahoo, Baidu. В Рунете – Яндекс, Mail.Ru, Рамблер.
Рассмотрим поподробнее само значение запроса для поиска, взяв для примера систему Яндекс.
Запрос обязан быть сформулирован пользователем в полном соответствии с предметом его поиска, максимально просто и кратко. К примеру, мы желаем найти информацию в данном поисковике: «как выбрать автомобиль для себя». Чтобы сделать это, открываем главную страницу и вводим запрос для поиска «как выбрать авто». Потом наши функции сводятся к тому, чтобы зайти по предоставленным ссылкам на информационные источники в сети.
Но даже действуя таким образом, можно и не получить необходимую нам информацию. Если мы получили подобный отрицательный результат, нужно просто переформировать свой запрос, или же в базе поиска действительно нет никакой полезной информации по данному виду запроса (такое вполне возможно при заданных «узких» параметров запроса, как, к примеру, «как выбрать автомобиль в Туле»).
Самая основная задача каждой поисковой системы – доставить людям именно тот вид информации, который им нужен. Приучить же пользователей создавать «правильный» вид запросов к поисковым системам, то есть фразы, которые будут соответствовать их принципам работы, практически, невозможно.
Именно поэтому специалисты-разработчики поисковиков делают такие принципы и алгоритмы их работы, которые бы давали пользователям находить интересующие их сведения. Это означает, что система, должна «думать» так же, как мыслит человек при поиске необходимой информации в интернете.
Когда он вводит свой запрос в поисковую машину, он желает найти то, что ему надо, как можно проще и быстрее. Получив результат, пользователь составляет свою оценку работе системы, руководствуясь несколькими критериями. Получилось ли у него найти нужную информацию? Если нет, то сколько раз ему пришлось переформатировать текст запроса, чтобы найти ее? Насколько актуальная информация была им получена? Как быстро поисковая система обработала его запрос? Насколько удобно были предоставлены поисковые результаты? Был ли нужный результат первым, или находился на 30-ом месте? Сколько «мусора» (ненужной информации) было найдено вместе с полезными сведениями? Найдется ли актуальная для него информация, при использовании ПС, через неделю, либо через месяц?
Основные характеристики поисковых систем
Полнота.
Точность.
Еще одна основная функция поисковой системы – точность. Она определяет степень соответствия запросу пользователя найденных страниц в Сети. К примеру, если по ключевой фразе «как выбрать автомобиль» найдется сотня документов, в половине из них содержится данное словосочетание, а в остальных просто есть в наличии такие слова (как грамотно выбрать автомагнитолу, и установить ее в автомобиль»), то поисковая точность равна 50/100 = 0,5.
Чем поиск точнее, тем скорее пользователь найдет необходимую ему информацию, тем меньше разнообразного «мусора» будет встречаться среди результатов, тем меньше найденных документов будут не соответствовать смыслу запроса.
Актуальность.
Это значимая составляющая поиска, которую характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика.
К примеру, на следующий день после возникновения информации о выходе нового iPad, множество пользователей обратилась к поиску с соответствующими видами запросов. В большинстве случаев информация об этой новости уже доступна в поиске, хотя времени с момента ее появления прошло очень мало. Это происходит благодаря наличию у крупных поисковых систем «быстрой базы», которая обновляется несколько раз за день.
Скорость поиска.
Наглядность.
Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения.
Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.
История развития поисковых систем
Когда интернет только начал развиваться, число его постоянных пользователей было небольшим, и объем информации для доступа был сравнительно невеликим. В основном доступ к этой сети имели лишь специалисты научно-исследовательских сфер. В то время, задача нахождения информации не была столь актуальна как сейчас.
Одним из самых первых методов организации широкого доступа к ресурсам информации стало создание каталогов сайтов, причем ссылки на них начали группировать по тематике. Таким первым проектом стал ресурс Yahoo.com, который открылся весной 1994-ого года. Впоследствии когда количество сайтов в Yahoo-каталоге существенно увеличилось, была добавлена опция поиска необходимых сведений по каталогу. Это еще не было в полной мере поисковой системой, так как область такого поиска была ограничена только сайтами, входящими в данный каталог, а не абсолютно всеми ресурсами в интернете. Каталоги ссылок весьма широко использовались раньше, однако в настоящее время, практически в полной мере утратили свою популярность.
Ведь даже сегодняшние, громадные по своим объемам каталоги имеют информацию о незначительно части сайтов в интернете. Самым известным и большим каталогом в мире был DMOZ (прекратил работу 14 марта 2017 года) имеет информацию о пяти миллионах сайтов, когда база Google содержит информацию о более чем 25 миллиардов страниц.
Самой первой настоящей поисковой системой стала WebCrawler, возникшая еще в 1994-ом году.
В следующем году появились AltaVista и Lycos. Причем первая была лидером по поиску информации очень длительное время.
В 1997-ом году Сергей Брин вместе с Ларри Пейджем создал машину поисковую Google как исследовательский проект в Стэндфордском университете. Сегодня именно Google, самая востребованная и популярная поисковая система в мире.
В сентябре 1997-ом году была анонсирована (официально) ПС Yandex, которая в настоящий момент является самой популярной системой поиска в Рунете.
Доля поисковых систем
Принципы работы поисковой системы
Модуль индексирования.
Данный компонент состоит из трех программ-роботов:
Spider (по англ. паук) – программа которая предназначена для того чтобы скачивать веб-страницы. «Паук» скачивает определенную страницу, одновременно извлекая из нее все ссылки. Скачивается код html практически с каждой страницы. Для этого роботы используют HTTP-протоколы.
«Паук» функционирует следующим образом. Робот передает запрос на сервер “get/path/document” и иные команды запроса HTTP. В ответ программа-робот получает поток текста, который содержит информацию служебного вида и, естественно, сам документ.
Crawler, исследуя найденные ссылки, ищет новые документы, еще не ставшие известными поисковой системе.
Indexer (робот-индексатор) – это программа, анализирующая страницы, которые скачали пауки.
Индексатор полностью разбирает страницу на составные элементы и проводит их анализ, применяя свои морфологические и лексические виды алгоритмов.
Анализ проводится над разнообразными частями страницы, такими как заголовки, текст, ссылки, стилевые и структурные особенности, теги html и др.
Таким образом, модуль индексирования дает возможность проходить по ссылкам заданного количества ресурсов, скачивать страницы, извлекать ссылочную массу на новые страницы из полученных документов и делать подробный их анализ.
База данных
Поисковый сервер
Это самый важный элемент всей системы, потому что от алгоритмов, лежащих в основе ее функциональности, прямо зависит скорость и, конечно же, качество поиска.