Поисковые системы интернета — это компьютерные программы, которые предназначены для помощи в поиске информации в глобальной компьютерной сети.
Поисковые системы: предназначение и виды
Замечание 1
Под поисковой системой понимается компьютерная программа, которая предназначена для выполнения поисковых операций в информационной среде.
Самым распространёнными системами для поиска информации являются веб-сервисы по поиску различных информационных данных во всемирной сети интернет. Кроме того, есть системы, которые способны найти файлы в FTP-серверах, нужную продукцию в магазинах, работающих в интернете, различную новостную информацию.
Сдай на права пока
учишься в ВУЗе
Вся теория в удобном приложении. Выбери инструктора и начни заниматься!
Чтобы найти нужные данные при посредстве поисковых систем, пользователь составляет специальный запрос, по которому и ведётся поиск. Функционирование системы поиска состоит в том, что по пользовательскому запросу находится документация, которая содержит или какие-либо заданные ключевые слова, или фразы каким-то образом имеющие корреляцию с ними. В результате поиска формируется страница, отображающая поисковые результаты. Там могут содержаться разные виды данных, например, веб-страницы, графика, фото, звуковые файлы. Отдельные системы поиска способны извлечь информацию из тематических информационных баз и других интернет-ресурсов.
Как работают ПОИСКОВЫЕ СИСТЕМЫ | Принцип работы ПОИСКОВИКОВ
Рейтинг поисковой системы тем выше, чем больше она способна обнаружить информации, соответствующей пользовательскому запросу. Поисковые итоги могут быть не полностью соответствующими запросу, что определяется особенностями применяемого системой алгоритма.
По способам поисковых операций и методике обслуживания, поисковые системы делятся на следующие виды:
- Системы на основе поисковых роботов.
- Системы, которыми управляют люди.
- Системы гибридного класса.
- Системы мета класса.
«Поисковые системы интернета»
Готовые курсовые работы и рефераты
Решение учебных вопросов в 2 клика
Помощь в написании учебной работы
Структурная организация поисковых систем включает следующие элементы:
- Программа-робот, которая собирает информацию в сети Интернет.
- Программа индексации, которая обеспечивает быструю ориентацию в собранной информации.
- Программа поиска, которая является графическим интерфейсом пользователя.
История разработки поисковых систем интернета
Одной из первых компьютерных программ, выполняющих поиск информации в интернете, стала программа Арчи, разработанная в девяностом году прошлого века. Она выполняла скачивание перечня всех файлов с видимых ею серверов и формировала информационную базу, в которой имелась возможность поиска согласно имени файла.
Но Арчи не выполняла индексацию содержимого файлов, поскольку в этом не было необходимости из-за небольшого объёма данных. Все последующие операции можно было легко сделать в ручном режиме. Затем разработка и внедрение нового сетевого протокола Gopher, стало стимулом к появлению ещё двух поисковые системы, Veronica и Jughead. По аналогии с Арчи, они тоже выполняли поиск имён файлов и заголовков, которые сохранялись уже в системах индексации Gopher.
Как работает поисковая система
В конце девяностых годов прошлого века Google, тогда ещё небольшая фирма, стала продавать ключевые слова. Это стало началом перехода поисковых систем от прямой конкуренции друг с другом к практическому использованию самого выгодного коммерческого использования возможностей интернета. Поисковые системы начали осуществлять продажу первых мест в поисковых итогах разным фирмам.
С начала двадцать первого века система поиска Google занимает лидирующие позиции в мире. Успех фирме принесли отличные поисковые характеристики, реализованные на основе алгоритма PageRank. Данный алгоритм, имеющий итеративную основу, выполняет ранжирование веб-страницы, основанное на количестве гиперссылок на эту веб-страницу. При этом предполагается, что на полезные и нужные страницы будет больше ссылок, чем на все остальные. Оформление интерфейса Google выполнено без всяческих излишеств, что отличает его от некоторых конкурирующих программ, встраивающих систему поиска в веб-портал.
В конце девяностых годов прошлого века была спроектирована поисковая машина Altavista, способная выполнять поиск на символах русского языка. Кроме того, примерно в это же время были реализованы русскоязычные системы поиска Рамблер и Апорт. Затем появилась ещё одна система, которая стала впоследствии необычайно популярной, это Яндекс. В мае четырнадцатого года этого века фирма Ростелеком реализовала национальную поисковую машину Спутник.
Принципы работы поисковых систем интернета
В основе практически всех поисковых систем лежат три главных компонента:
- Программа поискового робота.
- Программа выполнения индексации.
- Программа поиска в индексированном информационном массиве.
Эти три компонента включаются в работу поочерёдно. Вначале программа поискового робота находит информацию, соответствующую поисковому запросу. Далее, программа индексации формирует необходимые для поиска информационные индексы, и уже на последнем этапе программа поиска ищет в проиндексированных данных наиболее важную информацию.
Для обновления поисковой системы, вышеназванные действия повторяются. При работе систем поиска, они сохраняют информацию о большом числе веб-страниц, которую они извлекают из HTML-страниц. Программа поискового робота (Crawler) в автоматическом режиме выполняет проход по каждой ссылке, которая обнаружена на странице, и помечает её.
Далее Crawler, опираясь на найденные ссылки или на базе определённого перечня адресов, ищет новые документы, ещё не известные системе поиска. Хозяева интернет-сайтов имеют возможность запретить выполнение индексации некоторых файлов, страниц или каталогов с их сайта с помощью сервиса robots.txt. Поисковая система выполняет анализ содержания всех страниц для выполнения в дальнейшем их индексации.
Программа индексации разбивает страницу на отдельные части, используя специальные алгоритмы лексики и морфологии. Сформированные индексы дают возможность быстрого обнаружения информации согласно пользовательскому запросу.
Программа поиска вырабатывает конечный поисковый результат на основании операций с информацией, переданной программой индексации.
Источник: spravochnick.ru
Понятие и классификация поисковых систем
Поисковая система (англ. search engine ) – алгоритмы и реализующая их совокупность компьютерных программ, предоставляющая пользователю возможность быстрого доступа к необходимой ему информации при помощи поиска в обширной коллекции доступных данных. Одно из наиболее известных применений поисковых систем – веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.
Каждая поисковая система имеет собственный алгоритм поиска, который определенным образом анализирует релевантность сайтов, чтобы выдать результат, наиболее соответствующий запросу пользователя.
1) Типы поисковых систем по способу работы
а) Индексные поисковые системы собирают информацию в Интернете автоматически, с помощью специальных программ-роботов, посещающих веб-страницы. Они осуществляют всесторонний поиск по ключевым словам. Примерами таких поисковых систем являются Google, AltaVista, HotBot, Яндекс.
Индексные поисковые системы работают по одному общему принципу. Сначала агент начинает сканирование сети с определенного адреса. На сервере создаются индексированные копии документов, своего рода вспомогательные файлы. Затем сохраненные документы просматриваются, определяются гиперссылки с этих страниц, по ним осуществляется переход на новые страницы.
После сохранения копий найденных документов весь процесс повторяется. Все веб-страницы, проиндексированные поисковой системой, попадают в базу данных, что позволяет пользователю, формирующему запрос на поиск необходимой информации, мгновенно получить ссылки на нее.
б) Каталоговые системы поиска содержат тематически структурированный каталог серверов и чаще всего пополняются вручную модераторами. Эти системы устроены так же, как тематический каталог обычной библиотеки. Ссылки в них хранятся по теме категорий. Начав с основной страницы каталога, нужно выбрать ссылку, обозначающую главную категорию, а затем на последующих страницах указывать подкатегории до тех пор, пока не будут достигнуты ссылки на конкретные страницы. Ярким примером каталога является система Yahoo.
в) Метапоисковые системы – это системы, которые используют для поиска базы данных других поисковых систем. Они посылают запрос одновременно на несколько поисковых систем, каталогов и иногда в так называемую невидимую (скрытую) паутину – хранилище онлайн-информации, не считанной традиционными поисковыми системами. Собрав результаты, метапоисковая система удаляет дублированные ссылки и в соответствии со своим алгоритмом объединяет результаты в общем списке. Примером такой системы может служить российское решение Nigma, использующее для поиска Google , Yahoo , Апорт и Яндекс.
г) Специализированные поисковые системы, в отличие от поисковых систем общего назначения, которые ищут любую интересующую информацию, ищут информацию определенного вида, например, изображения, книги, организации, людей, то есть работают в какой-то конкретной области. Примерами таких систем могут служить moresoft.ru для поиска программ и файлов, bukinist.agava.ru для поиска книг и других электронных текстов, kinopoisk.ru для поиска информации о фильмах, Яндекс.Маркет для поиска описаний и цен товаров и т.п.
2) Типы поисковых систем по области поиска
По области поиска поисковые системы можно разделить на глобальные и локальные. Глобальные поисковые системы предназначены для поиска информации по всей сети Интернет либо по значительной ее части, а локальные поисковые системы – по какой-либо части Сети, например, по одному или нескольким сайтам, либо по локальной сети. Часто локальные поисковые системы собирают информацию в пределах одного национального домена, как, например, yandex.ru .
Также существуют локальные поисковые машины, которые можно установить себе на компьютер, например Copernic Desktop Search для Microsoft Windows, Spotlight для Mac OS X, Tracker для Linux. Они значительно облегчают жизнь тех пользователей, которые хранят огромные архивы нерассортированных файлов.
Источник: sites.google.com
Поисковая система
Поисковая система (поисковик) — это специальная программа, которая в ответ на запрос пользователя через веб-интерфейс (сайт) выдает список ресурсов, отсортированных по релевантности этому запросу.
Хорошая поисковая система предлагает материалы, которые наиболее корректно отвечают на запрос пользователя. При этом многие поисковики могут искать нужное не только по словам, но и по картинке или голосовому сообщению.
Прародителем всех поисковых систем считают программу Арчи — первый инструмент для поиска контента в интернете. Арчи предлагал пользователям архив со списком доступных файлов и возможностью поиска по ним.
Лишь в 1994 году появилась первая полноценная поисковая система — WebCrawler, которая стала индексировать не только названия файлов или заголовки страниц, но и их содержимое. А уже через три года, в 1997 году, на рынок вышли привычные нам Google и Яндекс — самые популярные поисковые системы в России, по данным Яндекс.радар .
Если обратиться к мировой статистике, то здесь лидирует Google (84,8%), а «Яндекс» (1,06%) уходит на 6-е место.
Доля рынка наиболее часто используемых поисковых систем по всему миру по состоянию на сентябрь 2022 г. Источник
Зачем нужна поисковая система
Без поисковых систем обычный пользователь вряд ли найдет в интернете нужную информацию, так как без них не будет привычного нам списка сайтов. Придется вручную вбивать адрес каждого ресурса, чтобы проверить, есть ли там то, что вы ищите. К счастью, алгоритмы поисковиков уже знают, какая информация есть на большинстве сайтов, и в ответ на запрос выдают список страниц, которые больше всего соответствуют этому запросу.
Кроме того, современные поисковые системы давно вышли за границы обычных поисковиков и превратились в целые экосистемы, которые помогают пользователям решать множество бытовых и бизнес-задач. В том же «Яндексе» есть электронная почта, маркетплейс, онлайн-кинотеатр, такси, доставка еды, карты, различные сервисы для бизнеса, а еще собственная платежная система и знакомый многим голосовой помощник Алиса.
У Яндекса столько разных сервисов, что они не поместились на одном экране даже мелким шрифтом
Этапы работы поисковиков
У каждой поисковой системы — свой алгоритм работы, который держится в строгом секрете. Однако условно весь процесс подбора нужной информации поисковиком можно разделить на три этапа: сканирование (поиск и сохранение страниц), индексация и ранжирование.
Сканирование
Чтобы поисковая система смогла найти нужную информацию в большом количестве сайтов, эти сайты должны быть ей известны, то есть прочитаны и сохранены в памяти.
Можно сравнить с библиотекой: если вы не знаете, какие книги стоят на полках и никогда не заглядывали в них, то вероятность того, что вы быстро сориентируетесь и найдете нужную цитату, равна нулю.
Поисковая система узнает о содержимом сайтов с помощью специального робота — краулера, или паука . Название происходит от английского crawler (ползающее насекомое, ползунок). Робот обходит все страницы, переходит по ссылкам и постепенно охватывает миллиарды веб-страниц в сети, сохраняет их и отправляет на индексацию.
Индексация
Следующий этап — подробный анализ загруженных страниц и добавление информации о том, какие сведения в них содержатся, в базу поисковой системы (создание индекса).
Индексный робот разбивает каждую сохраненную страницу на части (заголовки, текст, ссылки, теги html и т.д), изучает их содержимое, переваривает и структурирует. В результате получается упорядоченный список адресов страниц и размещенной на них информации.
По аналогии с библиотекой недостаточно знать, какие книги есть на полках. Важно составить подробный и удобный каталог, который расскажет, в каких книгах и на каких страницах искать нужную информацию.
Другой пример — предметный указатель в справочниках, который помогает без труда найти ответ на нужный вопрос. Все термины здесь размещены по алфавиту с указанием страниц, на которых они встречаются
Пока страница не проиндексирована, для поисковика она не существует. Поэтому важно, чтобы сайт был открыт для индексации. При необходимости можно закрыть от поисковых роботов отдельные страницы, например личный кабинет и корзину, чтобы они не попали в выдачу.
Как ускорить индексацию страниц
Если страница открыта для индексации, то самая распространенная причина того, что она не появляется в выдаче — она новая, и поисковый робот просто не успел ее проиндексировать.
В зависимости от характеристик сайта и возможностей поисковых роботов обновление или апдейт страниц может занять от нескольких минут до нескольких недель.
Проверить индексирование страницы можно в « Яндекс.Вебмастере » раздел «Индексирование», а в Google Search Console «Проверка URL».
Яндекс.Вебмастер помогает понять, виден ли сайт в поисковой выдаче
Также в «Яндекс Вебмастере» можно направить страницы сайта на индексацию вручную с помощью функции «Переобход страниц», а в Google Search Console — сделать запрос индексирования.
Ранжирование и поисковая выдача
Когда человек вводит запрос в поисковую строку, поисковик выбирает все страницы, которые имеют отношение к запросу, прогоняет их через свои алгоритмы и выдает список сайтов в определенном порядке. При этом чем выше сайт оказался в выдаче, тем лучше он соответствует запросу пользователя и требованиям поисковика.
Процесс сортировки сайтов по определенному списку критериев называется ранжированием. На результаты ранжирования влияет релевантность контента запросу, качество и удобство сайта, его технические и пользовательские характеристики и многое другое. Точный список критериев поисковые системы держат в секрете и постоянно обновляют свои алгоритмы.
По итогам ранжирования можно получить разные результаты поисковой выдачи:
- в разных поисковиках, так как используются различные критерии фильтрации;
- в разных регионах, так как в запросах учитывается местонахождение пользователя;
- на разных устройствах — в десктопной и мобильной версии, так как имеет значение удобство использования сайта на разных устройствах;
- по одинаковым запросам у разных пользователей, так как учитывается индивидуальная история поиска.
По запросу «Муми тролли» «Яндекс» и Google выдают разные результаты, на первой странице совпадает только один сайт из шести
Ранжирование позволяет пользователям быстрее получить нужную и достоверную информацию, а компаниям использовать поисковую выдачу для продвижения своего сайта.
Альтернативные поисковые системы
Большинству поисковых систем далеко до Яндекса и Гугла, и все же некоторые из них могут быть полезны в той или иной ситуации. Вот несколько примеров поисковиков, которые ориентируются на определенную нишу или предлагают больше конфиденциальности. Не только Яндекс и Google: 7 альтернативных поисковых систем
DuckDuckGo — поисковая система с открытым исходным кодом. Не собирает и не хранит данные о посетителях, а значит, обеспечивает максимальную конфиденциальность своим пользователям. Кроме того, Google и Яндекс стремятся персонализировать выдачу и учитывают предпочтения посетителя. В DuckDuckGo такого нет, поэтому поисковая выдача получается чуть более объективной. Например, через поисковик удобнее искать информацию на иностранном языке.
FindSounds — поисковик по звукам. Можно ввести текстовый запрос или загрузить образец. Запросы на русском не поддерживаются, но есть большой список русскоязычных тегов. Можно уточнить запрос, выбрав желаемый формат и качество звучания. Легко найти рев леопарда, жужжание осы, тикание часов и даже звук дыхания Дарта Вейдера.
Все найденные звуки доступны для скачивания.
BoardReader — поиск по форумам, сервисам вопросов и ответов и другим сообществам. Специальные настройки помогут быстро найти посты и комментарии, которые соответствуют заданным критериям: языку, дате публикации и названию сайта.
Источник: www.unisender.com