Определение понятия Поисковая система (англ.search engine) — это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска
Слайды и текст этой презентации
Слайд 1 Поисковые системы
Работу выполнила: Алсаева Ольга 11 «А»
Слайд 2
Определение
Поисковая система (англ.search engine) — это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине.
А также это аппаратно-программный комплекс, который предназначен для осуществления функции поиска в интернете, и реагирующий на пользовательский запрос который обычно задают в виде какой-либо текстовой фразы (или точнее поискового запроса), выдачей ссылочного списка на информационные источники, осуществляющейся по релевантности. Самые распространенные и крупные системы поиска: Google, Bing, Yahoo, Baidu. В Рунете – Яндекс, Mail.Ru, Рамблер.
Как удалить вирусы на Windows в два клика?
Слайд 3
Запрос в
поисковой системе
Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете.
Слайд 4
Запрос в поисковой системе
Слайд 5
Методы поиска
По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы. В архитектуру поисковой системы обычно входят:
поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов
индексатор, обеспечивающий быстрый поиск по накопленной информации, и
поисковик — графический интерфейс для работы пользователя[⇨].
Слайд 6
Принцип работы поисковых систем
Как правило, системы работают
Слайд 7
История развития поисковых систем
На
раннем этапе развития сети Интернет Тим Бернерс-Ли поддерживал список веб-серверов, размещённый на сайте ЦЕРН. Первой компьютерной программой для поиска в Интернете была программа Арчи. Она была создана в 1990 году, студентами, изучающими информатику в университете Макгилла в Монреале. Программа скачивала списки всех файлов со всех доступных анонимных FTP-серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержимое этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.
Слайд 8
Рынок поисковых
Google — самая популярная поисковая система в мире с долей на рынке 68,69 %. Bing занимает вторую позицию, его доля 12,26 %.
Самые популярные поисковые системы в мире
Слайд 9
Поисковые
системы Азии
В восточноазиатских странах и в России Google — не самая популярная поисковая система. В Китае, например, более популярна поисковая система Soso.В Южной Корее поисковым порталом собственной разработки Naver пользуется около 70 % жителей Yahoo! Japan и Yahoo! Taiwan — самые популярные системы для поиска в Японии и Тайване соответственно.
Слайд 10Российские поисковые системы
Яндексом пользуются 56,2 % пользователей в России
(Google — 37,6 %)[21].
Согласно данным LiveInternet в июне 2015
года об охвате русскоязычных поисковых запросов[22]:
Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарскоми других. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что, в основном, индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык, или другими способами ограничивают своих роботов русскоязычными сайтами.
Источник: thepresentation.ru
Как появились первые поисковые системы интернета
В настоящее время трудно представить свою жизнь без поисковых систем. Абсолютно каждый пользователь сети интернет ежедневно ищет информацию в таких поисковиках, как Яндекс и Google. Причем поисковые системы сейчас стали настолько «умны», что могут понять запрос буквально с полуслова. Но так было не всегда.
В конце восьмидесятых годов, когда интернет еще не был развит столь повсеместно, как таковых поисковиков не было в принципе. Пользователи сохраняли ссылки на полезные сайты в «закладках» или просто собирали их в отдельные текстовые файлы. История возникновения первых поисковых систем началась в девяностые годы и прошла огромный путь. Рассмотрим подробнее этапы зарождения и развития поисковых систем интернета.
1990. Archie.
Первой в мире поисковой системой считается появившийся в 1990 году Archie — компьютерная программа, осуществлявшая поиск файлов на анонимных FTP-серверах по протоколу FTP. Archie была разработана студентами Монреальского университета Макгилла Аланом Эмтейджем, Питером Дойчем и Биллом Хилланом. Программа была довольно примитивной — она просто скачивала списки файлов со всех доступных FTP-серверов и строила базу данных с возможностью поиска по названиям файлов. При этом индексировать содержимое файлов Archie не умела. Но в тот период это и не требовалось, так как объем информации был достаточно мал, и поиск можно было осуществлять вручную.
1991. Veronica. Jughead
В 1991 году студент Миннесотского университета Марк Маккэхилл создал новый сетевой протокол Gopher. Структура протокола была очень схожа со структурой каталогов в файловой системе (вложенные друг в друга каталоги и файлы). Это позволяло пользователям быстро искать необходимую информацию.
На базе Gopher были созданы две новые поисковые системы — Veronica и Jughead. Как и Archie, они искали имена файлов и заголовки, хранящиеся в индексных системах Gopher. Veronica предлагала поиск по ключевым словам практически всех заголовков в списках Gopher. Jughead же выполнял поиск информации по одному серверу за раз.
Протокол Gopher активно использовался университетами и правительственными учреждениями США, вплоть до конца 90-х годов. Впоследствии был практически полностью вытеснен протоколом HTTP.
1993. W3catalog.
В 1993 году разработчиком из Женевского университета Оскаром Нирштрассом была представлена поисковая система W3catalog. Она представляла собой ряд сценариев на Perl, которые копировали веб-страницы и форматировали их в стандартный формат. При этом W3catalog использовал только составленные вручную списки веб-ресурсов.
1993. Wandex.
В 1993 году разработчик из Массачусетского института Мэтью Грэй создает Wandex — первую в мире поисковую систему, способную индексировать сайты и выдавать результаты поиска по запросу. Однако, алгоритмы Wandex были еще очень далеки от совершенства. Сканировались только заголовки сайтов, а не все содержимое. При запросе выдавались не релевантные ссылки, а все подряд, без какого-либо анализа и ранжирования.
1993. Aliweb.
В том же 1993 году появилась поисковая система Aliweb. Поиск с помощью Aliweb также осуществлялся по ресурсам Всемирной сети. Однако владельцы сайтов должны были сами добавлять их в индекс Aliweb, чтобы эти сайты появлялись в поиске. Для многих это было очень неудобно, поэтому данная поисковая система так и не получила дальнейшее распространение.
1994. Excite.
В 1994 году студентами Стэнфордского университета была представлена поисковая система Excite. Программа использовала статистический анализ слов в тексте для упрощения поиска в интернете. В дальнейшем Excite стал включать в себя не только поисковую систему, но также и веб-почту, обмен мгновенными сообщениями, информационные ресурсы. В 1997 году Excite был отмечен как второй по популярности сайт в интернете.
1994. WebCrawler.
21 апреля 1994 года студентом Вашингтонского университета Брайаном Пинкертоном была запущена WebCrawler — первая в мире полнотекстовая поисковая система. Она осуществляла поиск по всему содержимому веб-страниц, а не только по их заголовкам. С тех пор это стало стандартом для большинства поисковых систем. Кроме того, WebCrawler стал первым поисковиком, получившим широкое распространение. Примечательно, что данная поисковая система работает до сих пор.
1994. Yahoo.
В 1994 году аспирантами Стэнфордского университета Дэвидом Фило и Джерри Янгом был создан сайт «Путеводитель Джерри по Всемирной паутине». Данный сайт представлял собой каталог других веб-сайтов. Изначально «Путеводитель» был предназначен для студентов университета.
Но уже к осени 1994 года сайт насчитывал более 2 тысяч ссылок, а его аудитория расширилась далеко за пределы университета. Фило и Янг продолжают активно работать над своим проектом, выбирают для него краткое запоминающееся название Yahoo! И уже к концу 1994 года Yahoo! становится домашней страницей веб-браузера Netscape. Постепенно Yahoo! превращается из обычного каталога в информационный портал, на котором доступны новости, афиша, погода, котировки и др.
На сегодняшний день Yahoo! входит в ТОП5 поисковых систем во всем мире, преимущественно в США.
1995. Altavista.
В 1995 году была запущена поисковая система Altavista. На момент своего появления Altavista была самой быстрой из всех поисковых систем — она работала на мощнейшем на то время сервере DEC Alpha. Кроме того, она принимала запросы на так называемом «естественном языке». Достаточно было ввести в поисковую строку любую фразу или вопрос, чтобы получить ответ.
Еще одним преимуществом Altavista стало обеспечение поддержки множества языков, в том числе китайского и японского. А в 1996 году Altavista запустила морфологическое расширение для русского языка.
1996. Апорт.
В феврале 1996 года была представлена поисковая система Апорт. На тот момент Апорт осуществлял поиск только по сайту russia.agama.com. По всему интернету поисковик начал искать лишь с конца 1997 года. Вплоть до середины 2000-х годов Апорт был одним из лидеров поиска в Рунете.
На пике популярности система обладала довольно расширенными возможностями — на главной странице присутствовал новостной блок, погода, телепрограмма, курс валют. Также Апорт давал возможность поиска организаций по заданному адресу. Стоит отметить тот факт, что Апорт стал первым поисковиком Рунета, кто применил технологию ранжирования Page Rank — базовую технологию Google.
Апорт как поисковая система просуществовала до 2012 года. После она была перепрофилирована в прайс-агрегатор.
1996. Rambler.
8 октября 1996 года на свет появляется еще одна поисковая система — Rambler. Ядро Rambler было написано российским программистом Дмитрием Крюковым всего за 4 месяца. Он же стал автором названия и логотипа поисковой системы. К моменту своего появления Rambler проиндексировал порядка 100 тысяч документов. Это стало отличным показателем, ведь число веб-сайтов Рунета на тот период составляло не более 50-ти.
Буквально за год Rambler становится лидером среди российских поисковых систем, оставляя позади себя первопроходцев поиска Рунета — Altavista и Апорт.
В 1997 году появился счетчик Rambler Top100 — первый рейтинг-классификатор Рунета. Счетчик позволял определять посещаемость веб-сайтов и популярность среди пользователей интернета, а также оценивать возможный трафик для рекламодателей.
В 1999 году Rambler получил награду как лучший российский сайт (по версии Международного Компьютерного Клуба).
Начиная с 2001 года Rambler начал сдавать свои позиции, уступив место лидера Яндексу. А в 2011 году Rambler полностью отказывается от собственной поисковой машины и устанавливает на своем портале поиск от Яндекс. На сегодняшний день Rambler является медийно-сервисным интернет-порталом, включающим в себя новостной агрегатор, почтовую службу, биржевые сводки и другие информационно-развлекательные сервисы.
1997. Yandex.
23 сентября 1997 года российские программисты и предприниматели Аркадий Волож и Илья Сегалович представили на выставке Softool новую поисковую систему Yandex.Ru. Стоит отметить тот факт, что первая рабочая версия поискового приложения под названием «Яndex» появилась еще в 1993 году. На тот момент приложение представляло собой инструмент для поиска информации в рамках одного сайта.
Несмотря на то, что Яндекс не был первой поисковой системой Рунета, он стал быстро набирать аудиторию. К середине 1999 года Яндекс уже входил в ТОП7 популярнейших сайтов Рунета. В 2001 году Яндекс становится лидером среди русскоязычных сайтов, обогнав Rambler. Успех был обусловлен запуском обновления поисковой системы: улучшение поиска ссылок, введение «взвешенного индекса цитирования», повышение точности и скорости поиска информации. В этом же году появляется система контекстной рекламы Яндекс.Директ, впоследствии ставшая основным источником доходов компании.
На сегодняшний день Яндекс является крупнейшим поисковым сервисом Рунета и входит в ТОП10 популярнейших поисковиков мира.
1997. Google.
В 1997 году в западных странах наступает переломный момент в развитии поисковых систем — двое студентов Стэнфордского университета Сергей Брин и Ларри Пейдж основывают Google. На самом деле разработка проекта велась еще с 1996 года.
Брин и Пейдж считали, что поисковые системы должны ранжировать и анализировать сайты в зависимости от того, сколько раз слова, используемые в поисковых запросах, появлялись на веб-страницах. Так был разработан алгоритм анализа ссылок Page Rank. Именно эта технология легла в основу поисковой системы Google. Проект был назван BackRub, а впоследствии переименован в Google.
Page Rank оказался отличным способом выявления полезных веб-ресурсов, и пользователи интернета довольно быстро поняли, что поиск в Google более эффективен, чем поиск с помощью других поисковых систем. Аудитория Google росла стремительными темпами. Уже к 2002 году Google занял место лидера среди поисковых систем по всему миру. На сегодняшний день Google является самым посещаемым сайтом в мире. Ежедневно он обрабатывает более 7 млрд. запросов в день, и это количество продолжает неуклонно расти.
1998. MSN Search. Bing.
Осенью 1998 года международная корпорация Microsoft представила поисковую систему MSN Search, которая использовала базу данных проиндексированных страниц от Inktomi. Система включала в себя поисковую машину, индекс и веб-сканер.
8 марта 2006 года была представлена демо-версия сервиса Windows Live Search. В сентябре 2006 года Windows Live Search полностью сменил уже устаревшую на тот момент поисковую систему MSN Search. Новый поисковый механизм позволял пользователям интернета искать информацию среди данных конкретного типа: по веб-страницам, новостям, музыке, изображениям.
3 июня 2009 года Live Search был официально заменен на Bing. Bing является поисковой системой по умолчанию в браузере Microsoft Edge. На сегодняшний день Bing занимает вторую строчку в списке мировых поисковых систем.
1998. Mail.
2000. Baidu.
В 2000 году два предпринимателя из Китая Робин Ли и Эрик Сю основали поисковую систему Baidu. На сегодняшний день Baidu является лидером среди поисковых систем Китая. Количество запросов, ежедневно обрабатываемых данным поисковиком, превышает 6 млрд, что неудивительно для самой густонаселенной страны мира. Примечательно, что в Китае Google используют лишь 4 процента пользователей интернета.
Популярность за пределами Китая поисковая система Baidu так и не получила. Связано это с несколькими факторами: Baidu индексирует лишь сайты на китайском и английском языках; предпочтение в ранжировании отдается сайтам, расположенным на китайских или гонконгских серверах; результаты поиска сильно цензурируются.
2008. DuckDuckGo.
25 сентября 2008 года предпринимателем Гэбриелом Вайнбергом была представлена поисковая система DuckDuckGo. Ее ключевой особенностью является конфиденциальность пользовательской информации. Система не хранит IP-адреса, не ведет логи и использует cookie только по мере необходимости.
За 30 лет своего развития и совершенствования поисковые системы прошли огромнейший путь. На сегодняшний день в мире существует более 20 действующих поисковых систем. Каждая из них обладает определенными достоинствами и недостатками. Нет однозначного ответа на вопрос «какой поисковик лучше». Одному пользователю удобнее искать в Google, другой предпочтет использовать Bing.
В заключение хотим отметить, что поисковые алгоритмы постоянно совершенствуются, что делает поиск информации в интернете еще более быстрым и эффективным.
Источник: link-tel.ru
«Прорвётся сквозь сеть твоя Альтависта». В чём люди искали информацию до Google и как это было
В это уже сложно поверить, но раньше люди не могли гуглить по вполне понятной причине — Google ещё не было. Рассказываем, как появились поисковые системы, что значит песня группы «Сплин» и при чём тут сериал «Ривердэйл».
Представьте себе, что вы переместились назад во времени, попали в девяностые и вам срочно нужно найти что-то очень важное в интернете. Сможете ли вы это сделать? Зависит от года, в котором вы оказались.
1990
В начале девяностых у пользователей интернета ещё не было привычки задавать вопросы поисковым системам. Ссылки на полезные сайты буквально передавали из рук в руки: ими делились со знакомыми, сохраняли их в отдельных текстовых файлах.
Но в 1990 году уже появилась первая в мире компьютерная программа для поиска в интернете. Её зовут Арчи (Archie), но это не столько имя, сколько сокращение от слова archive («архив»).
Создатели Арчи — Алан Эмтег, Билл Хилан и Питер Дойч, студенты, изучавшие информатику в университете Макгилла в Монреале (Канада). Сами того не зная, они положили начало многомиллиардной индустрии. Сам Эмтег вспоминал об этом так:
Я написал кусок кода, который заложил основу для многомиллиардной индустрии. В то время интернет не был бизнесом, и мы не стали патентовать Archie. На этом можно было заработать, но я не стал так делать, и совершенно об этом не жалею.
Арчи был ещё не поисковой системой, а просто программой, которая скачивает списки файлов со всех доступных серверов и строит базу данных с поиском по именам этих файлов. Эта программа не умела индексировать содержимое файлов, но для 1990 года это не было страшно. Объём данных пока был настолько мал, что всё можно было найти и вручную.
1991-1992
В 1991 году Марк Маккэхил из университета Миннесоты создал новый сетевой протокол — Gopher. Сетевые протоколы — наборы правил и действий, позволяющие устройствам в сети обмениваться информацией. Протокол Gopher позволял быстро искать информацию, потому что состоял из вложенных друг в друга каталогов — как папки в компьютере.
Вскоре на его базе появились две новые поисковые программы — Вероника (Veronica — Very Easy Rodent-Oriented Net-wide Index to Computerized Archives ) и Джагхед (Jughead — J onzy’s Universal Gopher Hierarchy Excavation And Display ). Раз уж первую программу назвали Арчи, этим двум дали имена в честь персонажей из одноимённых комиксов. Кстати, именно на этих комиксах основан современный сериал «Ривердэйл».
Вероника позволяла выполнять поиск по ключевым словам почти всех заголовков в списках Gopher. А Джагхед извлекал информацию о меню от определённых Gopher-серверов. Но ни одной полноценной системы для поиска в вебе пока так и не появилось.
1993
В начале 1990-х годов появились целые сайты-каталоги для хранения ссылок — рубрикаторы на них заполнялись вручную. В их числе, например, Yahoo! и Virtual Library (VLib), который вёл на сервере CERN изобретатель современного интернета Тим Бернерс-Ли.
В 1993 году Оскар Нирштрасс из Женевского университета написал cценарии на языке программирования Perl, которые копировали эти страницы и переписывали в стандартный формат. На их основе он и создал первую примитивную поисковую систему W3catalog.
Эта система ещё не умела сканировать все сайты подряд, она использовала составленные вручную списки веб-ресурсов.
В том же году появился первый поисковый робот, написанный на языке Perl, — World Wide Web Wanderer. Этот бот от Мэтью Грэя из Массачусетского технологического института создавал Wandex — первую систему с поиском прямо по веб-сайтам (в интернете их тогда было чуть больше 600).
В 1993 году появилась и вторая поисковая система — Aliweb. Она не использовала поискового робота, а вместо этого ждала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате.
1994-1996
Первая полнотекстовая поисковая система, индексирующая ресурсы при помощи робота, — WebCrawler (1994 год). Он первым в мире позволил искать по любым словам, расположенным на любых сайтах. Кстати, WebCrawler работает до сих пор.
Этот поисковик стал весьма популярным, а вскоре по его подобию были созданы и другие новые системы. Поначалу они конкурировали с сайтами-каталогами вроде Yahoo!, но вскоре всем стало ясно: поиск по текстам победил. Большинство каталогов объединилось с поисковыми роботами и тоже стало поисковыми системами.
Одним из самых известных поисковиков стала появившаяся в 1995 году AltaVista («взгляд сверху», «другая точка зрения»). До неё системы не работали с естественным языком: запрос надо было формулировать так, чтобы его «понял робот». А тут достаточно было напечатать любую фразу или вопрос, чтобы получить ответ.
В одноимённой песне группы «Сплин» 1999 года Александр Васильев обыграл и название поисковика, и изначальный смысл слова «альтависта».
На глубине прорвётся сквозь сеть твоя Альтависта. И ты сыграешь азбуку Морзе, симфонию Глюка на клавиатуре. Так, что навсегда уходящее солнце замрёт в этом жарком июле.
А в 1996 году появилась российская поисковая система «Рамблер» (rambler — странник, бродяга). В России она была весьма популярна вплоть до 2011 года, а потом превратилась в медиапортал персонализированных новостей.
1997
Возможно, вы не знали, но «Яндекс» появился на свет раньше, чем Google. Система была анонсирована 23 сентября 1997 года , хотя разработки велись ещё до этого. Название поисковика можно расшифровать двумя способами: yet another indexer («ещё один индексатор») или как «Языковой Индекс».
В 1990-е годы «Яндекс» действительно был «ещё одним поисковиком», ведь в России и в мире уже было множество подобных систем. Но к 2001 году он обогнал «Рамблер» в рунете, научился понимать вопросы на естественном языке, распознавать ошибки и опечатки и начал свой путь к настоящему триумфу.
1998
Если машина времени перенесла вас в 1998 год, вам повезло, и вы сможете гуглить по-настоящему. Ещё в 1996 году студенты Стэнфорда Ларри Пейдж и Сергей Брин начали работать над поисковой системой BackRub, а потом на её основе создали Google.
Домен Google.com был зарегистрирован ещё в сентябре 1997 года, но сама корпорация основана 2 сентября 1998-го — и теперь Google отмечает не один день рождения, а два. Само слово «гугл» — это искажённое число гугол — десять в сотой степени.
Благодаря лучшим алгоритмам Google и «Яндекс» стали международным и региональным лидерами. Создатели же первых поисковиков либо бросили это занятие, либо перешли на работу в крупные интернет-компании, выкупившие их системы целиком.
Сейчас Google — первая по популярности в мире система, которая обрабатывает больше 41 миллиарда запросов в месяц и индексирует больше 25 миллиардов веб-страниц.
А «Яндекс» называют национальным достоянием — и это неудивительно. Почти нигде в мире нет такого, чтобы местная поисковая система была не менее популярна, чем американская (другие исключения — Китай и Южная Корея). К тому же, Россия — единственная в мире страна, где без помощи США было создано больше одной успешной поисковой технологии.
Впрочем, некоторые пользователи интернета отказываются от поиска в Google и «Яндекс» из-за так называемого пузыря фильтров. Эти системы угадывают, что пользователь хотел бы увидеть, основываясь на его прошлых действиях в системе. В результате человек каждый раз получает выдачу, которая соответствует его интересам, перестаёт видеть информацию, которая противоречит его взглядам и остаётся в изоляции в собственном «информационном пузыре».
На волне борьбы с пузырём фильтров популярность потихоньку набирают другие системы, отказавшиеся от слежки и подтасовки результатов выдачи. Например, созданная в 2008 году DuckDuckGo позиционирует себя в качестве поисковика, который сохраняет конфиденциальность и показывает всё по запросу пользователя.
Вопросы кибербезопасности и ухода от слежки в последнее время волнуют многих людей. Так, владельцам айфонов стоит пристально изучить свои настройки, чтобы удостовериться, что их разговоры с Siri не прослушают другие люди.
А тем, у кого смартфон на Android, нужно беспокоиться о вездесущем Google. Компания получает данные о ваших перемещениях, даже если их отслеживание отключено. И проверить это можно в своём личном гугл-аккаунте.
Источник: medialeaks.ru