Информация — сведения независимо от формы их представления. Несмотря на широкую распространённость, понятие информации остаётся одним из самых дискуссионных в науке, а термин может иметь различные значения в разных отраслях человеческой деятельности.
Поисковая система – это программно-аппаратный комплекс, который предназначен для осуществления поиска в сети Интернет.
Компьютер — устройство или система, способная выполнять заданную, чётко определённую, изменяемую последовательность операций. Это чаще всего операции численных расчётов и манипулирования данными, однако сюда относятся и операции ввода-вывода.
Поиск информации
Информационный поиск
Информационный поиск (ИП) (англ. Information retrieval) — наука о поиске неструктурированной документальной информации. Особенно это относится к поиску информации в документах, поиск самих документов, добывания метаданных из документов, поиска текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет. Информационный поиск — большая междисциплинарная область науки, которая стоит на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, библиотечного дела, и статистики.
Структура HTTP запроса
Автоматические системы информационного поиска используют для уменьшения так называемого «информационной перегрузки». Многие университеты и публичных библиотек используют системы ИП для облегчения доступа к книгам, журналов и других документов. Самым известным примером систем ИП можно назвать поисковые системы в Интернете.
Поиск информации с помощью интернета
С каждым годом объемы интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к интернету, основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Поэтому особенно актуально правильно и грамотно научиться искать информацию.
Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.).
Поисковые системы
Основное
Если вы не знаете адреса, то для поиска информации в сети Интернет существуют поисковые системы, которые содержат информацию о ресурсах Интернета.
Каждая поисковая система – это большая база ключевых слов, связанных с Web-страницами, на которых они встретились. Для поиска адреса сервера с интересующей вас информацией надо ввести в поле поисковой системы ключевое слово, несколько слов или фразу. Тем самым вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде списка адресов Web-страниц, на которых встретились эти слова.
Как правило, поисковые системы состоят из трех частей: робота, индекса и программы обработки запроса.
Лучший вопрос на собеседовании: Что происходит после ввода адреса в браузер?
Робот (Spider, Robot или Bot) — это программа, которая посещает Web-страницы и считывает (полностью или частично) их содержимое. Роботы поисковых систем различаются индивидуальной схемой анализа содержимого Web -страницы.
Индекс — это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц. Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.
Программы обработки запроса
Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.
Наиболее распространенными поисковыми системами являются:
Результаты поиска выстраиваются по значимости – наиболее важные документы размещаются в начале списка. При этом положение найденного документа в списке определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).
Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов.
Список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться огромным. В связи с этим в мощных Поисковых Машинах предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска, с помощью команды «Искать в найденном».
Типы и способы поиска.
С помощью адреса Web-страницы;
С помощью поиска по гипиерсвязям;
С помощью поисковых программ.
Типы поиска в интернете:
поиск «бытовой», «любительской» информации (это могут быть сведения о погоде, расписания движения самолетов, сведения о результатах спортивных состязаний, текущие политические новости и многое другое);
Профиссионально-ориентированный или широкий информационный поиск;
Поиск справочной информации;
Поиск текущей профессиональной информации;
Поиск мест хранения информации;
Поиск ресурса по неполным данным о нем.
Сплошной. При сплошном методе пользователь для осуществления поставленной задачи обследует сплошь и без пропусков все наличие имеющихся пособий и источников.
Индуктивный. Индуктивный метод в широком смысле слова – это форма мышления, посредством которой мысль наводится (от лат. inductio – наведение) на какое-либо общее правило, общее положение, присущее всем единичным предметам какого-либо класса.
Дедуктивный. Содержанием дедукции, как метода познания, является использование общих положений при исследовании конкретных явлений.
Метод ассоциативной индексации определяется как «. механизм, благодаря которому любой элемент информации может служить отправной точкой для немедленного автоматического выбора (пользователем) любого другого элемента информации».
Метод навигации. Навигацией называется интерактивно управляемый пользователем процесс перемещения из одних узлов в другие, технически осуществляемый путем нажатия мышью на графически выделенные на экране компьютера объекты – «электронные» кнопки, идентифицирующие исходные точки дуг гипертекста.
Броузинг (browse) – процесс беглого просматривания гипертекстовых документов или гипертекстовой базы данных с целью поиска определенных сведений или просто чего-нибудь любопытного; в общем смысле – действий, целью которых является изучение информации, но не ее изменение.
Поиск информации — задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку, были выработаны все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ. Обширные возможности для работы с большими массивами информации дают поисковые сервисы Interner.
Контекстный поиск – это поиск по точной фразе. Он удобен для реферативного поиска информации, но доступен далеко не во всех поисковых системах. Прежде всего, чтобы обеспечивать такую возможность, система должна работать не только индексированными файлами, но и с полноценными образами Web-страниц. Эта операция достаточно медленная, и ее выполняют не все поисковые системы.
Заключение
В заключение, хочу сказать, что поиск информации с помощью компьютера и интернета, очень сильно облегчает жизнь многим людям, ведь так можно найти любую нужную информацию, которую пришлось бы долго искать при помощи других источников (например, учебников или энциклопедий).
Этот прорыв в технологиях очень сильно поможет человечеству в будущем, а может и наоборот.
Источник: www.evkova.org
Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.
Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей.
В России наиболее распространенными поисковыми системами являются:
За рубежом поисковых систем гораздо больше. Самыми популярными являются:
· Alta Vista (www.altavista.com);
· Fast Search (www.alltheweb.com);
· Northern Light (www.northernlight.com).
Яндекс является пожалуй наилучшей поисковой системой в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые система просматривает в течение нескольких секунд. На примере этой системы покажем как осуществляется поиск информации.
Поиск информации задается введением ключевого слова в специальную рамку и нажатием кнопки «Найти», справа от рамки.
Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости – наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).
Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов.
Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой системой под адресом Сайта. Некоторые недобросовестные авторы сайтов, для того, чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой системы, умышленно включают в документ бессмысленные повторы ключевого слова. Но как только поисковая система обнаруживает такой «замусоренный» документ, она автоматически исключает его из своей базы данных.
Даже ранжированный список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных Поисковых Машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово список из 34 899 Веб-страниц. После ввода в команду «Искать в найденном» уточняющего ключевого слова список сокращается до 750 страниц, а после ввода в эту команду еще одного уточняющего слова этот список сокращается до 130 Веб-страниц.
Поиск по рубрикатору поисковой системы
Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, представляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.
Приведем в качестве примера структуру поискового интернет-каталога Яндекс.
Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. В этом каталоге выделены следующие темы:
· Бизнес и экономика;
· Общество и политика;
· Наука и образование;
· Компьютеры и связь;
· Справочники и ссылки;
· Развлечения и отдых;
· Культура и искусство.
Каждая тема включает множество подразделов, а они, в свою очередь, содержат рубрики и т. д.
Предположим, вы готовите мероприятие ко Дню победы и хотите найти в Интернете слова известной военной песни Булата Окуджавы «Вы слышите, грохочут сапоги». Поиск можно организовать следующим образом:
Яндекс > Каталог > Культура и искусство > Музыка > Авторская песня
Такой способ поиска является достаточно быстрым и эффективным. В конце вам предлагается всего несколько ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст.
Другой пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога:.
Яндекс > Каталог > Компьютеры и связь > Мобильная связь > Мобильные телефоны
Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.
Поиск по ключевым словам
Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска.
Источник: lektsia.com
Лабораторная работа №8 Технология формирования простых и сложных запросов в поисковых системах
Для поиска интересующей вас информации необходимо указать браузеру адрес Web-страницы, на которой она находится. Это самый быстрый и надежный вид поиска. Для быстрого доступа к ресурсу достаточно запустить браузер и набрать адрес страницы в строке адреса.
Адреса Web-страниц приводятся в специальных справочниках, печатных изданиях, звучат в эфире популярных радиостанций и с экранов телевизора.
Если вы не знаете адреса, то для поиска информации в сети Интернет существуют поисковые системы, которые содержат информацию о ресурсах Интернета.
Каждая поисковая система – это большая база ключевых слов, связанных с Web-страницами, на которых они встретились. Для поиска адреса сервера с интересующей вас информацией надо ввести в поле поисковой системы ключевое слово, несколько слов или фразу. Тем самым вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде списка адресов Web-страниц, на которых встретились эти слова.
Как правило, поисковые системы состоят из трех частей: робота, индекса и программы обработки запроса.
Робот (Spider, Robot или Bot) — это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое.
Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.
Индекс — это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц.
Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.
Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.
Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей.
В России наиболее распространенными поисковыми системами являются:
- Рамблер (www.rambler.ru);
- Яндекс (www.yandex.ru);
- Мэйл (www.mail.ru).
За рубежом поисковых систем гораздо больше. Самыми популярными являются:
- Alta Vista (www.altavista.com);
- Fast Search (www.alltheweb.com);
- Google(www.google.com).
Яндекс является пожалуй наилучшей поисковой системой в российском Интернете. Эта база данных содержит около 200 000 серверов и до 30 миллионов документов, которые система просматривает в течение нескольких секунд. На примере этой системы покажем как осуществляется поиск информации. Поиск информации задается введением ключевого слова в специальную рамку и нажатием кнопки «Найти», справа от рамки. Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости – наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово (в заглавии документа важнее, чем в любом другом месте) и числом упоминаний ключевого слова (чем больше упоминаний, тем ранг выше).
Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов. Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой системой под адресом Сайта. Некоторые недобросовестные авторы сайтов, для того, чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой системы, умышленно включают в документ бессмысленные повторы ключевого слова. Но как только поисковая система обнаруживает такой «замусоренный» документ, она автоматически исключает его из своей базы данных. Даже ранжированный список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс (как и других мощных Поисковых Машинах) предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово список из 34 899 Веб-страниц. После ввода в команду «Искать в найденном» уточняющего ключевого слова список сокращается до 750 страниц, а после ввода в эту команду еще одного уточняющего слова этот список сокращается до 130 Веб-страниц.
Источник: studfile.net