От описания основных компонентов перейдем к архитектуре взаимодействия программного обеспечения в системе World Wide Web. WWW построена по хорошо известной схеме «клиент-сервер». На рисунке 7.1 показано, как разделены функции в этой схеме. Программа-клиент выполняет функции интерфейса пользователя и обеспечивает доступ практически ко всем информационным ресурсам Internet.
В этом смысле она выходит за обычные рамки работы клиента только с сервером определенного протокола, как это происходит в telnet, например. Отчасти, довольно широко распространенное мнение, что Mosaic или Netscape, которые безусловно являются WWW-клиентами, это просто графический интерфейс в Internet, является отчасти верным.
Однако, как уже было отмечено, базовые компоненты WWW-технологии (HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и поэтому мультипротокольные клиенты должны быть отнесены именно к World Wide Web, а не к другим информационным технологиям Internet. Фактически, клиент — это интерпретатор HTML.
Простейшая пара «Клиент-Сервер» на сокетах (Windows, C++)
И как типичный интерпретатор, клиент в зависимости от команд (разметки) выполняет различные функции. В круг этих функций входит не только размещение текста на экране, но обмен информацией с сервером по мере анализа полученного HTML-текста, что наиболее наглядно происходит при отображении встроенных в текст графических образов.
При анализе URL-спецификации или по командам сервера клиент запускает дополнительные внешние программы для работы с документами в форматах, отличных от HTML, например GIF, JPEG, MPEG, Postscript и т. п. Вообще говоря для запуска клиентом программ независимо от типа документа была разработана программа Luncher, но в последнее время гораздо большее распространение получил механизм согласования запускаемых программ через MIME-типы. Другую часть программного комплекса WWW составляет сервер протокола HTTP, базы данных документов в формате HTML, управляемые сервером, и программное обеспечение, разработанное в стандарте спецификации CGI.
До самого последнего времени (до образования Netscape) реально использовалось два HTTP-сервера: сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов расширилось. Появился очень неплохой сервер для MS-Windows и Apachie-сервер для Unix-платформ. Существуют и другие, но два последних можно выделить из соображений доступности использования.
Сервер для Windows — это shareware, но без встроенного самоликвидатора, как в Netscape. Учитывая распространенность персоналок в нашей стране, такое программное обеспечение дает возможность попробовать, что такое WWW. Второй сервер — это ответ на угрозу коммерциализации. Netscape уже не распространяет свой сервер Netsite свободно и прошел слух, что NCSA-сервер также будет распространяться на коммерческой основе. В результате был разработан Apachie, который по словам его авторов будет freeware, и реализует новые дополнения к протоколу HTTP, связанные с защитой от несанкционированного доступа, которые предложены группой по разработке этого протокола и реализуются практически во всех коммерческих серверах.
3 шага для начала работы в YCLIENTS
База данных HTML-документов — это часть файловой системы, которая содержит текстовые файлы в формате HTML и связанные с ними графику и другие ресурсы. Особое внимание хотелось бы обратить на документы, содержащие элементы экранных форм. Эти документы реально обеспечивают доступ к внешнему программному обеспечению.
Прикладное программное обеспечение, работающее с сервером, можно разделить на программы-шлюзы и прочие. Шлюзы — это программы, обеспечивающие взаимодействие сервера с серверами других протоколов, например ftp, или с распределенными на сети серверами Oracle. Прочие программы — это программы, принимающие данные от сервера и выполняющие какие-либо действия: получение текущей даты, реализацию графических ссылок, доступ к локальным базам данных или просто расчеты.
Завершая обсуждение архитектуры World Wide Web хотелось бы еще раз подчеркнуть, что ее компоненты существуют практически для всех типов компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в Internet, может создать свой WWW-сервер, или, по крайней мере, посмотреть информацию с других серверов.
Основные компоненты технологии World Wide Web
- язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);
- универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);
- протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).
- универсальный интерфейс шлюзов CGI (Common Gateway Interface).
В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем, т.е. способов отображения гипертекстовой информации и навигации в гипертекстовой сети. Значение гипертекстовой технологии сравнивали со значением книгопечатания. Утверждалось, что лист бумаги и компьютерные средства отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма представления информации тоже должна отличаться. Наиболее эффективной формой организации гипертекста были признаны контекстные гипертекстовые ссылки, а кроме того было признано деление на ссылки, ассоциированные со всем документом в целом и отдельными его частями.
Самым простым способом создания любого документа является его набивка в текстовом редакторе. Опыт создания хорошо размеченных для последующего отображения документов в CERN€е был — трудно найти физика, который не пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал стандарт языка разметки — Standard Generalised Markup Language (SGML).
Следует также принять во внимание, что согласно своим предложениям Т. Бернерс-Ли предполагал объединить в единую систему имеющиеся информационные ресурсы CERN, и первыми демонстрационными системами должны были стать системы для NeXT и VAX/VMS.
Обычно гипертекстовые системы имеют специальные программные средства построения гипертекстовых связей. Сами гипертекстовые ссылки хранятся в специальных форматах или даже составляют специальные файлы. Такой подход хорош для локальной системы, но не для распределенной на множестве различных компьютерных платформ.
В HTML гипертекстовые ссылки встроены в тело документа и хранятся как его часть. Часто в системах применяют специальные форматы хранения данных для повышения эффективности доступа. В WWW документы — это обычные ASCII- файлы, которые можно подготовить в любом текстовом редакторе. Таким образом, проблема создания гипертекстовой базы данных была решена чрезвычайно просто.
В качестве базы для разработки языка гипертекстовой разметки был выбран SGML (Standard Generalised Markup Language). Следуя академическим традициям, Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в терминах формы Бекуса-Наура). Естественно, что в HTML были реализованы все разметки, связанные с выделением параграфов, шрифтов, стилей и т. п., т.к. реализация для NeXT подразумевала графический интерфейс. Важным компонентом языка стало описание встроенных и ассоциированных гипертекстовых ссылок, встроенной графики и обеспечение возможности поиска по ключевым словам.
С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За это время произошло довольно серьезное развитие языка. Почти вдвое увеличилось число элементов разметки, оформление документов все больше приближается к оформлению качественных печатных изданий, развиваются средства описания не текстовых информационных ресурсов и способы взаимодействия с прикладным программным обеспечением. Совершенствуется механизм разработки типовых стилей. Фактически, в настоящее время HTML развивается в сторону создания стандартного языка разработки интерфейсов как локальных, так и распределенных систем.
Вторым краеугольным камнем WWW стала универсальная форма адресации информационных ресурсов. Universal Resource Identification (URI) представляет собой довольно стройную систему, учитывающую опыт адресации и идентификации e-mail, Gopher, WAIS, telnet, ftp и т. п. Но реально из всего, что описано в URI, для организации баз данных в WWW требуется только Universal Resource Locator (URL).
Без наличия этой спецификации вся мощь HTML оказалась бы бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к распределенным ресурсам сети. В URL можно адресовать как другие гипертекстовые документы формата HTML, так и ресурсы e-mail, telnet, ftp, Gopher, WAIS, например. Различные интерфейсные программы по разному осуществляют доступ к этим ресурсам.
Одни, как например Netscape, сами способны поддерживать взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW, другие, как например Chimera, вызывают для этой цели внешние программы. Однако, даже в первом случае, базовой формой представления отображаемой информации является HTML, а ссылки на другие ресурсы имеют форму URL. Следует отметить, что программы обработки электронной почты в формате MIME также имеют возможность отображать документы, представленные в формате HTML. Для этой цели в MIME зарезервирован тип «text/html».
Третьим в нашем списке стоит протокол обмена данными в World Wide Web — HyperText Transfer Protocol . Данный протокол предназначен для обмена гипертекстовыми документами и учитывает специфику такого обмена. Так в процессе взаимодействия, клиент может получить новый адрес ресурса на сети (relocation), запросить встроенную графику, принять и передать параметры и т. п. Управление в HTTP реализовано в виде ASCII-команд. Реально разработчик гипертекстовой базы данных сталкивается с элементами протокола только при использовании внешних расчетных программ или при доступе к внешним относительно WWW информационным ресурсам, например базам данных.
Последняя составляющая технологии WWW — это уже плод работы группы NCSA — спецификация Common Gateway Interface . CGI была специально разработана для расширения возможностей WWW за счет подключения всевозможного внешнего программного обеспечения. Такой подход логично продолжал принцип публичности и простоты разработки и наращивания возможностей WWW.
Если команда CERN предложила простой и быстрый способ разработки баз данных, то NCSA развила этот принцип на разработку программных средств. Надо заметить, что в общедоступной библиотеке CERN были модули, позволяющие программистам подключать свои программы к серверу HTTP, но это требовало использования этой библиотеки.
Предложенный и описанный в CGI способ подключения не требовал дополнительных библиотек и буквально ошеломлял своей простотой. Сервер взаимодействовал с программами через стандартные потоки ввода/вывода, что упрощает программирование до предела. При реализации CGI чрезвычайно важное место заняли методы доступа, описанные в HTTP. И хотя реально используются только два из них (GET и POST), опыт развития HTML показывает, что сообщество WWW ждет развития и CGI по мере усложнения задач, в которых будет использоваться WWW-технология.
Источник: lib.ru
Что такое WWW?
Вбивая в адресной строке своего браузера «www» пользователь часто не осознаёт точного значения этого термина и его сопутствующих коннотаций. При этом сам термин «www» (аббревиатура от «World Wide Web» – всемирная паутина) имеет замечательную историю, которая пишется и по сей день. В этой статье я расскажу, что такое WWW, познакомлю читателя с историей данного понятия, а также опишу каркас, на котором сегодня работает всемирная паутина.
Определение WWW
Для начала стоит определиться с тем, что это такое WWW. Как уже упоминалось выше, термин «WWW» является аббревиатурой от World Wide Web (в переводе с английского — «всемирная паутина»). Сегодня WWW – это совокупность цифровых источников информации, оформленных в виде гипертекстовых документов (их ещё называют веб-страницами).
Термин часто отождествляют с термином «Интернет», что в корне не верно. Если WWW (всемирная паутина) – это, по сути, коллекция веб-страниц, то «Интернет» — это огромное число компьютеров, объединённых сетью воедино. Хотя эта сеть компьютеров и обеспечивает работу WWW, тем не менее, именно эти, соединённые воедино, компьютеры и называются «Интернетом».
Потому будет правильнее говорить не «поищу что-либо в Интернете», а «поищу что-либо во всемирной паутине».
Структура WWW
Понимание того, что значит WWW, было бы неполным без понимания её структуры и принципов функционирования. В основе WWW лежит функционирование множества веб-серверов (программ, запускаемых на компьютере и использующих протокол HTTP для обмена данными). Обычно веб-сервер получает по сети запрос на какой-либо файл, находит его у себя и отправляет по адресу, указанному в запросе, причём некоторые серверы могут создавать нужный файл (документ), что называется, «на ходу».
Для просмотра информации от веб-сервера пользователь использует специальное программное обеспечение под названием «веб-браузер», который позволяет корректно отображать гипертекст (специально размеченный текст, часто с использованием гиперссылок).
Сам же гипертекст создаётся с использованием HTML – специального языка разметки гипертекста. Файлы на основе HTML является основой «всемирной паутины», а когда такой файл помещается на веб-сервер он уже называется «веб-страницей». Система веб-страниц называется «сайтом», «веб-сайтом» или «веб-ресурсом».
Что такое WWW v.2.0
Стоит дополнить понятие о том, что означает WWW, информацией о так называемой «второй версии WWW» (WEB 2.0). По сути, этот термин означает активную вовлеченность простого пользователя в создание контента и его распространение (блоги, социальные сети и так далее). При этом технологии создания веб-страниц в Web 2.0 по сравнению с Web 1.0 изменились не существенно.
Заключение
Выше я описал, что такое WWW, какова его история и особенности функционирования. Зародившись в конце 80х годов XX века как инструмент для обмена данных между учёными-физиками, WWW прошла несколько этапов своего развития, и ныне связывает воедино миллиарды человек по всему миру. При этом её возможности далеко не исчерпаны, и нас ждёт завораживающее будущее, построенное на сети Интернет и функционале. Не пропустите его.
Источник: sdelaicomp.ru
Что такое www в адресе сайта?
В адресной строке любого сайта перед основным доменом может быть приставка www.
Например, у сайта example.com может существовать версия www.example.com. Поисковой системой сайты будут восприниматься, как отдельные сайты со своей историей. По сути, это ссылки на разные домены. При этом по двум ссылкам откроется тот же самый сайт.
Например, у сайта example.com может существовать версия www.example.com. Поисковой системой сайты будут восприниматься, как отдельные сайты со своей историей. По сути, это ссылки на разные домены. При этом по двум ссылкам откроется тот же самый сайт.
Прежде чем начинать размещать внешние ссылки на ресурс, следует понять, в чем различие ссылок с префиксом www и без него.
Разработка SEO-сайтов с пожизненной гарантиейСоздаем невероятные SEO-сайты, оптимизированные по 69 параметрам уже на этапе разработки
Использовать ли www в адресной строке перед доменом?
-
Префикс www – это аббревиатура, которая означает world wide web – или информационная система, предоставляющая доступ к текстовой информации по протоколу http, по-русски – всемирная паутина. Много лет назад то, что мы называем интернетом, было лишь малой его частью. Сервера были маломощными, поэтому приходилось размещать, например:
- сервер Apache на одном суперкомпьютере;
- почтовый сервер – на другой машине;
- сервер FTP на третьей машине.
-
Имена серверам давали по названиям компьютеров, на которых они располагались. Учитывая предоставляемый сервис, выглядело это так:
- www.домен.com,
- mail.домен.com,
- ftp.домен.com.
С развитием технологий надобность в www отпала, адреса стали короче, людям стало удобнее не набирать префикс, а набирать сразу адрес сайта. Сегодня префикс www стал анахронизмом и мог бы исчезнуть.
Однако до сих пор многие каталоги автоматически добавляют к имени своего сайта приставку www. Немало пользователей набирают в поиске название сайта с www.
Получается что www.домен.com и домен.com технически считаются разными ресурсами, причем домен с www считается родственным домену третьего уровня вида sub.домен.com. Но при этом www.домен.com и домен.com указывают на одну и ту же страницу, в отличие от домена третьего уровня sub.домен.com.
Для продвижения сайта это может стать серьезной проблемой. Многие поисковики воспримут домен.com и www.домен.com, как разные ресурсы. Все внешние ссылки на сайт разделятся на две части в зависимости от того, в каком виде поставили ссылку (с www или без). Владелец лишится некоторых внешних ссылок на ресурс, что приведет к понижению рейтинга, и пользователей придет меньше, чем могло бы.
Серьезные поисковые роботы борются за уникальный контент и не индексируют страницы-двойники (и даже сайты).
Как этого избежать?
Необходимо использовать способ переадресации одного псевдонима другому (что, по сути, является переадресацией самому себе). Такой способ называется Редиректом.
Для того чтобы правильно продвигать сайт, необходимо настроить 301 Редирект с неглавного зеркала на главное зеркало. А какое зеркало – главное, с www или без www, вы можете решить самостоятельно.
Например, если вы наберете адерс нашего сайта с www — www.advegital.com — вас автоматически перебросит на адрес без www — advegital.com . Потому что на нашем сайте настроен 301 редирект с www на адрес без www. Мы считаем, что лучше в качестве основного использовать адрес без www — зачем тратить время на лишние три буквы?
Для поисковых систем оба адреса равнозначны, но критично, чтобы главное зеркало было одно. Тогда сайт будет ранжироваться правильно.
Нужен настоящий SEO-сайт и интернет-реклама ? Пишите, звоните:
Наша почта:
Единая справочная: 8 (843) 2-588-132
WhatsApp: +7 (960) 048 81 32
Оставить заявку
Источник: advegital.com