что такое world wide web

Что такое world wide web

Всеми́рная паути́на (англ. World Wide Web ) — распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом. Для загрузки и просмотра web-страниц используются специальные программы – браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же. Для обозначения Всемирной паутины также используют слово веб (англ. web ) и «WWW».

Содержание

Структура и принципы Всемирной паутины

что такое world wide web. Смотреть фото что такое world wide web. Смотреть картинку что такое world wide web. Картинка про что такое world wide web. Фото что такое world wide web

Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенных по всему миру. Веб-сервер является программой, запускаемой на подключённом к сети компьютере и использующей протокол жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически распределять ресурсы в ответ на HTTP-запрос. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов англ. Uniform Resource Identifier ). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов англ. Uniform Resource Locator ). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён англ. Domain Name System ) — доменное имя (или непосредственно

Для обзора информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа — веб-браузер. Основная функция веб-браузера — отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссы́лки. Большая часть информации в Вебе представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык англ. HyperText Markup Language ), язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, ма́стера по разметке называют веб-мастером или вебмастером (без дефиса). После HTML-разметки получившийся гипертекст помещается в файл, такой HTML-файл является самым распространённым ресурсом Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт. В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки веба основаны на технологии URL.

Технологии Всемирной паутины

В целом можно заключить, что Всемирная паутина стоит на «трёх китах»: HTTP, HTML и URL. Хотя в последнее время HTML начал несколько сдавать свои позиции и уступать их более современным технологиям разметки: XML. XML (англ. eXtensible Markup Language ) позиционируется как фундамент для других языков разметки. Для улучшения визуального восприятия веба стала широко применяться технология CSS, которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, — система обозначения ресурсов англ. Uniform Resource Name ).

Популярная концепция развития Всемирной паутины — создание семантической паутины. Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина — это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования. Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework ), который основан на синтаксисе англ. RDF Schema ) и англ. Protocol And RDF Query Language ) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.

История Всемирной паутины

В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли (совместно с его помощниками) были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год.

В рамках проекта Бернерс-Ли написал первый в мире веб-сервер «httpd» и первый в мире гипертекстовый веб-браузер, называвшийся «WorldWideWeb». Этот браузер был одновременно и англ. What You See Is What You Get — что видишь, то и получишь), его разработка была начата в октябре 1990 года, а закончена в декабре того же года. Программа работала в среде «NeXTStep» и начала распространяться по Интернету летом 1991 года.

Первый в мире веб-сайт Бернерс-Ли создал по адресу http://info.cern.ch/, теперь сайт хранится в архиве. Этот сайт появился он-лайн в Интернете 6 августа 1991 года. На этом сайте описывалось, что такое Всемирная паутина, как установить веб-сервер, как использовать браузер и т. п. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.

что такое world wide web. Смотреть фото что такое world wide web. Смотреть картинку что такое world wide web. Картинка про что такое world wide web. Фото что такое world wide web

На первой фотографии во Всемирной паутине была изображена пародийная филк-группа Les Horribles Cernettes. [1] Тим Бернес-Ли попросил их отсканированные снимки и лидера группы после CERN Hardronic Festival.

И всё же теоретические основы веба были заложены гораздо раньше Бернерса-Ли. Ещё в 1945 году Ванна́вер Буш разработал концепцию «Memex» — вспомогательных механических средств «расширения человеческой памяти». Memex — это устройство, в котором человек хранит все свои книги и записи (а в идеале — и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Оно является расширением и дополнением памяти человека. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути ко Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).

С 1994 года основную работу по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (англ. World Wide Web Consortium, W3C ), основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. Данный Консорциум — организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: «Полностью раскрыть потенциал Всемирной паутины путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». Две другие важнейшие задачи Консорциума — обеспечить полную «интернационализа́цию Сети́» и сделать Сеть доступной для людей с ограниченными возможностями.

W3C разрабатывает для Интернета единые принципы и стандарты (называемые «Рекоменда́циями», англ. W3C Recommendations ), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все Рекомендации Консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.

Перспективы развития Всемирной паутины

В настоящее время наметились две тенденции в развитии Всемирной паутины: семантическая паутина и социальная паутина. Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных. Социальная паутина полагается на работу по упорядочиванию имеющейся в Паутине информации, выполняемую самими пользователями Паутины. В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (OPML, микроформаты XHTML).

Существует также популярное понятие Web 2.0, обобщающее сразу несколько направлений развития Всемирной паутины.

Способы активного отображения информации во Всемирной паутине

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно — тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

Следует отметить, что это деление весьма условно. Так, скажем, блог или гостевую книгу можно рассматривать как частный случай форума, который, в свою очередь, является частным случаем системы управления контентом. Обычно разница проявляется в назначении, подходе и позиционировании того или иного продукта.

Отчасти информация с сайтов может также быть доступна через речь. В Индии уже началось [2] тестирование системы, делающей текстовое содержимое страниц доступным даже для людей, не умеющих читать и писать.

Источник

что такое world wide web. Смотреть фото что такое world wide web. Смотреть картинку что такое world wide web. Картинка про что такое world wide web. Фото что такое world wide webmasterok

Мастерок.жж.рф

Хочу все знать

Сегодня исполняется 25 лет с того дня, как английский физик и инженер Тим Бернерс-Ли сформулировал идею Всемирной паутины (World Wide Web, WWW), положив начало интернет-коммуникации в том виде, какой мы ее знаем сейчас.

Всего за четверть века интернет проник практически во все сферы человеческой деятельности и стал неотъемлемой частью повседневной жизни людей, поэтому не будет преувеличением сказать, что изобретение Всемирной паутины является одним из поворотных моментов в истории человечества.

Тима Бернерса-Ли иногда называют создателем интернета, но это не вполне верно. Интернет как систему протоколов, обеспечивающих передачу пакетов данных между объединенными в сеть компьютерами, разработали сотрудники Агентства по перспективным оборонным научно-исследовательским разработкам США (DARPA) Винтон Серф и Роберт Кан в конце 60-х — начале 70-х гг. прошлого века. Бернерс-Ли предложил использовать возможности компьютерных сетей, а также концепцию гипертекста, выдвинутую в 1965г. философом и социологом Теодором Нельсоном, для создания принципиально новой системы организации информации и доступа к ней.

На протяжении 80-х гг. Тим Бернерс-Ли работал в Европейском центре ядерных исследований (ЦЕРН). Несмотря на то, что сотрудники ЦЕРНа имели возможность пользоваться самыми современными на тот момент компьютерными технологиями, обилие сведений обо всех проектах и экспериментальных исследованиях в Центре существенно затрудняло поиск научной информации, которая могла понадобиться исследователям. Ситуация усугублялась также и тем, что на разных компьютерах были установлены различные операционные системы, и перенос данных с одного компьютера на другой был сопряжен со значительными сложностями или вовсе невозможен по причине несовместимости файловых форматов.

12 марта 1989г. Тим Бернерс-Ли представил руководству ЦЕРНа проект единой системы организации, хранения и общего доступа к информации, которая должна была решить проблему обмена знаниями и опытом между сотрудниками Центра. Тим Бернерс-Ли отмечал в проекте, что хотя официально ЦЕРН имеет иерархическую структуру — подразделения состоят из рабочих групп, группы из секций и т.д., — исследователи могут общаться между собой напрямую, если им это необходимо. Аналогичным образом следовало наладить и доступ к информации: если индивидуальные компьютеры хранили данные в виде иерархии, то в сети (условное название, которое Бернерс-Ли изначально дал своему проекту, было Mesh, то есть «сеть») организующим принципом должна была стать система перекрестных ссылок, не ограниченная рамками какой бы то ни было жестко заданной структуры. Проблему различий между операционными системами на разных компьютерах Бернерс-Ли предложил решить следующим образом: на пользовательских компьютерах («клиентах») предполагалась установка кроссплатформенных программ-браузеров, обеспечивающих доступ к компьютеру-серверу, где хранится гипертекстовая информация.

Таким образом, в проекте 1989г. были сформулированы основополагающие принципы работы Всемирной паутины, не претерпевшие существенных изменений и по сей день. Более того, уже в первоначальном тексте проекта Тим Бернерс-Ли отмечал, что в отношении проблемы накопления, хранения и организации информации ЦЕРН представляет собой миниатюрную модель мира, каким он должен стать в ближайшем будущем. И действительно, его предсказания полностью оправдались.

Проект был одобрен, и в течение 1989-1991гг. Бернерс-Ли вместе с коллегами создали стандарты протокола передачи гипертекста (Hypertext Transfer Protocol, HTTP) и универсальный язык разметки (Hypertext Markup Language, HTML), а также запустили первый в мире веб-сервер. В 1990г. Тим Бернерс-Ли придумал и термин «Всемирная паутина» — так был назван написанный им веб-браузер (название писалось слитно, WorldWideWeb).

Но заслуга Бернерса-Ли не только в создании и последующем претворении в жизнь принципов организации Всемирной паутины. В первой половине 90-х гг. он, возглавляя Консорциум Всемирной паутины (World Wide Web Consortium), приложил значительные усилия для того, чтобы убедить весь остальной мир использовать единые стандарты интернет-коммуникации. Поскольку Всемирная паутина с самого начала представляла собой открытый, некоммерческий проект, отсутствие стандартизации и унификации могло привести к ее распаду на множество частных «интернетов», несовместимых друг с другом.

На посту главы Консорциума Всемирной паутины Тим Бернерс-Ли продолжает отстаивать те идеалы, которые легли в основу проекта 1989г.: Паутина должна быть в первую очередь средой, в которой каждый может поделиться знаниями с другими. Кроме того, по убеждению Бернерса-Ли, компьютеры могут не только хранить и передавать информацию, но и более эффективно ее обрабатывать. Этому посвящен проект семантической паутины — надстройки над Всемирной паутиной, обеспечивающей машинную обработку данных. Разработка семантической паутины должна стать шагом на пути к созданию искусственного интеллекта.

Кликабельно

Двадцать пять лет спустя: предварительные итоги

Оценить ту роль, которую играет изобретение Бернерса-Ли в жизни современного человека, каждый может с помощью простого мысленного эксперимента, представив себе, как выглядел бы типичный рабочий или выходной день без доступа к интернету. Так, 53% проживающих в США респондентов, которые были опрошены в этом году в рамках исследования Pew Research Center’s Internet & American Life Project, заявили, что с большим трудом могли бы отказаться от использования Всемирной паутины. Для сравнения, в 2006г. такой ответ дали только 38% опрошенных американцев.

Между тем сам факт повсеместного проникновения и массового использования Всемирной паутины еще не дает ответа на вопрос, чем она является по своей сути. Паутина существует благодаря компьютерным технологиям, однако не это является ее отличительной особенностью. В соответствии с исходным замыслом, это средство общения прежде всего на человеческом языке. Не случайно из всех типов гипермедиа на первом плане находится именно гипертекст, т.е. система текстов, переплетенных перекрестными гиперссылками.

По сравнению с традиционными способами письменного общения, интернет позволяет обмениваться текстами с фантастической скоростью: электронное письмо доходит до адресата в любой точке мира практически мгновенно. Безусловно, подобный скачок является революцией в коммуникации, но и это не отличительная особенность Всемирной паутины. Электронная почта предшествует WWW (самые ранние разработки относятся ко второй половине 60-х — началу 70-х гг.) и, за исключением скорости передачи, в существенных чертах не отличается от почты бумажной. Конечно, современное электронное письмо может стать гипертекстом или гипермедиа благодаря включению гиперссылок, изображений, звуко- и видеозаписей, но происходит это благодаря тому, что сегодня электронная почта интегрирована в контекст Всемирной паутины.

Притом что гипертекстовый характер Паутины лежит на поверхности, это свойство далеко не сразу смогло проявить себя в полной мере. На протяжении достаточно длительного времени после того, как Всемирная паутина стала массовым явлением, многие пользователи были ограничены ролью адресата, не имея возможности самим участвовать в создании гипертекстовых сообщений. В лучшем случае пользователи заводили личные страницы на платформе GeoCities и подобных сервисов, но они не могли конкурировать с крупными веб-сайтами по популярности и количеству посетителей. Кроме того, для создания собственной веб-страницы требовалось хотя бы минимальное знакомство с языком HTML, что также сужало круг потенциальных авторов. Такое положение вещей шло в разрез с замыслом создателя Всемирной паутины, поскольку большинству участников интернет-коммуникации отводилась роль пассивной аудитории, не имеющей возможности сказать свое слово.

Ситуация переменилась благодаря феномену, получившему название «Веб 2.0″ (Web 2.0). Это понятие, введенное в широкий обиход тезкой Бернерса-Ли Тимом О’Рейлли, обозначает такую организацию веб-сайтов, которая позволяет пользователям самим создавать и редактировать содержание сайтов. К Web 2.0 относится «Википедия» и другие энциклопедии в формате Wiki, а также прочие сайты, позволяющие пользователям редактировать свое содержание, а также блоги и социальные сети. Многие подобные сайты оснащены графическим пользовательским интерфейсом, для их редактирования не требуется знания языка HTML, в некоторых случаях используется более упрощенный язык форматирования.

Интересно, что Тим Бернерс-Ли в интервью, опубликованном на сайте IBM developerWorks, скептически отнесся к понятию Web 2.0, подчеркнув, что существенного различия между Web 1.0 и Web 2.0 нет, так как Всемирная паутина с самого начала была задумана именно как среда общения, где каждый пользователь может внести свой вклад и поделиться информацией. Само явление, однако, он оценил положительно, хотя и отметил, что предпочел бы более широкое распространение знания HTML.

Кликабельно 1280 рх

На примере «Википедии» хорошо видно, какие возможности общения дает гипертекстовый формат. Во-первых, это коллективное авторство письменного текста, причем такое, когда каждый из потенциально неограниченного числа соавторов может выступать в роли как автора своего фрагмента, так и редактора всего получившегося текста целиком. Такая форма совместного редактирования текстов до появления Всемирной паутины была в лучшем случае редким исключением, если вообще встречалась. Во-вторых, тексты никогда не бывают полностью завершенными, поскольку всегда существует возможность внесения новой правки. Эту особенность тоже предвидел в своем проекте Бернерс-Ли, говоря о том, что гипертекст может содержать ссылки на любую информацию — и на готовые публикации, и на черновики.

В-третьих, «Википедия» и подобные сайты показали способность пользователей к стихийной самоорганизации. Концепция «свободной энциклопедии, которую может редактировать каждый,» поначалу вызывала у многих скептицизм и опасения, что содержание такого проекта не достигнет должного уровня качества. Действительно, становление «Википедии» сопровождалось и атаками интернет-вандалов, и случаями включения в статьи недостоверной и непроверенной информации. Тем не менее со временем «Википедия» наладила эффективную систему контроля качества и выработала стандарты работы редакторов. В этом процессе также сыграл немаловажную роль гипертекст: наличие ссылок на достоверные источники является одним из главных критериев, по которым оценивается качество той или иной статьи.

Говоря об общении во Всемирной паутине, нельзя не упомянуть и предшествующий эпохе Web 2.0 тип сайтов, позволяющих добавлять пользовательский контент. Речь идет о веб-форумах. Публичный характер общения, на который намекает само название этого типа сайтов, позволяет, например, осуществлять совместную работу нескольких человек над одним проектом, а также дает возможность индивидуальным пользователям обращаться за советом или решением своей проблемы к «коллективному разуму». Открытый доступ к сообщениям на форуме означает, что однажды найденное решение может впоследствии пригодиться другим пользователям. Такая форма накопления и сохранения практического опыта полностью совпадает с описанием проекта 1989г. Обращение за помощью ко «всему интернету» стало настолько популярным среди пользователей способом решения проблем, что в Паутине появились специализированные сайты вопросов и ответов, такие как WikiAnswers.

Прошедшие двадцать пять лет наглядно показали, что создание и использование гипертекстов является естественной, органичной для человека деятельностью, а не уделом узкой группы специалистов по электронным коммуникациям. Вместе с тем глава Консорциума Всемирной паутины уверен, что в полной мере реализовать потенциал его изобретения человечеству еще только предстоит. И решающую роль в этом, считает Тим Бернерс-Ли, сыграет не технический прогресс, а развитие общества.

Источник

История WWW¶

Интернет — это глобальная компьютерная сеть, объединяющая сотни миллионов компьютеров в общее информационное пространство. Интернет представляет свою инфраструктуру для прикладных сервисов различного назначения, самым популярным из которых является Всемирная Паутина – World Wide Web (www).

World Wide Web (www, web, рус.: веб, Всемирная Паутина) — распределенная информационная система, предоставляющая доступ к гипертекстовым документам по протоколу HTTP.

WWW — сетевая технология прикладного уровня стека TCP/IP, построенная на клиент-серверной архитектуре и использующая инфраструктуру Интернет для взаимодействия между сервером и клиентом (рис. 1).

Серверы www (веб-серверы) — это хранилища гипертекстовой (в общем случае) информации, управляемые специальным программным обеспечением.

Документы, представленные в виде гипертекста называются веб-страницами. Несколько веб-страниц, объединенных общей тематикой, оформлением, связанных гипертекстовыми ссылками и обычно находящихся на одном и том же веб-сервере, называются веб-сайтом.

Для загрузки и просмотра информации с веб-сайтов используются специальные программы — браузеры, способные обрабатывать гипертектовую разметку и отображать содержимое веб-страниц.

что такое world wide web. Смотреть фото что такое world wide web. Смотреть картинку что такое world wide web. Картинка про что такое world wide web. Фото что такое world wide web

Рис. 1. Архитектура сервиса WWW

В основе www — взаимодействие между веб-сервером и браузерами по протоколу HTTP (HyperText Transfer Protocol). Веб-сервер — это программа, запущенная на сетевом компьютере и ожидающая клиентские запросы по протоколу HTTP. Браузер может обратиться к веб-серверу по доменному имени или по ip-адресу, передавая в запросе идентификатор требуемого ресурса. Получив запрос от клиента, сервер находит соответствующий ресурс на локальном устройстве хранения и отправляет его как ответ. Браузер принимает ответ и обрабатывает его соответствующим образом, в зависимости от типа ресурса (отображает гипертекст, показывает изображения, сохраняет полученные файлы и т.п.).

Основной тип ресурсов Всемирной паутины — гипертекстовые страницы. Гипертекст — это обычный текст, размеченный специальными управляющими конструкциями — тегами. Браузер считывает теги и интерпретирует их как команды форматирования при выводе информации. Теги описывают структуру документа, а специальные теги, якоря и гиперссылки, позволяют установить связи между веб-страницами и перемещаться как внутри веб-сайта, так и между сайтами.

Т. Дж. Бернерс-Ли — «отец» Всемирной паутины

что такое world wide web. Смотреть фото что такое world wide web. Смотреть картинку что такое world wide web. Картинка про что такое world wide web. Фото что такое world wide web

Сэр Тимоти Джон Бернерс-Ли — британский учёный-физик, изобретатель Всемирной паутины (совместно с Робертом Кайо), автор URI, HTTP и HTML. Действующий глава Консорциума Всемирной паутины (W3C). Автор концепции семантической паутины и множества других разработок в области информационных технологий. 16 июля 2004 года Королева Великобритании Елизавета II произвела Тима Бернерса-Ли в Рыцари-Командоры за «службу во благо глобального развития Интернета».

Компоненты WWW¶

Функционирование сервиса обеспечивается четырьмя составляющими:

Адресация веб-ресурсов. URL, URN, URI

Для доступа к любым сетевым ресурсам необходимо знать где они размещены и как к ним можно обратиться. Во Всемирной паутине для обращения к веб-документам изначально используется стандартизованная схема адресации и идентификации, учитывающую опыт адресации и идентификации таких сетевых сервисов, как e-mail, telnet, ftp и т.п. — URL, Uniform Resource Locator.

URL (RFC 1738) — унифицированный локатор (указатель) ресурсов, стандартизированный способ записи адреса ресурса в www и сети Интернет. Адрес URL имеет гибкую и расширяемую структуру для максимально естественного указания местонахождения ресурсов в сети. Для записи адреса используется ограниченный набор символов ASCII. Общий вид адреса можно представить так:

В августе 2002 года RFC 3305 анонсировал устаревание URL в пользу URI (Uniform Resource Identifier), еще более гибкого способа адресации, вобравшего возможности как URL, так и URN (Uniform Resource Name, унифицированное имя ресурса). URI позволяет не только указавать местонахождение ресурса (как URL), но и идентифицировать его в заданном пространстве имен (как URN). Если в URI не указывать местонахождение, то с его помощью можно описывать ресурсы, которые не могут быть получены непосредственно из Интернета (автомобили, персоны и т.п.). Текущая структура и синтаксис URI регулируется стандартом RFC 3986, вышедшим в январе 2005 года.

Язык гипертекстовой разметки HTML¶

HTML ( `HyperText Markup Language <>`_ ) — стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц созданы при помощи языка HTML. Язык HTML интерпретируется браузером и отображается в виде документа, в удобной для человека форме. HTML является приложением SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879.

HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. Для этого он представляет небольшой (сравнительно) набор структурных и семантических элементов — тегов. С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен единообразно воспроизводиться на различном оборудовании (монитор ПК, экран органайзера, ограниченный по размерам экран мобильного телефона, медиа-проектор). Однако современное применение HTML очень далеко от его изначальной задачи. Со временем основная идея платформонезависимости языка HTML стала жертвой коммерциализации www и потребностей в мультимедийном и графическом оформлении.

Протокол HTTP¶

HTTP ( `HyperText Transfer Protocol <>`_ ) — протокол передачи гипертекста, текущая версия HTTP/1.1 (RFC 2616). Этот протокол изначально был предназначен для обмена гипертекстовыми документами, сейчас его возможности существенно расширены в сторону передачи двоичной информации.

HTTP — типичный клиент-серверный протокол, обмен сообщениями идёт по схеме «запрос-ответ» в виде ASCII-команд. Особенностью протокола HTTP является возможность указать в запросе и ответе способ представления одного и того же ресурса по различным параметрам: формату, кодировке, языку и т. д. Именно благодаря возможности указания способа кодирования сообщения клиент и сервер могут обмениваться двоичными данными, хотя данный протокол является символьно-ориентированным.

HTTP — протокол прикладного уровня, но используется также в качестве «транспорта» для других прикладных протоколов, в первую очередь, основанных на языке XML (SOAP, XML-RPC, SiteMap, RSS и проч.).

Общий шлюзовый интерфейс CGI¶

CGI ( `Common Gateway Interface <>`_ ) — механизм доступа к программам на стороне веб-сервера. Спецификация CGI была разработана для расширения возможностей сервиса www за счет подключения различного внешнего программного обеспечения. При использовании CGI веб-сервер представляет браузеру доступ к исполнимым программам, запускаемым на его (серверной) стороне через стандартные потоки ввода и вывода.

Интерфейс CGI применяется для создания динамических веб-сайтов, например, когда веб-страницы формируются из результатов запроса к базе данных. Сейчас популярность CGI снизилась, т.к. появились более совершенные альтернативные решения (например, модульные расширения веб-серверов).

Программное обеспечение сервиса WWW¶

Веб-сервер — это сетевое приложение, обслуживающее HTTP-запросы от клиентов, обычно веб-браузеров. Веб-сервер принимает запросы и возвращает ответы, обычно вместе с HTML-страницей, изображением, файлом, медиа-потоком или другими данными. Веб-серверы — основа Всемирной паутины. С расширением спектра сетевых сервисов веб-серверы все чаще используются в качестве шлюзов для серверов приложений или сами представляют такие функции (например, Apache Tomcat).

Созданием программного обеспечения веб-серверов занимаются многие разработчики, но наибольшую популярность (по статистике http://netcraft.com) имеют такие программные продукты, как Apache (Apache Software Foundation), IIS (Microsoft), Google Web Server (GWS, Google Inc.) и nginx.

Apache — свободное программное обеспечение, распространяется под совместимой с GPL лицензией. Apache уже многие годы является лидером по распространенности во Всемирной паутине в силу своей надежности, гибкости, масштабируемости и безопасности.

IIS (Internet Information Services) — проприетарный набор серверов для нескольких служб Интернета, разработанный Майкрософт и распространяемый с серверными операционными системами семейства Windows. Основным компонентом IIS является веб-сервер, также поддерживаются протоколы FTP, POP3, SMTP, NNTP.

Google Web Server (GWS) — разработка компании Google на основе веб-сервера Apache. GWS оптимизирован для выполнения приложений сервиса Google Applications.

nginx [engine x] — это HTTP-сервер, совмещенный с кэширующим прокси-сервером. Разработан И. Сысоевым для компании Рамблер. Осенью 2004 года вышел первый публично доступный релиз, сейчас nginx используется на 9-12% веб-серверов. Браузеры

Браузер, веб-обозреватель (web-browser) — клиентское приложение для доступа к веб-серверам по протоколу HTTP и просмотра веб-страниц. Как правило браузеры дополнительно поддерживают и ряд других протоколов (например ftp, file, mms, pop3).

Первые HTTP-клиенты были консольными и работали в текстовом режиме, позволяя читать гипертекст и перемещаться по ссылкам. Сейчас консольные браузеры (такие, как lynx, w3m или links) практически не используются рядовыми посетителями веб-сайтов. Тем не менее такие браузеры весьма полезны для веб-разработчиков, так как позволяют «увидеть» веб-страницу «глазами» поискового робота.

Исторически первым браузером в современном понимании (т.е. с графическим интерфейсом и т.д.) была программа NCSA Mosaic, разработанная Марком Андерисеном и Эриком Бина. Mosaic имел довольно ограниченные возможности, но его открытый исходный код стал основой для многих последующих разработок.

Существует большое число программ-браузеров, но наибольшей популярностью пользуются следующие:

Internet Explorer (IE) — браузер, разработанный компанией Майкрософт и тесно интегрированный c ОС Windows. Платформозависим (поддержка сторонних ОС прекращена, начиная с версии 5). Единственный браузер, напрямую поддерживающий технологию ActiveX. Не полностью совместим со стандартами W3C, в связи с чем требует дополнительных затрат от веб-разработчиков.

Firefox — свободный кроссплатформенный браузер, разрабатываемый Mozilla Foundation и распространяемый под тройной лицензией GPL/LGPL/MPL. В основе браузера — движок Gekko, который изначально создавался для Netscape Communicator. Однако, вместо того, чтобы предоставить все возможности движка в стандартной поставке, Firefox реализует лишь основную его функциональность, предоставляя пользователям возможность модифицировать браузер в соответствии с их требованиями через поддержку расширений (add-ons), тем оформления и плагинов.

Safari — проприетарный браузер, разработаный корпорацией Apple и входящий в состав операционной системы Mac OS X. Бесплатно распространяется для операционных систем семейства Microsoft Windows. В браузере используется уникальный по производительности интерпретатор JavaScript и еще ряд интересных для пользователя решений, которые отсутствуют или не развиты в других браузерах.

Chrome — кроссплатформенный браузер с открытым исходным кодом, разрабатываемый компанией Google. Первая стабильная версия вышла 11 декабря 2008 года. В отличие от многих других браузеров, в Chrome каждая вкладка является отдельным процессом. В случае если процесс обработки содержимого вкладки зависнет, его можно будет завершить без риска потери данных других вкладок. Еще одна особенность — интеллектуальная адресная строка (Omnibox). К возможности автозаполнения она добавляет поисковые функции с учетом популярности сайта, релевантности и пользовательских предпочтений (истории переходов).

Opera — кроссплатформенный многофункциональный веб-браузер, впервые представленный в 1994 году группой исследователей из норвежской компании Telenor. Дальнейшая разработка ведется Opera Software ASA. Этот браузер обладает высокой скоростью работы и совместим с основными стандартами. Отличительными особенностями Opera долгое время являлись многостраничный интерфейс и возможность масштабирования веб-страниц целиком. На разных этапах развития в Opera были интегрированы возможности почтового/новостного клиента, адресной книги, клиента сети BitTorrent, агрегатора RSS, клиента IRC, менеджера закачек, WAP-браузера, а также поддержка виджетов — графические модулей, работающих вне окна браузера. Роботы-«пауки»

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *