|
Основные тенденции и проблемы в области разработки и применения информационных технологий
Основные тенденции и проблемы в области разработки и применения информационных технологий
1.МирОвые информационные ресурсы: классификация и характеристики Информация, также как материя и энергия, -- одно из фундаментальных понятий современной науки. В последние десятилетия существенно возросло значение информации и информационных технологий. Информатизация стала явлением глобальным. Автоматизированные системы делопроизводства, телекоммуникации и обработки данных интегрируются в информационные ресурсы, занимающие все более значимое положение в ряду с другими ресурсами предприятия, отрасли, национальной экономики в целом. Управление информационными ресурсами включает организацию данных и управление процессами их обработки. Управленческая функция здесь включает анализ целей и тенденций организации, планирование капиталовложений в информацию, персонал и системы, анализ окупаемости информации, организацию доступа к ней. Информационный ресурс (ИР) с наиболее общих позиций может быть определен как совокупность накопленной информации, зафиксированной на материальных носителях в любой форме, обеспечивающей ее передачу во времени и пространстве для решения научных, производственных, управленческих и других задач. В соответствии со сложившимися представлениями под информационными ресурсами в дальнейшем будем подразумевать информационные массивы и базы данных (документов) в машиночитаемой (электронной) форме, рассматриваемые совместно с информационными технологиями или сервисами, придающими им необходимую мобильность. Собственно документ содержит текст и сведения о его структуре и стиле, а именно: структуру документа - заглавие, параграфы, оглавление и т.п. (логическая структура), а также абзацы, расположение текста, шрифты (физическая структура); архитектуру содержания - набор графических элементов, выделение определенных слоев, строк и т.п.; коммуникативный формат - способы кодирования объектов, признаков и содержания документов. 2. Мировые информационные сети 2.1 Типы сетей и принципы их работы Сеть -- это объединение компьютеров, связанных друг с другом каким-либо способом (например, проводами или по радио), благодаря чему имеется возможность передавать данные между компьютерами, или узлами сети. Чаще всего с сетями мы сталкиваемся в офисе. Там мы имеем дело с локальной сетью, объединяющей компьютеры, расположенные в одном или соседних зданиях. При переходе от сети небольшого офиса (локальной) к более крупным сетям (глобальным), покрывающим более обширную территорию получают интерсеть - это две и более сетей, объединенных вместе (обычно с помощью маршрутизатора) в одну большую «сеть сетей». Интернет является глобальной сетью, объединяющей множество разнородных локальных компьютерных сетей. Узловые компьютеры этой сети, на которых и хранится в различном виде информация, называются серверами. Зачем люди создают сети, в частности локальные? Наиболее очевидные причины таковы: Связь (например, электронная почта) Общее использование информации (например, баз данных) Общее использование ресурсов (например, сетевых принтеров) Различают следующие типы сетей: сеть коммутации каналов и сеть с пакетной коммутацией. Сеть коммутации каналов используется в телефонных системах. Телефонная сеть создаёт канал связи от одной точки к другой, так что можно проследить путь, по которому голос путешествует из одной точки мира в другую. Такие сети имеют ограниченную пропускную способность и очень чувствительны к разрыву линий. Достоинством же такой системы является то, что при осуществлении звонка линия целиком принадлежит только вам, никто другой не может её у вас отнять. В сети с пакетной коммутацией данные перед передачей разбиваются на части. В результате получается множество отдельных пакетов, или датаграмм, которые доставляются по отдельности через сеть к месту назначения. По прибытии к получателю пакеты повторно собираются в нужном порядке и создают исходное сообщение. В теории пакеты никогда не сбиваются с пути и путешествуют по наикратчайшему маршруту в обход заторов и обрывов. Кроме того, сеть пакетной коммутации может быть очень большой. Большее число пакетов лишь замедлит работу сети, но вы никогда не услышите в ней коротких гудков или сообщения «все каналы заняты». В таких сетях много времени уходит на нумерацию и сортировку пакетов, а также на ожидание подтверждений о получении. Здесь не гарантируется быстрая доставка данных, но сети с коммутацией пакетов устойчивы, просто расширяются и достаточно дешевы. Интернет - это сеть с пакетной коммутацией. Ее отличительной особенностью является высокая надежность. Если выходят из строя некоторые линии связи или компьютеры, то сообщения могут быть переданы по другим каналам, поскольку всегда имеется несколько путей передачи информации. Правила доступа, представления и передачи данных в сети регламентируются специальными протоколами связи. Протокол - это просто согласованный набор правил выполнения чего-либо. В связи протоколом называют набор правил передачи данных между компьютерными системами. Существуют протоколы транспортного, прикладного, сетевого уровней (каждую функцию выполняет соответствующее программное обеспечение). 2.2 Сетевые протоколы связи Сетевым протоколом называется набор правил, которыми пользуются компьютеры в сети для связи друг с другом. Наиболее распространенными протоколами являются IPX (Internet Packet Exchange компании Novell), AppleTalk компании Apple и протокол TCP/IP (Transmission Control Protocol / Internet Protocol - протокол управления передачей / межсетевой протокол). В Интернете используется протокол TCP/IP. Таким образом, Интернетом называется объединение сетей всего мира, в котором все компьютеры «разговаривают» на сетевом протоколе TCP/IP, а также основанные на нём и доступные для использования службы (электронная почта, Web и проч.). Так как Интернет - это сеть с пакетной коммутацией, данные к пользователю могут прийти в любом порядке, могут потеряться по пути и т.д. Протокол TCP/IP занимается решением этих проблем. TCP/IP - это на самом деле группа протоколов, главными из которых являются TCP (Transmission Control Protocol - протокол управления передачей) и IP (Internet Protocol - межсетевой протокол). TCP делает именно то, что обозначает его имя, - управляет передачей данных: отвечает за сборку сообщения, отправку ответов и повторную пересылку данных. Протокол IP отвечает за адрес в Интернете. На его основании определяется, куда надо отправлять пакеты. 2.3 Глобальные сети: калейдоскоп возможностей Как было справедливо замечено еще очень давно, не стоит и пытаться объять необъятное. Это более чем справедливо в отношении компьютерных сетей, масштаб которых уже сейчас трудновообразим. Нигде в мире нет ни единого центра Сети, ни даже списка всех её пользователей и вообще всего, что в ней есть. Сеть - живой организм, она растет и расширяется почти неуправляемо, новообразования в ней возникают (и умирают) явочным порядком, и уследить за всем этим просто невозможно. Посмотрим, какие основные возможности дают нам глобальные сети: · Электронная почта - это то, ради чего многие и становятся пользователями сети. Быстрая доставка (чтобы достичь даже самого отдаленного адресата, письму обычно требуется не более 5-10 минут), возможность рассылки одного письма многим адресатам, все преимущества компьютерной подготовки и обработки писем, низкая цена и высокая надежность - все эти преимущества превратили электронную почту в нечто большее, чем просто заменитель почты «бумажной». Единственный недостаток - то, что пока еще не у каждого жителя Земли есть свой электронный адрес. · Телеконференции - замечательный способ общаться с людьми, быть в курсе новостей, распространять рекламу, собирать информацию, отдыхать и развлекаться. Телеконференции представляют собой своеобразную всепланетную стенгазету, куда каждый может вывесить своё собственное обращение, размышление, вопрос, реплику и т.д., равно как и ознакомиться с мнениями других людей (живущих на разных континентах). Существует огромное количество телеконференций на самые разнообразные темы - бизнес, спорт, искусство, развлечения, программирование и многое др.; масштабы варьируются от компании в несколько человек до многотысячных шумных аудиторий, где не так-то просто отфильтровать нужную информацию. Участие в телеконференции для пользователя с online-доступом сводится к визиту на особый сервер, где он может просматривать списки заголовков свежих статей, читать их и отвечать на заинтересовавшие его сообщения. Удобнее и экономичнее при этом пользоваться специальными программами, позволяющими быстро скачивать с сервера все сообщения из выбранных групп, а просматривать и отвечать на них уже после отключения от сети. Пользователи с почтовым доступом обычно получают сообщения из телеконференций вместе с остальной почтой, хотя для них существует также возможность получать лишь списки заголовков сообщений, заказывая затем отдельно выбранные статьи. · Списки рассылки. Это еще один способ организовать общение единомышленников в сети, у которого есть важное преимущество: список рассылки может завести любой пользователь самостоятельно, для этого ему не нужно договариваться с узлами, распространяющими телеконференции. Достаточно установить на своем компьютере специальную программу, которая хранит список адресов заинтересованных пользователей - подписчиков - и автоматически рассылает им всем поступающие сообщения. Организовав (с помощью той же сети) рекламу нового списка рассылки, его хозяин может почивать на лаврах - дальше система функционирует самостоятельно. Заинтересованный пользователь, послав на компьютер, обслуживающий список, письмо со специальной командой становится подписчиком. После этого он будет получать все сообщения, поступающие на адрес списка, и сможет сам публиковать свои статьи, посылая их на этот адрес. Простота создания списков рассылки привела к тому, что их количество очень велико, а число подписчиков в среднем в списке весьма незначительно (редко превышает 100 человек). Зато темы, которым посвящены списки рассылки, поражают своим разнообразием, а подчас и экзотичностью. · WWW(World Wide Web -- «Всемирная паутина», часто называемая просто Web) -- пожалуй, самое интересное и многообещающее средство организации сетевых информационных ресурсов. Эта система объединяет все Web-серверы сети. Хранящиеся на Web-узлах документы называются Web-страницами. В настоящее время они являются основным и наиболее распространенным типом информационных ресурсов в Интернет. Для многих сам термин «WWW» (или «Web») уже является синонимом слова «Интернет». WWW строится на основе гипертекстового представления информации. Стандарты, на которых строится WWW, состоят из двух основных частей: одна часть устанавливает особый протокол, по которому Web-серверы выдают хранящиеся на них Web-страницы пользователям, а вторая заведует оформлением этих документов, позволяя связывать их с иллюстрациями и друг с другом с помощью гипертекстовых ссылок. WWW-документ может содержать ссылки (как бы «протягивать ниточки»- отсюда и «паутина» в названии) на любые ресурсы, доступные в сети, - чаще всего на другие Web-страницы, которые физически могут располагаться в любой точке планеты. Пользователь работает с WWW, как правило, в графической операционной системе с помощью особой программы-браузера (англ. browser). Получив WWW-документ с сервера, браузер выводит его на экран в готовом оформленном виде, расставляет по своим местам иллюстрации, по желанию пользователя воспроизводит звуковые и видеофрагменты, а главное - оживляет гипертекстовые ссылки в этом документе, сводя процедуру запроса новой страницы с сервера к щелчку мышью по соответствующей ссылке (которая может быть представлена в документе как словом или фразой, так и изображением). Дружественный и интуитивно ясный интерфейс WWW, его захватывающая интерактивность и богатые изобразительные возможности WWW-документов произвели настоящий переворот в Интернете, превратив его из средства общения ученых и развлечения студентов в один из основных инструментов современного бизнеса и в средство массовой информации, образования и развлечения. · Файловые серверы и базы данных. Многие крупные узлы сети являются в то же время и файловыми серверами, т.е. хранилищами разнообразных файлов (программ, текстов, графики), дающими возможность любому желающему искать, просматривать и получать эти файлы через сеть. Кроме того, многие организации - коммерческие фирмы, библиотеки, университеты, государственные учреждения - устраивают на своих узлах сети общедоступные базы данных по соответствующей тематике. Чаще всего эта информация предоставляется в режиме online через интерфейс WWW (для пользователей с почтовым подключением существуют обходные пути получения такой информации - «ftpmail-серверы»). Информационный взрыв в самом WWW привел к появлению особых поисковых серверов - автоматических программ, которые скачивают и заносят в одну большую базу данных содержимое всех документов, до которых они могут добраться на WWW, а затем позволяют всем желающим осуществлять поиск в этой базе по ключевым словам. Поскольку сейчас практически любые ресурсы обязательно имеют WWW-интерфейс, такие поисковые системы являются, безусловно, самым эффективным инструментом для нахождения практически любой информации. · Выход на другие средства связи. Многие из связанных друг с другом сетей предоставляют доступ и к другим средствам связи: телефаксу, телексу, телеграфу, пейджинговой связи и даже обычной (бумажной) почте - и всё это не вставая из-за компьютера! Конечно, послать факс напрямую часто быстрее, но если ваш адресат находится на другом конце планеты, следует воспользоваться услугами особых «шлюзов» - узлов сети, принимающих письма по электронной почте и отправляющих их факсом на заказанный номер. На этом же шлюзе вы можете завести свой почтовый ящик, и приходящие на ваше имя факсы также будут переправляться вам по электронной почте. Фирма берет на себя все заботы по дозвону, качеству связи и т.п. Точно так же, с помощью особых шлюзов, можно отправлять из сети телеграммы и обычные письма. Технологии Интернета вторгаются и в такие традиционные области, как телефония и телевидение. Пропускная способность модемов уже позволяет передавать приличного качества звук, закодированный потоком байтов. Достаточно написать программу, которая будет кодировать и отправлять по каналам Интернета ваш голос с подключенного к компьютеру микрофона - и вы получите полный аналог обычного телефона, позволяющий переговариваться с пользователем Интернета в любой точке мира, платя не больше, чем вы обычно платите за свой online-доступ (что во много десятков раз дешевле любого международного разговора). Появились компании, обеспечивающие связь по этой технологии с жителями крупных городов - причем даже с теми, кто не имеет никакого отношения к Интернету, а имеет лишь телефонный номер. При этом «международная» часть маршрута звонка идет через Интернет, а достигнув узла сети в городе назначения, звук с помощью специального устройства транслируется на нужный номер уже по местной телефонной сети. Этой же технологией пользуются Интернет-радиостанции, чьи передачи может слушать любой пользователь с достаточно скоростным подключением к сети. Те, кто подключен к Интернету не через модем, а через каналы с большей пропускной способностью, могут обмениваться в реальном времени не только звуком, но и изображением (видеотелефон, видеоконференции). Иной вариант объединения возможностей WWW и телевидения - устройство, получившее название «WebTV». Эта приставка к телевизору состоит из модема, микропроцессора и небольшого количества памяти, в которой записана программа-браузер. Подключив это устройство к телефонной розетке и договорившись с фирмой-провайдером о доступе к Интернету, вы получите возможность читать Web-страницы прямо на экране своего телевизора, выбирая гипертекстовые ссылки с помощью пульта дистанционного управления. 3. Как устроен интернет 3.1 Классификация информационных ресурсов, доступных пользователю Интернета Огромное количество разнообразных информационных ресурсов, доступных пользователю Интернета, можно подразделить на следующие классы: «Всемирная паутина» WWW. Электронная почта Система телеконференций (в Интернете она называется Usenet) Хранилища файлов, расположенные на узлах сети (практически все они бесплатны). Различные базы данных и системы поиска информации, такие как Archie и полнотекстовые поисковые системы по содержимому WWW и Usenet. Инструменты выхода на другие средства связи - факсовые, телеграфные, «бумажные» и прочие шлюзы. Весьма практичная (и потому чаще всего платная) возможность. К сожалению, равноправия всех пользователей Интернета по отношению к этим возможностям нет. Если электронная почта и система телеконференций доступны практически каждому, имеющему лишь почтовый адрес в сети, то для работы с библиотеками файлов и поисковыми системами желательно более сложное и дорогое прямое подключение. 3.2 Службы поиска и передачи информации в Интернет: FTP, Gopher, Web Все файлы на всех компьютерах в Интернете представляют вместе некое пространство документов. Как же в нем найти нужную информацию и заполучить её? В Интернете с помощью специальных инструментов или служб ведется поиск, а затем - извлечение информации из какой-либо удаленной системы. Для извлечения информации вы пользуетесь программой, которая находится на вашем локальном компьютере и называется клиентом. Для того, чтобы получить информацию, программа-клиент связывается с удаленной системой, называемой сервером. Программа-клиент запрашивает документ у удаленного сервера, который в ответ выдает клиенту запрашиваемый документ, а тот, в свою очередь, выводит его на экран. Это взаимодействие называется технологией клиент - сервер. Она является основой большинства, если не всех, служб, работающих в Интернете. Преимущество архитектуры клиент-сервер в том, что вычислительная нагрузка распределяется между клиентской машиной -- вашим компьютером -- и удаленным сервером. Это разделение так важно потому, что позволяет серверу общаться с множеством различных типов клиентов. Например, сервер на основе ОС Windows с легкостью может выдавать информацию программе-клиенту, работающей на Macintosh (и наоборот). Кроме того, архитектура клиент-сервер очень легко масштабируется, т.к. пользователи не связаны с какой-либо одной неизменной системой. (Для сравнения: в более ранней хостовой модели вычислений несколько терминалов подключались к одному суперкомпьютеру). На протяжении нескольких лет сменилось несколько схем извлечения информации из Интернета. Первое поколение: FTP (File Transfer Protocol - протокол передачи файлов). FTP - программа позволяет пользователю подключиться к удаленной системе, а затем обменяться с ней файлами. Несмотря на свою эффективность, FTP-программа требовала от пользователей знать в точности, какой именно файл им был нужен. С течением времени появились более удобные FTP-клиенты с графическими простыми интерфейсами, но сам протокол по-прежнему не позволял вести просмотр информации. В связи с тем, что с помощью FTP-программ не так-то просто найти нужный файл, была изобретена служба под названием Archi, позволяющая по ключевым словам найти нужный файл, который затем можно было забрать с помощью FTP. В теории все файлы, которые можно переписать с помощью FTP называются ftp-пространством. Второе поколение: Gopher связано с появлением системы просмотра информации в виде иерархических меню, которая называлась Gopher. Она была разработана в университете штата Минессота как информационная система для студенческого городка. А названа она была в честь университетского талисмана («gopher» с английского «суслик»). В 1991-93 гг. наступил расцвет Gopher. В этой системе используется интерфейс в виде меню, с помощью которого можно получить доступ к огромному количеству преимущественно текстовой информации. Перемещение по gopher-пространству осуществлялось путём выбора нужного пункта меню. Gopher преодолел многие недостатки FTP, предоставив пользователям возможность просматривать большие архивы информации. Но по мере увеличения содержимого в Интернете работа с меню становилась всё труднее. В связи с этим была изобретена программа поиска по gopher-системам, которую в шутку над системой Archie назвали Veronica. Система Veronica позволяет вести поиск gopher-документов по названию или ключевым словам. Доступ к ней осуществляется через то же меню Gopher, которое в отличие от Archie, представляет совершенно независимую от FTP систему. Простая линейная (иерархическая) природа Gopher и отсутствие удовлетворительной поддержки мультимедиа обрекло данную систему на сравнительно короткий период существования. Третье поколение: Web появилась примерно в то же время, что и Gopher. Здесь был реализован метод организации информации в Интернет в виде собрания связанных друг с другом документов, названных гипертекстом или гипермедиа. С помощью Web-браузера, например Mosaic, Netscape Navigator или Internet Explorer пользователи Интернета могли просматривать большие объёмы гипертекста и другой информации нелинейным способом. Web и его интерфейс обладали большей простотой и богатством средств выражения. Популярность Web росла с неимоверной быстротой. В отличие от FTP и Gopher, в Web есть множество каталогов и средств поиска. В их число входят службы Lycos, HotBot, AltaVista, Yahoo и десятки других. Что же отличает Web от других информационных систем Интернета? Ответ: гипермедиа. 3.3 Гипертекст и гипермедиа. Сборник документов WWW Традиционное представление текста в виде книги обычно называется последовательным, или линейным, потому что существует порядок, в котором надо читать текст: вторая страница идет после первой. В данном методе представления информации есть множество преимуществ. Он строится на логической упорядоченности материала. Тем не менее, для работы с большими объёмами информации этот метод не подходит. Существуют различные механизмы, которые могут ускорить поиск нужных сведений в документах. Например, в книге для быстрого перехода к нужной информации используются указатели, содержание и заголовки разделов. Указатель прокладывает путь от идеи к конкретной странице в документе, где она излагается. Ссылки и сноски в тексте могут указывать на другие части документа, имеющие отношение к данному контексту. Непоследовательный способ доступа к информации посредством ссылок, сносок и указателей используется для работы с большими объёмами информации и для её организации. Именно здесь и приходит на помощь гипертекст. Гипертекстовый документ-это электронный документ, содержащий ссылки на другие документы, которые выступают как бы в роли сносок. Например, гипертекстовый документ о коровах может содержать ссылку в слове «молоко», которая, если последовать за ней, приведет вас к другому документу, рассказывающему о типах молока. Гипертекст - это нелинейный метод доступа к информации. Многие находят, что данный способ чем-то похож на то, как люди решают свои проблемы. Гипермедиа - это то же, что и гипертекст, только с более широкими мультимедийными возможностями, например использованием звука и графики. Гипермедиа-документ о коровах, скажем, содержал бы рисунки коров, кнопки, нажав которые можно было бы услышать мычание, а также обычные ссылки, ведущие к другим документам о коровах. Большинство людей знакомы с гипермедиа по компакт-дискам, на которых распространяются электронные энциклопедии. Хотя здесь и есть сходство с Web, но пользователь, путешествуя по ссылкам, ограничен рамками компакт-диска. У Web есть главное преимущество: объём содержащегося в нем материала практически безграничен. Определение: World Wide Web - это сборник гипертекстовых / гипермедиа-документов, которые расположены на серверах по всему Интернету. Документы, расположенные на этих Web-серверах, содержат указатели, которые связывают данные документы друг с другом. Все эти документы вместе образуют единое Web-пространство. 3.4 Язык разметки HTML, его роль в Web HTML (Hypertext Mackup Language) - язык разметки гипертекста, который используется для создания Web-страниц. HTML - всего лишь инструмент, с помощью которого выполняется главная задача - публикация и распространение информации в электронном виде через Интернет Информацией может быть любое сообщение, которое вы желаете передать другому человеку, и оно не обязательно должно быть в форме текста, но и в виде изображений, звуков, видеоролика или в любой другой форме. HTML - лишь часть огромной системы, используемой для передачи Web-страниц. Web включает в себя страницы, созданные с помощью специальных технологий, например HTML, программы, аппаратное обеспечение, Интернет и всё с ним связанное, а также броузеры, которые выводят страницы на экран. Власть создателя Web-документов распространяется только на структуру его страницы. То, с какой скоростью она будет загружаться и как выглядеть на экране компьютера конечного пользователя, зависит от времени и от используемого броузера. В этом заключается самая большая трудность издательского дела в Web. 3.5 Браузеры-программы просмотра WWW-документов Для доступа к Web необходим Web-браузер. Это клиентская программа, с помощью которой просматриваются Web-страницы. В настоящее время существует много различных браузеров под десятки операционных систем. Несмотря на это, на рынке доминируют Internet Explorer компании Microsoft и Navigator/Communicator компании Netscape.(последние новости о браузерах находятся по адресу www.browserwatch.com или www.browsers.com) Принцип работы Web-браузера очень прост. Вспомните принцип клиент-сервер. Web-браузер - это клиентская программа, которая расположена на компьютере пользователя. Web-сервер - это система, которая отвечает на запросы клиента и выдает ему различные страницы с информацией. На первом этапе пользователь запрашивает документы у Web-сервера путем ввода адреса документа в виде унифицированного указателя ресурса (uniform resource locator-URL). URL - это адрес объекта. Он указывает, где расположен объект, как его надо передавать и каким образом задействовать. После того, как было указано, какой документ нужно получить, необходимо определить, где он находится. Для этого браузер обращается к списку доменных имён. Доменным именем называется символьное имя компьютера-узла сети. В то время как символьные имена компьютеров предназначены для облегчения пользователем запоминания адресов и задания ссылок на них, истинным адресом Web-сервера является числовой IP-адрес. Каждый сервер, доступный в сети Интернет, имеет свой уникальный IP-адрес, по которому к нему можно подключиться с помощью протокола TCP/IP. IP-адрес представляет собой последовательность из четырех чисел в диапазоне от 0 до 255, разделенных точками (например, 213.6.17.34). IP-адрес имеют все серверы, а вот символьное имя есть не у всех. Перевод имени в цифровое значение или цифрового значения в имя называется трансляцией адреса. При наборе адреса в браузере за преобразование имени в цифровое значение отвечает сервер доменных имен. На выполнение этой операции уходит некоторое время. Она вообще может закончиться неудачей, если машина вышла из строя, программа преобразования зависла или в наборе адреса была допущена ошибка. Если всё пройдет успешно, будет найдена машина, к которой направится запрос о документе. После того, как нужная машина обнаружена, ей направляется запрос. Общение между Web-браузером и сервером идет с помощью протокола HTTP (HyperText Transfer Protocol). Протоколом передачи гипертекста (HTTP) называется язык, на котором пользовательская программа разговаривает с сервером, а также формат ответов, которые выдает сервер. Протокол HTTP - протокол уровня приложений. Он определяет, как клиент должен запрашивать данные у Web-сервера и как сервер должен их выдавать. Протокол HTTP не определяет, как данные должны передаваться по сети; это относится к ведению низкоуровневых транспортных протоколов типа TCP. HTTP - очень простой протокол. Запрос (например, http://www.ucsd.edu), набранный в окне браузера, преобразовывается в запрос HTTP, который выглядит так: «GET /HTTP/1.0» Это означает следующее: «Выдать документ из корневого каталога с помощью протокола HTTP версии 1.0». В результате будет выдан определённый по умолчанию документ из указанного места на сервере. Если у сервера запрашивается документ первого уровня, то в результате будет получена так называемая «домашняя страница» узла. После того как запрос в формате HTTP будет передан Web-серверу, тот разбирает запрос и определяет, правильно ли он составлен. В отношении запроса могут действовать некоторые ограничения. Поступил ли запрос от адреса, с которым серверу «разрешено» разговаривать? Правильно ли оформлен запрос? Существует ли вообще запрашиваемый файл? Если что-то не так, сервер выводит сообщение об ошибке. Если запрос прошел все проверки, сервер пытается выполнить его и ищет требуемый файл, а затем отправляет результат обратно. К результату добавляется заголовок, описывающий характер передаваемых данных. Сервер отправляет браузеру не только запрошенную информацию. Кроме неё он добавляет информацию о статусе запроса, время его обработки, тип возвращаемых данных и так далее. Самое важное в этой дополнительной информации - заголовок. Он оформляется в виде MIME-заголовка и указывает тип данных, содержащихся в документе. Например, когда Web-сервер отправляет клиенту HTML-данные, в MIME-заголовке прописывается тип text/html. Браузер видит MIME-заголовок подобного типа и рассматривает полученные данные как HTML - файл. Браузер просматривает MIME-заголовок в поступающих данных и определяет, что с ними нужно делать, при помощи своей таблицы, где перечислены MIME-типы и соответствующие им действия. В случае с Web-страницей, написанной на языке HTML, браузер читает полученную информацию, а затем выводит страницу на экран. При получении других данных, например видеофайла, для просмотра запускается вспомогательная программа либо подключаемый модуль plug-in. После прочтения полученных данных браузер может обнаружить, что ему требуется запросить у Web-сервера дополнительную информацию, например изображения. В таком случае процесс повторяется, хотя первые его этапы будут выполняться уже быстрее, так как местоположение сервера уже было определено раньше. Если коротко описать этот процесс, то в Web используется модель клиент-сервер. Браузер (клиент) запрашивает страницы у Web-сервера по сети. Обработка запроса ведется с помощью протокола HTTP, сама передача данных выполняется с помощью протокола TCP/IP. Указатели на запрашиваемые объекты пишутся в форме унифицированных указателей ресурсов (URL), которые в значительной степени используют службу доменных имен. После обработки запроса требуемая информация передаётся вместе с индикатором MIME-типа, чтобы браузер знал, как ему обработать полученные данные. Большинство страниц создаются с помощью языка разметки HTML, а MIME позволяет использовать для этого и другие технологии. 3.6 Система адресации в сети Интернет Чтобы отыскать какой-либо объект в Интернете, необходимо знать его адрес, а затем подключиться к тому компьютеру, где этот объект находится. Пользователь запрашивает документы у Web-сервера путем ввода адреса документа в виде URL. URL - унифицированный способ обозначения объекта или услуги в Интернете. Основная структура URL показана ниже: Протокол://адрес узла/каталог/имя файла Рассмотрим каждую часть URL в отдельности. Адрес узла. Каждый компьютер в Интернете имеет уникальный цифровой адрес, который называется адрес IP. Адрес IP может выглядеть, например, так: 192.102.249.3. Он принадлежит мощной машине, стоящей у крупного провайдера в г.Сан-Диего. Адрес IP присваивается машине для того, чтобы к ней можно было направить информацию. Компьютерам и маршрутизаторам, конечно, проще оперировать цифровыми значениями, в том числе адресами IP, а вот людям запомнить эти числа значительно труднее. В связи с этим компьютерам присваиваются буквенно-цифровые адреса, которые называются доменными именами. Доменное имя может выглядеть, например, так: www.ucsd.edu . Запомнить доменное имя проще, чем адреса IP, и оно всегда несет какой-то смысл. В данном случае www - это название машины, которая предоставляет услуги Web, UCSD - университет в г.Сан-Диего, а edu обозначает, что это образовательное учреждение. В Интернете полное доменное имя состоит из имени машины и имени домена. Имя машины может быть любым. Имена серверов с Web-документами обычно начинаются с префикса www. Тем не менее в локальных сетях часто встречаются машины с именами их владельцев или вообще с экзотическими названиями (например dell-p6-200-a12). Другая часть адреса узла - имя домена - составляется достаточно просто. В США имя домена состоит из названия домена или организации и типа домена, разделенных точкой. Например, sun.com. Домен «sun» принадлежит компании Sun Microsystem. Он существует в зоне коммерческих узлов, т.к. Sun-коммерческая фирма. Поэтому имя заканчивается типом «com». В США большинство доменов обозначаются тремя буквами и характеризуют, к какому виду относится организация, владеющая сервером (см. табл.5). Доменное пространство за пределами США организовано несколько сложнее. Полное доменное имя, включая код страны, пишется следующим образом: Имя машины. доменное имя. тип домена. код страны Табл. 5. Типы доменов, используемые в США на момент 1997 года |
Тип домена | Описание домена | Пример | | Com | Коммерческие структуры и предприниматели | apple.com | | Net | Сети и сетевые провайдеры | cerf.net | | Org | Некоммерческие и прочие организации | greenpeace.org | | Edu | Колледжи и университеты | ucla.edu | | Gov | Правительственные учреждения США | whitehouse.gov | | Mil | Военные учреждения федерального правительства США | nosc.mil | | us | Используется различными организациями и лицами, включая школы, библиотеки, городские и окружные правительства | co.san-diego.ca.us | | |
Идентификаторы зон, расположенных за пределами США, состоят из двухбуквенного кода, обозначающего страну, в которой находится сервер. Некоторые из них приведены в таблице 6. Внутри каждой страны организации, выдающие имена, сами решают, какие типы доменов создавать. Эти типы могут не совпадать с используемыми в США. Например, имя www.sony.co.jp -указывает на Web-сервер компании Sony, расположенной в коммерческой зоне (co) Японии (jp). В данном случае для обозначения коммерческой структуры вместо com используется co. В Великобритании образовательные учреждения помещаются в домен ac. Например, адрес Web-серверов Оксфордского университета выглядит так: www.oх.ac.uk, где для обозначения образовательного учреждения используется ac , а не edu, как в США. Один из доменов самого верхнего уровня, int, зарезервирован для организаций, созданных международными соглашениями между правительствами различных государств, например Европейский Союз(eu.int) Табл.6 Национальные домены |
Зона | Обозначение | | uk | Великобритания | | de | Германия | | ca | Канада | | ru | Россия | | su | Страны бывшего СССР | | us | США | | jp | Япония | | |
По буквенным именам людям легче обращаться к серверам Интернета. Настоящим адресом сервера является цифровой IP-адрес. Преобразованием буквенного имени сервера в его IP-адрес занимается служба, которая называется системой доменных имен (Domain Name System-DNS). Она выполняет преобразование автоматически. От доменных имен и от надежности службы доменных имен зависит работоспособность Web. Если сервер доменных имен недоступен, вы не получите доступ и к Web-серверу. Более подробная информация о машинах и доменных именах расположена на Web-узлах http://www.iahc.org/; http://rs.internic.net/ rs.internic.html или http://www.isi.edu/div7/iana/ . После того, как машина была найдена по доменному имени или по адресу IP, необходимо указать точно каталог на машине, где находится нужный ресурс. Имя файла. Оно, как правило, состоит из двух частей - имени и стандартного расширения, разделяемых точкой. Файлам могут присваиваться любые имена, главное, чтобы они соответствовали правилам операционной системы, на которой работает сервер. Специальные символы типа пробелов, двоеточий и черт могут сослужить плохую службу, если их использовать в именах файлов, доступных через Web. Файл с именем test:1.htm может вызвать проблемы у систем Macintosh, а test/1.htm - вообще недопустимое имя для Macintosh, и вызовет проблемы у PC и UNIX-машин. Для Web очень важно расширение файла, так как порой только по нему можно определить тип информации, хранящейся в файле. Например, файл с исходным кодом HTML имеет расширение html или htm, а изображения в формате JPEG имеют расширение jpg. Web-сервер считывает расширение и на основании его определяет, какой заголовок надо отправить вместе с файлом браузеру. Если расширение отсутствует или поставлено неправильно, файл может быть неправильно интерпретирован. Когда браузеры читают файлы напрямую, они также обращают внимание на его расширение, определяя по нему, что нужно делать с файлом. Если расширение отсутствует или поставлено неправильно, файл наверняка не будет выведен в Web-браузере. В целях обеспечения большей совместимости следует избегать использования в именах файлов пробелов, заглавных букв и специальных символов. Авторы и пользователи должны обращать особое внимание на регистр букв в именах файлов и каталогов.
Страницы: 1, 2, 3, 4
|
|