КОМПЬЮТЕРНЫЕ СЕТИ
ИНТЕРНЕТ КАК ЕДИНАЯ СИСТЕМА РЕСУРСОВ
Работать в Сети и не использовать все ее ресурсы просто неразумно. Благодаря развивающимся с огромной скоростью технологиям Интернета, информационные ресурсы Сети связываются все теснее. Если раньше компьютерные сети в основном служили для обмена письмами по электронной почте, то сегодня мы рассматриваем Интернет как единую систему ресурсов. Это и комнаты для бесед — чаты, и телеконференции, и сетевые новости, и форумы, и служба пересылки файлов FTP, и электронная почта, и IP-телефония, и даже электронная коммерция.
Гипертекстовая система WWW
«Всемирная паутина» (WWW — World Wide Web) — самый популярный и интересный сервис Интернета, популярное и удобное средство работы с информацией. Самое распространенное имя для компьютера в Интернете сегодня — www, больше половины потока данных Интернета приходится на долю WWW. Количество серверов WWW сегодня нельзя оценить точно, но по некоторым оценкам их более 30 млн. Скорость роста WWW даже выше, чем у самой сети Интернет.
WWW — это всемирное хранилище информации, в котором информационные объекты связаны структурой гипертекста. Гипертекст — это прежде всего система документов с перекрестными ссылками, способ представления информации при помощи связей между документами. Поскольку система WWW позволяет включить в эти документы не только тексты, но и графику, звук и видео, гипертекстовый документ превратился в гипермедиа-документ.
Гипертекст или гипертекстовые ссылки являются «ключевой фигурой» в способе представления информации в WWW.
Немного истории WWW. «Всемирная паутина» (WWW) — одна из важных составных частей всемирной сети. И у нее — своя история.
Это интересно
В Швейцарии находится Европейская лаборатория по изучению физических частиц (CERN), В 1980 г. человек по имени Тим Бернес-Ли, работавший в то время в Церне, начал разработку проекта глобальной компьютерной сети, которая обеспечивала бы физикам всего мира доступ к различной информации. На это ушло девять лет.
В I989 г, после многолетних технических экспериментов мистер Тим предложил конкретный вариант, который и явился началом World Wide Web, или сокращенно WWW.
Со временем многие поняли, что такими услугами смогут пользоваться разные люди, не только физики. WWW стала быстро расти. Многие люди помогали ей в этом: одни разрабатывали аппаратные средства, другие создавали программное обеспечение, развивающее WWW, третьи улучшали линии связи. Все это позволило ей стать тем, чем она сейчас является — «всемирной паутиной».
Принципы работы клиента и сервера. WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипермедийный документ — документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т.д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки в документах WWW организованы таким образом, что каждый информационный ресурс в глобальной сети Интернет однозначно адресуется, и документ, который вы читаете в данный момент, способен ссылаться как на другие документы на этом же сервере, так и на документы (и вообще на ресурсы Интернета) на других компьютерах Интернета. Причем пользователь не замечает этого и работает со всем информационным пространством Интернета как с единым целым.
Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Интернета. Более того, большинство программ-клиентов WWW (браузеры, навигаторы) не просто понимают такие ссылки, но и являются программами-клиентами соответствующих сервисов: FTP, gopher, сетевых новостей Usenet, электронной почты и т.д. Таким образом, программные средства WWW являются универсальными для различных сервисов Интернета, а сама информационная система WWW играет интегрирующую роль.
Перечислим некоторые термины, использующиеся в WWW.
Первый термин — html — это набор управляющих последовательностей команд, содержащихся в html-документе и определяющих те действия, которые программа просмотра (браузер) должна выполнить при загрузке этого документа. Это означает, что каждая страница является обычным текстовым файлом, содержащим текст, который виден всем, и некоторые инструкции для программы, невидимые для людей в виде ссылки на другие страницы, изображения, серверы. Таким образом, заполняются анкеты, регистрационные карты, проводятся социологические опросы.
Второй термин — URL (uniform resource locator — универсальный указатель на ресурс). Так называются те самые ссылки на информационные ресурсы Интернета.
Еще один термин — http (hypertext transfer protocol — протокол передачи гипертекста). Это название протокола, по которому взаимодействуют клиент и сервер WWW.
WWW — сервис прямого доступа, требующий полноценного подключения к Интернету и, более того, часто требующий быстрых линий связи в случае, если документы, которые вы читаете, содержат много графики или другой нетекстовой информации.
Побродим no WWW. Браузер — это своего рода окно в WWW. Чтобы увидеть несметные богатства Сети, необходимо иметь специальное окно, которое «прорубает» программа просмотра — браузер (иногда в литературе ее называют «броузер»). Как окно, которое русский царь Петр I в свое время прорубил в Европу. И хотя физические размеры окна браузера невелики, «петровское» окно в Европу — лишь узенькая щелочка по сравнению с ним.
Это интересно
Browser (англ.) означает посетитель магазина, рассматривающий товары, перелистывающий книги, так трактует это слово весьма авторитетный «Англо-русский словарь» под ред. Ю-Апресяна.
На вопрос: какие браузеры используются чаще? — нет однозначного ответа. Сейчас чаще других используются браузеры фирм Netscape и Microsoft. Они фактически стали стандартами для Интернета. Правда, это произошло совсем недавно.
Это интересно
Еще в начале 90-х гг. существовал всего один браузер Mosaic, распространяемый бесплатно. Его разработал Марк Андрессеи.
Принципиальной разницы между Netscape Navigator и Internet Explorer нет. Каждый их них имеет и встроенную электронную почту и клиент-программу поддержки групп новостей. Оба могут предоставлять возможности просмотра движущихся изображений, прослушивания речи и других звуков и обеспечивать междугороднюю телефонную связь.
Каждая фирма считает свой браузер самым быстрым. И каждая имеет документальное подтверждение этому. Ответ на этот вопрос неоднозначен, потому что скорость зависит не только от браузера, но и от параметров самого компьютера.
Какой же браузер выбирать для работы?
Все зависит от того, что вы собираетесь делать. Если вы обращаетесь к разделам, ориентированным на Netscape, то надо воспользоваться браузером этой же фирмы. Считается, что Netscape Navigator использует 35 ...40 % пользователей Интернета. Ну, а если компьютер работает с программами фирмы Microsoft, то конечно лучше применять Internet Explorer (примерно 60 ...65% пользователей Интернета используют его).
Интернет — это странички, которые видны в окно браузера. Найти ссылку на другую страницу легко: попадая на нее, указатель мыши меняет форму, стрелка превращается в изображение руки, а в строке состояния браузера высвечивается адрес документа, который будет показан, если нажать левую кнопку мыши.
Сайт — это набор документов, объединенных общей темой и служащих общей цели. Адрес сайта в Интернете называют доменным именем. Он состоит из последовательностей символов — доменов, разделенных точками и начинается с www (например, www.kolledg.ru).
Internet Explorer. Окно программы Internet Explorer имеет дружелюбный и простой в работе интерфейс.
В поле заголовка окна программы Internet Explorer, расположенного вдоль верхней границы, вы видите название программы и имя текущего документа. Чуть ниже расположены элементы управления программой, кнопки с рисунками и экранное меню. Под кнопками экранного меню располагается поле, в которое надо ввести адрес (URL) Web-страницы. Щелкнув по стрелке в конце этого поля, видно раскрывающийся список адресов, по которым вы путешествовали в последнее время. Выбор адреса можно осуществлять из этого списка.
Большая часть – окно демонстрации Web-страниц. Внизу окна располагается строка состояния, отображающая информацию о действиях программы в данный момент. Например, если подвести курсор к выделенному слову в тексте, то в строке состояния будет виден адрес документа, с которым оно связано Когда программа вызывает какой-либо документ, в строке состояния появляется шкала, показывающая, сколько времени осталось для завершения загрузки страницы, а текст говорит, получен ли отлет от сервера, найден ли документ.
После ввода в поле Адрес любой URL, например адрес поискового каталога Rambler (http://www.rambler.nl), начинается загрузка страницы. В это время на панели инструментов активизируется красная кнопка Остановить. С помощью которой можно остановить загрузку.
Кнопки со стрелками Назад и Вперед в левой части панели инструментов служат для передвижения назад и вперед, кнопка Обновить — для перезагрузки файла, Домой — для возврата на домашнюю страницу, Поиск — для поиска в Интернете, Избранное — для пометки понравившихся вам серверов, чтобы быстро к без проблем вернуться к ним еще раз. Следующая кнопка Печать поможет вам распечатать документ, кнопка Размер служит для увеличения или уменьшения шрифта, Кодировка — для изменения кодировки. Воспользовавшись кнопкой Почта, можно отослать почтовое отправление, если почтовая программа у вас настроена.
Посмотрим на экранное меню. Команда Файл/Создать/Окно позволяет открыть новое окно для поиска других документов. Для открытия Web-страницы служит команда Файл/Открыть, а для сохранения используется команда Файл/Сохранить. Здесь же в меню Файл командой Печать можно распечатать понравившуюся вам страничку.
В меню Правка с помощью команды Выделить все можно выделить весь текст на странице и копировать его командой Копировать. Это один из вариантов перенесения текста из Интернета на ваш компьютер. Командой Вставить текст помещается в редактор Word.
Поисковые механизмы в Интернете. Чтобы получить информацию или услугу в WWW, ее надо, прежде всего, разыскать.
Для поиска информации в Сети используются специальные поисковые службы. Обычно поисковая служба — это компания. имеющая свой сервер, на котором работает некая поисковая система. Услуги абсолютного большинства поисковых служб бесплатны, но тем не менее по темпам роста сегодня это самый эффективный бизнес в мире.
На сегодняшний лень существует два основных способа «ориентации» в Web-пространстве: во-первых, с помощью так называемых поисковых систем (Rambler, AltaVista, Yandex) и, во-вторых, по электронным каталогам (Weblist, Yahoo, DMOZ, Mavica-Net). Последние отличаются от поисковых серверов тем, что ссылки на конкретные сведения в них составляют люди, а не компьютерные программы. Такой метод обработки информации значительно повышает точность поиска.
Поисковые электронные каталоги-классификаторы. Классификаторы хранят упорядоченные списки ссылок на Web-узлы. Обычно каждой ссылке соответствует краткое описание. Списки упорядочены по тематическим размерам на поисковом сервере.
Они похожи на предметные каталоги общественных библиотек. На начальной странице поискового каталога мы выбираем тему, которая нас интересует, затем в рамках темы выбираем категорию, потом подкатегорию, и так далее, пока не получим конкретный список Web-ресурсов, рекомендованных для просмотра. Основным недостатком и в то же время достоинством каталогов является «человеческий фактор». Данные, которые заносятся в каталог, проходят «ручную» обработку.
Поисковые системы-указатели. В них пользователь формирует запрос с помощью ключевых слов, выражающих объект его поиска, а поисковая система выдает ему список ссылок на Web-cграницы, содержащие данные ключевые слова. Основное отличие поисковых указателей от поисковых каталогов состоит в полной автоматизации всех этапов работы. Здесь отсутствует «человеческий фактор», и поэтому количество Web-страниц, к которым ведет поисковый указатель, намного больше.
Сбор информации поисковыми роботами. Поисковые указатели работают в три этапа.
1. Разработка специальной агентской программы, способной путешествовать по Web-узлам Интернета, просматривать Web-страницы и копировать их содержание на центральный сервер поисковой системы. Такие агентские программы называют «червяками», «пауками», поисковыми роботами (сокращенно «ботами»), поисковыми машинами, «краулерами» и т. п.
2. Индексация ресурсов. Собрать на центральном сервере образцы сотен миллионов Web-страниц — это одно дело, а суметь выбрать те их них, которые нужны клиенту, сформировавшему запрос — совсем другое. Отвечать надо очень быстро, а для этого хранить данные надо не как попало, а с виде специальных структур. Процесс преобразования той формы данных, в которой они хранятся на Web-страницах, в другие формы, удобные для быстрого просмотра, называется индексацией. В результате индексации и образуется база данных, которую называют поисковым указателем.
3. Исполнение запроса клиента. Лучшие поисковые системы в ответ на запрос просматривают свои индексы за десятые доли секунды и немедленно возвращают списки ссылок, ведущих к за требованным ресурсам.
У каждого из двух основных типов поисковых служб есть достоинства и недостатки. Поисковые каталоги формируют вручную с помощью живых людей, поэтому, если мы находим в них нужный нам ресурс, то этот ресурс — один из лучших в Сети. Он не обязательно самый лучший и, может быть, лишь входит в первую двадцатку, но он явно не случаен и может рассматриваться как рекомендованный.
Ответственные редакторы поискового каталога, имеющие солидное образование в большинстве областей науки, техники и культуры, не будут включать в свой каталог очевидную ерунду. 'Поисковые каталоги удобнее и тем, что там не бывает десятков ссылок на один и тот же ресурс, размещенный в разных местах. В общем, если надо быстро найти лучший источник по какой-то теме, то надо начинать поиск с поискового каталога.
Организация поиска в Интернете. Без удачи не обходится ни одно дело, а поиск в Интернете в особенности. Как конкретно происходит поиск информации в Интернете? Посмотрим это на примере поисковой системы Апорт
Когда в поле Адрес браузера вводится строка http://www.aport.ru и нажимается клавиша [Enter], Интернет за счет своих внутренних ресурсов определяет, на каком компьютере находится сайт, далее туда посылается запрос, и, если нужный файл на месте, он отправляется браузеру, который отображает его в своем окне.
Система Апорт хранит содержимое всех известных системе сайтов, иначе было бы невозможно показать те места на странице, где встречается указанное нами слово. Потому что Апорт — это автоматический индекс. При поиске Апорт посещает все известные системе сайты, переписывает тексты всех доступных страниц и хранит тексты вместе с их адресами в своей базе данных. Поэтому, обращаясь к системе Апорт, мы ищем заданное для поиска слово во всех текстах страниц, которые есть в ее базе.
Электронные каталоги ищут заданное для поиска слово в описаниях сайтов, которые и ней хранятся и поэтому в системе Апорт будет найдено документов намного больше, чем и любом электронном каталоге.
Апорт — это автоматический индекс. Апорт навещает нее известные системе сайты и переписывает все встреченные тексты страничек в свою базу данных. Кроме того, посетив сайт. Апорт запоминает все ссылки на другие страницы и сайты и дальше, когда выпаяет свободное время, навешает эти сайты и тоже переписывает к себе в базу. Ясно, что через какое-то время работы в базе данных окажутся все русскоязычные сайты. В Интернете есть сайты на разных языках, Апорт — это местная поисковая система, которая интересуется документами на русском языке.
Автоматический индекс, как гигантский насос, засасывает все, что встретит на своем пути. В то же время каталог ресурсов гораздо более разборчив. Сюда попадают только те сайты, которые просмотрел и одобрил редактор — специальный сотрудник, занимающийся их поиском и оценкой.
Чтобы понять, почему предварительный просмотр сайта может быть полезен, нужно знать, что Интернетом никто не управляет. Здесь нет никакой цензуры, и за содержание сайта в подавляющем большинстве случаев отвечает только его хозяин. Значит, никакой гарантии, что сайт соответствует своему названию, нет. Тем более нет гарантий, что документы, помещенные на сайт, содержат полезные и правдивые сведения.
Когда Апорт записывает все сайты подряд в свою базу данных, система, наряду с ценными и точными сведениями, засасывает горы словесного мусора. Вместе с красивыми и тщательно спроектированными сайтами Апорт индексирует неряшливые домашние страницы, где в беспорядке на безумном фоне разбросаны фотографии хозяина, его жены и любимой собаки. Такие страницы заведомо не попадут в тематический каталог, потому что их не пропустит редактор.
У каталогов ресурсов есть, как ни странно, еще одно преимущество — малый размер. Просмотрев сайты каталогов ресурсов, мы сможем лучше сориентироваться в проблеме и составить более точный запрос. Ведь в системе Апорт можно искать не одно слово, а несколько.
Наконец, сведения, хранящиеся в тематическом каталоге, могут быть полезны автоматическому индексу. Если мы внимательно рассмотрим окно Апорта, то увидим, что вслед за адресом сайта идет раздел Описание сайта. Но откуда он известен? Ведь Апорт тупо складывает в свою базу данных содержимое всех найденных страниц, таков ведь принцип работы поисковой системы? Оказывается, описание сайтов, если они есть, Апорт берет из тематического каталога @Rus, адрес которого www.atrus.ru. Кстати, ссылки Автомобили, Наука и др. — не что иное, как рубрики этого тематического каталога. Выбрав мышью одну из надписей, мы попадем прямо в каталог и можем путешествовать по рубрикам или искать нужное слово. Значит, Апорт не просто автоматический индекс, а союз индекса и каталога, заключенный ради удобства поиска.
Большинство сайтов предоставляют поисковым системам их хозяева, Для этого в поисковых системах есть специальные ссылки Добавить сайт. Хозяин сайта вводит его адрес и краткую характеристику. Если сайт предоставлен системе Апорт, то он будет обязательно помещен в базу данных (проиндексирован). Если же сайт предоставлен в каталог, то его судьба зависит от редактора, который может занести его адрес в наиболее подходящий с его точки зрения раздел каталогов, а может и не занести, если сочтет сайт неинтересным или не соответствующим теме.
Сегодня многие Интернет-серверы решают сразу несколько различных задач, чтобы привлечь побольше посетителей.
< Назад Вперед >
|