Всемирная паутина www: гипертекст, поисковые машины - OXFORDST.RU

Всемирная паутина www: гипертекст, поисковые машины

Всемирная паутина WWW: гипертекст, поисковые машины

Всемирная Паутина — это совокупность информационных ресурсов, связанных средствами телекоммуникаций и основанных на гипертекстовом представлении данных. Поиск информации в Internet. Конкретизация области поиска при помощи выделения ключевых слов.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 27.06.2010
Размер файла 111,4 K
  • посмотреть текст работы
  • скачать работу можно здесь
  • полная информация о работе
  • весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

санкт-петербургский государственный

Университет экономики и финансов

РЕФЕРАТ НА ТЕМУ (2 курс, 2 семестр):

«Всемирная паутина www: гипертекст, поисковые машины»

238 группы Мельник О. Н.

Проверила: доцент кафедры информатики

Всемирная паутина WWW

Единицей гипертекстовых данных Всемирной Паутины является Web-страница — минимальный фрагмент гипертекста, который можно загрузить и прочитать за один раз. Web- страница содержит текст, графику и ссылки на другие Web- страницы.

Для идентификации гипертекстовой страницы в Сети используется так называемый URL — Universal Resource Locator — Универсальный Локатор Ресурсов. В нем содержится информация о способе передачи данных между клиентом и сервером (протоколе), имени сервера, на котором находится страница, пути в дереве каталогов сервера, по которому находится страница и имени страницы.

Для представления Web-страниц используется специальный язык разметки гипертекста — HTML (Hypertext Markup Language). Конструкции этого языка — тэги — позволяют управлять шрифтом, цветом текста и фона, определять ссылки, вставлять графику, аудио и видео и т.п. Сами тэги при чтении страницы не видны, а видны только результаты их действия. Если сравнить, как выглядит страница в исходном тексте и она же на экране браузера, то порой удивительно, насколько велики различия.

Клиента для WWW называют браузером. Браузер — это программа, которая загружает и, интерпретируя тэги HTML, показывает в своем окне WWW-страницы. Браузер отображает картинки в теле страницы, проигрывает аудио и видео, загружает следующую страницу, когда пользователь щелкает мышью по ссылке и пр. и пр. для того, чтобы сделать путешествие по Всемирной Паутине как можно более комфортным.

Гипертекст и web-страницы

Сам термин «гипертекст» появился с возникновением электронных документов, задолго до появления службы WWW. Поскольку современные электронные документы содержат не только текст, но и мультимедиа-информацию, понятие гипертекста было расширено до понятия гипермедиа. Гипермедиа — это метод организации мультимедиа-информации на основе ссылок на разные типы данных. Гипермедиа-документы могут использоваться не только в WWW, но и, например, в электронной энциклопедии на CD-ROM, где ссылка в тексте часто ведет на аудио- или видеоролик.

Особенно продуктивной идея гипертекста оказалась применительно к объединению цифровой информации, распределенной на серверах во всем мире. Документ, доступный через Web, называют Web-страницей, а группы страниц, связанных общим именем, темой и объединенных навигационно, — Web-сайтами. Первую страницу, которую видит пользователь при обращении на тот или иной ресурс, называют стартовой, домашней или индексной страницей (home page). Система гиперссылок определяет структуру Web-сайта. Страницы на сайте могут иметь линейную древовидную структуру, но чаще на каждой странице имеется несколько ссылок, что и позволяет говорить о структуре «паутина» (см. рис. 1)

1. Конкретизируется область поиска, выделяются ключевые слова, характерные для интересующей области. Рекомендуется по возможности подбирать такие слова, которые не используются ни в каких других областях деятельности или знания.

2. На поисковый сервер посылается запрос, сформированный из ключевых слов. На многих поисковиках имеется возможность конкретизировать область поиска путем выбора соответствующих пунктов предлагаемых меню.

3. Так или иначе, от сервера приходит список ссылок на WWW- страницы, в которых обнаружены запрошенные слова с кратким описанием каждой из них или просто с небольшим начальным фрагментом страницы.

4. Далее следует исследование подходящих (судя по заголовку или описанию) страниц. Здесь начинается “свободное плавание”, то есть переход по ссылкам с текстом, который обещает нечто интересное.

5. Сохранение на диске интересующего материала.

Отыскать нужную информацию в Седьмом океане — океане информации было бы просто невозможно если бы не существовало поисковых серверов. Такие серверы предоставляют возможность поиска страниц по ключевому слову или в иерархическом дереве каталога. Существуют как чисто англоязычные и русскоязычные, так и смешанные серверы. Документов на английском языке в Internet гораздо больше, чем на русском, поэтому имеет смысл посетить также и западные поисковики.

Для поиска информации по ключевому слову на поисковый сервер посылается запрос. Запрос формируется автоматически — нужно только ввести слова в поле ввода, выбрать нужные опции поиска и нажать кнопку. Обратно приходит Web-страница с отчетом о результатах поиска. Так как список найденных документов может быть очень большим, он разбивается на фрагменты по 10-100 элементов (на каждом сервере по-разному), а в конце отчета приводятся ссылки на следующие фрагменты списка.

Каждый элемент отчета формируется следующим образом:

— в начале идет заголовок документа являющийся также и ссылкой на этот документ (если у документа нет заголовка — может быть и такое — то здесь помещается надпись ‘No title’);

— далее следует небольшой фрагмент самого документа по которому практически всегда можно понять, о чем идет речь в документе и, следовательно, подходит он вам или нет;

— и, наконец, список URL данного документа (один и тот же документ может быть продублирован по разным адресам).

Чтобы перейти к документу, достаточно щелкнуть либо по ссылке с текстом заголовка, либо по одной из ссылок с URL. Кстати, единственный поисковик, который выдает пользователю не фрагмент документа, а настоящую аннотацию (на английском языке), написанную людьми — это Yahoo.

Второй метод отыскания документов, предоставляемый поисковыми серверами — поиск по каталогам. Практически на всех поисковых машинах есть такие каталоги (исключение — Altavista, Rambler). В таких каталогах вся область знаний разбивается на несколько крупных подобластей, например, искусство, бизнес, компьютеры, образование, спорт, политика, путешествия, здоровье и т.д. и т.п. Дале каждая такая подобласть разбивается на более мелкие разделы и подразделы. Таким образом в процессе поиска вы на каждом шаге будете уточнять искомое понятие, сужая область поиска, пока не получите список ссылок на документы, уже более соответствующих нужной вам теме.

Наиболее популярными англоязычными поисковиками являются: Yahoo, Magellan, Infoseek, Excite, WebCrawler, русскоязычными: Rambler, Русская Машина Поиска, всеязычным — Altavista, Altavista Telia.

Классификация поисковых машин

News and Media — >> Newspapers — > The New York Times

Altavista и Yahoo! лидируют в этом списке. На этих сайтах существует обширная база данных и хорошо структурированная иерархия. Euroseek незаменим при поиске отдельных европейских ресурсов.

Глобальные поисковые машины

Поскольку все вышеперечисленные поисковые системы используют различные базы данных, то используя одни и те же ключевые слова, можно получить совершенно разные результаты. Иногда лучше обратится к так называемым системам «мета-поиска». Такие поисковые машины посылают ваш запрос на огромное количество разных поисковых систем. Затем обрабатывают полученные результаты, удаляют повторяющиеся адреса ресурсов и представляют более широкий спектр того, что представлено в сети Интернет.

Системы мета-поиска

Inference Find — http://www.inference.com/infind/

Meta Find — http://www.metafind.com/

Иногда по определенной тематике поисковая система выдает такое огромное количество ссылок, что пользователь просто не в состоянии просмотреть их всех и найти лучшее. Northern Light и About.com (раннее известный как The Mining Company) используют услуги экспертов, которые вносят в базу данных самые лучшие ресурсы. Эти сайты очень информативны и представляют очень ценную информацию.

Специальные поисковые системы

Northern Light — http://www.nlsearch.com/

Иногда вам необходима самая общая информация. Для этого можно воспользоваться онлайновыми энциклопедиями. В некоторых случаях статьи энциклопедии содержат ссылки на необходимые ресурсы.

Энциклопедии

Энциклопедия Британника — http://www.britannica.com/

Кирилл и Мефодий — http://www.km.ru

Из-за невероятного увеличения информационных ресурсов Интернет в последние годы некоторые старые поисковые системы перестали быть эффективными. Поэтому появились такие поисковые машины, как Google и Direct Hit, которые сортируют ссылки по принципу популярности. Используя математический алгоритм, они выдают адреса тех ресурсов, на которые чаще всего указывают другие сайты.

Поисковые системы второго поколения

Direct Hit — http://www.directhit.com/

Заключение

Список литературы

1. Галанин С. «WWW — всемирная паутина». http://iatp.ulstu.ru/edu/internet/www/

2. Прохоров А.Н. «Всемирная паутина (www)». / http://www.intuit.ru/department/office/od/7/

3. Поисковые машины Интернет. / http://www.pskov.org.ru/engines.html

4. Поисковая система. Википедия. /

http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0

5. Всемирная паутина. / http://dic.academic.ru/dic.nsf/ruwiki/18318

Подобные документы

История появления и развития сети Интернет, особенности ее гуманитарной и технической стороны. Применение системы World Wide Web — «Всемирная паутина». Ключевые аспекты WWW-технологии, специфика ее использования для создания образовательных ресурсов.

реферат [19,3 K], добавлен 26.03.2011

Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима «расширенный поиск», который имеет каждая из поисковых систем в Интернете.

реферат [27,3 K], добавлен 06.08.2014

Всемирная система объединенных компьютерных сетей, построенная на использовании протокола IP и маршрутизации пакетов данных. Домен и его уровни. Основные сервисы Internet. Что нужно для подключения к сети Internet. Правила поиска информации в Интернете.

курсовая работа [1,5 M], добавлен 10.01.2012

Основная информационная система в Интернете — World Wide Web (WWW) или Всемирная Паутина. Домены организационного и географического уровня. Программа Internet Explorer фирмы Microsoft для использования Интернета: настройка программы и принципы работы.

курсовая работа [503,3 K], добавлен 16.06.2009

Основные протоколы доступа к именованным ресурсам через WWW-сеть. Техника поиска и перемещения в сетях WWW. Загрузка и просмотр веб-страниц и определение местонахождения ресурсов в сети. Технология идентификации URI и система доменных имён DNS.

контрольная работа [2,5 M], добавлен 28.02.2017

Общая характеристика моделей баз данных: объектно-ориентированная, иерархическая, реляционная. Всемирная паутина глобальной компьютерной сети Интернет как сетевая база данных, рассмотрение особенностей основных составляющих: узел, уровень, связь.

презентация [1,4 M], добавлен 14.10.2013

Основные протоколы, используемые в Интернет. Инструменты поиска в Интернете. Популярные поисковые системы. Как работают механизмы поиска. Средства поиска и структурирования. Автоматизированная навигация по Сети. Критерии качества работы поисковой машины.

реферат [19,7 K], добавлен 14.02.2012

Всемирная паутина www: гипертекст, поисковые машины

Реферат выполнила: студентка 238 группы Мельник О. Н.

Санкт-петербургский государственный университет экономики и финансов

Санкт – Петербург 2009 г .

Всемирная Паутина — это совокупность информационных ресурсов, связанных средствами телекоммуникаций и основанных на гипертекстовом представлении данных, разбросанных по всему миру. Всемирная Паутина также обозначается как WWW (World Wide Web), W3 или просто Web.

Единицей гипертекстовых данных Всемирной Паутины является Web-страница — минимальный фрагмент гипертекста, который можно загрузить и прочитать за один раз. Web- страница содержит текст, графику и ссылки на другие Web- страницы.

Для идентификации гипертекстовой страницы в Сети используется так называемый URL — Universal Resource Locator — Универсальный Локатор Ресурсов. В нем содержится информация о способе передачи данных между клиентом и сервером (протоколе), имени сервера, на котором находится страница, пути в дереве каталогов сервера, по которому находится страница и имени страницы.

Для представления Web-страниц используется специальный язык разметки гипертекста – HTML (Hypertext Markup Language). Конструкции этого языка – тэги – позволяют управлять шрифтом, цветом текста и фона, определять ссылки, вставлять графику, аудио и видео и т.п. Сами тэги при чтении страницы не видны, а видны только результаты их действия. Если сравнить, как выглядит страница в исходном тексте и она же на экране браузера, то порой удивительно, насколько велики различия.

Клиента для WWW называют браузером. Браузер – это программа, которая загружает и, интерпретируя тэги HTML, показывает в своем окне WWW-страницы. Браузер отображает картинки в теле страницы, проигрывает аудио и видео, загружает следующую страницу, когда пользователь щелкает мышью по ссылке и пр. и пр. для того, чтобы сделать путешествие по Всемирной Паутине как можно более комфортным.

Гипертекст и web-страницы

Гипертекст (Hypertext) — это документ (в первую очередь текстовый), содержащий гиперссылки. Гиперссылка — это связь слова или содержащегося в документе изображения с другим ресурсом, которым может быть как еще один документ, так и раздел текущего документа. Подобные «связанные» слова или картинки документа, как правило, выделяются по оформлению из общего текста. Общепринятой является практика подчеркивания слова или предложения, связанного гиперссылкой.

Сам термин «гипертекст» появился с возникновением электронных документов, задолго до появления службы WWW. Поскольку современные электронные документы содержат не только текст, но и мультимедиа-информацию, понятие гипертекста было расширено до понятия гипермедиа. Гипермедиа — это метод организации мультимедиа-информации на основе ссылок на разные типы данных. Гипермедиа-документы могут использоваться не только в WWW, но и, например, в электронной энциклопедии на CD-ROM, где ссылка в тексте часто ведет на аудио- или видеоролик.

Особенно продуктивной идея гипертекста оказалась применительно к объединению цифровой информации, распределенной на серверах во всем мире. Документ, доступный через Web, называют Web-страницей, а группы страниц, связанных общим именем, темой и объединенных навигационно, — Web-сайтами. Первую страницу, которую видит пользователь при обращении на тот или иной ресурс, называют стартовой, домашней или индексной страницей (home page). Система гиперссылок определяет структуру Web-сайта. Страницы на сайте могут иметь линейную древовидную структуру, но чаще на каждой странице имеется несколько ссылок, что и позволяет говорить о структуре «паутина» (см. рис. 1)

Рис. 2.5. Компьютерная сеть и «паутина» документов

Wеb-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся wеb-страницы.

Wеb-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись, видео. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.

Гиперссылка — это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в паутине. Обычно изображение гиперссылки на странице каким-то образом выделяется, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом. Гиперссылки могут быть связаны не только с текстом, но и с другими видами объектов: рисунок, фото, видео, звукозапись, телеканал и др.

В основе технологии WWW лежат следующие понятия:

  • НТТР (HyperText Transfer Protocol, протокол передачи гипертекста);
  • адрес URL (Universal Resource Locator, универсальный указатель ресурса);
  • язык HTML (HyperText Markup Language, язык разметки гипертекста).

НТТР (HyperText Transfer Protocol) — протокол передачи гипертекста. Используется службой WWW. Браузер — клиент-программа WWW посылает запрос wеb-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает клиенту требуемый файл или сообщение об ошибке, если файл недоступен. Протокол НТТР регулирует данный вид взаимодействия между клиентом и сервером.

URL-aдpec. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IP-адреса, доменные адреса.’ В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурса. Каждая wеb-страница или файл имеют свой уникальный URL-адpec, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь+имя) на сервере. Например, URL-адрес главной страницы wеb-сайта газеты «Первое сентября» выглядит так:

Префикс «www» образовался больше 20 лет назад и обозначал то, что на соответствующем домене работает именно wеb-сервер, а не какой-либо иной сервис. Но теперь, когда WWW стал доминирующим сервисом, смысл в его указании почти пропал.

Следует заметить, что имя составлено по правилам операционной системы Unix, под управлением которой работают серверы Интернета. В отличие от Windows вместо символа «» (обратный слеш) здесь используется символ «/» (слеш). Кроме того, строчные и прописные буквы не являются взаимозаменяемыми.

Web-сайт (другое название — web-узел) — это совокупность взаимосвязанных страниц, принадлежащих какому-то одному лицу или организации. Wеb-сайт организуется на wеb-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные его разделы. Пример главной страницы wеb-узла издательства «БИНОМ. Лаборатория знаний» приведен на рис. 2.6.

Рис. 2.6. Фрагмент главной страницы сайта издательства БИНОМ

HTML — стандартный язык описания wеb-страниц. Теги (метки) языка HTML интерпретируются браузером, который на их основе строит в памяти компьютера объектную модель документа, а затем выводит эти объекты на экран. В результате пользователь видит отображение wеb-страницы в окне браузера. Язык HTML является основой любого гипертекстового документа, даже если он был создан в одном из конструкторов сайтов или визуальном редакторе.

Wеb-браузер — программа-клиент WWW. Слово browser можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator, Internet Explorer, Opera, Google Chrome.

Средства поиска информации в WWW

Как уже говорилось выше, WWW — это система web-страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система wеb-страниц не структурирована.

Единственной координатой web-документа является его URL-aдpec. Однако URL-aдpec никак не связан с содержанием документа. Но поиск данных осуществляется именно по содержанию. Как же в такой ситуации можно выполнять поиск нужной информации в паутине?

В поиске информации в WWW пользователю помогает поисковая служба Интернета — услуга поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.

Поисковые каталоги. Если вам приходилось пользоваться услугами больших библиотек, то вы знаете, что такое библиотечный каталог. Существуют алфавитные и предметные каталоги. В алфавитных каталогах карточки с библиографическими данными книг разложены в алфавитном порядке фамилий авторов. В предметных каталогах карточки систематизированы по содержанию книг.

Систематизация в предметном каталоге производится по иерархическому принципу. На первом уровне иерархии весь книжный фонд делится на крупные разделы: художественная литература, учебная литература, общественно-политическая литература, научно-техническя литература и т. п. Каждый из этих разделов делится на подразделы; например, учебная литература делится на разделы высшего, среднего, дошкольного образования. Книги для среднего образования могут делиться по предметам, которые, в свою очередь, делятся по классам. Чтобы подобрать литературу по нужной теме, читатель должен понимать принцип организации каталога.

Поисковые каталоги WWW организованы по аналогичному иерархическому принципу. Только в них систематизируется информация не о книгах, а о документах, хранящихся в World Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т. д. Каждое имя в этом списке является внутренней гиперссылкой поискового каталога. Щелчок мышью по гиперссылке вызывает на экран список заголовков следующего подраздела и т. д. Очевидно, такая система подобна дереву файловой системы. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые wеb-документы.

Поисковые каталоги заполняются вручную специалистами, обслуживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме. Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.

Поисковые указатели. Другое название этого вида поисковой службы — поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели — это перечень основных терминов с указанием страниц, на которых они встречаются. Например, в учебнике по информатике вы ищете в таком списке слово «процессор», напротив которого указаны номера страниц. Затем на этих страницах читаете всё, что написано о процессоре.

Принцип работы поисковых указателей заключается в создании и использовании индексных списков — аналогов книжных предметных указателей.

Задачи поисковых машин состоят в формировании индексных списков, охватывающих как можно большее число документов паутины, а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически.

Основной составляющей поисковых машин являются программы просмотра wеb-документов, которые называют по-разному: роботами, червяками, пауками и пр. Наверное, наиболее подходящим названием является «пауки», если уж сеть WWW называть паутиной! Непрерывно, днем и ночью, они сканируют всё информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины всё время меняется и дополняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина всё время должна поддерживать информацию в актуальном состоянии.

Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы представляют «know how», т. е. объекты интеллектуальной собственности авторов, и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» — случайных документов, не имеющих отношения к теме поиска.

В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенные по убыванию рейтинга. Pейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка.

Число поисковых указателей превышает число поисковых каталогов. Популярными в Pоссии указателями являются:

Поисковая служба Google работает как в международном, так и в российском секторе Интернета и является самой популярной.

Интернет / Коммуникации | Всемирная паутина

Всемирная паутина (англ. World Wide Web ) — распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключённых к Интернету. Для обозначения Всемирной паутины также используют слово веб (англ. web «паутина») и аббревиатуру WWW .

Предыстория. Глобальные гипертекстовые структуры.

Гипертекст — текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и т.д. Во время чтения такого текста (в соответствующей программе, его обрабатывающей и выполняющей соответствующие ссылки или действия) вы видите подсвеченные (выделенные) в тексте слова. В Internet в контексте WWW можно получать доступ к чему угодно, к telnet, e-mail, ftp, Gopher, WAIS, Archie, USENET News и т.п.

В WWW можно ссылаться на данные на других машинах в любом месте сети, тогда при активации этой ссылки эти данные автоматически передадутся на исходную машину и вы увидите на экране текст, данные, картинку, а если провести в жизнь идею мультимедиа, то и звук услышите, музыку, речь. Это слегка напоминает Gopher, но фактически это принципиально другое и новое. В Gopher имеется жесткая структура меню, по который вы двигаетесь, как вам угодно. Эта структура не зависит от того, что вы делаете, какой документ пользуете и т.д. В WWW вы двигаетесь по документу, который может иметь какую угодно гипертекстовую структуру. Вы сами можете организовать структуры меню в гипертексте. Имея редактор гипертекстов, вы можете создать любую структуру рабочей среды, включая документацию, файлы, данные, картины, программное обеспечение и т.д., и это не будет новое программное обеспечение, а просто гипертекст. Увы, создание гипертекстовых редакторов с человеческим лицом (дружественным интерфейсом, отладчиком и т.д.) задача не из простых и еще не решенная.

Так как «читать» гипертекст приятнее (и вообще имеет смысл) в том случае, когда не возникает задержек при активации ссылок (подкачка текста с другого сервера или просто с сервера, но по местной сетевой линии, пересылка изображений, баз данных и т.д.), то WWW следует устанавливать на быстрые линии. На медленных линиях использование WWW превратится в сплошное мучение, ожидание, зависание, все прелести и сам смысл теряются. Также нерационально работать, например, по telnet в WWW на очень далеко расположенной машине, — это влетит вам в добрую копеечку. Именно поэтому хочется иметь такой сервер у себя в стране, хотя бы один. WWW требует наличия по крайней мере доступа по вызову. Этот способ структурирования информации и организации доступа к ней предложен и развит в CERN. Поработать в WWW можно по telnet на машине info.cern.ch. Трафик WWW составляет пока 0.31% от всего.

История WWW

Сам термин «гипертекст» (hypertext) появился спустя двадцать лет в 1965 году.Его предложил предложил бакалавр философии Теодор Холм Нельсон из Гарвардского университета. Он определил его как непоследовательное письмо, как текст, который ветвится и предоставляет читателю выбор наилучшего варианта чтения на интерактивном экране. Тогда же появился и первый вариант программы подготовки гипертекстов для суперкомпьютеров (мэйнфреймов), написанный на ассемблере и позволяющий сравнивать различные элементы материала и отменять внесенные изменения. Нельсон назвал программу «Xanadu». Большую роль в создании гипертекста сыграл также легендарный компьютерный деятель Дуглас Энгельбарт, который параллельно с Нельсоном вел разработку обучающей системы HLAM/T (Human using Language, Artifacts, and Methodology, in which he is Trained). Он еще за два года до Нельсона выдвинул идею интерактивного взаимодействия человека и машины, включавшую в себя основные концепции гипертекстового письма, но реализовать ее на практике не сумел.

Отцы-основатели гипертекста
В ноябре 1990 года к работе по проекту Тима Бернерса-Ли подключаются Николя Пеллоу (Nicola Pellow), занявшийся написанием гипертекстового браузера «Line mode» и Бернд Полерман (Bernd Pollermann), помогавший с разработкой кода поискового сервера для гипертекстового доступа к информационным базам данных CERN. Тогда же на свет появляется первоначальный прототип первого в мире гипертекстового web-браузера, называвшегося «WorldWideWeb» и совмещавшего в себе также функции редактора гипертекста. Спустя всего месяц в CERN демонстрируются первые наработки в данной области с возможностью доступа к гипертекстовым файлам, поисковой системе CERN’а и новостным статьям интернета. Следующим шагом на пути к Всемирной паутине стал выпуск в марте 1991 года гипертекстового браузера для ограниченной аудитории, работающих на vax, rs6000 и sun4 машинах, а 17 мая 1991 года стандарт WWW был утвержден и WWW начинает работать на центральных машинах CERN. Эту дату можно считать началом плетения всемирной паутины. Первый в мире web-сайт появился он-лайн в Интернете 6 августа 1991 года по адресу http://info.cern.ch/ . На нем описывалось, что такое Всемирная паутина, как установить web-сервер, как использовать браузер и т.п. Сайт также стал первым в мире интернет-каталогом, так как позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты. Однако для широкой публики новый браузер станет доступен лишь 15 января 1992 года, когда его версия 1.1 будет выложена для скачивания по протоколу FTP. В 1994 г. Тим Бернерс-Ли основал и возглавил Консорциум Всемирной паутины (World Wide Web Consortium, W3C). Этот Консорциум разрабатывает для Интернета единые принципы и стандарты (W3C Recommendations), которые затем внедряются производителями программ и оборудования. Таким образом, достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все Рекомендации Консорциума Всемирной паутины открыты, т.е. не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.

Следующим шагом на пути к интернету в его нынешнем виде стало создание WWW, изобретателем которого считается Тим Бернерс-Ли (Tim Berners-Lee). Он является автором технологий HTTP, URI/URL и HTML, т.е. всех тех элементов, что легли в основу Всемирной паутины. В 1980 году Тим Бернерс-Ли для собственных нужд написал программу «Enquire» (можно вольно перевести как «Дознаватель»), которая являлась гипертекстовой системой и использовала случайные ассоциации для хранения данных. Впоследствии, работая в швейцарском Европейском центре ядерных исследований в Женеве (CERN), он пришел к выводу, что физика высоких энергий нуждается в сетевой гипертекстовой системе для эффективного сопровождения проектов и исследований, а CERN может стать отличным полигоном для реализации гипертекстовых идей. В марте 1989 года, создавая в CERN внутреннюю сеть организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, ставший первым опытом WWW. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления своего проекта группе Тима Бернерса-Ли понадобилось изобрести систему адресации, которая бы каждому объекту в Сети приписывала уникальный адрес (систему URI — единообразный идентификатор ресурса).

Тим Бернерс-Ли
В ноябре 1990 года к работе по проекту Тима Бернерса-Ли подключаются Николя Пеллоу (Nicola Pellow), занявшийся написанием гипертекстового браузера «Line mode» и Бернд Полерман (Bernd Pollermann), помогавший с разработкой кода поискового сервера для гипертекстового доступа к информационным базам данных CERN. Тогда же на свет появляется первоначальный прототип первого в мире гипертекстового web-браузера, называвшегося «WorldWideWeb» и совмещавшего в себе также функции редактора гипертекста. Спустя всего месяц в CERN демонстрируются первые наработки в данной области с возможностью доступа к гипертекстовым файлам, поисковой системе CERN’а и новостным статьям интернета.

Следующим шагом на пути к Всемирной паутине стал выпуск в марте 1991 года гипертекстового браузера для ограниченной аудитории, работающих на vax, rs6000 и sun4 машинах, а 17 мая 1991 года стандарт WWW был утвержден и WWW начинает работать на центральных машинах CERN. Эту дату можно считать началом плетения всемирной паутины. Первый в мире web-сайт появился он-лайн в Интернете 6 августа 1991 года по адресу http://info.cern.ch/. На нем описывалось, что такое Всемирная паутина, как установить web-сервер, как использовать браузер и т.п. Сайт также стал первым в мире интернет-каталогом, так как позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты. Однако для широкой публики новый браузер станет доступен лишь 15 января 1992 года, когда его версия 1.1 будет выложена для скачивания по протоколу FTP.

В 1994 г. Тим Бернерс-Ли основал и возглавил Консорциум Всемирной паутины (World Wide Web Consortium, W3C). Этот Консорциум разрабатывает для Интернета единые принципы и стандарты (W3C Recommendations), которые затем внедряются производителями программ и оборудования. Таким образом, достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все Рекомендации Консорциума Всемирной паутины открыты, т.е. не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.

Всемирная паутина WWW: гипертекст, поисковые машины

Для представления Web-страниц используется специальный язык разметки гипертекста — HTML (Hypertext Markup Language). Конструкции этого языка — тэги — позволяют управлять шрифтом, цветом текста и фона, определять ссылки, вставлять графику, аудио и видео и т. п. Сами тэги при чтении страницы не видны, а видны только результаты их действия. Если сравнить, как выглядит страница в исходном тексте… Читать ещё >

  • Выдержка
  • Похожие работы
  • Помощь в написании

Всемирная паутина WWW: гипертекст, поисковые машины ( реферат , курсовая , диплом , контрольная )

санкт-петербургский государственный

Университет экономики и финансов

КАФЕДРА ИНФОРМАТИКИ РЕФЕРАТ НА ТЕМУ (2 курс, 2 семестр):

«Всемирная паутина www: гипертекст, поисковые машины»

238 группы Мельник О. Н.

Проверила: доцент кафедры информатики

Всемирная паутина WWW

Всемирная Паутина — это совокупность информационных ресурсов, связанных средствами телекоммуникаций и основанных на гипертекстовом представлении данных, разбросанных по всему миру. Всемирная Паутина также обозначается как WWW (World Wide Web), W3 или просто Web.

Единицей гипертекстовых данных Всемирной Паутины является Web-страница — минимальный фрагмент гипертекста, который можно загрузить и прочитать за один раз. Webстраница содержит текст, графику и ссылки на другие Webстраницы.

Для идентификации гипертекстовой страницы в Сети используется так называемый URL — Universal Resource Locator — Универсальный Локатор Ресурсов. В нем содержится информация о способе передачи данных между клиентом и сервером (протоколе), имени сервера, на котором находится страница, пути в дереве каталогов сервера, по которому находится страница и имени страницы.

Для представления Web-страниц используется специальный язык разметки гипертекста — HTML (Hypertext Markup Language). Конструкции этого языка — тэги — позволяют управлять шрифтом, цветом текста и фона, определять ссылки, вставлять графику, аудио и видео и т. п. Сами тэги при чтении страницы не видны, а видны только результаты их действия. Если сравнить, как выглядит страница в исходном тексте и она же на экране браузера, то порой удивительно, насколько велики различия.

Клиента для WWW называют браузером. Браузер — это программа, которая загружает и, интерпретируя тэги HTML, показывает в своем окне WWW-страницы. Браузер отображает картинки в теле страницы, проигрывает аудио и видео, загружает следующую страницу, когда пользователь щелкает мышью по ссылке и пр. и пр. для того, чтобы сделать путешествие по Всемирной Паутине как можно более комфортным.

Гипертекст и web-страницы

Гипертекст (Hypertext) — это документ (в первую очередь текстовый), содержащий гиперссылки. Гиперссылка — это связь слова или содержащегося в документе изображения с другим ресурсом, которым может быть как еще один документ, так и раздел текущего документа. Подобные «связанные» слова или картинки документа, как правило, выделяются по оформлению из общего текста. Общепринятой является практика подчеркивания слова или предложения, связанного гиперссылкой.

Сам термин «гипертекст» появился с возникновением электронных документов, задолго до появления службы WWW. Поскольку современные электронные документы содержат не только текст, но и мультимедиа-информацию, понятие гипертекста было расширено до понятия гипермедиа. Гипермедиа — это метод организации мультимедиа-информации на основе ссылок на разные типы данных. Гипермедиа-документы могут использоваться не только в WWW, но и, например, в электронной энциклопедии на CD-ROM, где ссылка в тексте часто ведет на аудиоили видеоролик.

Особенно продуктивной идея гипертекста оказалась применительно к объединению цифровой информации, распределенной на серверах во всем мире. Документ, доступный через Web, называют Web-страницей, а группы страниц, связанных общим именем, темой и объединенных навигационно, — Web-сайтами. Первую страницу, которую видит пользователь при обращении на тот или иной ресурс, называют стартовой, домашней или индексной страницей (home page). Система гиперссылок определяет структуру Web-сайта. Страницы на сайте могут иметь линейную древовидную структуру, но чаще на каждой странице имеется несколько ссылок, что и позволяет говорить о структуре «паутина» (см. рис. 1)

Рисунок 1

Поиск информации в Internet

Как правило, последовательность поиска информации в Internet выглядит следующим образом:

1. Конкретизируется область поиска, выделяются ключевые слова, характерные для интересующей области. Рекомендуется по возможности подбирать такие слова, которые не используются ни в каких других областях деятельности или знания.

2. На поисковый сервер посылается запрос, сформированный из ключевых слов. На многих поисковиках имеется возможность конкретизировать область поиска путем выбора соответствующих пунктов предлагаемых меню (10, «https://referat.bookap.info»).

3. Так или иначе, от сервера приходит список ссылок на WWWстраницы, в которых обнаружены запрошенные слова с кратким описанием каждой из них или просто с небольшим начальным фрагментом страницы.

4. Далее следует исследование подходящих (судя по заголовку или описанию) страниц. Здесь начинается «свободное плавание», то есть переход по ссылкам с текстом, который обещает нечто интересное.

5. Сохранение на диске интересующего материала.

Отыскать нужную информацию в Седьмом океане — океане информации было бы просто невозможно если бы не существовало поисковых серверов. Такие серверы предоставляют возможность поиска страниц по ключевому слову или в иерархическом дереве каталога. Существуют как чисто англоязычные и русскоязычные, так и смешанные серверы. Документов на английском языке в Internet гораздо больше, чем на русском, поэтому имеет смысл посетить также и западные поисковики.

Для поиска информации по ключевому слову на поисковый сервер посылается запрос. Запрос формируется автоматически — нужно только ввести слова в поле ввода, выбрать нужные опции поиска и нажать кнопку. Обратно приходит Web-страница с отчетом о результатах поиска. Так как список найденных документов может быть очень большим, он разбивается на фрагменты по 10−100 элементов (на каждом сервере по-разному), а в конце отчета приводятся ссылки на следующие фрагменты списка.

Каждый элемент отчета формируется следующим образом:

— в начале идет заголовок документа являющийся также и ссылкой на этот документ (если у документа нет заголовка — может быть и такое — то здесь помещается надпись ‘No title’);

— далее следует небольшой фрагмент самого документа по которому практически всегда можно понять, о чем идет речь в документе и, следовательно, подходит он вам или нет;

— и, наконец, список URL данного документа (один и тот же документ может быть продублирован по разным адресам).

Чтобы перейти к документу, достаточно щелкнуть либо по ссылке с текстом заголовка, либо по одной из ссылок с URL. Кстати, единственный поисковик, который выдает пользователю не фрагмент документа, а настоящую аннотацию (на английском языке), написанную людьми — это Yahoo.

Второй метод отыскания документов, предоставляемый поисковыми серверами — поиск по каталогам. Практически на всех поисковых машинах есть такие каталоги (исключение — Altavista, Rambler). В таких каталогах вся область знаний разбивается на несколько крупных подобластей, например, искусство, бизнес, компьютеры, образование, спорт, политика, путешествия, здоровье и т. д. и т. п. Дале каждая такая подобласть разбивается на более мелкие разделы и подразделы. Таким образом в процессе поиска вы на каждом шаге будете уточнять искомое понятие, сужая область поиска, пока не получите список ссылок на документы, уже более соответствующих нужной вам теме.

Наиболее популярными англоязычными поисковиками являются: Yahoo, Magellan, Infoseek, Excite, WebCrawler, русскоязычными: Rambler, Русская Машина Поиска, всеязычным — Altavista, Altavista Telia.

Классификация поисковых машин

Первая таблица включает в себя ведущие мировые поисковые машины, которые были первыми поисковыми службами в сети Интернет. С их помощью пользователи могут вести поиск, используя ключевые слова или логические конструкции. Большинство служб использует специальные языки запросов. Кроме того, можно воспользоваться уже существующей иерархией каталогов. Например, если вы ищете сайт определенной газеты, то нужно следовать по каталогу Yahoo! следующим образом:

News and Media — >> Newspapers — > The New York Times

Altavista и Yahoo! лидируют в этом списке. На этих сайтах существует обширная база данных и хорошо структурированная иерархия. Euroseek незаменим при поиске отдельных европейских ресурсов.

Глобальные поисковые машины

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: