Що таке всесвітнє інформаційне павутиння. Історія всесвітнього павутиння. Як було створено Всесвітнє павутиння

Світова співдружність мереж;
♦ що таке World Wide Web;
♦ Web-сервер, Web-сторінка, Web-сайт;
♦ гіперструктура WWW;
♦ браузер – клієнт-програма WWW; Проблема пошуку інформації в Інтернеті.

Інтернет - світова співдружність мереж

Хотілося б вам заглянути до резиденції президента США – Білого дому, чи відвідати Лувр – найбільший художній музей світу, чи дізнатися, яка погода в Антарктиді, чи отримати відомості про вистави, що йдуть сьогодні ввечері у московських театрах? Усього цього та багато іншого можна досягти, не виходячи з-за столу, на якому встановлено персональний комп'ютер, підключений до світової мережіІнтернет.

Інтернет поєднує тисячі локальних, галузевих, регіональних комп'ютерних мереж усього світу. Окремий користувач, який не є абонентом якоїсь із перелічених мереж, також може підключитися до Інтернету через найближчий вузловий центр.

Усі перелічені вище послуги комп'ютерних мереж ( електронна пошта, телеконференції, файлові архіви та ін.) працюють і в Інтернеті. У цьому можуть бути лише проблеми мови спілкування. Мовою міжнародного спілкування у світовій мережі є англійська. Ось вам ще один стимул старанно вивчати англійська мова !

Що таке World Wide Web

Найцікавішою послугою, що надається користувачам Інтернету, починаючи з 1993 року, стала можливість роботи з інформаційною системою World Wide Web (скорочено - WWW). Це словосполучення можна перекласти як «всесвітнє павутиння». Саме робота з WWW мала на увазі, коли на початку цього параграфу вам пропонувалися будь-які інформаційні чудеса.

Дуже важко дати точне визначення, що таке WWW. Цю систему можна порівняти з величезною енциклопедією, сторінки якої розкидані комп'ютерами-серверами, об'єднаними мережею Інтернет. Щоб отримати потрібну інформацію, користувач повинен дістатись до відповідної сторінки енциклопедії. Можливо, маючи на увазі таку аналогію, автори WWW запровадили поняття Web-сторінки.

Web-сервер, Web-сторінка, Web-сайт

Web-сторінка – це основна інформаційна одиниця WWW. Вона є окремим документом, що зберігається на Web-сервері. Сторінка має своє ім'я (подібно до номера сторінки в енциклопедії), за яким до неї можна звернутися.

Інформація на Web-сторінці може бути різною: текст, малюнок, фотографія, мультимедіа. На Web-сторінках розміщують також рекламу, довідкову інформацію, наукові статті, останні новини, ілюстровані видання, художні каталоги, прогноз погоди та багато іншого. Простіше сказати: на Web-сторінках є «все».

Декілька Web-сторінок можуть бути пов'язані тематично і утворювати Web-сайт. Кожен сайт має Головна сторінка, Яка називається домашньою (Ноте раге). Це своєрідний титульна сторінка, з якого можна переглядати документи, що зберігаються на сервері. Зазвичай домашня сторінка містить зміст - назви розділів. Щоб звернутися до потрібного розділу, достатньо підвести покажчик миші до назви розділу та натиснути кнопку миші.

Гіперструктура WWW

Однак переглядати Web-сторінки зовсім не обов'язково поспіль, перегортаючи їх, як у книзі. Найважливішим властивістю WWW є гіпертекстова організація зв'язків між Web-сторінками. Причому ці зв'язки діють як між сторінками одному сервері, а й між різними серверами WWW.

Зазвичай ключові слова, Від яких йдуть гіперзв'язки, виділяються на Web-сторінці кольором або підкресленням. Клацнувши мишею на такому слові, ви за прихованим посиланням перейдете до перегляду іншого документа. Причому цей документ може бути на іншому сервері, в іншій країні, на іншому континенті. Найчастіше користувач Інтернету поняття не має, де знаходиться сервер, з яким він зараз спілкується. Образно кажучи, за один сеанс роботи можна кілька разів "облетіти" навколо земної кулі.

Роль ключа для зв'язку може виконувати не лише текст, а й малюнок, фотографія, покажчик звукового документа. У разі замість терміна «гіпертекст» вживається термін «гіпермедіа».

На ту саму Web-сторінку можна вийти різними шляхами. Аналогія зі сторінками книжки тут не працює. У книзі сторінки мають певну послідовність. Web-сторінки такої послідовності немає. Перехід від однієї сторінки до іншої відбувається через гіперзв'язки, що утворюють мережу, яка нагадує павутину. Звідси і походить назва системи.

Узагальнюючи сказане, можна дати таке визначення:

World Wide Web – це розподілена по всьому світу інформаційна системаз гіперзв'язками, що існує на технічної базивсесвітньої мережі Інтернет.

Браузер – клієнт-програма WWW. Проблема пошуку інформації в Інтернеті

Переміщатися по "павутині" користувачеві допомагає спеціальне програмне забезпечення, яке називається Web-браузером від англійського "browse" - "оглядати, вивчати". За допомогою браузера потрібну інформацію можна знайти різними способами. Найкоротший шлях – за допомогою адреси Web-сторінки. Ви набираєте цю адресу на клавіатурі, натискаєте клавішу введення і потрапляєте відразу на місце.

Інший шлях – пошук. Ви можете почати рух зі своєї домашньої сторінки з гіперзв'язків. При цьому є небезпека не туди піти, заплутатися в павутинні, потрапити в глухий кут. Втім браузер дозволяє повернутися назад на будь-яку кількість кроків, продовжити пошук іншим маршрутом. Такий пошук подібний до блукання в незнайомому лісі (щоправда, менш небезпечний).

Хорошими помічниками в навігації WWW є спеціальні пошукові програми. Вони знають все або майже все про WWW. Такій програмі достатньо вказати набір ключових слів по темі, що вас цікавить, і вона видасть список посилань на відповідні Web-документи. Якщо список виявиться занадто довгим, потрібно додати якісь уточнюючі терміни.

Користувач Інтернету під час сеансів роботи в мережі позначається зануреним в інформаційний простір із необмеженими ресурсами. Останнім часом став поширеним термін «кіберпростір» про під яким розуміється вся сукупність світових систем телекомунікацій та інформації, що циркулює в них.

Система WWW дуже швидко розвивається. Вже зараз усі її ресурси погано піддаються огляду. Випускаються товсті довідники, каталоги, які старіють швидше, ніж телефонні книги. Тому одночасно зі збільшенням обсягу інформації вдосконалюється система пошуку у World Wide Web.

Коротко про головне

Інтернет – всесвітня глобальна комп'ютерна мережа.

World Wide Web - Всесвітнє павутиння: розподілена по всьому світу інформаційна система з гіперзв'язками, яка існує на технічній базі світової мережі Інтернет.

Web-сторінка – окремий документ WWW.

Web-сервер - комп'ютер у мережі Інтернет, що зберігає Web-сторінки та відповідне програмне забезпечення, до роботи з ними.

Web-сайт – сукупність тематично пов'язаних сторінок.

Гіпермедіа – система гіперзв'язків між мультимедіа документами.

Web-браузер – клієнт-програма для роботи користувача з WWW.

Пошук потрібного документа WWW може відбуватися: шляхом вказівки його адреси; шляхом переміщення «павутиною» гіперзв'язків; шляхом використання пошукових програм.

Кіберпростір - сукупність світових систем телекомунікацій та інформації, що циркулює в них.

Запитання та завдання

1. Що таке Інтернет?
2. Як перекладається словосполучення "World Wide Web"?
3. Що таке WWW?
4. Яку інформацію можна отримати з WWW?
5. Як організовано зв'язок між Web-сторінками?
6. У чому аналогія між WWW та павутинням?
7. Що таке гіпермедіа?
8. Що таке Web-сервер?
9. Якими методами WWW можна знайти потрібну сторінку?

І. Семакін, Л. Залогова, С. Русаков, Л. Шестакова, Інформатика, 9 клас
Надіслано читачами з інтернет-сайтів

Вся інформатика онлайн, список тем з предметів, збірка конспектів з інформатики, домашня робота, питання та відповіді, реферати з інформатики

Зміст уроку конспект урокуопорний каркас презентація уроку акселеративні методи інтерактивні технології Практика завдання та вправи самоперевірка практикуми, тренінги, кейси, квести домашні завдання риторичні питання від учнів Ілюстрації аудіо-, відеокліпи та мультимедіафотографії, картинки графіки, таблиці, схеми гумор, анекдоти, приколи, комікси притчі, приказки, кросворди, цитати Доповнення рефератистатті фішки для допитливих шпаргалки підручники основні та додаткові словник термінів інші Вдосконалення підручників та уроківвиправлення помилок у підручникуоновлення фрагмента у підручнику елементи новаторства на уроці заміна застарілих знань новими Тільки для вчителів ідеальні урокикалендарний план на рік

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Подібні документи

Теоретичні основи Інтернет-технологій та основних служб Інтернету. Ознайомлення з можливостями підключення до Інтернету. Основні служби мережі. Принципи пошуку інформації у WWW. Огляд сучасних Інтернетбраузерів. Програми для спілкування у мережі.

курсова робота , доданий 18.06.2010

Що таке Інтернет? Internet як засіб масової інформації. Служби Internet. Мережа преса. Структура Політ.ру. Статистика. Рейтинг. Із чого складається Internet? ICQ – нова можливістьспілкування. Адміністративний устрій Internet.

реферат, доданий 10.05.2003

Інтернет – глобальна інформаційна мережа, його будова, основні служби, історія виникнення. Доступ до інформації. Сервер, провайдер, маршрутизатор. Концепція протоколів Інтернету. Мова форматування HTML. Програми браузери. Протоколи URL-адрес.

реферат, доданий 23.10.2011

Характеристика та значення інтернет-технологій у сучасній освіті. Позитивна можливість сучасних Internet-технологій. Основні переваги електронного навчання, аналіз навчальних програм, характеристика телекомунікаційних технологій.

дипломна робота , доданий 23.06.2012

Роль та значення Інтернету в житті суспільства. Тенденції розвитку Інтернету в Росії: проблеми та перспективи, характеристика структури ринку. Сфери обслуговування реалізують послуги через Інтернет. Використання Інтернет-технологій у соціокультурній сфері.

курсова робота , доданий 04.02.2011

Поняття "інформація". Інтерактивність. Інформаційний пошук. Інтернет як основне засіб інтерактивного пошуку інформації. Історія створення Інтернету. Доступ в Інтернет. Пошукові ресурси Типи пошукових систем. Електронна пошта.

курсова робота , доданий 15.02.2007

Основні факти з історії появи інтернету, ключові принципита перспективи подальшого розвитку. Мовні галузі Інтернету, російськомовне середовище всесвітньої мережі (Рунет). Види браузерів для перегляду веб-сторінок. Спектри сервісів та послуг Інтернету.

контрольна робота , доданий 25.02.2012

Структура та принципи Всесвітнього павутиння

Всесвітнє павутиння навколо Вікіпедії

Всесвітнє павутиння утворюють мільйони веб-серверів мережі Інтернет, розташованих по всьому світу. Веб-сервер є програмою , яка запускається на підключеному до мережі комп'ютері та використовує протокол HTTP для передачі даних. У найпростішому вигляді така програма отримує по мережі HTTP-запит на певний ресурс, знаходить відповідний файл на локальному жорсткому диску і відправляє його по мережі комп'ютеру. Більш складні веб-сервери здатні динамічно розподіляти ресурси у відповідь HTTP-запит. Для ідентифікації ресурсів (найчастіше файлів або їх частин) у Всесвітньому павутинні використовуються однакові ідентифікатори ресурсів URI (англ. Uniform Resource Identifier). Для визначення місцезнаходження ресурсів у мережі використовують одноманітні локатори ресурсів URL (англ. Uniform Resource Locator). Такі URL-локатори поєднують у собі технологію ідентифікації URI та систему доменних імен DNS (англ. Domain Name System) - доменне ім'я(або безпосередньо -адреса в числовому записі) входить до складу URL для позначення комп'ютера (точніше - одного з його мережевих інтерфейсів), що виконує код потрібного веб-сервера.

Для огляду інформації, отриманої від веб-сервера, на клієнтському комп'ютерізастосовується спеціальна програма- Веб-браузер . Основна функція веб-браузера – відображення гіпертексту. Всесвітня павутина нерозривно пов'язана з поняттями гіпертексту та гіперпосилання. Більшість інформації в Інтернеті є саме гіпертекст. Для полегшення створення, зберігання та відображення гіпертексту у Всесвітньому павутинні традиційно використовується мова HTML (англ. HyperText Markup Language ), мова розмітки гіпертексту. Робота з розмітки гіпертексту називається версткою, майстра з розмітки називають веб-майстром або веб-майстром (без дефісу). Після HTML-розмітки гіпертекст, що вийшов, поміщається у файл, такий HTML-файл є основним ресурсом Всесвітньої павутини. Після того, як HTML-файл стає доступним веб-серверу, його починають називати веб-сторінкою. Набір веб-сторінок створює веб-сайт . До гіпертексту веб-сторінок додаються гіперпосилання. Гіперпосилання допомагають користувачам Всесвітньої павутини легко переміщатися між ресурсами (файлами) незалежно від того, знаходяться ресурси на локальному комп'ютеріабо на віддаленому сервері. Гіперпосилання веб-сервера засновані на технології URL.

Технології Всесвітнього павутиння

Для покращення візуального сприйняття Інтернету стала широко застосовуватися технологія CSS, яка дозволяє задавати єдині стилі оформлення для багатьох веб-сторінок. Ще одне нововведення, яке варто звернути увагу, - система позначення ресурсів URN (англ. Uniform Resource Name).

Популярна концепція розвитку Всесвітнього павутиння - створення семантичного павутиння. Семантична павутина - це надбудова над існуючим Всесвітнім павутинням, яка покликана зробити розміщену в мережі інформацію більш зрозумілою для комп'ютерів. Семантична павутина - це концепція мережі, в якій кожен ресурс людською мовою був би забезпечений описом, зрозумілим комп'ютеру. Семантична павутина відкриває доступ до чітко структурованої інформації для будь-яких програм, незалежно від платформи та незалежно від мов програмування. Програми зможуть самі знаходити потрібні ресурси, обробляти інформацію, класифікувати дані, виявляти логічні зв'язки, робити висновки та навіть приймати рішення на основі цих висновків. При широкому поширенні та грамотному впровадженні семантична павутина може спричинити революцію в Інтернеті. Для створення зрозумілого комп'ютера опису ресурсу в семантичній павутині використовується формат RDF (англ. Resource Description Framework ), який заснований на синтаксисі XML та використовує ідентифікатори URI для позначення ресурсів. Новинки у цій галузі - це RDFS (англ.)російська. (англ. RDF Schema) та SPARQL (англ. Protocol And RDF Query Language ) (вимовляється як «спаркл»), нова мова запитів для швидкого доступудо даних RDF.

Історія Всесвітнього павутиння

Винахідниками всесвітньої павутини вважаються Тім Бернерс-Лі і меншою мірою Роберт Кайо. Тім Бернерс-Лі є автором технологій HTTP, URI/URL та HTML. У 1980 році він працював у Європейській раді з ядерних досліджень (фр. Conseil Européen pour la Recherche Nucléaire, CERN ) консультантом з програмного забезпечення. Саме там, у Женеві (Швейцарія), він для потреб написав програму «Енквайр» (англ. Enquire, можна вільно перекласти як «Дозвідник»), яка використовувала випадкові асоціації для зберігання даних і заклала концептуальну основу для Всесвітньої павутини.

Перший у світі веб-сайт був розміщений Бернерсом-Лі 6 серпня 1991 на першому веб-сервері доступному за адресою http://info.cern.ch/, (). Ресурс визначав поняття Всесвітньої павутини, містив інструкції щодо встановлення веб-сервера, використання браузера тощо. Цей сайт також був першим у світі інтернет-каталогом, тому що пізніше Тім Бернерс-Лі розмістив та підтримував там список посилань на інші сайти.

На першій фотографії у Всесвітньому павутинні була зображена пародійна філк-група Les Horribles Cernettes. Тім Бернес Лі попросив їх відскановані знімки у лідера групи після CERN Hardronic Festival.

І всеж теоретичні основиІнтернет були закладені набагато раніше Бернерса-Лі. Ще 1945 року Ваннавер Буш розробив концепцію Memex (англ.)російська. - Допоміжних механічних засобів «розширення людської пам'яті». Memex - це пристрій, в якому людина зберігає всі свої книги та записи (а в ідеалі - і всі свої знання, що піддаються формальному опису) і який видає необхідну інформацію з достатньою швидкістю та гнучкістю. Воно є розширенням та доповненням пам'яті людини. Бушем було також передбачено всеосяжне індексування текстів та мультимедійних ресурсів з можливістю швидкого пошукунеобхідної інформації. Наступним значним кроком на шляху до Всесвітнього павутиння було створення гіпертексту (термін запроваджений Тедом Нельсоном у 1965 році).

Семантична павутина передбачає поліпшення зв'язності та релевантності інформації у Всесвітньому павутинні через введення нових форматів метаданих.
Соціальне павутиння покладається на роботу з упорядкування наявної в Павутинні інформації, що виконується самими користувачами Павутини. В рамках другого напряму напрацювання, що є частиною семантичної павутини, активно використовуються як інструменти (RSS та інші формати веб-каналів, OPML, мікроформати XHTML). Частково семантизовані ділянки Дерева категорій «Вікіпедії» допомагають користувачам усвідомлено переміщатися в інформаційному просторі, проте дуже м'які вимоги до підкатегорій не дають підстав сподіватися на розширення таких ділянок. У зв'язку з цим інтерес можуть бути спроби складання атласів Знання.

Існує також популярне поняття Web 2.0, що узагальнює відразу кілька напрямків розвитку Всесвітньої павутини.

Способи активного відображення інформації у Всесвітньому павутинні

Інформація в Інтернеті може відображатися як пасивно (тобто користувач може лише зчитувати її), так і активно - тоді користувач може додавати інформацію та редагувати її. До способів активного відображення інформації у Всесвітньому павутинні відносяться:

Слід зазначити, що цей поділ дуже умовний. Так, скажімо, блог або гостьову книгу можна розглядати як окремий випадок форуму, який, у свою чергу, є окремим випадком системи управління контентом. Зазвичай різниця проявляється у призначенні, підході та позиціонуванні того чи іншого продукту.

Частково інформація з сайтів може бути доступна через мовлення. В Індії вже почалося тестування системи, що робить текстовий вміст сторінок доступним навіть для людей, які не вміють читати та писати.

World Wide Web іноді іронічно називають Wild Wild Web (дикий, дикий Web) – за аналогією з назвою однойменного фільму Wild Wild West (Дикий, дикий Захід).

Див. також

Примітки

Література

Філдінг, Р.; Геттіс, Дж.; Могул, Дж.; Фрістік, Р.; Мазінтер, Л.; Ліч, П.; Бернерс-Лі, Т. (Червень 1999). "Hypertext Transfer Protocol - http://1.1" (Information Sciences Institute).
Бернерс-Лі, Тім; Брей, Тім; Коннолі, Ден; Коттон, Підлога; Філдінг, Рой; Джекл, Маріо; Ліллі, Кріс; Мендельсон, Ной; Оркард, Девід; Уолш, Норман; Вілліамс, Стюарт (Грудень 15, 2004). "Architecture of the World Wide Web, Volume One" (W3C).
Поло, Лучано World Wide Web Technology Architecture: Conceptual Analysis . New Devices(2003). Архівовано з першоджерела 24 серпня 2011 року. Перевірено Липень 31 2005 року.

Посилання

Офіційний сайт Консорціуму Всесвітньої павутини (World Wide Web Consortium (W3C)) (англ.)
Tim Berners-Lee, Mark Fischetti.Плетя павутину: витоки і майбутнє Всесвітньої павутини = Weaving the Web: Original Design and Ultimate Destiny of the World Wide Web. - New York: HarperCollins Publishers (англ.)російська. . - 256 p. - ISBN 0-06-251587-X, ISBN 978-0-06-251587-2(англ.)

Інші організації, що займаються розвитком Всесвітнього павутиння та Інтернету в цілому

Вебта веб-сайти
Глобально
Локально
Види сайтів та сервісів
Створення та обслуговування
Типи макетів, сторінок, сайтів
Технічне
Маркетинг
Соціум та культура

Семантична павутина
Основи	Всесвітня павутина · Інтернет · Гіпертекст · Бази даних · Семантичні мережі · Онтології · Дескрипційна логіка
Підрозділи	Linked Data · Data Web · Hyperdata · Dereferenceable URIs · Rule bases · Data Spaces
Програми	Семантична вікі · Semantic publishing · Semantic search · Semantic computing · Semantic advertising · Semantic reasoner · Semantic matching · Semantic mapper · Semantic broker · Semantic analytics · Semantic service oriented architecture
Пов'язані теми	Фолксономія · Бібліотека 2.0 · Веб 2.0 Посилання · Інформаційна архітектура · Управління знаннями · Колективний інтелект · Тематичні карти · Mindmapping · Метадані · Geotagging · Web science
Стандарти	Синтаксис: RDF (RDF/XML · Нотація 3 · Turtle · N-Triples) · SPARQL · URI · HTTP · XML Схеми, онтології: RDFS · OWL · Rule Interchange Format · Semantic Web Rule Language · Common Logic ·

Всесвітнє павутиння (скорочено World Wide Webабо WWW) - це єдність інформаційних ресурсів, які пов'язані між собою засобами телекомунікацій та засновані на гіпертекстовому поданні даних, розкиданих по всьому світу.

Роком народження Всесвітньої павутини вважається 1989 рік. Саме цього року Тім Бернерс-Лі запропонував спільний гіпертекстовий проект, який згодом отримав назву Всесвітнього павутиння.

Творець «павутини» Тім Бернес-Лі, працюючи в лабораторії фізики елементарних частинок європейського центру ядерних досліджень «CERN» У Женеві (Швейцарія), спільно з партнером Робертом Кайо займалися проблемами застосування ідей гіпертексту для побудови інформаційного середовища, яке б спростило обмін інформацією між фізиками .

Підсумком цієї роботи з'явився документ, у якому розглядалися поняття, що мають важливе значення для «павутини» в її сучасному вигляді, та були запропоновані ідентифікатори URI, протокол HTTR та мова HTML. Без даних технологій вже не можна уявити сучасний Інтернет.

Бернерс-Лі створив перший у світі веб-сервер та перший у світі гіпертекстовий веб-браузер. На першому у світі веб-сайті він описав, що таке Всесвітня павутина та як встановити веб-сервер, як використовувати браузер тощо. Цей сайт був першим у світі Інтернет-каталогом.

Починаючи з 1994 року найголовніші завдання розвитку Всесвітньої павутини взяв на себе Консорціум Всесвітньої павутини ( World Wide Web Consortium, WЗС), який організував і досі очолює Кім Бернес-Лі. Консорціум розробляє та впроваджує технологічні стандарти для Інтернету та Всесвітньої павутини. Місія WЗС: «Повністю розкрити потенціал Всесвітньої павутини шляхом створення протоколів і принципів, що гарантують довгостроковий розвиток Мережі» . WЗС розробляє «Рекомендації», щоб досягти сумісності між програмними продуктами та апаратурою різних компаній, що робить Всесвітню мережу більш досконалою, універсальною та зручною.

Пошукові системи: склад, функції, принципи роботи.

Пошукова система - це програмно-апаратний комплекс, призначений для пошуку в мережі Інтернет і реагує на запит користувача, що задається у вигляді текстової фрази (пошукового запиту), видачею списку посилань на джерела інформації, в порядку релевантності (відповідно до запиту). Найбільші міжнародні пошукові системи: "Google", «Yahoo», "MSN". У російському Інтернеті це – "Яндекс", «Рамблер», "Апорт".

Опишемо основні характеристики пошукових систем :

Повнота

Повнота - одна з основних характеристик пошукової системи, що є відношенням кількості знайдених за запитом документів до загальної кількості документів у мережі Інтернет, що задовольняють даному запиту. Наприклад, якщо в Інтернеті є 100 сторінок, що містять словосполучення «як вибрати автомобіль», а за відповідним запитом було знайдено лише 60 із них, то повнота пошуку буде 0,6. Очевидно, що чим повніше пошук, тим менша ймовірність того, що користувач не знайде потрібний документ, за умови, що він взагалі існує в Інтернеті.

Точність

Точність - ще одна основна характеристика пошукової машини, яка визначається мірою відповідності знайдених документів запиту користувача. Наприклад, якщо за запитом «як вибрати автомобіль» знаходиться 100 документів, у 50 з них міститься словосполучення «як вибрати автомобіль», а в інших просто ці слова («як правильно вибрати магнітолу і встановити в автомобіль»), то точність пошуку вважається рівною 50/100 (=0,5). Чим точніше пошук, тим швидше користувач знайде потрібні йому документи, тим менше «сміття» серед них буде зустрічатися, тим рідше знайдені документи не відповідатимуть запиту.

Актуальність

Актуальність - не менш важлива складова пошуку, що характеризується часом, що проходить з моменту публікації документів у мережі Інтернет, до занесення їх до індексної бази пошукової системи. Наприклад, наступного дня після появи цікавої новини велика кількість користувачів звернулася до пошукових систем з відповідними запитами. Об'єктивно з моменту публікації новинної інформації на цю тему пройшло менше доби, проте основні документи вже були проіндексовані та доступні для пошуку завдяки існуванню у великих пошукових систем так званої «швидкої бази», яка оновлюється кілька разів на день.

Швидкість пошуку

Швидкість пошуку тісно пов'язана з його стійкістю до навантажень. Наприклад, за даними ТОВ «Рамблер Інтернет Холдинг», на сьогоднішній день у робочі години до пошукової машини Рамблер надходить близько 60 запитів на секунду. Така завантаженість потребує скорочення часу обробки окремого запиту. Тут інтереси користувача та пошукової системи збігаються: відвідувач бажає отримати результати якнайшвидше, а пошукова машина повинна відпрацьовувати запит максимально оперативно, щоб не гальмувати обчислення наступних запитів.

Наочність

Наочність уявлення результатів є важливим компонентом зручного пошуку. За більшістю запитів пошукова машина знаходить сотні, а то й тисячі документів. Внаслідок нечіткості складання запитів або неточності пошуку навіть перші сторінки видачі не завжди містять тільки потрібну інформацію. Це означає, що користувачеві часто доводиться проводити свій власний пошук усередині знайденого списку. Різні елементи сторінки видачі пошукової системи допомагають орієнтуватися в результатах пошуку. http://help.yandex.ru/search/?id=481937.

Коротка історія розвитку пошукових систем

У початковий період розвитку Інтернет, кількість його користувачів була невелика, а обсяг доступної інформації порівняно невеликий. Здебільшого доступ до мережі Інтернет мали лише співробітники науково-дослідної сфери. У цей час завдання пошуку інформації в Інтернеті не було таким актуальним, як нині.

Одним із перших способів організації доступу до інформаційним ресурсаммережі стало створення відкритих каталогів сайтів, посилання на ресурси у яких групувалися згідно з тематикою. Першим проектом став сайт Yahoo.com, що відкрився навесні 1994 року. Після того, як кількість сайтів у каталозі Yahoo значно збільшилася, було додано можливість пошуку потрібної інформації з каталогу. У повному розумінні це ще не було пошуковою системою, тому що пошукова область була обмежена лише ресурсами, які є в каталозі, а не всіма Інтернет ресурсами.

Каталоги посилань широко використовувалися раніше, проте практично втратили свою популярність нині. Так як навіть сучасні, величезні за своїм обсягом каталоги, містять інформацію лише про мізерну частину мережі Інтернет. Найбільший каталог мережі DMOZ (його ще називають Open Directory Project) містить інформацію про 5 мільйонів ресурсів, тоді як база пошукової системи Google складається з понад 8 мільярдів документів.

Першою повноцінною пошуковою системою став проект WebCrawler, що вийшов друком у 1994 році.

1995 року з'явилися пошукові системи Lycos та AltaVista. Остання довгі роки була лідером у сфері пошуку інформації у мережі Інтернет.

У 1997 році Сергій Брін та Ларрі Пейдж створили пошукову машину Google у рамках дослідницького проекту у Стендфордському університеті. У теперішній момент Google – найпопулярніша пошукова система у світі!

У вересні 1997 року було офіційно анонсовано пошукову систему Yandex, що є найпопулярнішою в російськомовному Інтернеті.

В даний час існують три основні міжнародні пошукові системи - Google, Yahoo і MSN, які мають власні бази та алгоритми пошуку. Більшість інших пошукових систем (яких налічується велика кількість) використовує у тому чи іншому вигляді результати трьох перелічених. Наприклад, пошук AOL (search.aol.com) використовує базу Google, а AltaVista, Lycos та AllTheWeb – базу Yahoo.

Склад та принципи роботи пошукової системи

У Росії основною пошуковою системою є «Яндекс», далі – Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причому зараз Mail.ru використовує механізм і базу пошуку «Яндекса».

Майже всі великі пошукові системи мають свою власну структуру, відмінну від інших. Однак, можна виділити загальні для всіх пошукових машин основні компоненти. Відмінності у структурі може лише у вигляді реалізації механізмів взаємодії цих компонентів.

Модуль індексування

Модуль індексування складається з трьох допоміжних програм (роботів):

Spider (павук) – програма, призначена для завантаження веб-сторінок. "Павук" забезпечує скачування сторінки та витягує всі внутрішні посилання з цієї сторінки. Завантажується HTML-код кожної сторінки. Для завантаження сторінок роботи використовують протоколи HTTP. Працює «павук» в такий спосіб. Робот на сервер передає запит "get/path/document" та деякі інші команди HTTP-запиту. У відповідь робот отримує текстовий потік, що містить службову інформацію і сам документ.

URL сторінки

дата, коли сторінку завантажили

http-заголовок відповіді сервера

тіло сторінки (html-код)

Crawler («мандрівний» павук) – програма, яка автоматично проходить за всіма посиланнями, знайденими на сторінці. Виділяє всі посилання на сторінці. Його завдання - визначити, куди далі має йти павук, спираючись на посилання або виходячи із заздалегідь заданого списку адрес. Crawler, слідуючи за знайденими посиланнями, здійснює пошук нових документів, ще невідомих пошуковій системі.

Indexer (робот-індексатор) - програма, яка аналізує веб-сторінки, завантажені павуками. Індексатор розбирає сторінку на складові та аналізує їх, застосовуючи власні лексичні та морфологічні алгоритми. Аналізують різні елементи сторінки, такі як текст, заголовки, посилання структурні та стильові особливості, спеціальні службові html-теги і т.д.

Таким чином, модуль індексування дозволяє обходити за посиланнями задану безліч ресурсів, завантажувати сторінки, що зустрічаються, витягувати посилання на нові сторінки з одержуваних документів і проводити повний аналіз цих документів.

База даних

База даних, або індекс пошукової системи - це система зберігання даних, інформаційний масив, в якому зберігаються спеціальним чином перетворені параметри всіх завантажених та оброблених модулем індексування документів.

Пошуковий сервер

Пошуковий сервер є найважливішим елементом усієї системи, оскільки від алгоритмів, які лежать в основі її функціонування, безпосередньо залежить якість та швидкість пошуку.

Пошуковий сервер працює наступним чином:

Отриманий від користувача запит піддається морфологічному аналізу. Генерується інформаційне оточення кожного документа, що міститься в базі (яке і буде згодом відображено у вигляді сніпету, тобто відповідного запиту текстової інформаціїна сторінці видачі результатів пошуку).

Отримані дані передаються як вхідні параметри спеціальному модулю ранжування. Відбувається обробка даних за всіма документами, внаслідок чого для кожного документа розраховується власний рейтинг, що характеризує релевантність запиту, введеного користувачем, та різних складових цього документа, що зберігаються в індексі пошукової системи.

Залежно від вибору користувача, цей рейтинг може бути скоригований додатковими умовами (наприклад, так званий «розширений пошук»).

Далі генерується сніппет, тобто для кожного знайденого документа з таблиці документів вилучаються заголовок, коротка анотація, найбільш відповідна запиту і посилання на сам документ, причому знайдені слова підсвічуються.

Отримані результати пошуку передаються користувачеві як SERP (Search Engine Result Page) – сторінки видачі пошукових результатів.

Як видно, всі ці компоненти тісно пов'язані один з одним і працюють у взаємодії, утворюючи чіткий досить складний механізм роботи пошукової системи, що вимагає величезних витрат ресурсів.

Жодна пошукова система не охоплює всі ресурси Інтернету.

Кожна пошукова система збирає відомості про ресурси Інтернет, застосовуючи свої унікальні методи, і формує власну базу даних, що періодично оновлюється. Доступ до цієї бази надається користувачеві.

Пошукові системи реалізують два способи пошуку ресурсу:

Пошук за тематичним каталогам - інформаціяпредставляється як ієрархічної структури. На верхньому рівні - загальні категорії ("Інтернет", "Бізнес", "Мистецтво", "Освіта" і т.д.), на наступному рівні категорії поділяються на розділи і т.д. Найнижчий рівень – посилання на конкретні веб-сторінки чи інші інформаційні ресурси.

Пошук за ключовими словами (індексний пошук або детальний) - користувач надсилає пошуковій системі запит, Що складається з ключових слів. Система повертаєкористувачеві перелік знайдених на запит ресурсів.

Більшість пошукових систем поєднують обидва способи пошуку.

Пошукові системи можуть бути локальними, глобальними, регіональними та спеціалізованими.

У російській частині Інтернет (Рунет) найбільш популярні зараз пошукові системи загального призначення Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Google (www.google.ru).

Більшість пошукових системреалізовано у вигляді порталів.

Портал (від англ.portal- головний вхід, ворота) це веб-сайт, який інтегрує різні сервіси Інтернет: засоби пошуку, пошту, новини, словники і т.д.

Портали можуть бути спеціалізованими (як,www. museum. ru) та загальними (наприклад,www. km. ru).

Пошук за ключовими словами

Набір ключових слів, за якими ведеться пошук, також називають критерієм пошуку або темою пошуку.

Запит може складатися як із одного слова, і з поєднання слів, об'єднаних операторами - символами, якими система визначає, яку дію їй необхідно произвести. Наприклад: запит Москва Пітер містить оператор І (так сприймається пробіл), який вказує, що треба шукати документи, в яких є обидва слова - і Москва, і Пітер.

Для того, щоб пошук був релевантним (від англ. relevant - доречний, що стосується справи), слід враховувати кілька загальних правил:

Незалежно від того, у якій формі вжито слово у запиті, пошук враховує всі його словоформи за правилами російської. Наприклад, за запитом "квиток" будуть знайдені і слова "квитком", "квитку" і т.д.

Великі літери слід використовувати тільки в власних іменах, щоб не переглядати зайві посилання. На запит "ковалів", наприклад, будуть знайдені документи, де йдеться і про ковалів, і про Кузнєцових.

Бажано звужувати коло пошуку, використовуючи кілька ключових слів.

Якщо потрібної адреси немає серед першої двадцятки знайдених адрес, слід змінити запит.

Кожна пошукова система використовує свою мову запитів. Для знайомства з ним користуйтеся вбудованою довідкою пошукової системи

Великі сайти можуть мати вбудовані системи пошуку інформації в межах веб-сторінок.

Запити в подібних системах пошуку, як правило, будуються за тими самими правилами, що й у глобальних пошукових системах, проте знайомство з довідкою тут не буде зайвим.

Розширений пошук

Пошукові системи можуть надавати механізм користувача, що дозволяє формувати складний запит. Перехід за посиланням Розширений пошукдає можливість редагувати параметри пошуку, вказувати додаткові параметри та вибирати найбільш зручну форму показу результатів пошуку. Нижче описано параметри, які можуть бути задані при розширеному пошуку в системах Япс1ех та Rambler.

Опис параметра	Назва в Яндекс	Назва вRambler
Де шукати ключові слова (заголовок документа, основний текст тощо)	Словниковий фільтр	Пошук за текстом...
Які слова повинні або не повинні бути присутніми в документі і наскільки точним має бути збіг	Словниковий фільтр	Шукати слова запиту... Виключити документи, які містять наступні слова...
На якій відстані один від одного повинні розташовуватися ключові слова	Словниковий фільтр	Відстань між словами запиту...
Обмеження на дату документа		Дата документа...
Обмеження пошуку межами одного або кількох сайтів	Сайт/Вершина	Шукати документи лише на наступних сайтах...

Обмеження пошуку з мови документа		Мова документа...
Пошук документів, що містять картинку з певним ім'ям або підписом	Зображення
Пошук сторінок, що містять об'єкти	Спеціальні об'єкти
Форма представлення результатів пошуку	Формат видачі	Виведення результатів пошуку

Деякі пошукові системи (наприклад, Яндекс) дозволяють вводити запити природною мовою. Ви пишіть, що потрібно знайти (наприклад: замовлення квитків на поїзд з Москви до Пітера). Система аналізує запит та видає результат. Якщо вона Вас не влаштовує, переходьте на мову запитів.

В інформатиці значна увага приділяється комп'ютерним мережам. Їх найбільш яскравими представниками є Інтернет та Всесвітнє павутиння. Інтернет – це телекомунікаційна мережа комп'ютерів. Вона є основою Всесвітньої павутини (Мережі), системи взаємопов'язаних між собою документів, розташованих на різних комп'ютерах, підключених до Інтернету. За бажання підкреслити віртуальний характер документів їх сукупність характеризується як гіперпростору. Досить очевидно, що Інтернет, Всесвітнє павутиння та гіперпростір є нерозривною трійцею. Їх суб'єктом виступають не окремі особи, а мережеве комунікативне співтовариство. Відповідно до цієї обставини на перший план виходять концепти. комунікації, групового дискурсу і соціальної спільноти людей. Всі ці концепти розглядалися філософами задовго до появи 1980-х років. Всесвітньої павутиння. Результати їх аналізу здатні пролити світло на природу Інтернету та Мережі1. Уявімо їх у максимально економному вигляді.

Поняття комунікації є результатом складного процесу пізнання природи взаємодій для людей. Але недостатньо стверджувати, що люди взаємодіють між собою: важливо зрозуміти концептуальний зміст такої взаємодії. Здійснюючи вчинки як соціальні істоти, люди прагнуть оптимізувати свої цінності. Комунікація – це обмін цінностями, результатом якого є досягнення згоди (Консенсусу) або незгоди (Діссенсусу). Герменевтики (Х.-Г. Гадамер, Ю. Хабермас) надають згоді більшу етично вагу, ніж незгоді. Прямо протилежної точки зору дотримуються постструктураліст (Ж. Дерріда, Ж.-Ф. Ліотар). Їх диссенсус етично більш значущий, ніж консенсус. Обидві сторони не мислять соціальну реальність без дискурсу - обміну судженнями ціннісного змісту. Дискурс завжди свідчить про наявність певної спільності людей: учасники дискурсу за визначенням не є атомами, які претендують на індивідуальну самотність.

Отже, надалі нам доведеться постійно пам'ятати нерозривну трійцю концептів: комунікація, дискурс, спільність людей. Причому всі вони виступають у різному вигляді залежно від характеру знання, що розглядається. Згадані концепти найчастіше розглядається у контексті: 1) інформатики; 2) менеджменту; 3) економіки; 4) політології; 5) соціології; 6) психології; 7) звичайного знання.

Не завжди дослідники розрізняють рівні знання. У такому разі вони в гонитві за універсальними цінностями збиваються на поверхневі міркування типу "Мережа – це благо", "Інтернет – це зло". Такі міркування лише з погляду змістовні. При найближчому розгляді з'ясовується, що потребують специфікації, а вона неможлива без звернення до концептуального багатства наук. З урахуванням зазначеної обставини розглянемо Інтернет та Мережа у тих різних наук, як і ненаукового знання.

Мережа з позицій інформатики

Зрозуміло, цікаві для нас феномени увібрали в себе все багатство інформатики як науки. Але вирішальне значення у формуванні та розвитку Мережі мали п'ять "китів": гіпертекст, HTML, URL, HTTP та пошукові системи.

Гіпертекст - це документ, що включає посилання до інших текстів. Термін був придуманий і введений в інформатику американцем Т. Нельсоном в 1969 р. Першою особливістю гіпертексту є його не лінійний, а характер, що гілкується. Знання реалізується у формі перехресних посилань. Отже, має місце схрещення текстів, але це, як відомо, - необхідний ознака диалога1. Чудове досягнення спеціалістів, які розробили концепт гіпертексту, полягало у створенні технологічної можливості відтворення дискурсу у формі інтертекстуальності. Його особливість полягає в тому, що ініціатива постійно переходить від однієї особи до іншої. Таку можливість надає гіпертекст. На початку XX ст. філософи Л. Вітгенштейн і М. Хайдеггер ініціювали мовний поворот під девізом "мова важливіша за ментальність". У процесі його реалізації також було усвідомлено, що діалог важливіший за монолог. Пересічні тексти в структурному і смисловому відношенні значно багатші за лінійну конструкцію.

HTML(англ. HyperText Markup Language) - стандартна мова структурування та форматування документів у Мережі. Текстові документи, що містять код на мові HTML обробляються та відображаються у форматованому вигляді браузерами.

URL(англ. Uniform Resource Locator) - Одноманітний локатор (визначник місцезнаходження) ресурсу в Інтернеті. Всім ресурсам присвоюються імена, за якими їх знаходять у Мережі та на які вони відгукуються.

HTTP(англ. HyperText Transfer Protocol) - Протокол передачі гіпертексту. Споживач (клієнт) надсилає запит постачальнику (серверу). Той робить необхідні дії та повертає назад повідомлення з результатом. У запиті та відповіді ресурс вказується відповідно до певного способу кодування.

Концепти HTML, URL, HTTP були розроблені творцем Всесвітньої павутини англо-американським ученим Т. Б. Лі у 1990-1992 рр. Геніальність Т. Б. Лі виявилася насамперед у глибокому розумінні концептуальної структури Мережі.

Пошукова система – це програмно-апаратний комплекс, який надає можливість пошуку документів в Інтернеті. Програмна частинапошукової системи, що забезпечує її функціональність, називається пошуковою машиною. Основним критерієм якості роботи пошукової системи є релевантність, тобто. ступінь відповідності знайденого запиту. Згідно з численними опитуваннями, на сьогоднішній день найпопулярнішою пошуковою системою є Google. Універсальної пошукової системи, зрозуміло, немає. До нового знання ведуть різноманітні пошукові стратегії. Завжди важливо пам'ятати, що будь-який пошук ведеться не випадково, а у зв'язку з прийнятим рішенням. Таким чином, пошук запускає механізм синтезу нового знання, а це неможливо без комунікації з іншими суб'єктами Мережі і, отже, без утворення тієї чи іншої віртуальної спільноти людей, наприклад, прихильників пошукової системи Яндекс, настільки популярної в Рунеті. Як бачимо, концепти комунікації, дискурсу та спільноти людей набувають в інформатиці специфічної форми.

Вище було розглянуто концептуальні засади Інтернету та Мережі. Зрозуміло, всі вони зазнали численних метаморфоз. HTML, URL, HTTP, пошукові системи та браузери мають численних конкурентів. За бажання зрозуміти їхню історію необхідно будувати відповідні проблемні ряди та їх інтерпретації. Нам було важливо позначити основні концептуальні вузли Мережі, які є надбанням безпосередньо самої інформатики.