Домашня » як » Що таке URL (Uniform Resource Locator)?

    Що таке URL (Uniform Resource Locator)?

    Коли ви вводите адресу у веб-переглядачі, багато що відбувається за лаштунками. І більша частина цього визначається різними частинами введеної URL-адреси. Давайте ближче подивимося.

    URL-адреса може складатися з групи різних частин. Існує ім'я вузла, яке відображає IP-адресу конкретного ресурсу в Інтернеті і купу додаткової інформації, яка повідомляє вашому веб-переглядачу і серверу, як правильно обробляти речі. Ви можете придумати IP-адресу як щось на зразок телефонного номера. Ім'я хосту подібне до імені особи, номер телефону якого потрібно знайти. Стандарт, що називається DNS, працює у фоновому режимі, наприклад, у телефонній книзі, переводячи більш привабливі для людини імена хостів у IP-адреси, які мережі використовують для маршрутизації трафіку.

    Маючи на увазі цю аналогію, давайте поглянемо на структуру URL-адреси і як він працює, щоб отримати, де ви хочете йти.

    Як структурується URL-адреса

    Структуру URL-адреси вперше визначив сер Тім Бернерс-Лі-хлопець, який створив Web і перший веб-браузер в 1994 році. URL-и по суті поєднують ідею доменних імен з ідеєю використання шляху до файлу для визначення конкретних структуру папок і файлів. Таким чином, це схоже на шлях, подібний до C: Документи Особистий myfile.txt у Windows, але з деякими додатковими матеріалами на початку, щоб допомогти знайти потрібний сервер в Інтернеті, де цей шлях існує, і протокол, який використовується для доступу до інформації.

    URL-адреса складається з декількох різних частин. Візьмемо, наприклад, основну URL-адресу, подібну до наведеної нижче.

    Цей простий URL розбивається на дві основні компоненти: схему та повноваження.

    Схема

    Багато людей вважають URL-адресу просто веб-адресою, але це не зовсім так просто. Веб-адреса - це URL-адреса, але всі URL-адреси не є веб-адресами. Інші послуги, доступ до яких можна отримати в Інтернеті, як FTP або навіть локально подібні до MAILTO, також є URL-адресами. Частина URL-адреси схеми (ті літери, за якими слідує двокрапка) позначає протокол, з яким повинні спілкуватися програми (наприклад, веб-переглядач) і сервер.

    Веб-адреси є найпоширенішою URL-адресою, але є й інші. Таким чином, ви можете побачити такі схеми:

    • Протокол передачі HyperText (HTTP): це базовий протокол Інтернету і визначає, які дії веб-сервери та веб-переглядачі повинні виконувати у відповідь на певні команди.
    • HTTP Secure (HTTPS): це форма HTTP, яка працює над безпечним, зашифрованим шаром для безпечного транспортування інформації.
    • Протокол передачі файлів (FTP): Цей протокол часто використовується для передачі файлів через Інтернет.

    У сучасних веб-переглядачах схема технічно не потрібна як частина URL-адреси. Якщо ви ввійдете на веб-сайт, наприклад "www.howtogeek.com", ваш браузер автоматично визначить правильний протокол для використання. Проте деякі інші програми (і протоколи) вимагають використання схеми.

    Авторитет

    Орган повноважень URL (який передує дві риски) сам розбивається на групу частин. Давайте почнемо з дуже простого URL-роду, який приведе вас до домашньої сторінки сайту.

    У цьому простому прикладі вся частина "www.example.com" називається іменем хоста, і вона вирішується до IP-адреси. Ви також можете ввести IP-адресу в адресному рядку браузера замість імені хоста, якщо вам це відомо.

    Але, розбираючи ім'я хоста, це допомагає прочитати його назад, щоб зрозуміти, що відбувається, тому ось ці компоненти:

    • Домен верхнього рівня: У нашому прикладі "com" - це домен верхнього рівня. Це найвищий рівень в ієрархії системи доменних імен (DNS), яка використовується для перекладу IP-адрес у прості адреси мови, які нам легше запам'ятовувати. Ці домени верхнього рівня створюються та керуються Інтернет-корпорацією для присвоєних імен та номерів (ICANN). Три найпоширеніші домени верхнього рівня: .com, .net і .gov. Більшість країн також мають власний дволітерний домен верхнього рівня, тому ви побачите домени типу .us (США), .uk (Великобританія), .ca (Канада) та багато інших. Є також деякі додаткові домени верхнього рівня (наприклад, музей), які спонсоруються та управляються приватними організаціями. Окрім цього, існують також деякі загальні домени верхнього рівня (наприклад .club, .life і .news).
    • Піддомен: Оскільки DNS є ієрархічною системою, як "www", так і "приклад" частини нашого прикладу URL вважаються субдоменами. Частина «www» є субдоменом домену верхнього рівня «com», а частина «www» є субдоменом домену «приклад». Ось чому ви часто бачите компанію з зареєстрованою назвою "google.com", розбиту на окремі піддомени, такі як "www.google.com", "news.google.com", "mail.google.com" і так далі.

    Це найпростіший приклад розділу повноважень URL-адреси, але все може стати більш складним. Існують два інші компоненти, які можуть містити розділ повноважень:

    • Інформація про користувача: Розділ повноважень може також містити ім'я користувача та пароль для сайту, до якого ви отримуєте доступ. Незвично побачити цю структуру в URL сьогодні, але це може статися. Якщо присутні, частина інформації користувача надходить до імені хосту і слідує за знаком @. Таким чином, ви можете побачити щось на зразок "//username:[email protected]", якщо він містить інформацію користувача.
    • Номер порту: Мережні пристрої використовують IP-адреси для отримання інформації на потрібний комп'ютер у мережі. Коли цей трафік прибуває, номер порту повідомляє комп'ютеру про програму, для якої призначений цей трафік. Номер порту - це ще один елемент, який ви часто не бачите під час перегляду веб-сторінок, але ви можете побачити його в мережевих програмах (наприклад, іграх), які вимагають введення URL-адреси. Якщо URL-адреса містить номер порту, то вона приходить після імені хосту і передує двоеточию. Це виглядатиме приблизно так: "//www.example.com:8080."

    Отже, це схема і розділ повноважень URL-адреси, але, як ви могли здогадатися після перегляду багатьох URL-адрес під час перегляду веб-сторінок, вони можуть включати ще більше матеріалів.

    Шляхи, запити та фрагменти

    Є три додаткові частини URL-адреси, які можна побачити після частини повноважень: шляхи, запити та фрагменти. Ось як вони працюють.

    Шлях

    Розділ повноважень URL-адреси отримує ваш веб-переглядач (або будь-яке інше) на потрібний сервер у мережі. Слідуючий шлях, який працює так само, як шлях у Windows, MacOS або Linux, приводить вас до потрібної папки або файлу на цьому сервері. Шляху передує слеш, а між кожним каталогом і підкаталогом є слеш, наприклад:

    www.example.com/folder/subfolder/filename.html

    Останній фрагмент - це назва файлу, який відкривається під час доступу до веб-сайту. Хоча ви не бачите його в адресному рядку, це не означає, що його немає. Деякі мови, які використовуються для створення веб-сторінок, приховують ім'я файлу та розширення, які ви переглядаєте. Завдяки цьому URL-адреса легше запам'ятовувати та вводити текст, а також надає йому більш чистий вигляд.

    Запит

    Частина запиту URL-адреси використовується для ідентифікації речей, які не є частиною строгої структури шляху. Найчастіше ви бачите їх, коли ви виконуєте пошук або коли веб-сторінка доставляє дані через форму. Частині запиту передує знак запитання і з'являється після шляху (або після імені хосту, якщо шлях не включено).

    Наприклад, візьміть цю URL-адресу, коли ми шукали Amazon за ключовими словами "wi-fi extender":

    https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender

    Пошукова форма передала інформацію пошуковій системі Amazon. Після запитання ви можете побачити дві частини запиту: URL для пошуку (це частина "url = search-alias% 3Daps & field") і ключові слова, які ми ввели (це ключові слова = wi-fi + частина).

    Це досить простий приклад, і ви часто бачите URL-адреси з додатковими (і більш складними) змінними. Наприклад, це URL-адреса, коли ми шукали Google за ключовим словом "howtogeek":

    https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome… 69i57j69i60l4j0.1839j1j4 & sourceid = chrome & ie = UTF-8

    Як ви можете бачити, там є деяка інформація. У цьому випадку можна побачити додаткову інформацію, що вказує мову пошуку, використовуваний браузер (Chrome) і навіть номер версії веб-переглядача.

    Фрагмент

    Останній компонент URL-адреси, який ви бачите, називається фрагментом. Фрагмент передує позначці хешу (#) і використовується для позначення певного місця на веб-сторінці. При кодуванні веб-сторінки дизайнери можуть створювати орієнтири для окремих заголовків тексту. Коли правильний фрагмент використовується в кінці URL, ваш браузер завантажує сторінку, а потім переходить до цього якоря. Якорі та URL-адреси з фрагментами часто використовуються для створення таблиць вмісту на веб-сторінках для полегшення навігації.

    Ось приклад. Сторінка Вікіпедії про Відродження є досить довгим документом, і вона розбита на 11 секцій, кожна з яких має кілька підрозділів. Але кожен заголовок на сторінці містить якір, а зміст у верхній частині статті містить посилання, які дозволяють переходити до різних розділів. Ці зв'язки працюють, включаючи фрагменти.

    Ви також можете використовувати ці фрагменти безпосередньо в адресному рядку або як спільні посилання. Скажімо, ви, наприклад, хотіли показати комусь розділ цієї сторінки, що охоплює Росію. Ви можете просто надіслати їм це посилання:

    https://en.wikipedia.org/wiki/Renaissance#Russia

    Ця частина "#Росія" в кінці URL-адреси перескакує їх прямо в цей розділ після завантаження сторінки.


    Так що у вас є це - більше, ніж ви, ймовірно, коли-небудь хотіли дізнатися про те, як працюють URL-адреси.

    Зображення: Pawel Horazy / Shutterstock