Adresse Web
Un article de Wikipédia, l'encyclopédie libre.
Les adresses Web sont une des trois inventions[1] à la base du World Wide Web, et selon ses inventeurs[2], la plus fondamentale. Le grand public les connaît sous la forme de libellés d'une dizaine de caractères commençant généralement par « www » (le sigle du World Wide Web) et qui identifient une page Web ; par exemple www.example.com
. Il s'agit en fait d'une simplification de la syntaxe techniquement correcte qui est http://www.example.com
.
Dans le langage technique, on ne parle pas d'adresse Web mais d'URL (pour Uniform Resource Locator, soit repère uniforme de ressource), d'URI (pour Uniform Resource Identifier, soit identifiant uniforme de ressource) ou plus rarement d'URN (Uniform Resource Name, soit nom uniforme de ressource). Ces dénominations techniques font référence à une syntaxe formellement définie par des standards d'Internet, notamment les RFC 1738, RFC 2396 et RFC 3986. En outre, le U de « uniforme », qui signifiait à l'origine universel (RFC 1630), met l'accent sur les capacités d'adressage quasiment universelles de ces adresses : forums Usenet, boîte de courrier électronique, site FTP, etc. ; soit pratiquement tout ce qui est disponible sur Internet et même au-delà, comme des standards, des livres, etc.
Il ne faut pas confondre les adresses Web avec les adresses électroniques ni les adresses IP. La dénomination adresse Internet peut désigner une adresse Web, mais elle est en fait totalement ambiguë.
Sommaire |
[modifier] Une invention fondamentale
Les trois inventions à la base du Web sont :
- les adresses Web
- le protocole de communication Hypertext Transfer Protocol (HTTP)
- le langage de balisage HyperText Markup Language (HTML)
Or une ressource du Web peut parfaitement être transférée avec un autre protocole que HTTP, comme le File Transfer Protocol. Elle peut également être dans un autre format de données que HTML, comme du texte brut, une image numérique, etc. En revanche, pour être identifiée et accessible, elle doit être exprimable sous la forme d'une adresse Web.
[modifier] Exemples
http://www.example.com/page.html
- La ressource est un document HTML accessible par le protocole HTTP
ftp://www.example.com/page.html
- La ressource est un document HTML accessible par le protocole FTP
http://www.example.com/i.png
- La ressource est une image Portable Network Graphics (PNG) accessible par le protocole HTTP
ftp://www.example.com/i.png
- La ressource est une image PNG accessible par le protocole FTP
[modifier] Débats terminologiques
Dans les cercles techniques, les adresses Web ont été connues sous divers noms : adresse WWW, Universal Document Identifier, Universal Resource Identifiers (RFC 1630), et finalement divisées en Uniform Resource Locators (URL, RFC 1738, RFC 1808) et Uniform Resource Names (URN, RFC 1737), le tout étant des Uniform Resource Identifiers (URI, RFC 2396, RFC 3986)[3]. L'abréviation URL est utilisée dans le standard HTML 3.2[4] est elle est devenue la plus connue et utilisée par les techniciens.
Diverses francisations ont été proposées par des organismes nationaux. Le Vocabulaire de l'informatique et de l'internet publié au Journal officiel du 16 mars 1999 par la Commission générale de terminologie et de néologie de France[5] a proposé « adresse réticulaire » et « adresse universelle ». Ces deux dénominations ont été rejetées par l'Office québécois de la langue française à cause de leur manque de précision, et elles ne sont pas entrées dans l'usage courant. L'Office québécois de la langue française propose[6], « adresse URL », « URL », « adresse Web » et « adresse W3 ». Il fait remarquer que « adresse Web » ne s'utilise généralement que pour les ressources des sites Web, alors que l'abréviation URL met l'accent sur l'universalité de ces adresses, qui peuvent identifier des forums Usenet, des sites FTP, etc. Le grand public confond aussi souvent adresse Web, adresse email et adresse IP. Pour éviter toutes ces ambiguïtés, les professionnels du Web utilisent souvent l'abréviation « URL », bien qu'ils fassent en fait références aux URI.
Le nom original que l'inventeur du Web donne aux adresses Web est Universal Document Identifier (UDI) [7]. L'été 1992, il propose à l'Internet Engineering Task Force (IETF) de standardiser ces UDI, mais la dénomination « universel » a été écartée car jugée trop « arrogante » pour un projet alors jeune comme le Web. La dénomination Uniform Resource Identifier (URI) est le compromis résultant.
Lors de la standardisation des URI, il était clair qu'en pratique, les adresses Web n'identifiaient pas des documents, mais des emplacements de documents. Autrement dit, si un document est déplacé, alors son adresse change. Le résultat pratique est le bris de tous les hyperliens sur ce document, soit une erreur HTTP 404.
Devant cet état de fait, il a été décidé que les adresses Web seraient appelées Uniform Resource Locator (URL). L'idée était de standardiser deux sortes d'URI : Les URL seraient les URI qui indiquent « comment » (par quel chemin sur le réseau) accéder à une ressource ; les Uniform Resource Names (URN) seraient les URI qui identifient éternellement les mêmes documents, où qu'ils se trouvent.
Tim Berners Lee ne cessait cependant pas d'insister pour que, au moins en théorie, les adresses Web soient conçues pour être universelles. Il trouvait aussi que l'IETF perdait son temps en discussions, aussi en juin 1994 il publie le RFC 1630, Universal Resource Identifiers in WWW. Ce premier RFC sur les adresses Web est de la catégorie informationnelle. Il décrit simplement la pratique de l'époque, et contient quelques erreurs.
[modifier] Adresse Web et URL
Exemple | adresse Web | URL | commentaire |
---|---|---|---|
www.example.com |
oui | non | adresse typique de page d'accueil de site |
http://www.example.com/ |
oui | oui | URL correspondant à l'adresse précédente |
example.com/une/page |
oui | non | adresse de page quelconque dans un site |
http://example.com/une/page |
oui | oui | URL correspondant à l'adresse précédente |
dupond@example.com |
oui | non | utilisation de l'utilisateur dupond sur le site example.com |
dupond@example.com |
non | non | adresse email |
mailto:dupond@example.com |
non | oui | URL de l'adresse email précédente |
Pour faire simple, une adresse Web est une URL commençant par http://
ou peut être complétée en une telle URL.
http:// |
example.com |
/une/page |
protocole de communication HTTP | nom de domaine | chemin sur le serveur HTTP |
Le concept d'adresse Web est étroitement lié à celui d'URL. Formellement, le Web permet d'établir un hyperlien vers toute ressource identifiable avec une URL. Comme toute page Web peut être liée ou consultée en connaissant son URL, le terme plus explicite d'« adresse Web » est rapidement apparu. Mais le concept d'URL est plus vaste, il permet d'« adresser » des ressources hors du Web, comme des forums Usenet ou des boîtes aux lettres électroniques (en utilisant une adresse email dans l'URL). Une URL n'est donc pas forcément une adresse Web. Inversément, une adresse Web peut être écrite sous une forme simplifiée qui ne reprend qu'une partie d'URL.
[modifier] Support des navigateurs Web
Dans les premières années du Web, les navigateurs Web n'acceptaient que des URL pour identifier les ressources. Mais suite au développement du Web, le protocole de communication HTTP s'est imposé pour transmettre l'immense majorité des ressources consultées. Ainsi une URL de page Web commence presque toujours par http://
. Les navigateurs Web ont donc évolué pour permettre l'omission de ces caractères lors d'une saisie dans leur barre d'adresse ; ils sont automatiquement ajoutés le cas échéant. Ainsi une adresse Web comme example.com/une/page
est automatiquement transformée en l'URL http://example.com/une/page
. Certains navigateurs vont jusqu'à compléter une adresse comme example
en http://www.example.com/
, mais le risque de complétion erronée n'est alors plus négligeable.
[modifier] Nom de domaine
Une adresse Web réduite à un nom de domaine comme www.example.com
ou example.com
est souvent considérée comme étant celle d'un site Web, bien que techniquement il s'agisse de l'adresse d'une page (d'accueil) : la page racine (/
) du domaine (example.com
). Le nom de domaine est la partie d'une adresse Web la plus importante ; elle sert notamment en publicité. Durant la bulle internet, certaines entreprises et certains logiciels ont pris l'adresse de leur site Web comme nom de société (Amazon.com, OpenOffice.org, etc.). Les noms de domaine font l'objet d'une problématique et d'un article propres.
[modifier] Voir aussi
[modifier] Références
- ↑ Les trois inventions à la base du World Wide Web sont les adresses, HTML et HTTP.
- ↑ Les inventeurs du World Wide Web sont Tim Berners-Lee et Robert Cailliau.
- ↑ RFC 1945, chap 3.2
- ↑ HTML 3.2 Reference Specification
- ↑ Vocabulaire de l'informatique et de l'internet, Journal officiel [français] du 16 mars 1999, [1]
- ↑ http://www.oqlf.gouv.qc.ca/ressources/bibliotheque/dictionnaires/Internet/fiches/8869606.html
- ↑ Weaving the Web, p.66
[modifier] Articles connexes
[ URL | nom de domaine | hyperlien | navigateur Web | World Wide Web ]
[modifier] Liens externes
- Vocabulaire d'Internet - Banque de terminologie du Québec - [2]
Portail de l'informatique – Accédez aux articles de Wikipédia concernant l’informatique. |