Pour comprendre l'histoire de l'URL, il faut remonter au 11 janvier 1982, date à laquelle vingt-deux informaticiens se sont réunis pour discuter d'un problème lié au « courrier électronique » (ce que nous appelons aujourd'hui le courrier électronique). Parmi les participants figuraient des personnes qui allaient plus tard fonder Sun Microsystems, le créateur de Zork, le concepteur du protocole NTP et celui qui a convaincu le gouvernement de financer Unix. Le problème était simple : le réseau ARPANET comptait 455 hôtes et la situation devenait ingérable.
Le passage de ARPANET et la naissance du domaine
Ce problème est apparu lorsque l'ARPANET s'apprêtait à passer de son protocole NCP d'origine au protocole TCP/IP, qui constitue la base de ce que nous appelons aujourd'hui Internet. Ce changement allait créer une multitude de réseaux interconnectés, nécessitant un système de noms de domaine plus hiérarchisé. Dans ce système, l'ARPANET pourrait résoudre ses propres domaines tandis que les autres réseaux résoudraient les leurs.
À cette époque, ces réseaux portaient des noms originaux comme « COMSAT », « CHAOSNET », « UCLNET » et « INTELPOSTNET », et étaient gérés par des groupes d'universités et d'entreprises à travers les États-Unis. Ces groupes souhaitaient communiquer entre eux et pouvaient se permettre de louer des lignes 56 kHz auprès des compagnies de téléphone et d'acquérir le matériel nécessaire au routage.
À l'origine, l'architecture d'ARPANET reposait sur un centre d'information réseau (NIC) chargé de gérer un fichier répertoriant tous les hôtes du réseau, appelé HOSTS.TXT, similaire au fichier /etc/hosts des systèmes Linux ou macOS. Cependant, ce système ne pouvait pas évoluer indéfiniment.

La naissance du domaine et l'évolution du courrier électronique
La priorité à cette époque était le courrier électronique, ce qui posait un problème d'adressage. La solution a consisté à créer un système hiérarchique permettant d'interroger un système externe pour obtenir le domaine nécessaire. C'est ainsi qu'est né le concept de domaine, et les adresses sont passées de « utilisateur@hôte » à «utilisateur@hôte.domaine", un format que nous utilisons encore aujourd'hui."
Bien que cette décision n'ait pas été prise avec une vision claire de l'avenir, elle a été choisie car elle causait moins de problèmes dans les systèmes existants.
UUCP et les itinéraires de Bang
Le système UUCP, créé en 1976, permettait aux ordinateurs de communiquer via des routes appelées « chemins Bang », par lesquelles pouvaient être envoyés des fichiers ou des courriels. Ce système était un précurseur de l'Internet public que nous connaissons aujourd'hui.
DNS et les premiers TLD
Le système DNS, que nous utilisons encore aujourd'hui, a été proposé en 1983. Le DNS associe les noms de domaine à des adresses IP et permet aux utilisateurs de trouver efficacement des sites web. Les premiers TLD (domaines de premier niveau) comprenaient .com, .gov, .org, .edu et .mil, qui sont encore largement utilisés aujourd'hui.
Le système DNS a été conçu de manière hiérarchique, avec un ensemble de serveurs racine chargés de la résolution des noms de domaine. Aujourd'hui, le système DNS racine est constitué de treize clusters de serveurs. Historiquement, les réponses DNS étaient traitées par paquets UDP, limitant leur taille à 512 octets.

Punycode et l'internationalisation des domaines
Avec la croissance et l'expansion mondiale d'Internet, le besoin de prendre en charge les caractères non latins dans les noms de domaine s'est fait sentir. Cela a conduit à la création de Punycode, un système qui convertit les caractères Unicode (tels que les lettres chinoises ou arabes) en ASCII, les rendant ainsi compatibles avec l'infrastructure existante.
Punycode n'était pas la première proposition pour résoudre ce problème, mais elle a été adoptée car elle est efficace en matière d'encodage de caractères et garantit que les noms de domaine sont compréhensibles à la fois par les machines et par les utilisateurs.
Protocoles, ports et composant « supplémentaire »
Le protocole le plus couramment utilisé pour accéder aux sites web est HTTP, inventé par Tim Berners-Lee spécifiquement pour le web. Cependant, d'autres protocoles tels que FTP et Gopher étaient également populaires aux débuts d'Internet.
Le port par défaut pour HTTP est le port 80, attribué dès les débuts du Web. Cela permettait aux navigateurs d'accéder aux pages Web via HTTP sans avoir besoin de spécifier le port dans l'URL.
La double barre oblique « // » qui sépare le protocole du reste de l'URL provient d'un ancien système informatique appelé Apollo. Bien que Tim Berners-Lee ait exprimé des regrets quant à cette décision, elle fait toujours partie de la norme URL.
La voie vers l'avenir : fragments, URN et authentification
Les URL contiennent également des extraits, représentés par le symbole « # », qui permettent de créer un lien vers une partie spécifique d'une page. De plus, des paramètres de requête et des identifiants d'authentification pouvaient être ajoutés à l'URL, bien que ces pratiques aient été remplacées par des méthodes plus sûres et plus efficaces.
Bien que les URL aient évolué depuis leur création, elles demeurent un élément essentiel du fonctionnement du Web. Malgré la proposition de systèmes plus avancés comme les URN (Uniform Resource Names), les URL restent le moyen le plus efficace d'identifier et d'accéder aux ressources en ligne.
Cet article explore l'évolution de l'URL, depuis ses débuts modestes sur ARPANET jusqu'à son rôle actuel de composante essentielle de l'infrastructure Internet. Au fil des années, de nombreuses propositions, erreurs et avancées ont façonné le système d'adressage web que nous utilisons aujourd'hui.
Article original de Zack Bloom | 05 mai Publié en 2020 Le blog Cloudflare











