Introduction au fonctionnement d'Internet : infrastructure, protocoles, applications

Objectifs

  • Savoir définir ce qu'est un client, un serveur, un routeur, un protocole

  • Connaître les base du protocole TCP/IP

  • Savoir ce qu'est une adresse IP et un nom de domaineq

  • Savoir associer les principales applications d'Internet (SSH, mail et Web a minima), leurs principaux protocoles (SSH, IMAP, SMTP et HTTP) et leurs principaux outils (terminal, client mail, navigateur web)

Centralisation

Stockage

La bibliothèque d'Alexandrie était l'une des plus grandes bibliothèques du monde (Égypte, 288 av. J.-C.).

Nineteenth-century artistic rendering of the Library of Alexandria

Quel est le problème ?

The fire of Alexandria

Indexation

Le Mundaneum avait pour objectif d'indexer toutes la connaissance du monde en un seul endroit (Belgique, 1920).

The Mundaneum

Quel est le problème ?

Drawers in the Mundaneum

Accès

Avant Internet (dans les années 60 et 70), les premiers réseaux étaient des réseaux locaux construits autour de gros ordinateurs centraux.

IBM Mainframe computer 7090 (NASA, 1962)

Quel est le problème ?

IBM 7090 console

Aux origines du modèle décentralisé d'Internet

Enjeux militaire

La menace nucléaire plaide pour davantage de résilience.

Théorie des systèmes

Norbert Wiener, à travers ses travaux sur la cybernétique, propose une nouvelle vision du monde, dont l'information et la communication sont les éléments fondamentaux.

Contre-culture

La contre-culture hippie rejette la bureaucratie et la hiérarchie. Elle recherche des fonctionnements plus horizontaux.
Les échanges et influences mutuelles entre contre-culture et universitaires d'une part, universitaires et militaires d'autre part, sont nombreux.

Principe de la communication sur Internet

Une communication via Internet implique  :

  • les ordinateurs des personnes qui communiquent, on les appelle des clients ;

  • les routeurs, ce sont des ordinateurs dont le rôle et de faire passer l'information d'un ordinateur à un autre sur Internet ;

  • en général des serveurs, ce sont des ordinateurs en charge de gérer la communication pour un ensemble de clients ;

  • des moyens physiques pour relier ces ordinateurs (câbles et ondes) ;

  • des protocoles qui permettent à des logiciels installés sur ces machines de communiquer les unes avec les autres.

FondamentalInternet est un vaste réseau d'ordinateurs qui communiquent entre eux

Pour que les clients, les routeurs et les serveurs puissent communiquer entre eux, ils faut qu'ils soient reliés physiquement et qu'ils hébergent des logiciels qui respectent des protocoles communs.

Exemple

Infrastructure réseau d'Internet

Fondamental

Les composants fondamentaux du réseau Internet sont les câbles très haut débit par lesquels transitent les données.

Ordinateurs clients

DéfinitionClient

Un ordinateur client est un ordinateur qui demande un service à un autre ordinateur, par exemple : envoie ce mail à telle adresse de ma part.

Tout ordinateur qui utilise des services sur Internet est un client.

ExempleEnvoyer un mail

Si j'envoie un mail à contact@picasoft.net depuis mon mail stephane.crozat@utc.fr :

  • Mon ordinateur est le client, via le logiciel de mail Thunderbird il demande au serveur mail de l'UTC d'envoyer mon mail au serveur mail de Picasoft (il utilise pour cela le protocole SMTPS).

  • Ensuite quand quelqu'un chez Picasoft consultera les mails du compte contact, il demandera à son serveur quels nouveaux mails il a reçu et il y aura le mien parmi ceux-là (il utilise pour cela le protocole IMAPS).

ExempleDemander une page web

Si je consulte la page page https://fr.wikipedia.org/wiki/Internet :

  • Mon ordinateur est le client, via le navigateur web Firefox il demande au serveur web de Wikipédia de m'envoyer une page HTML (il utilise pour cela la requête GET du protocole HTTPS).

  • Le serveur web de Wikipédia renvoie la page HTML demandée (il utilise pour cela une réponse HTTPS).

Ordinateurs serveurs

DéfinitionServeur

Un serveur est un ordinateur dont le rôle est de proposer des services, par exemple : stocker des pages web ou acheminer des mails.

ExempleExemple de serveur

L'UTC propose un serveur pour envoyer des mails en utilisant le protocole SMTPS, il s'appelle smtps.utc.fr.

stph@mypc:~$ ping smtps.utc.fr
PING smtps.utc.fr (195.83.155.8) 56(84) bytes of data.
64 bytes from smtps.utc.fr (195.83.155.8): icmp_seq=1 ttl=62 time=0.454 ms
64 bytes from smtps.utc.fr (195.83.155.8): icmp_seq=2 ttl=62 time=0.752 ms
64 bytes from smtps.utc.fr (195.83.155.8): icmp_seq=3 ttl=62 time=0.739 ms
64 bytes from smtps.utc.fr (195.83.155.8): icmp_seq=4 ttl=62 time=0.726 ms

Ordinateurs routeurs

DéfinitionRouteur

Un routeur est un ordinateur dont le rôle est d'acheminer des paquets d'information sur Internet, on peut voir cela comme un coursier.

Remarque

Pour qu'un message se déplace d'un ordinateur à un autre sur Internet, il devra passer par plusieurs routeurs, de plus en plus proches de sa destination.

Exempletraceroute from pic.crzt.fr to www.utc.fr

 1  h7.tetaneutral.net (91.224.148.1)  
 2  renater.par.franceix.net (37.49.236.19)  
 3  te0-0-0-1-ren-nr-compiegne-rtr-091.noc.renater.fr (193.51.177.53)
 4  rrtp-vl221-te0-0-0-0-compiegne-rtr-011.noc.renater.fr (193.51.181.189)  
 5  * * *
 6  * * *
 7  gw-utc.utc.fr (195.83.154.242) 

Exemple

Protocoles réseaux TCP/IP

Afin de pouvoir communiquer entre elles toutes les machines d'Internet respectent des règles communes. Ces règles sont standardisées au sein de protocoles.

Le fonctionnement d'Internet repose fondamentalement sur les protocoles réseaux IP et TCP.

DéfinitionProtocole IP

Le protocole (ou couche) IP gère les communications entre plusieurs machines d'un réseau.

Elle est basée sur l'adressage, le routage et la fragmentation.

DéfinitionPaquet IP

Les entités transmises par le protocole IP sont des paquets (ou datagramme).

Exemple

How the Internet works in 5 minutes (extrait)

Exemple

Codage d'un paquet IP

DéfinitionProtocole TCP

Le protocole (ou couche) TCP gère les communications de bout en bout.

Elle est basée sur la correction des erreurs, le ré-ordonnancement et le contrôle de flux.

  • Plutôt que de raisonner en terme de paquets, elle raisonne en terme de messages complets.

  • Elle est capable de corriger des erreurs dans la transmission des messages (congestion du réseau...) et de ré-ordonnancer des paquets qui auraient pris une route différente et seraient arrivés dans le mauvais ordre.

  • Ses mécanismes de contrôle de flux permettent d'adapter la vitesse d'envoi des données à la capacité de réception du destinataire.

Remarque

Sur la base du protocole de communication TCP/IP on peut bâtir des applications, tels que HTTP pour consulter des fichiers sur le Web ou FTP pour transférer des fichiers.

Adresses IP et noms de domaine

DéfinitionAdresses IP

Une adresse IP est un numéro d’identification d'une machine.

Il est attribué de façon à chaque appareil relié à Internet.

Les adresses ont un format différent selon la version d'IP utilisée :

  • pour IPv4, les adresses sont sur 4 octets (exemple : 192.168.3.200),

  • pour IPv6, les adresses sont sur 16 octets (exemple : 2001:0db8:0000:85a3:0000:0000:ac1f:8001).

DéfinitionNom de domaine

Un nom de domaine est une adresse symbolique permettant d'éviter de devoir retenir des adresses IP.

Ainsi, à un nom de domaine tel que wikipedia.org on peut associer une adresse telle que 91.198.174.192.

DéfinitionDNS

Un serveur DNS (pour Domain Name System) est un serveur qui a connaissance de la correspondance entre noms de domaines et adresses IP. Il est capable de répondre à des requêtes qui lui demandent de résoudre un nom de domaine en une adresse IP.

Protocoles applicatifs d'Internet : SSH, mail, Web...

DéfinitionProtocole

Un protocole est un langage standard que tous les ordinateurs qui veulent communiquer entre eux respectent.

Les protocoles sont la condition de fonctionnement d'Internet, ils permettent à des ordinateurs différents qui utilisent des logiciels différents de communiquer entre eux.

FondamentalQui établit les protocoles ?

Internet est géré de façon décentralisée, il n'y a pas une structure qui gère l'ensemble, les protocoles sont souvent le résultat de discussions ouvertes à toutes et tous.

En pratique il y a quelques organismes de standardisation, comme l'IETF qui publie les RFC ou le W3C qui standardise les langages du Web, comme HTML ou CSS.

AttentionInternet ≠ Web (métonymie)

Le protocole principal du Web est HTTP.

Il existe d'autres protocoles sur Internet : FTP pour le transfert de fichier, SSH pour l'accès à des ordinateurs distants, SMTP et IMAP pour le mail, etc.

ExempleConnexion distante (1969)

  • Naissance : 1969

  • Protocole : Telnet (1969, RFC 15), SSH (1995, RFC 4251)

ExempleMail (1971)

ExempleWeb (1990)

  • Naissance : 1990

  • Protocole : HTTP (1990, W3C, RFC 1945) (et le langage de formatage de documents HTML)

Les clients et les serveurs web parlent HTTP

DéfinitionServeur web

Un serveur web est un logiciel qui traite les requêtes HTTP de clients.

Il est installé sur une machine hébergeant des documents (HTML, CSS, JavaScript, etc.) et est accessible depuis Internet.

DéfinitionNavigateur web

Un navigateur web est client HTTP qui a trois rôles.

  1. Effectuer des requêtes HTTP (GET, POST, etc.).

  2. Comprendre les réponses à ces requêtes.

  3. Interpréter les fichiers web (HTML, CSS, JavaScript) retournés.

DéfinitionMéthodes HTTP

Les méthodes HTTP sont les commande que le client (navigateur) envoie au serveur.

Exemple

Les plus courantes sont :

  • GET (pour demander une ressource, une page HTML par exemple)

  • POST (pour transmettre des données au serveur, par exemple quand on remplit un formulaire en ligne)

DéfinitionCode de retour HTTP

Un code HTTP est un code à 3 chiffres qui est présent dans chaque réponse HTTP du serveur.

Exemple

Les plus courants sont :

  • 200 OK : « Tout est bon »,

  • 401 Unauthorized: « Vous n'avez pas le droit d'accéder à cette ressource, il faut une authentification »,

  • 404 Not Found: « Ressource non trouvée »,

  • 500 Internal Server Error: « Erreur du serveur ».

Synthèse

Questions

  • Quelles sont les différences entre Internet et le web ?

  • Retracer le chemin d'une requête entre un navigateur web et un site web en nommant les principaux protocoles utilisés.

  • Est-ce possible pour un dirigeant de couper l'accès à un site web ? Citer des stratégies et leurs limites.

Concepts

  • Contre-culture et Internet

  • Décentralisation d'Internet

  • Standardisation des protocoles

Protocole

Un protocole informatique est un ensemble de règles techniques permettant à des ordinateurs d'échanger des informations via un langage commun.

IETF
Internet Engineering Task Force

Serveurs web

DéfinitionServeur web

Un serveur web est un logiciel qui traite les requêtes HTTP de clients.

Il est installé sur une machine hébergeant des documents (HTML, CSS, JavaScript, etc.) et est accessible depuis Internet ou un réseau local (un intranet).

Les ressources servies par le serveur peuvent être statiques, c'est-à-dire sans qu'elles existent préalablement à la requête (un fichier HTML, une image PNG, etc.) ou dynamiques, c'est-à-dire construites à chaque requête faite au serveur.

ExempleServeurs HTTP
  • Apache : le serveur web le plus utilisé avec 44,3% des parts de marché en février 2019.

  • Nginx : le deuxième serveur web le plus utilisé mais est le premier parmi les 1000 sites les plus actifs.

  • Node.js : un environnement d'exécution JavaScript en dehors du navigateur qui fait aussi office de serveur HTTP.

À retenir
  • Un serveur hébergeant des fichiers web a besoin d'un serveur web pour les rendre disponibles à travers le protocole HTTP.

  • Apache et Nginx sont les serveurs web les plus utilisés.

Navigateurs web

DéfinitionNavigateurs web

Un navigateur web est client HTTP qui a trois rôles.

  1. Effectuer des requêtes HTTP (GET, POST, etc.).

  2. Comprendre les réponses à ces requêtes.

  3. Interpréter les fichiers web (HTML, CSS, JavaScript) retournés.

Remarque

Tous les navigateurs web possèdent un interpréteur JavaScript permettant d'exécuter ce langage sur l'ordinateur client.

FondamentalLes outils de développement sous Firefox

Les navigateurs possèdent aussi une partie « Outils de développement » destinée à aider les développeurs web dans leur activité.

Sous Firefox, ces outils sont disponibles en appuyant sur F12 ou clic droit > Inspecter l'élément.

Outils de développement Firefox (F12)
Extrait du moniteur réseau quand on accède à www.mozilla.org
Outils de développement Firefox (onglet requête)
À retenir
  • Les navigateurs web sont des clients HTTP.

  • Ils interprètent les langages du Web (HTML, CSS, JS).

  • Ils disposent d'outils de développement permettant d'inspecter les fichiers des pages web et les requêtes et réponses HTTP.

URL : Uniform Resource Locator

DéfinitionLes URL

Les URL sont nées en même temps que le World Wide Web et permettent d'identifier une ressource sur un serveur web.

Décomposition d'une URL
Exemple

Lorsque https://www.wikipedia.org/wiki/URL est rentrée dans un navigateur web, ce dernier fait une requête GET sur la ressource « /wiki/URL » du serveur pointé par www.wikipedia.org, en sécurisant la connexion grâce à HTTPS.

Codes de retour HTTP

DéfinitionCode HTTP

Un code HTTP est un code à 3 chiffres qui est présent dans chaque réponse HTTP du serveur. Ce code est destiné au client HTTP pour lui indiquer le statut de sa requête.

Les codes HTTP sont séparés en 5 familles, qui se distinguent par le premier digit du code retour :

  • 1xx : Informations

  • 2xx : Succès

  • 3xx : Redirections

  • 4xx : Erreur du client

  • 5xx : Erreur du serveur

ExempleLes codes HTTP courants

Il existe plusieurs dizaines de code HTTP, mais certains sont plus utilisés que d'autres, en voici quelques-uns :

  • 200 OK : « Tout est bon »,

  • 201 Created: « Ressource ajoutée avec succès »,

  • 401 Unauthorized: « Vous n'avez pas le droit d'accéder à cette ressource, il faut une authentification »,

  • 404 Not Found: « Ressource non trouvée »,

  • 500 Internal Server Error: « Erreur du serveur ».

Liste des raccourcis clavier

Liste des fonctions de navigation et leurs raccourcis clavier correspondant :

  • Bloc Suivant : flèche droite, flèche bas, barre espace, page suivante, touche N
  • Bloc Précédent : flèche gauche, flèche haut, retour arrière, page précédente, touche P
  • Diapositive Suivante : touche T
  • Diapositive Précédente : touche S
  • Retour accueil : touche Début
  • Menu : touche M
  • Revenir à l'accueil : touche H
  • Fermer zoom : touche Échap.