Il y a quelques années, une étude menée par une universitaire auprès d’utilisateurs du réseau révélait leur très grande inculture technique : pour une large part, la structure du réseau était un mystère, et à la question : « Où se trouve l’information que vous consultez ? », beaucoup répondaient : « Quelque part dans le tuyau ». Très généralement, Internet est perçu comme un service centralisé auquel on s’abonne ; il y aurait le client (nous) qui consomme l’information fournie par un ensemble de grosses entreprises, grâce à un service technique unique (Internet, le Web).
À n’en pas douter, de très nombreux utilisateurs ne se posent pas trop de questions, et sont toujours incapables de savoir où est quoi. Si beaucoup se doutent bien que tel serveur est « aux Etats-Unis » ou « en France », ça ne va pas plus loin. Une question simple : lorsque vous vérifiez votre courrier électronique, vous le récupérez à quel endroit ? Est-ce dans votre modem, chez votre fournisseur de service, chez le fournisseur de service de celui qui l’envoit, sur une grosse machine chez Microsoft ?
Au-delà des problèmes d’utilisation qu’une telle inculture entraîne (relever son courrier lorsqu’on n’est pas sur son propre ordinateur... mission impossible pour beaucoup d’utilisateurs), ce sont tous les débats autour des implications sociales, démocratiques, politiques du réseau qui sont pervertis.
Cet article va donc tenter de vous expliquer où se trouve l’information sur l’internet, qui la produit, qui la diffuse et comment elle se retrouve dans votre ordinateur.
L’internet, c’est d’abord une structure logique, un ensemble de protocoles, des langues communes adoptées par tous les ordinateurs pour communiquer entre eux. Avant de poursuivre, nous vous invitons à lire notre article Cékoidonc, Internet ?.
Par extension, le terme Internet désigne également la structure physique du réseau, c’est-à-dire l’ensemble des machines qui communiquent en utilisant ces protocoles.
Avant tout, ce réseau physique est constitué des ordinateurs qui y sont connectés en permanence, et qui y sont parfaitement identifiés (par une adresse IP qui ne change pas). Toutes ces machines peuvent entrer en contact les unes avec les autres, au travers du maillage mondial des lignes de communication qui les relient. Chaque machine peut en contacter une autre, la plupart du temps en passant au travers d’autres machines.
Ces machines sont souvent spécialisées dans des tâches précises, leur point commun étant l’adoption des protocoles de l’internet. Parmi ces tâches, on trouve les serveurs (qui « contiennent » et fournissent l’information que nous consultons), les routeurs (qui se contentent de relier les lignes de communication et de gérer le trajet de l’information sur le réseau), et les fournisseurs d’accès (qui nous permettent de nous connecter au réseau avec nos petites machines).
Tous ces ordinateurs sont reliés de manière permanente par des lignes de communications spécialisées, ouvertes en permenance, et pouvant supporter l’échange d’importantes quantités d’information (hauts débits).
Mais nous, simples utilisateurs, n’avons ni les moyens ni le besoin (en général) d’être connecté en permanence au réseau avec de tels tuyaux. Nous nous connectons uniquement lorsque nous en avons besoin, avec des tuyaux plus petits, et adaptés à nos besoins. Inutile ici de définir toutes les méthodes possibles ; le principe général, que l’on se connecte avec un modem, l’ADSL ou le câble, quelque soit le débit ou le mode de facturation, cela revient à nous connecter directement à une des machines évoquées précédemment, c’est-à-dire la machine d’un fournisseur d’accès quand nous en avons besoin.
La machine du fournisseur d’accès est donc connectée en permanence aux autres machines du réseau ; et c’est en passant par cette machine-là que notre ordinateur accède à l’ensemble du Net.
Le principe général
Le principe général de la plupart des services disponibles (je parle là de service au sens de protocole, de type d’usage, de façon informatique d’accéder à l’information ; non au sens du service commercial auquel on s’abonne) est très simple :
l’information désirée est installée sur un serveur, une des nombreuses machines (plusieurs centaines de milliers dans le monde) reliées en permanence au réseau ;
lorsque nous « demandons » cette information, le réseau nous met en contact, via son maillage (ses lignes de communication et ses routeurs) avec ce serveur ;
ensuite l’échange d’information se déroule comme si on était connecté directement à cette machine ; ça n’est pas vrai physiquement, mais pour l’utilisateur final, toute la gestion des trajets de l’information est transparent.
Voici plus précisément comme cela se déroule...
Tout d’abord, il faut savoir où se trouve l’information. L’information que vous voulez consulter est bien évidemment installée sur un serveur ; mais lequel parmi les centaines de milliers connectés au réseau ?
Le plus simple serait de connaître l’adresse IP (le numéro unique attribué à chaque machine connectée au réseau) ; mais ces adresses sont composées de 12 chiffres, difficiles à mémoriser. Aussi on indique généralement un nom en clair, plus facile (yahoo.com, minirezo.net...). Je vous passe les détails, puisque tout cela se déroule de manière transparente pour l’utilisateur : la structure physique et logique du réseau se met alors en branle pour déterminer, pour chaque nom en clair à quelle adresse IP cela correspond.
Il faut ici insister : si l’information que vous souhaitez consulter est installée sur un serveur, il faut bien comprendre que pour des informations différentes, il s’agit de serveurs différents à chaque fois. Les serveurs se comptent par centaines de milliers, on en ajoute chaque jour. Il n’y a donc pas un gros serveur, ou un service centralisé qui regroupe toutes les informations disponibles sur le réseau ; il y a un nombre énorme de machines qui contiennent de l’information.
L’information étant localisée, le serveur qui la contient est déterminé et identifié, la connexion peut s’établir.
Votre machine est donc, via le maillage du réseau, connectée au serveur. Vous devenez le client qui réclame l’information au serveur. Dorénavant, tout se déroule comme si la machine du fournisseur d’accès et les routeurs intermédiaires, n’existaient pas : de manière transparente, vous consultez le serveur comme si vous y étiez connecté en direct (et cela, que la machine soit installée dans le paté de maison voisin de votre logement, ou à l’autre bout de la planète).
Le serveur vous envoit, à votre demande, les informations que vous lui réclamez sous forme de fichiers informatiques. À charge pour votre ordinateur de savoir lire et afficher ces fichiers (voir notre article sur les protocoles).
Le FTP
Le FTP (File Transfer Protocol) est sans doute le protocole de l’internet, parmi les plus couramment utilisés, qui illustre de la façon la plus simple ce que nous venons d’expliquer.
Il s’agit d’un protocole qui permet l’échange de fichiers entre un client et un serveur. Vous l’utilisez certainement quotidiennement, parfois sans le savoir : les sites de téléchargement de sharewares, de certaines informations volumineuses, la mise à jour d’un site Web. Les butineurs Web manipulent sans difficulté le FTP, si bien que de nombreux utilisateurs ne se rendent pas compte qu’ils ne sont plus sur le Web.
Le serveur FTP contient des fichiers de toutes sortes, de tous formats. Le client qui va vouloir accéder à ces fichiers (soit les récupérer, soit en installer de nouveaux), va donc se « brancher » sur le réseau par l’intermédiaire de son fournisseur d’accès, indiquer le nom de la machine visée, le réseau va le mettre en contact avec le serveur distant via les différentes lignes de communication et les routeurs ; dès lors, le client et le serveur semblent dialoguer en direct, et les opérations de téléchargement s’effectuent simplement.
Le fonctionnement le plus simple sur l’internet : un client se connecte, via le maillage du réseau, à un serveur distant, et les deux échangent des fichiers.
Où est l’information ? C’est un fichier sur un serveur.
Le Web
Bien que relativement récent, le Web repose également sur un fonctionnement très simple. L’information est installée sur un serveur, et le client se connecte sur ce serveur pour récupérer l’information. Il s’agit d’un échange de fichiers entre deux machines, de la même façon que pour le FTP.
La différence, c’est que les fichiers récupérés par le client sont dans un format unique (en HTML), alors que les fichiers récupérés par FTP peuvent être de n’importe quel format (des fichiers pour n’importe quel logiciel, des logiciels...). Du fait de ce format unique, ce fichier peut être utilisé par un seul logiciel (le butineur), et affiché à l’écran de l’utilisateur.
La subtilité, ici, c’est que le fichier récupéré par l’utilisateur (en HTML) contient non seulement du texte mis en page, mais également des indications pour intégrer d’autres fichiers (du graphisme en particulier). Ainsi, après avoir récupéré le premier fichier en HTML, le client va-t-il demander au serveur de lui envoyer des fichiers supplémentaires qui permettront d’afficher correctement l’ensemble des informations. (Autre nuance : ces nouveaux fichiers peuvent être installés soit sur le serveur d’origine, soit encore sur une autre machine.)
Où est l’information ? L’information est, encore une fois, sur un unique serveur. Mais la récupération d’un premier fichier (au format HTML) provoque automatiquement la récupération d’autres fichiers (graphiques...) par le client, qui va alors regrouper tous ces fichiers pour créer un affichage dans le butineur.
Les newsgroups
Évoquons maintenant les newsgroups, ou forums. Nous parlons du service spécifique, et non des forums de discussion installés dans les sites Web. On utilise ces services soit par une fonction dédiée des butineurs (donc une fonction très différente du Web), soit par des logiciels spécifiques.
Ces services permettent d’échanger des informations directement fournies par des utilisateurs du réseau, selon des thèmes classés. Nous allons le voir, l’information est ici totalement décentralisée, contrairement aux sites Web et aux serveurs FTP.
Pour le client, les choses semblent se dérouler d’une manière classique : il se connecte à un serveur qui contient les newsgroups en indiquant le nom de cette machine (par exemple : news.wanadoo.fr), et accède ainsi aux nombreux forums thématiques. À priori, rien de nouveau : on se connecte sur un machine, et on échange des informations...
Mais notez cette différence : lorsque l’on veut se connecter à Yahoo, depuis n’importe où dans le monde, on indique l’adresse www.yahoo.com. Pour les newsgroups, vous indiquez généralement l’adresse de votre fournisseur d’accès (news.fournisseur.fr), et vous accédez à l’intégralité (ou presque) des forums thématiques ; il semble évident qu’à l’autre bout de la planète, pour accéder aux mêmes forums, on ne va se connecter sur le serveur de votre fournisseur...
L’information à laquelle vous accédez sur le serveur de votre fournisseur d’accès (sur son serveur de news) est dupliquée sur tous les serveurs de news de la planète en permanence. Ainsi, en vous connectant et en postant dans les news, vous consultez ou enrichissez sur la machine de votre fournisseur, mais ensuite cette information est immédiatement reproduite sur tous les autres serveurs de news de la planète.
Où est l’information ? L’information que vous consultez ou que vous enrichissez se trouve, à ce moment précis, sur le serveur de news auquel vous vous connectez (en général, celui de votre fournisseur d’accès). Ensuite, cette information est dupliquée et reproduite à l’identique sur tous les serveurs de news de la planète.
Ainsi, un utilisateur de Hong-Kong consultera les mêmes informations que vous, mais recopiées sur un serveur différent.