Usenet c'est quoi ce truc?
Autant vous prévenir tout de suite là, ça ne rigole plus

 

Si vous utilisez les news, vous êtes sur Usenet et non pas Internet. A priori on s'en fout, cependant cette nuance explique les curieuses voire incompréhensibles contraintes des news binaires.

Usenet est un réseau de réseaux qui est une sous-composante distincte de l'Internet (en fait, c'est l'ancêtre d'Internet...). Les échanges électroniques sur Usenet se font en mode texte. Pour échanger du binaire (nos fichiers à nous qu'on aime lire et publier), les logiciels de news les convertissent en pseudo-texte dans une forme compris par les machines. d' où une prise de poids au passage. C'est l'encodage. Les logiciels de news le font automatiquement. À la réception, normalement le décodage se fait automatiquement . Pour des contraintes avant tout techniques, que de très gros fichiers ne monopolisent les serveurs ou saturent des routeurs, l' infrastructure d' usenet "exige" qu'un nombre maximal de lignes soit respecté pour un message pseudo-texte. Par exemple, 3000 lignes. Ce qui arrive alors, c'est qu'un fichier binaire, encodé en pseudo-texte, sera trop gros pour entrer dans un seul message. Les logiciels de news vont alors tronçonner en "petites parties" le fichier (autrement dit, en plusieurs messages). Voir Les secrets du postage à la tronçonneuse .

Ainsi par exemple, si on décide de poster à 3000 lignes, un fichier de 1.44Mo sera découpé et envoyé en fait en 7 parties (messages) différents, chacun de 3000 lignes. Plus le nombre de lignes sera bas et/ou plus le fichier sera gros en taille, plus le nombre de parties sera élevé.

Il faut comprendre qu'il n'y a pas un serveur central qui regroupe tous les messages, mais que vous lisez et écrivez sur le serveur de votre fournisseur d'accès. Ensuite en fonction de ses choix économiques, politiques, techniques votre fournisseur va relayer ou pas les messages des autres serveurs, et c'est lui qui va décider du nombre de lignes max des fichiers qu'il acceptera de publier. On comprend mieux pourquoi quand celui qui publie et celui qui lit sont sur le même serveur, la taille des messages peut être importante et qu'il y a peu ou pas de perte

Une autre composante est que le chemin sur Usenet n' est jamais le même. Pour équilibrer la charge de transport, le réseau s' auto-organise et chaque partie (message) transite par un chemin différent: Montréal, Paris, New York, bref tous les chemins possibles. Ce cheminement multiple s'appelle la propagation. Et contrairement à ce que l'on peut croire, elle n'est pas instantanée, mais peut parfois prendre des heures, voire des jours. La raison en est qu'un message peut être mis en attente quelques heures, par exemple, dans la queue de traitement d'un routeur débordé. Vous pouvez visualiser ce chemin; avec OE, faites un clic droit sur un message, choisissez propriétés et l'onglet détails, la première ligne "path" vous montre le chemin parcouru

Quand tout marche bien, au bout de quelques heures (24 heures maximum), à l'arrivée, le serveur que vous utilisez devrait avoir reçu tous les messages composants chaque fichier en provenance de toutes les parties du monde. Dans le meilleur de cas, il est possible de tout récupérer.

Sauf que...

Sauf que l'architecture de Usenet ne garantit pas que les messages se rendent à destination! Un message peut être bloqué définitivement sur
un routeur à Bruxelles, ou perdu par un spooler à Paris, ou corrompu dans le transport par satellite au-dessus de l'Atlantique, ou être rejeté par un serveur débordé( genre économie de bout de chandelles de Wanamou), ou encore arriver trop en retard sur votre serveur pour rejoindre les autres. Il y a donc plus ou moins souvent des pertes dans le transport. Plus le chemin est long plus les risques sont grands.

Plus les pertes sont importantes, plus ce que l'on appelle la complétude sur un serveur est faible.

Un serveur, c'est un peu comme une baignoire: ca reçoit passivement des posts 24h/24h. Et il y a donc des bons serveurs et des mauvais serveurs, comme il y a des bons et des mauvais contenants pour recevoir de l'eau.

Si j'essaie de faire entrer 10 litres d'eau à la seconde dans un tuyau qui ne peut en contenir que 2, alors, bien sur, ça pisse de tous les bords partout, je suis mouillé de la tête au pied, et je perds de l'eau. De la même façon, quand le flot de messages sur Usenet est plus important pour un serveur que ce qu'il peut en recevoir, il perd des messages. Pour vous donner une idée, le traffic sur Usenet peut atteindre par moment 10 TeraBits/seconde, alors que plusieurs serveurs bas de gamme sont équipés de cables limités à 2 TeraBits/sec. Ces serveurs perdent donc 80% du traffic qui est définitivement perdu ! Les messages qui passent sont le plus souvent identifiés par l'administrateur du serveur comme "plus importants" que les autres, notamment les vrais messages textes (dont le nombre de lignes est faible), les fichiers en provenance des autres serveurs appartenant à l'administrateur, les fichiers dans les groupes les plus populaires, etc. Le reste, tant pis ! Une astuce consiste donc à faire de petits fichiers pour leurs donner plus " d'importance " mais en les multipliant on accroit le risque d'en perdre, il faut donc trouver un bon ratio.

Bon ben j'espère ne pas avoir écrit trop de conneries, ni avoir été trop chiant, mais le problème est souvent évoqué et pour mettre de l'humour la dedans ma doudou dit donc ;-)))

texte en bonne partie inspiré par plein de trucs écrits là http://guidefrench.tripod.com/