Je pense que nous préférons la version album, mais OK, bien sûr Top of the Pops

Aujourd’hui peut-être plus que jamais, les données sont éphémères. Malgré la révélation tardive de Stephen Hawking selon laquelle l’information ne peut jamais vraiment être détruite, elle peut absolument disparaître de l’accès public sans laisser de trace.

Ce ne sont pas seulement des données analogiques non plus. Tout comme les livres sont épuisés, les sites Web peuvent se déconnecter, emportant avec eux la richesse des connaissances, des opinions et des faits qu’ils contiennent. (Vous ne trouverez pas les archives d’herbes complètes de old Deadspin sur ce site, par exemple.) Et à une époque où les mises à jour d’histoires, de chansons ou de vidéos courtes se font en un clic, les modifications se produisent et ne laissent souvent aucune indication sur ce qui s’est passé auparavant. Il y a toute une génération d’adultes qui ignorent qu’une certaine fusillade dans la cantine de Mos Eisley était un meurtre de sang-froid, par exemple.

En savoir plus

Ainsi, un jour donné, Peter Hanrahan, 19 ans, passe ses soirées à écouter des émissions de radio en tête des charts des années 1960.Étudiant du nord de l’Angleterre, il a récemment commencé à collectionner des épisodes de Top of the Pops – une émission musicale britannique diffusée entre 1964 et 2006 – après avoir vu le film de Tarantino en 2019, Une fois Sur un moment à Hollywood.

« Je cherchais des épisodes TOTP car j’ai constaté qu’il y en avait un grave manque disponible sur YouTube, le BBC iPlayer ou toute autre émission de radio », raconte-t-il à Ars. « Mais je voulais faire l’expérience de ce que cela aurait été à l’époque et chercher à cause de l’atmosphère de la radio dans Il était une fois à Hollywood. C’est une autre façon de découvrir la musique de cette époque. »

Si Hanrahan voulait simplement découvrir plus de classements britanniques des années 60, bien sûr, il aurait pu simplement courir sur Spotify. Mais il veut l’expérience de la télévision telle qu’elle a été enregistrée à l’époque — y compris les audiences en studio en direct, les controverses sur la synchronisation labiale et les délinquants sexuels présumés.

Publicité

Naturellement, YouTube a beaucoup d’anciens épisodes, mais la BBC a essayé de supprimer ceux mettant en vedette Jimmy Savile ou Gary Glitter, par exemple. Aujourd’hui, c’est loin d’être une bibliothèque TOTP complète avec seulement une fraction des épisodes que Hanrahan recherche accessibles sur la plateforme. YouTube est également prompt à répondre aux avis de retrait, et les épisodes qui sont actuellement là un jour peuvent disparaître le lendemain.

Son prochain arrêt est archive.org, la vénérable bibliothèque à but non lucratif qui possède 411 milliards de pages Web archivées, 23 millions de livres, 5,5 millions de films et une variété d’autres données. Souvent, ils auront ce dont Hanrahan a besoin, mais sinon, son prochain arrêt est un coin obscur de reddit, où il est juste possible que quelqu’un, quelque part, ait une copie enregistrée.

Il a fallu beaucoup de temps à Hanrahan pour les trouver et les obtenir, mais son travail, traçant les bords d’Internet et se connectant avec de vraies personnes, porte enfin ses fruits. Au cours de sa première année en tant qu’accumulateur avoué, Hanrahan avait collecté plus d’un téraoctet de données.

Publicité

Cette impermanence de l’information, bien sûr, va bien au-delà de la vieille radio britannique. Et heureusement pour les générations futures, la démangeaison de le chercher, de le collecter et de le stocker va également au-delà de Hanrahan. C’est un sentiment qui pousse actuellement des milliers de personnes à se regrouper en ligne dans la poursuite commune de l’archivage de vieux médias de toutes sortes. Ce n’est pas l’opération bien coordonnée des Archives Internet financée par des subventions et des partenariats; c’est le r / Datahoarder axé sur l’obsession individuelle.

Il y a un subreddit pour tout

En 2020, la communauté r / Datahoarder sur reddit compte près de 200 000 membres, avec environ 1 000 personnes au ralenti ou postées dans le subreddit à tout moment. Le but commun ici est exactement ce que cela ressemble: ces archivistes amateurs ont entrepris de collecter et de capturer des données et de les conserver pour l’enregistrement, la référence et la lecture future. Souvent, l’objectif est de conserver ces informations en ligne et hors ligne, via des supports physiques ou des téraoctets de disques durs personnels et de stockage. D’une certaine manière, vous pouvez considérer r / Datahoarder comme des milliers d’archives Internet individuelles au hasard — bien que chaque membre ait tendance à avoir quelques domaines d’intérêt spécifiques.

Sur r/Datahoarder, vous trouverez des personnes stockant des données sur tout, des vidéos YouTube aux disques d’installation de jeux. Une personne prévoyait même de copier tous les sites Web basés en Australie alors même que le pays brûlait dans les pires incendies de forêt de l’histoire. Le message a été supprimé après qu’il a été souligné que les serveurs physiques des sites Web australiens sont situés en dehors du pays. Ils sont en sécurité pour l’instant — ouf.

Publicité

Certains utilisateurs archivent chaque site Web qu’ils visitent ou service qu’ils utilisent, et la gamme de médias comprend pratiquement tout: les films, la musique et le porno sont tous populaires.

Et pour les futurs historiens, chaque tweet, chaque diffusion en direct, chaque émission de télévision et d’information sur le mouvement démocratique de Hong Kong récent et en cours a été balayé par quelques utilisateurs dévoués. Cela s’avère déjà utile pour au moins un universitaire qui a visité r / DataHoarder à la recherche de matériel de recherche pour sa thèse de maîtrise en sociologie sur les manifestations de Hong Kong.

Tout matériel est le bienvenu. Alors que de nombreux utilisateurs disposent d’énormes racks de stockage d’équipements coûteux, même d’humbles PI Raspberry sont régulièrement équipés de disques surdimensionnés et utilisés comme grattoirs reddit en temps réel. Ce message embarrassant de 3 heures du matin sur la façon dont vous avez vraiment besoin de revenir avec votre ex? Vous l’avez peut—être supprimé quelques secondes après sa publication, mais il est presque garanti qu’il existe plusieurs copies dans des archives privées – disponibles pour votre ex sur demande.

Publicité

1990 les périphériques de stockage de masse de l’époque tels que le lecteur Zip Iomega flottent occasionnellement à la surface du sous-marin, alors que leurs propriétaires les redécouvrent dans une armoire sous les escaliers, suscitant des discussions sur les pilotes, les méthodes de récupération, les formats de fichiers et la lisibilité.

Le désir de sauvegarder l’information pour la postérité semble presque universel mais se manifeste de différentes manières selon l’intérêt propre de chaque thésauriseur. Faites défiler les tableaux et vous trouverez des sites Web archivés offrant une personnalisation pour les machines Windows 98 et les curseurs de nouveauté. Vous trouverez des utilisateurs ayant pour mission de préserver l’ensemble de l’Internet d’un seul pays à un moment donné. Vous trouverez des utilisateurs dont l’obsession particulière est les prévisions météorologiques par satellite pour le Japon ou les films muets.

Comme vous pouvez le deviner sur la base d’une collection d’utilisateurs technologiques très motivés et obsédés, r / Datahoarder a commencé en tant que canal de discussion IRC unique sur freenode. Finalement, la communauté est passée aux r/datahoarders encore utilisés occasionnellement, r/datahoarder ayant vu le jour il y a quatre ans. Il existe également un subreddit d’échange séparé, r / DHExchange, où les membres tentent de combler les lacunes de leurs collections.

Publicité

La discussion de nos jours est généralement très technique, tournant en grande partie autour de moyens efficaces de stocker ou de thésauriser de grandes quantités de données glanées en ligne et ailleurs. Les utilisateurs veulent obtenir des conseils sur les baies de disques durs qui s’étendent sur des centaines de téraoctets, les options de stockage de masse dans le cloud et les coûts étonnants associés à l’archivage d’anciens médias autrement oubliés comme les émissions, la musique, les revues et les pages Web.

Hanrahan ne s’est pas impliqué par amour de l’air du temps musical des années 1960 — les anciens numéros de musique britannique ne sont que le dernier effort d’archives qu’il entreprend. Dans la vraie vie, Hanrahan a 12 tiroirs de briques Lego coordonnées en couleurs qu’il utilise fréquemment et une vaste collection de vinyles, qui comprend tout, de l’original The Good, the Bad et la bande originale laide à la musique de Red Dead Redemption II. Sans surprise, il maintient également une grande bibliothèque de jeux numériques.

« Cela a commencé en compilant des trucs que je pense relativement difficiles à trouver, et juste des trucs sympas que je trouve, comme de vieilles publicités et des intros télévisées comme celles d’ABC », a-t-il déclaré.

Publicité

En tant que petit poisson fantaisiste dans le bassin de thésaurisation des données, le stockage de Hanrahan n’est pas étendu, mais reste considérablement supérieur à ce que la plupart des utilisateurs auraient sur leurs systèmes domestiques. Sa capacité de stockage est de 6 To, avec 3 To donnés aux sauvegardes. Il dépense 100 £ supplémentaires (environ 130 $) sur deux disques de 1 To chaque fois qu’il commence à manquer d’espace. Il conserve même des disques supplémentaires contenant ses données les plus précieuses chez un autre membre de la famille et met à jour son trésor chaque année.

 Non, pas ce genre d
Agrandir / Non, pas ce genre d’accumulateur. Gardez ça pour AMC.
Kurt Wittman / Images éducatives / Groupe Universal Images via Getty Images

Une brève histoire de l’archivage des impulsions

L’envie de stocker des enregistrements et des informations rares ou utiles dure depuis aussi longtemps que les humains en ont les moyens. Les premières archives de documents écrits ont commencé à apparaître vers 3500 avant JC — peu de temps après l’invention de l’écriture, et la Grande Bibliothèque d’Alexandrie a été fondée dans le but d’acquérir et de thésauriser les meilleures copies et les plus faisant autorité de chaque œuvre jamais produite, employant des scribes pour les copier à la main sur le plus beau parchemin disponible — l’ancien équivalent des déchirures blu ray UltraHD 8K.

Ce n’est que dans les années 1970, avec le succès phénoménal de la cassette compacte, que l’archivage amateur des médias populaires en direct est devenu possible. Les adolescents dans leurs chambres enregistraient des émissions de radio en direct alors qu’ils diffusaient les dernières chansons pop des stations de radio pirates. En 1974, le magazine Billboard a rapporté que plus de 40% de tous les groupes d’âge enregistraient des émissions en direct à la radio, avec une baisse correspondante du nombre de cassettes préenregistrées achetées. L’enregistrement à domicile tue l’industrie de la musique? C’est là que ça a commencé. Des cassettes ont été enregistrées et enregistrées à nouveau, avant d’être condamnées à l’élimination ou au purgatoire du stockage éternel dans un boîtier en plastique jaunissant lentement, ou au fond d’un tiroir de cuisine.

Publicité

L’avènement du Betamax et de la VHS a rapidement donné aux thésauriseurs un nouvel outil. Des émissions de télévision et des films en direct et préenregistrés sont devenus disponibles à la demande dans les bibliothèques personnelles des utilisateurs. Comme pour les cassettes, la plupart des émissions enregistrées ont été enregistrées plus tard pour faire de la place pour le prochain épisode de The Bob Newhart Show ou All in the Family. Ce que la plupart des gens avaient à l’esprit n’était pas une archive permanente — c’était la commodité de pouvoir regarder ou écouter le dernier épisode d’un savon préféré quand cela leur convenait.

Mais comme les magnétoscopes ont cédé la place aux lecteurs DVD, puis aux DVDR, aux boîtes TiVo et finalement au paysage du streaming que nous connaissons et aimons aujourd’hui, les cassettes VHS ont subi le même sort que les cassettes. La télévision diffusée, comme la radio, a été largement perdue dans la nuit des temps à moins que les créateurs et les détenteurs de droits ne s’efforcent de créer et de stocker des sauvegardes en toute sécurité.

Par exemple, Doctor Who est l’une des exportations les plus réussies de la télévision britannique et, à son apogée en 1982, l’émission était regardée par un public mondial de 98 millions de personnes. Aujourd’hui, le fandom est obsessionnel — se penchant sur les moindres détails de l’intrigue, stockant des épisodes et se disputant pour savoir laquelle des 13 incarnations du Docteur était la plus grande.

Publicité

Mais entre sa diffusion initiale en 1967 et 1978, la BBC a systématiquement supprimé ses émissions après leur diffusion, estimant qu’il n’y avait aucune valeur pratique à conserver des copies. Neuf ans d’épisodes bien-aimés de Doctor Who manquent. Certains clips survivent et de temps en temps, un épisode complet apparaîtra, gracieuseté d’un réseau étranger qui a trouvé la bande originale de deux pouces dans une boîte sur le côté du canapé, mais la plupart des premières émissions de Doctor Who ont disparu pour de bon.

Avons-nous vraiment besoin de tout?

Dans l’exemple spécifique ci-dessus, l’effort de sauvetage de Doctor Who est en cours et il est peu probable que les archives de la BBC disparaissent de sitôt. Mais certains utilisateurs de r / Datahoarder s’inquiètent de l’impermanence d’autres types de télévision en réseau, de ses archives et d’Internet dans son ensemble.

Prenez l’utilisateur Reddit Cwtard. Il craint que la politique et la censure empêchent les gens de l’avenir d’accéder facilement aux faits d’aujourd’hui. Si tout ce qui survit sont des émissions d’opinion dans les archives des services de streaming, par exemple, les futurs téléspectateurs ne verront qu’une vision déformée et unilatérale du passé.

Publicité

 » Je recueille des nouvelles parce qu’il est le plus en danger. C’est un enregistrement de ce que nous étions amenés à croire ainsi qu’un enregistrement de ce que nous étions autorisés à entendre « , a-t-il déclaré à Ars. « S’il y a quelque chose que les mondialistes, les entreprises et les politiciens veulent effacer d’Internet — à mon avis, c’est la nouvelle. »

Cwtard a commencé à archiver les nouvelles en 2008 et n’a découvert que plus récemment r/Datahoarder. Il est devenu un lieu virtuel où il peut garder un œil sur les émissions pour étoffer sa collection incomplète. Pour lui, Internet est un lieu impermanent, qui peut disparaître à tout moment, et Cwtard a besoin du matériel sur ses serveurs, en sa possession physique. Il considère qu’il s’agit d’une obligation de veiller à ce qu’une véritable trace du présent et du passé survive dans le futur.

Actuellement, Cwtard est à la recherche d’anciennes émissions de nouvelles du soir de CBS, du NBC Today Show, de Hoda et Jenna, de CBS Sunday Morning, de Face the Nation et de 60 Minutes, ainsi que de copies ou de scans de vieux journaux.

Publicité

 » Il y a certainement un devoir plus large quand vous voyez ce qui se passe dans le tuyau. Au mieux, Internet sera basé sur un abonnement, seuls les riches ayant un accès actuellement apprécié par tout le monde. Au pire, il sera complètement aseptisé de tout ce qui est jugé dangereux ou « mal pensé  » « , dit-il. « Compte tenu du climat géopolitique de nos jours, il est possible qu’un événement ferme complètement Internet — au moins jusqu’à ce que la télévision 2.0 soit prête à être mise en ligne. Dans ce cas, vous voulez pouvoir enregistrer autant d’historique que possible car lorsqu’il reviendra, seul l’historique autorisé sera autorisé, à mon avis. »

Cwtard n’a pas tort. Même Internet Archive — une institution extrêmement respectée sur r/Datahoarder – est menacée. En 2019, un différend sur les livres audio a menacé de mettre le site hors ligne dans toute la Russie. Les poursuites peuvent se produire à tout moment dans n’importe quelle partie du monde, et le monolithique archive.org pourrait être légalement bloqué par les FAI, son trésor enterré à jamais.

 Pensez que vous aurez besoin d'un peu plus d'un a href = SSD /a pour vraiment devenir un accumulateur numérique.
Agrandir / Pensez que vous aurez besoin d’un peu plus qu’un SSD portable pour vraiment devenir un accumulateur numérique.
Valentina Palladino

Ai-je vraiment besoin d’un placard de serveur? Oui et non

La méfiance à l’égard du cloud computing est un thème courant, mais non prépondérant, parmi les thésauriseurs de données. Certains font confiance à leurs archives et sauvegardes comme Google et Amazon; d’autres partagent certainement le point de vue de Cwtard.

« Le stockage en nuage a la même impermanence qu’Internet, encore moins en réalité », dit-il.  » Vous faites confiance à des entreprises qui ont prouvé qu’on ne pouvait pas leur faire confiance. Pourquoi confier vos données à une entreprise qui a des mœurs et des valeurs différentes de vous?… Ils poussent l’idée du cloud. Ils veulent que le public leur cède toutes les données. Je pense qu’ils ont une vision du monde où les ordinateurs n’accèdent qu’au cloud, donc il n’y a aucune raison de posséder un ordinateur. »

Publicité

Encore une fois, l’idée de confier de grandes quantités de données à des géants du Web tels que Google est populaire en dehors de r / Datahoarder. Les ventes de plates-formes de bureau avec une évolutivité illimitée et un boîtier largement vide pour remplir les baies RAID sont en chute libre depuis des années, tandis que les ventes de la gamme Chromebook de Google (qui offrent généralement une mémoire très limitée et un stockage intégré non évolutif — avec un compte cloud gratuit) ont explosé depuis le lancement de la gamme en 2006. En janvier 2019, Google a révélé que les Chromebooks étaient utilisés par 30 millions d’étudiants et d’enseignants. D’ici 2023, les estimations indiquent que Google expédiera 17 millions de Chromebooks par an.

Donc, bien que tout ce dont quelqu’un a besoin pour commencer dans le trou du lapin r / Datahoarder soit un ordinateur portable à faible spécification et un compte avec quelques téraoctets dans le cloud, il y a des raisons de se concentrer sur le physique et le local. Google a en particulier depuis longtemps la mauvaise habitude d’espionner les activités de ses utilisateurs, et ses soi-disant mécanismes anti-abus peuvent verrouiller l’accès aux fichiers que le géant de la recherche soupçonne d’être une copie illicite de matériel protégé par le droit d’auteur.

Aux États-Unis, tout ce qui a été créé après le 1er janvier 1978, qu’il s’agisse d’un dessin, d’un poème, d’un document de référence ou d’un article de blog, a un droit d’auteur pour la vie de l’auteur plus 70 ans. Ainsi, presque tout ce qui a été publié sur le Web depuis sa création, ou diffusé sous quelque forme que ce soit au cours des 100 dernières années, est toujours légalement verrouillé. Ce que font de nombreux thésauriseurs de données dépendant du cloud est techniquement illégal et peut être arrêté ou supprimé par Google sans avertissement. À la lumière de cela, le stockage sur site est la seule solution pour les utilisateurs qui souhaitent conserver une archive qu’ils possèdent tous les deux et qui est à l’abri des regards indiscrets ou de la suppression.

Publicité

De nombreux thésauriseurs ont été touchés par des réclamations de droits d’auteur DMCA, les obligeant à mettre hors ligne leurs archives accessibles au public. L’un des incidents les plus poignants a impliqué u / dunklesToast qui avait amassé plus de 200 Go de bandes dessinées de Donald Duck en finnois mais a été contraint de se déconnecter après avoir reçu un avis légal. Quelques fans s’étaient même engagés à apprendre la langue pour pouvoir apprécier l’effort monumental, tandis que d’autres avaient prévu un effort de traduction de masse. Tout pour rien.

En conséquence, il n’est pas rare de voir, sur le subreddit de requête r/DHExchange, des utilisateurs demandant des films rares ou interdits. Il y a aussi des messages à la recherche de versions actuelles, proposant des scans de magazines pour augmenter les trous dans des tirages de plusieurs décennies, et (comme Peter) demandant des spectacles de musique britannique d’un passé lointain.

Étonnamment, les demandes sont souvent satisfaites par les personnes qui ont enregistré à la télévision en direct depuis des décennies, souvent sur des équipements obsolètes.

Publicité

 » J’ai quelques enregistrements de 1999 « , lit-on dans une réponse à une autre demande de TOTP. « Ce n’est malheureusement pas la meilleure qualité; des têtes de magnétoscope renversées lors de l’enregistrement et un fantôme horrible en raison des grands bâtiments à proximité, mais c’est observable. »L’utilisateur, AU8830, a téléchargé les épisodes sur un hôte temporaire, chaque fichier représentant 12 Go dans toute sa gloire entrelacée et truffée d’artefacts. « Merci beaucoup, c’est épique! Vous êtes une légende « , lit-on dans la réponse.

Même si les données, quelle que soit leur forme, sont disponibles ailleurs en ligne ou dans les bibliothèques, r/Datahoarder a toujours conscience qu’elles pourraient disparaître à tout moment. Et ce que deviennent ces caches d’informations personnelles des décennies plus tard est un risque et un défi évidents inhérents à cette approche d’enregistrement frauduleuse par rapport à l’institutionnalisation des bibliothèques ou des archives Internet. Hanrahan prévoit de donner ses disques à un ami qui le « soutiendra et le stockera en toute sécurité », dit-il (et espère). Mais les parents et amis de Cwtard n’apprécient pas ce qu’il fait. « Le travail de ma vie ne servira à rien. Jeté à la poubelle comme un vieil Atari trouvé dans un grenier « , a-t-il déclaré. « Cela ne veut pas dire que je n’ai pas l’obligation de le faire de toute façon. »

Plus que toute autre chose, cela — un sentiment d’obligation d’agir pour un plus grand bien informationnel – peut être l’ultime à emporter pour quiconque patauge périodiquement dans le monde du r / Datahoarder. Certaines personnes ne viennent que pour la musique britannique ou la météo japonaise ou les disques d’installation Microsoft. Mais le devoir plus large exprimé par Cwtard est certainement repris périodiquement par d’autres utilisateurs.

Publicité

 » Une pensée de douche vient de me frapper aujourd’hui « , a posté u / mamborambo sur le subreddit r / datahoarders moins utilisé. « Avec tous les projets d’archivage actifs lancés récemment pour sauvegarder le contenu historique des groupes Yahoo, Youtube, des listes de diffusion mourantes, des preuves de violations des droits de l’homme, etc. etc., le rôle des datahoarders a été élevé d’un nerd aux tendances de thésaurisation compulsives à un champion de la liberté d’expression et de la préservation de l’histoire. Nous allons maintenant hardiment là où l’intérêt de l’entreprise échoue. Nos téraoctets sont enfin utilisés pour l’amélioration de l’humanité. Espérons qu’aucune de nos plates-formes domestiques n’échoue, nous nous souvenons de faire notre sauvegarde 3-2-1 correctement, et surtout de rendre notre butin accessible, car les données sont inutiles si elles ne sont pas partagées. »

Et si les données sont ce que vous recherchez actuellement, j’ai le sentiment de savoir où je peux vous trouver une copie archivée.

David Rutland est un écrivain indépendant avec une formation en journalisme imprimé. C’est un joueur de guitare terrible, et il passe son temps libre à parcourir les îles britanniques, hors réseau, avec sa caravane et son chien. Il écrit également pour cyberpunks.com et dirige planetearth.appuyez depuis un Raspberry Pi derrière son canapé.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

lg