Observations sur Mastodon, la vie privée et la décentralisation
On entend souvent que Mastodon serait le réseau social de la vie privée, notamment parce que les différentes instances seraient hébergées sans intervention des "GAFAM" et autres prestataires privés. Dans cet article, je vais essayer de définir ce qu'est pour moi le Fediverse et ce qu'il n'est pas.
Le Fediverse est une ressource communautaire et humaine
De par la possibilité de choisir son instance, l'utilisateur final peut choisir la communauté et la modération qu'il souhaite, et ainsi se sentir plus en sécurité que sur les réseaux sociaux privés comme Twitter. L'utilisateur n'est ainsi pas exposé à la création d'un profil publicitaire, ou à des algorithmes : ce sont des humains qui construisent les fils, ce sont des humains qui définissent les règles et ce sont enfin des humains qui prennent des décisions de modération. Si celles-ci déplaisent à l'utilisateur final, celui-ci peut toujours déménager son compte vers une instance qui lui correspond mieux.
Edit : @crowdagger@corneill.es me rappelle (ici) à juste titre l'existence de sélections algorithmiques notamment sur le "Threadiverse" (Lemmy, kbin). Il n'est pas très clair pour moi si, comme sur Twitter, ces algorithmes mettent en avant les sujets controversés ou négatifs (comme ça peut également être le cas sur Reddit pour les différentes options de classement). Cependant, sur le Fediverse à proprement parler, il ne me semble qu'aucune sélection algorithmique mettant en valeur les sujets polémiques et les contenus négatifs n'existe à ce stade.
Le Fediverse ne protège pas totalement la vie privée des utilisateurs finaux
C'est également quelque chose qu'on entend souvent à propos de Mastodon : il n'y a a priori de raison de croire que Mastodon protège absolument la vie privée des utilisateurs finaux. D'une part parce qu'il est établi que les messages privés ne sont pas chiffrés de bout en bout et sont ainsi a priori visible par l'administrateur (en fouillant dans la base de données et pas sur une interface dédiée, par conséquent aucun admin probablement ne s'amuse à le faire). Les messages privés seront visibles de l'administrateur dans l'interface de modération si l'un d'eux venait à être signalé. Dans les autres scénarios, rien ne laisse à penser a priori qu'un administrateur n'espionne ses utilisateurs.
Le concept-même du Fediverse est la fuite de données : lorsqu'une publication est créée, elle est dupliquée sur 200 instances (chiffre au pif mais on doit pas être loin). Rien ne permet d'affirmer que les publications transmises à des instances tierces ne seront pas archivées indéfiniment, même lorsqu'elles sont paramétrées pour être visibles uniquement des abonnés de l'utilisateur. Rien ne permet d'affirmer non plus que ces mêmes publications seront effectivement supprimées de tous les serveurs tiers lorsque l'utilisateur le souhaite, parce qu'il n'est pas possible d'avoir la certitude que tous honorent l'instruction de supprimer ces publications pourtant supprimées sur l'instance d'origine. Rien ne permet d'affirmer non plus que des acteurs comme Google ne copieront pas ces publications en partie sur leurs serveurs, dans la mesure où les instances n'ont pas la même politique par rapport à l'indexation des moteurs de recherche, notamment via le mécanisme du fichier robots.txt.
Le Fediverse n'est pas indépendant des géants du web comme Amazon, Cloudflare, Backblaze (j'en oublie)...
Mastodon stocke les médias des utilisateurs, locaux et distants, pour une durée indéterminée pour les médias locaux et pour une durée définie par l'administrateur pour les médias distants (la durée définie peut être illimitée). Passé ce délai, l'instance est amenée à télécharger à nouveau les médias distants si un utilisateur local souhaite y accéder.
Afin de stocker les médias (qui représentent une énorme quantité de données, déjà 50Go sur une instance de 3 utilisateurs actifs), les administrateurs ont souvent recours à des géants d'internet pour assurer un stockage à grande échelle et rapide, pour des raisons financières et afin d'assurer la pérennité de l'instance pour éviter d'avoir à changer de serveur tous les quatre matins : de telles solutions peuvent être le stockage S3 d'Amazon Web Services, R2 de Cloudflare, B2 de Backblaze, ou également Wasabi. Dans ce scénario, les instances stockent les médias locaux comme distants sur de tels services, généralement de manière chiffrée mais avec les clés du prestataire, de telle manière que celui-ci a techniquement accès aux fichiers ainsi stockés. Dès lors, si une instance stocke les médias sur son serveur sans avoir recours à de telles solutions, il est impossible de déterminer qu'une instance tierce ne stockera pas ces mêmes médias chez un de ces géants du stockage d'objets (puisque les instances copient ces médias dans leur cache, qui peut se situer sur leur serveur ou dans le cloud comme expliqué).
Bon nombre d'instances font également confiance à des solutions de réseau de diffusion de contenu ("CDN") et de sécurité comme Cloudflare pour éviter les attaques par déni de service et assurer un affichage plus rapide des médias mis en cache. Dans un tel scénario, Cloudflare a techniquement accès au trafic en clair, théoriquement aux médias, aux publications, etc, puisque le trafic passe par les serveurs de Cloudflare avant d'atteindre le serveur de l'instance.
Là encore, rien ne permet d'affirmer qu'une publication X ne sera pas dupliquée sur un serveur distant utilisant Cloudflare : ainsi, bien qu'une instance A n'utilise pas de telle solution, Cloudflare aura tout de même théoriquement accès à la publication au moment où celle-ci est transmise au serveur B derrière Cloudflare. Cela peut également s'appliquer aux mentions privées ("messages privés"), surtout dans la mesure où elles ne sont pas chiffrées de bout en bout, dans un scénario où un utilisateur d'une instance A envoie un MP à un utilisateur sur l'instance B.
Le Fediverse est décentralisé humainement, mais pas tant que ça techniquement
Que ce soit par le mécanisme de Cloudflare ou directement des entreprises qui louent leurs serveurs aux différentes instances, les acteurs numériques qui proposent de tels services sont des professionnels de la location de serveurs et de l'hébergement de sites web comme OVH, Scaleway ou encore Hetzner. Ces entreprises sont généralement de grande taille et centralisent dans leurs centres de données une grande partie de l'internet européen.
En revanche, il est vrai d'affirmer que le réseau est décentralisé humainement, et que les politiques de contenus et de modération appartiennent (en partie et en fonction de la loi) à leurs administrateurs et modérateurs, de même que leur politique de fédération.
Est-ce un problème ?
À mon sens, tous ces points ne posent pas réellement de problème et sont une fatalité pour assurer un service de qualité, pérenne et rapide. L'intérêt que je trouve à Mastodon est surtout son aspect humain.
Edit : @crowdagger@corneill.es rappelle (ici) qu'il est possible d'auto-héberger son instance avec des solutions prometteuses comme GoToSocial, chez soi par exemple, ce qui permet de nuancer un peu l'impact des géants de l'hébergement et de la location de serveurs. Modulo une connaissance technique spécifique, GTS permet de faire tourner une instance Fédiverse fonctionnelle sur du petit matériel comme un raspberry pi. Toujours d'après @crowdagger@corneill.es (ici) et à juste titre, on peut rappeler que la relative dépendance à ces sociétés de stockage d'objets et à l'entreprise louant les serveurs peut être nuancée par l'exportabilité d'une instance du Fédiverse, permettant avec une sauvegarde de faire tourner la même instance sur à peu près n'importe quel serveur.
Il est nécessaire cependant d'avoir conscience de ces limites pour adapter son usage du réseau à ces contraintes.