Vue lecture

Le Frido 2025

Présentation

Le Frido est un livre de mathématique libre initialement destiné à l'agrégation, mais devenu généraliste. En supposant connue une théorie intuitive des ensembles, ça va jusqu'aux martingales, distributions, extensions de corps, etc. Avec toutes les démonstration intermédiaires (modulo les 981 entrées restantes dans ma liste de choses à faire).

Les résultats sont classés par ordre logique mathématique : chaque démonstration ne s'appuie que sur des résultats énoncés et démontrés plus haut. C'est loin d'être l'ordre pédagogique.

L'extension guilietta donne le reste de ce que je sais en math : groupes de Lie (l'objectif est de donner la liste des représentations de SL(2,C)).

Nouveautés 2025

Le bouquin vient de dépasser les 3000 pages cette année.

  • Théorème de Banach-Alaoglu.
  • Démonstration du fait que le système trigonométrique est une base hilbertienne.
  • Fonctions analytiques entre espaces de Banach. L'objectif sera d'énoncer et démontrer le théorème d'inversion locale. Le seul doc que j'aie trouvé est celui-ci. Sinon ChatGPT se débrouille assez bien.
  • Structure de groupe de Lie sur un sous-groupe fermé (ça c'est dans une extension)
  • Dans le même ordre d'idée : modification de la définition d'une variété pour accepter des cartes à partir d'ouverts de n'importe quel espace vectoriel normé (et non seulement de \mathbb{R}^n). Formellement, ça rend correcte pour un groupe de Lie l'idée de prendre des cartes depuis l'algèbre de Lie. En pratique, ça permet aussi de prendre des cartes depuis le produit tensoriel des fibres pour prendre le produit tensoriel de fibrés vectoriels. Si on n'accepte que des cartes depuis des ouverts de \mathbb{R}^n, il faut prendre un isomorphisme (pas canonique) entre \mathbb{R}^n et le produit tensoriel, et montrer qu'en réalité rien ne dépend de ce choix. L'inconvénient est qu'on ne peut plus parler de l'ensemble des cartes.

    Sommaire

    Mon flot de rédaction

    Quand j'écris une démonstration, soit je cherche un peu par moi-même, soit je cherche sur internet. Quand je trouve un texte qui me semble correct, je commence par rédiger sur du papier de brouillon; la plupart du temps j'ajoute beaucoup de détails par rapport à ce que je lis. En particulier, j'écris sur mon papier de brouillon les labels (dans le Frido) des résultats à citer.

    Quand ma démonstration est terminée, je copie des feuilles vers LaTeX. Chaque démonstration passe donc par (au moins) deux rédactions personnelles : une de l'écran vers le papier de brouillon et une du papier vers LaTeX.

    ChatGPT

    Ce flot est valable également quand je demande à ChatGPT. Ce dernier est maintenant crédité comme source dans neuf démonstrations. Parfois seul parfois en collaboration avec moi ou d'autres sources. Je ne copie-colle jamais un résultat.

    Avant de demander à ChatGPT, je regarde d'abord pas mal sur internet ; et je me demande parfois pourquoi d'ailleurs.

    Mon activité sur Stack

    Lorsque je ne trouve pas une démonstration en ligne, je demande souvent sur Stack. Et parfois je n'ai pas de réponses satisfaisantes.

    Zorn et existence d'un max pour tout ensemble fini

    Je demande si il est vrai que tout ensemble Dedekin-fini totalement ordonné a un maximum.

    À mon avis la preuve donnée par Asaf Karagila (et qui a 5 votes positifs) a au moins un trou ; j'explique dans les commentaires ce qui ne me va pas. Si vous avez une idée de comment compléter, n'hésitez pas.

    Connexité

    Voici une question qui lie connexité et espaces totalement normaux. Je ne suis pas certain que l'énoncé soit même vrai.

    Si vous êtes douées en topologie, lâchez-vous.

    Remarque pas très gentille

    À chaque fois que je dois poser une question sur Stack ou à ChatGPT, je ne peux pas m'empêcher de penser que soit je suis nul en recherche sur Internet (c'est le cas), soit l'ensemble de la communauté mathématique a échoué à mettre en ligne des résultats importants.

    Citations

    Le Frido cite toutes ses sources, théorème par théorème. À côté de chaque énoncé, il y a une liste des endroits où j'ai trouvé des informations utiles soit pour l'énoncé soit pour la démonstration.

    La référence [1] signifie qu'il y a de l'invention personnelle non triviale. C'est moi qui ai inventé (une partie de) soit de l'énoncé, soit de la preuve.

    Plagiat massif

    Dans le monde de l'enseignement académique, le plagiat massif est la norme. Par exemple, le dernier en date que j'ai utilisé cite cinq livres en avouant ouvertement que ce n'est pas complet. Et bien entendu, il ne dit pas quelle partie de son texte vient d'où.

    En ne remontant ma bibliographie pas plus loin que juillet 2025, je trouve celui-ci qui ne cite aucune source. Si un étudiant avait fait ça dans un mémoire de licence, il aurait été engueulé comme du poisson pourri.

    Les mathématiciens professionnels ne citent pratiquement jamais Wikipédia ou math.stackexchange.com. Le Frido oui.

    Pourquoi citer ses sources ?

    La bibliographie sert à remercier la personne qui a fait l'effort de me rendre l'information disponible.

    En ce qui me concerne, la bibliographie ne sert pas à :

    1. permettre de remonter à l'inventeur original d'un énoncé ou d'une technique
    2. permettre au lecteur d'aller plus loin
    3. donner de la crédibilité à un résultat.

    Développons

    1. Les résultats présentés dans le Frido ne sont pas de la recherche toute fraîche. Il est illusoire de remonter la chaîne de la source de la source de la source pour trouver l'idée originale.
    2. Si le lecteur veut aller plus loin, il possède le même internet que moi. Il est de très rare que j'utilise une source qui ne soit pas en ligne.
    3. Ce qui fait la crédibilité d'un résultat, c'est la démonstration. Si la lectrice veut se convaincre qu'un résultat est vrai, elle peut soit faire la même recherche que moi sur le même internet, soit lire la preuve donnée. Le Frido n'est pas un ouvrage de vulgarisation. La lectrice est supposée être là pour lire et comprendre les démonstrations.

    Le cas particulier chatGPT (1)

    chatGPT n'est pas un cas particulier.

    Si c'est l'entreprise OpenAI qui a fait l'effort de mettre une information disponible pour moi, c'est elle que je cite. C'est bien l'entreprise OpenAI qui a la citation, pas chatGPT lui-même en tant que "personne". Cela est à mettre en relief par rapport au cas de cette réponse où je cite bien la personne qui a écrit et non l'entreprise derrière stack.

    Que OpenAI elle-même soit incapable de citer les sources sur lesquelles elle base sa réponse est — dans mon contexte — un non-problème. En effet, je serais moi-même incapable de vous dire d'où je connais le paradoxe de Zénon, la définition de la continuité ou la démonstration de la formule n(n+1) / 2. Ce sont des informations qui sont codées dans mon cerveau. Je suis capable de vous les dire, mais pas de faire de citations de mes sources.

    Le cas particulier chatGPT (2)

    Ce n'est pas un cas particulier.

    En remontant ma biblio jusqu'à janvier 2025, je trouve cet intéressant exemple : ma question sur math.stackexchange à propos de variétés analytiques.

    Voici l'ordre dans lequel se sont passées les choses.

    1. Je me pose une question de math qui me semble assez naturelle.
    2. Je ne trouve rien sur internet.
    3. Je pose la question sur math.stackexchange
    4. Je n'ai pas de réponses.
    5. Je pose à chatGPT un copié-collé de ma question qui est sur Stack.
    6. chatGPT me donne une réponse correcte.
    7. Je rédige la réponse de chatGPT et la publie dans Giulietta.

    Question : à qui suis-je supposé donner le crédit de la démonstration ?

    Ma réponse : à OpenAI.

    Au final, la communauté mathématique a échoué à mettre en ligne un énoncé et une démonstration correcte de «tout groupe de Lie C^{\infty} est analytique».
    Ensuite la communauté mathématique a échoué à répondre à une question sur stackexchange.
    Au final c'est un échec retentissant pour l'ensemble de la communauté mathématique.

    En réalité la question de savoir si OpenAI mérite une entrée dans ma biblio est une question très accessoire. Il y a un problème de publication scientifique largement en amont.

    Le cas particulier chatGPT (3)

    Bon. ok. ChatGPT est un cas particulier. Le plus souvent quand je demande à chatGPT c'est que j'ai déjà fait des recherches sur Internet et souvent également demandé sur stack sans avoir de réponses utiles.

    Donc quand je cite chatGPT, c'est un signe que l'ensemble de la communauté mathématique a échoué dans sa mission de mettre la connaissance correctement en ligne.

    Mettons une mathématicienne (nommons-la Alice) ayant écrit un résultat dans un livre privateur. Supposons qu'elle retrouve ce résultat dans le Frido avec chatGPT comme source. Est-elle en droit de râler ?

    Étudions la question.

    1. Au niveau du Frido, tous les résultats sont établis depuis plus d'un siècle. Aucune de mes sources n'a probablement inventé aucun des résultats présentés.
    2. Si elle avait publié le PDF de son bouquin en ligne plutôt que de le vendre à un éditeur, elle aurait sans doute eu la citation. Elle a échangé de l'argent contre de la visibilité (j'assume : je dis bien qu'elle a reçu de l'agent pour être moins visible).
    3. OpenAI l'a-t-elle volé ? Peut-être. Son éditeur pourra pleurnicher devant un tribunal.
    4. Son salaire est payé par mes impôts. Donc la moralité de publier un livre privateur est en soi déjà une question pas du tout triviale.

    Bref.

    Qu'il y ait un problème dans la chaîne "livre privateur -> openAI -> moi" est possible.

    Mais le vrai problème de mon point de vue est largement en amont. Pourquoi il y avait un livre privateur à la base ?

    Images de couverture

    Les images de couverture proviennent de Pepper et Carrot.

    yanntricks

    On parlait de tikz dans un fil sur typst.

    Le Frido fait ses figures avec yanntricks, un module python basé sur sage. Le principe est qu'on décrit sa figure en python, puis le code Tikz est généré automatiquement. Pratiquement tout ce qui est calculable en python/sage est traçable.

    Il y a deux idées de base :

    • Tout est ramené à des points et segments de droites. Écrivez en python une fonction ma_fonction qui prend un réel et retourne un point, passez cette fonction au constructeur ma_courbe=CustomGraph(ma_fonction), et hop ma_courbe.code_tikz() est le code tikz d'une série de segments de droites qui donnera votre courbe.

    • Le code Tikz créé contient du code LaTeX écrivant dans un fichier la taille des boîtes (bounding box) des éléments LaTeX que vous insérez, de telle sorte qu'en deux passes, yanntricks soit au courant des tailles (ça marche avec tous les compteurs internes de LaTeX; vous pouvez donc tenir compte du numéro de la page courante dans votre image). Cela permet de faire :

    C = Cirle(Point(2,1),4)  #cercle de centre (2,1) et de rayon 4
    C.put_mark($\omega-x$, 30) # placer $\omega-x$ sur le cercle à un angle 30 degrés
    C.tikz_code()

    Le code tikz produit mettra automatiquement \omega-x à la bonne place pour que le centre de la boîte soit sur le rayon qui fait un angle de 30 degrés avec l'horizontale, et assez loin pour que la boîte ne coupe pas le cercle.

    Très peu de changements sont nécessaires pour générer le code pstricks ou tikz ou quoi que ce soit d'autre : seulement les droites, points et quelque trucs de base. Pas besoin des cercles, courbes, etc.

    L'inconvénient

    L'inconvénient de yanntricks est que le code est une usine à gaz que j'ai développé par à coups pendant une dizaine d'années — sans linter, sans annotations de types et sans rigueur. En réalité, le prix du billet d'entrée est absurdement élevé. Tellement que moi-même je ne m'y aventure plus.

    Vente

    Extrait du règlement (dans le rapport), page 42) de l'agrégation :

    Durant tout ce temps, elles ou ils ont libre accès […] à leurs
    propres ouvrages. Seuls sont autorisés les ouvrages avec un numéro ISBN et jouissant d'une véritable
    diffusion commerciale. […] une « diffusion commerciale avérée » est tout autant importante.
    […] Cette restriction est motivée par le principe d'égalité des candidats : les ressources documentaires autorisées doivent être facilement accessibles à tout candidat au concours.

    En résumé :

    1. Si une ressource est gratuite, ce n'est pas assez cher pour être facilement accessible à tous les candidats.
    2. Les livres qui ne sont plus vendus (et qui ne sont donc disponibles qu'en seconde main) ne sont pas autorisés.

    Truc marrant : le point 1 est bizarre, mais est appliqué, tandis que le point 2 est très raisonnable mais n'est pas appliqué. C'est ce qui arrive quand on écrit un règlement en ayant un cas très précis en tête et qu'on ne se rend pas compte que ce qu'on écrit a une portée beaucoup plus large que le seul cas auquel on pense.

    Et le pire est que ce règlement n'interdit même pas ce livre qui, si j'ai bien compris, est exactement ce qu'on avait envie de refuser au départ : une pure liste de définitions et d'énoncés de théorèmes classés par leçon.

    Avis si vous travaillez dans une prépa agreg : tapez un plan par leçon (avec la démonstration des deux développements), publiez-là sur thebookedition et ensuite bachotez seulement ces leçons avec vos étudiants.

    Bref, pour faire plaisir au règlement de l'agreg, le Frido est en vente :

    Total : 115,86 euros.

    Problème d'accès aux ressources documentaires

    Ironie mise à part, je trouve que l'objectif est évidemment très louable :
    « principe d'égalité des candidats : les ressources documentaires autorisées doivent être facilement accessibles à tout candidat au concours.»

    Par contre force est de constater que l'accès aux ressources est encore très inégalitaire.

    • certaines candidates arrivent avec des valises entièrement remplies de livres. Probablement un millier d'euros de livres. Toutes les candidates ne peuvent pas facilement se procurer ça.
    • l'acceptation des livres qui ne sont plus disponibles qu'en seconde main (voire plus du tout) crée une forte inégalité entre les candidates qui ont accès à une bibliothèque universitaire et les autres.

    Que faire ? Tout accepter ?

    Finalement, si tout était accepté sans aucune restriction, certes certaines auraient accès à quelque documents de plus que les autres. Mais il y a tellement de ressources disponibles que le petit plus qu'un candidat pourrait se procurer n'a aucune chance d'être décisif.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    •  

    Plateformes de distribution de musique : l'alternative Bandcamp... et ses alternatives

    Cette dépêche présente Bandcamp, une plateforme de distribution de musique qui fait figure d'alternative artist-friendly parmi les mastodontes du secteur, ainsi que deux plateformes alternatives, Subvert et Nina, qui se sont montées récemment en réaction aux craintes liées à la situation de monopole et au rachat de Bandcamp.

    Bandcamp

    Parmi les plateformes de distribution de musique en ligne, Bandcamp fait figure d'exception. Contrairement à Deezer, Spotify ou Tidal, il ne s'agit pas d'une plateforme classique où on streame de la musique en continu et où on partage des listes de lecture. C'est un magasin en ligne où les artistes peuvent exposer leur contenu et le proposer à la vente (numérique ou physique, merchandising, etc.).

    Les utilisateurs peuvent acheter avec ou sans compte et offrir des albums à des amis. Un compte permet de garder une trace de ses achats, les exposer pour les faire découvrir, et les streamer via une appli mobile, ainsi que de suivre des artistes pour être notifié des sorties et recevoir leurs messages, ou d'autres utilisateurs pour être notifié de leurs achats.

    Les artistes peuvent choisir de laisser leurs albums en écoute libre, et c'est souvent le cas, même si certains ne permettent l'écoute que d'un ou deux morceaux dans un album. L'achat d'un album est principalement un acte de soutien de la part des fans.

    Bandcamp bénéficie d'une excellente image auprès du public. Elle est reconnue pour pratiquer des tarifs raisonnables pour les artistes. Lors du COVID, la plateforme a instauré le Bandcamp Friday, pendant lequel elle ne prélève aucun frais (hors frais bancaires). Elle continue de proposer un Bandcamp Friday de temps en temps.

    En mars 2022, Bandcamp a été revendue à Epic Games (créateurs de Fortnite), qui l'a revendue un an et demi plus tard à Songtradr qui a licencié la moitié des 118 employés, notamment ceux impliqués dans la création d'un syndicat. Cela suscite des craintes chez les artistes et les utilisateurs quant à la pérennité du modèle. Bandcamp deviendrait-t-elle evil ?

    Des alternatives se montent.

    Subvert : le modèle coopératif

    Crée en août 2024 sur un modèle coopératif, Subvert prévoit d'être opérationnelle à l'automne 2025. Le principe devrait être le même, mais la plateforme appartient à ses membres (artistes, labels, auditeurs).

    L'adhésion à la coopérative coûte 100$. Elle est gratuite pour les créateurs.

    Subvert annonce 0% de frais de plateforme lors des achats (Bandcamp Friday tous les jours). Le modèle économique repose sur les adhésions à la coopérative et les contributions volontaires proposées lors des achats.

    Subvert annonce 7139 artistes, 1305 labels, et 987 soutiens.

    Nina : le modèle décentralisé

    Nina est une plateforme décentralisée démarrée en février 2021. Elle s'appuie sur des technologies opensource (blockchain). Solana est utilisée pour les transactions et les données de réseau (quel utilisateur suit quel artiste ou autre utilisateur, etc.). Arweave est utilisée pour les sons, images et métadonnées des albums.

    Code source et outils sont disponibles ici: https://dev.ninaprotocol.com/.

    Artistes et même utilisateurs peuvent créer des hubs pour exposer de la musique, des listes de lecture, etc.

    La musique sur Nina est en écoute libre. L'achat est donc un acte de soutien mais il peut aussi donner droit à des bonus (sons en meilleure qualité, morceaux supplémentaires, vidéos,…).

    Il n'y a pas de frais de plateforme. Les artistes doivent payer un montant initial minime pour publier un album et les acheteurs ont des frais de transaction minimes aussi (0,04 $) via Solana.

    Nina auto-évalue favorablement son impact environnemental.

    Nina annonce plus de 20 000 artistes, labels et auditeurs.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    •  

    Lancement de l'EDRIX : un indice pour mesurer la souveraineté numérique européenne

    Un rapport récent a introduit l’Indice Européen de Résilience Numérique (EDRIX) dont l'objectif est de mesurer de manière chiffrée et objective la capacité des 27 États membres de l'Union européenne à « construire, maintenir et contrôler leur propre destinée numérique » et vise à fournir un outil d'analyse pour guider les politiques industrielles vers un « EuroStack » souverain.

    L'indice agrège les scores de cinq piliers, dont quatre reposent sur des données mesurables concrètes, plutôt que de se contenter de simples déclarations d'intention.

    • Politiques Publiques : maturité des stratégies Open Source nationales (basé sur les rapports OSOR de la Commission européenne).
    • Écosystème de Développeurs : densité de développeurs par habitant (données GitHub, à défaut de disposer des données des autres plateformes) et nombre de solutions souveraines référencées dans les principaux annuaires (données agrégées issues de l'annuaire EuroStack).
    • Adoption par la Société Civile : part de marché des navigateurs "souverains" (Firefox, Brave, Opera) et part de marché des ordinateurs sous Linux (moyenne de 3,7 % dans l'UE27).
    • Résilience du Secteur Privé : souveraineté de l'infrastructure (web, mail, DNS) des domaines nationaux à fort trafic.
    • Résilience du Secteur Public : souveraineté de l'infrastructure des institutions publiques clés (Présidence, Gouvernement, capitale).

    Le rapport introduit également un indice complémentaire plus spécifique au logiciel libre, l'EOTRIX (European Open Technology Readiness Index).

    Concernant la France, qui se classe seulement 6ème, le rapport révèle un tableau contrasté qui illustre le fossé entre politique et pratique, avec un écosystème de développeurs et une adoption par la société civile qui n'obtiennent que des scores moyens (respectivement 4,08/10 et 5,09/10).

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    •  

    Incident du 26 août 2025 ayant touché les serveurs de production et de développement

    Il y a exactement deux mois, un incident était survenu suite à un redémarrage brutal du serveur hébergeant les conteneurs de production et de développement ayant entraîné une attribution inattendue d’adresses IP. Et des réponses techniques 502 Bad Gateway pour notre lectorat.

    Ce 26 août, vers 15:22, un message peu engageant est arrivé par pneumatique sur nos téléscripteurs (via Signal pour être précis) : « Tiens c’est bizarre j’ai perdu accès au site. Et au serveur oups. » L’après-midi et la soirée furent longues.

    Sommaire

    Premier diagnostic

    Le serveur répond au ping et permet les connexions TCP port 22, mais pas le SSH. Et les services web ne répondent plus. Souci matériel ? Noyau en vrac ? Attaque en cours ? Les spéculations vont bon train.

    La connexion au serveur revient par intermittence, permettant à un moment d’exécuter quelques commandes, à d’autres d’attendre longuement pour l’affichage d’un caractère ou l’exécution de la commande tapée.

    Le premier contact réétabli avec le serveur est assez clair (une forte charge) :

    $ uptime
    15:06:59 up 2 days,  2:54,  1 user,  load average: 50,00, 205,21, 260,83

    (dernier redémarrage le week-end précédent, mais surtout une charge système moyenne respectivement de 50, 205 et 261 sur les 1, 5 et 15 dernières minutes)

    Initialement on suppose qu’il s’agit d’un trop grand nombre de requêtes ou de certaines requêtes tentant des injections de code sur le site (bref le trafic de fond plutôt habituel et permanent), et on ajoute des règles de filtrage péniblement et lentement pour bloquer les IP qui ressortent le plus dans nos logs.

    Le site est alors inaccessible pendant plusieurs périodes. On arrête et relance ensuite plusieurs fois les services en pensant avoir ajouté suffisamment de filtrage, mais rapidement le serveur se retrouve englué. Les services sont alors arrêtés plus longuement le temps d’analyser les logs au calme. Au calme inclut notamment ne pas juste disposer d’une connexion ssh depuis un smartphone, mais plutôt d’un clavier et d’un grand écran par exemple, de l’accès à tous les secrets et toute la documentation aussi.

    Finalement le trafic n’est pas énorme (en volume total) et si les requêtes hostiles sont bien présentes, rien ne semble inhabituel. Par contre les processus de coloration syntaxique partent en vrille, consommant chacun un processeur et aspirant allègrement la mémoire disponible. Avant d’être éliminés par le noyau Linux.

    La console est remplie d’élimination de processus de ce type :

    Le plein d’OutOfMemory

    Mais si rien n’a changé niveau logiciel sur le conteneur LXC de production et si les requêtes ne sont pas inhabituelles, qu’est-ce qui peut bien écrouler le serveur et créer ces processus gourmands ?

    Eh bien des requêtes habituelles…

    Pendant les phases d’attente lorsque le serveur ne répondait plus vraiment, nous avons noté qu'une nouvelle entrée de suivi a été créée (merci BAud et merci RSS/Atom pour nous avoir permis de la voir alors que le serveur ne répondait déjà plus). Elle indique que la coloration syntaxique ne marche plus sur le site. Notamment l’exemple donné dans la documentation.

    Pourtant le rendu fonctionne en testant en ligne de commande avec pygmentize.

    Mais oui en testant l’exemple donné via le site, il est créé un processus Python2 pygment qui commence à se gaver de ressources.

    Et en regardant les différents contenus et commentaires créés sur le site autour de l’incident, en filtrant sur ceux contenant des blocs avec de la coloration syntaxique, la dépêche (alors en préparation) sur G'MIC 3.6 apparaît. Et en testant cette dépêche, il est bien créé quatre processus Python2 pygment qui se gavent de ressources et ne semblent jamais vouloir se terminer. À rapprocher par exemple d’une page qui a été servie en 6785.9978s.

    4 processus gourmands

    OK, le souci vient de requêtes tout à fait habituelles de coloration syntaxique, reste à comprendre pourquoi ces processus tournent mal.

    La boucle sans fin

    Un petit strace pour suivre les appels système en cours sur un des processus infernaux relève une boucle assez violente :

    (...)
    close(623199355)                        = -1 EBADF (Bad file descriptor)
    close(623199356)                        = -1 EBADF (Bad file descriptor)
    close(623199357)                        = -1 EBADF (Bad file descriptor)
    (...)
    

    Il semble y avoir une immense itération sur des descripteurs de fichiers, en vue de les fermer, mais à l’aveugle, sans savoir s’ils existent réellement.

    En regardant le code du composant utilisé (pygments), il semble n'y avoir qu'un seul appel à close() :

    # close fd's inherited from the ruby parent
            import resource
            maxfd = resource.getrlimit(resource.RLIMIT_NOFILE)[1]
            if maxfd == resource.RLIM_INFINITY:
                maxfd = 65536
    
            for fd in range(3, maxfd):
                try:
                    os.close(fd)
                except:
                    pass

    Donc on itère sur tous les descripteurs entre 3 et le maximum déterminé…

    >>> import resource
    >>> print(resource.getrlimit(resource.RLIMIT_NOFILE)[1])
    524288
    >>> print(resource.RLIM_INFINITY)
    -1

    Un demi-million de fois ici donc. L’objectif initial de la boucle est de fermer les descripteurs de fichiers provenant du processus Ruby père, issue du fork via Open3.popen3. La version suivante du composant la remplace d’ailleurs par un ajout de l'option :close_others, qui précisément « modifie l’héritage [des descripteurs de fichiers du processus parent] en fermant les non-standards (numéros 3 et plus grands) ».

    Sur une Debian 12, la limite du nombre de fichiers par défaut, c’est 1 048 576. C’est déjà probablement bien plus que la valeur qui prévalait à l’époque où a été écrit la boucle Python (on avait des limitations à 4096 à une époque reculée). Mais il s’avère que durant le week-end l’hôte du conteneur de production a été migré en Debian 13. Sans modification du conteneur de production pensions-nous. Sans modification directe du conteneur de production. Mais quid d’une modification indirecte ? Par exemple si la limite par défaut des « Max open files » était passée à 1 073 741 816 sur l’hôte, soit 1024 fois plus que quelques jours auparavant. Et donc des boucles nettement plus longues voire sans fin, sans libération de mémoire.

    On ne peut mettre à jour le composant pygments dans l’immédiat, mais on peut limiter les dégâts en abaissant la limite du nombre de descripteurs de fichiers à quelque chose de raisonnable (i.e. on va gaspiller raisonnablement des cycles CPU dans une boucle un peu inutile mais brève…). Une édition de /etc/security/limits.conf, un redémarrage du conteneur de production et on peut vérifier que cela va nettement mieux avec cette réparation de fortune.

    Une dernière page d’epub ?

    Le conteneur LXC portant le service epub de production a assez mal pris la surcharge du serveur, et vers 20h08, systemd-networkd sifflera la fin de la récré avec un eth0: The interface entered the failed state frequently, refusing to reconfigure it automatically (quelque chose comme « ça n’arrête pas d’échouer, débrouillez-vous sans moi »). Le service epub est resté en carafe jusqu’au 27 août vers 13h31 (merci pour l’entrée de suivi).

    Voir ce commentaire sur la dépêche de l’incident précédent expliquant la séparation du service epub et du conteneur principal de production (en bref : dette technique et migration en cours).

    Retour en graphiques sur la journée

    Le serveur était très occupé. Au point de n’avoir pas le temps de mettre à jour les graphiques de temps en temps.

    Rétrospectivement les processeurs du serveur ont travaillé dur : 140 de charge sur le graphique (mais avec des pics jusque 260 d’après la commande uptime), contre moins de 5 en temps normal (un petit facteur de 28 à 52   ô_Ô)

    Charge CPU

    Et l’utilisation de la mémoire montre aussi de brutaux changements de comportement : libération intempestive de mémoire (Free, en vert), utilisation mémoire plus importante que d’habitude (Used, en jaune), là où le comportement normal est d’avoir le maximum en cache (Cached, en orange) et des processus tellement peu consommateurs en RAM que cela n’apparaît normalement pas.

    Utilisation mémoire

    Mesures préventives et correctives

    Dans les actions en cours ou à prévoir :

    • mettre à jour la documentation pour disposer facilement et rapidement des informations pour les connexions aux cartes d’administration ou les procédures de blocages d’IP
    • procéder à la montée de version des composants (yapuka, épineux sujet de la dette technique à éponger)
    • vérifier l’efficacité des limitations CPU/mémoire mises sur certains conteneurs LXC et les étendre aux autres
    • mettre des limites sur des processus particuliers (comme ceux de pygments)
    • ajouter le déploiement des limites par utilisateur dans le code Ansible
    • corriger la collecte rrd des métriques concernant les interfaces réseau
    • remonter les alertes OOM qui ne sont pas normales
    • comprendre la surconsommation mémoire ? (les boucles actives expliquent la consommation processeur, mais pour la mémoire ?)

    Bonus inattendu pour l’incident précédent du 26 juin 2025

    De façon cocasse, ce nouvel incident et le temps passé à parcourir les différents logs ont permis de retrouver les infos de la carte d’administration distante et d’expliciter l’origine du redémarrage serveur intempestif. À quelque chose malheur est bon, si on peut dire. Ceci n’est pas une invitation pour un prochain incident.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    •  

    L'April invite à participer à la Fête des Possibles, partout en France du 12 septembre au 12 octobre

    Une nouvelle édition de la Fête des Possibles aura lieu du 12 septembre au 12 octobre 2025. Des centaines d’événements seront organisés partout en France et en Belgique pour rendre visibles les initiatives citoyennes qui contribuent à construire un avenir plus durable et solidaire.

    Le logiciel libre a toute sa place dans cette dynamique ! Ainsi, l'April, partenaire de la Fête des Possibles, invite les organisations locales de promotion du logiciel libre et de la culture libre à proposer un voire plusieurs rendez-vous dans le cadre de cette initiative.

    Titre de l'image

    Initiée et coordonnée par le Collectif pour une Transition Citoyenne (CTC), la Fête des Possibles aspire à faire prendre conscience à un maximum de citoyennes et de citoyens que des solutions existent pour vivre en meilleure santé, pour moins polluer, pour mieux vivre ensemble. C’est aussi l'occasion de montrer à de nouveaux publics que « c’est possible » d’utiliser au quotidien des logiciels respectueux de nos libertés !

    Pour cette nouvelle édition de la Fête des Possibles, l'équipe d'organisation a voulu davantage mettre en valeur l'informatique libre : ainsi, des formats d'animation autour du logiciel libre sont désormais suggérés sur le site de la manifestation.

    Concrètement, comment participer ?

    • Si vous avez déjà prévu un événement autour du logiciel libre ou de la culture libre entre le 12 septembre et le 12 octobre 2025, pensez à l'ajouter sur le site de la Fête des Possibles, en indiquant la thématique « Vivre et faire autrement » ;
    • Vous pouvez aussi proposer un rendez-vous ad hoc pour la Fête ! Dans ce cas, n'hésitez pas à l'ajouter sur le site de la Fête des Possibles dès que vous connaissez la date, il sera toujours possible d'affiner la présentation plus tard ;​
    • Vous pouvez, sans doute aussi, vous « greffer » à un événement déjà prévu, en proposant à l'organisation de prévoir de la place pour de la sensibilisation au logiciel libre : vérifiez sur la carte des rendez-vous si des événements sont déjà programmés près de chez vous ;
    • Votre événement se déroule en ligne ? Il est possible de le préciser dans le formulaire de soumission 👍​

    Pour permettre à l'April de mettre en valeur la contribution des organisations autour du Libre, nous vous invitons à inscrire votre événement également sur l'Agenda du Libre, en ajoutant le mot-clé fete-des-possibles-2025.

    Préparez dès maintenant votre événement, et rendez-vous du 12 septembre au 12 octobre 2025 pour agir avec la Fête des Possibles !

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    •  

    Le système de paiement GNU Taler prend vie

    GNU Taler est un système de paiement conçu pour les transactions financières les plus courantes dans tout type de devise (euros, dollars, bitcoins…), développé depuis dix ans à l’initiative de l’Inria et sorti officiellement en 1.0 au mois de mai. Il permet depuis cette date d’effectuer des transactions en francs suisses, mais il fonctionnait d’ores et déjà comme une monnaie locale à Bâle, sur les distributeurs de boissons de la Haute école spécialisée bernoise, et avec des cryptomonnaies comme Bitcoin ou Ethereum. Dans la zone euro, c’est la banque allemande GLS qui devrait rendre Taler disponible pour tous ses sociétaires au cours de l’été 2025, suivi par la banque hongroise MagNet en 2026.

    Taler n’est pas une crypto-monnaie, ni une blockchain. Selon les mots de Christian Grothoff, professeur à l’université de Berne et contributeur au projet, « vous pouvez envisager GNU Taler comme une approche alternative pour construire quelque chose comme l’euro numérique, mais avec des considérations supplémentaires que la banque centrale européenne ne semble pas avoir, comme les droits humains ».

    Bien que Taler ne soit pas une monnaie, du point de vue de l’acheteur, il « se comporte comme de l’argent liquide » : « quand vous le dépensez, vous avez la même discrétion [privacy] qu’avec du liquide ». Ce n’est qu’au moment où le vendeur verse la somme payée sur son compte en banque que celle-ci peut être identifiée (le “T” de “Taler” signifie “taxable”). Cela signifie aussi que l’argent que vous utilisez via Taler reste associé à votre appareil : si vous perdez votre téléphone, vous perdez votre porte-monnaie numérique (en contrepartie, votre historique d’achats reste aussi sur votre appareil, et reste donc privé par défaut).

    Principe de GNU Taler

    Intégration

    Un des enjeux pour permettre à Taler de décoller sera l’intégration de ce moyen de paiement chez une masse critique de commerçants, qui elle même ne sera possible qu’une fois les interfaces logicielles / connecteurs disponibles. Pour cela :

    • Un portail des intégrations disponibles ou en cours de préparation (dont Magento, WooCommerce, Odoo et Joomla) a été monté
    • Une initiative pour financer ces composants logiciels a été mise en place, portée par NLnet, bien connue ici pour soutenir les projets libres.

    À propos

    Le déploiement est porté par le consortium européen NGI TALER avec des membres des Pays-Bas, Belgique, France, Allemagne, Grèce, Hongrie, Luxembourg et Suisse.

    Le premier point de vente physique acceptant les Taler a été mis en place dans la Haute école spécialisée bernoise en 2020.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    •  

    Kernel Recipes 2025 – 12e édition : c’est parti !

    Nous (NdM: équipe d'organisation de Kernel Recipes) sommes fiers de vous annoncer la 12e édition de Kernel Recipes. Elle aura lieu du 22 au 24 septembre 2025 à Paris. Comme les années précédentes, une vingtaine d'interventions reatives au fonctionnement de la communauté, des outils, la question de l'usage de Rust, de la sécurité… Le programme est en ligne et quasiment complet.

    Titre de l'image

    Le parrain de cette édition : Paul McKenney

    Cette année, nous avons l’immense honneur d’accueillir Paul E. McKenney en tant que parrain de l’édition. Contributeur incontournable du noyau Linux depuis plus de 30 ans, connu pour son travail sur RCU (Read-Copy-Update), Paul proposera un talk sur RCU avec probablement des surprises sur scène au programme.

    Charity auctions

    Comme tous les ans nous mettons à l'honneur une association pour tenter d'apporter une contribution. Cette année, il s'agit des Restos du Coeur. Plus précisément, les fonds récoltés seront destinés à l’entretien et au développement de leur infrastructure informatique, entièrement gérée par des bénévoles, et essentielle au bon fonctionnement quotidien de l’organisation.

    Julien Briault, bénévole qui s’en occupe le soir après son travail, sera présent pour nous parler de son engagement et de son rôle.

    Titre de l'image

    La billetterie est ouverte !

    Les places sont désormais disponibles, alors ne tardez pas à réserver la vôtre. Ne tardez pas, la moitié des places est déjà partie ! Vous êtes étudiants, contactez-nous pour bénéficier d'une remise de 50% sur les entrées.

    Dans la salle

    Notre "flying mic" fait peau neuve et continuera à favoriser les échanges lors des interventions. Frank TIZZONI sera également de la partie pour croquer sur le fait particpants et orateurs. Jean-Christophe Huwette (Uweti) sera à la manoeuvre pour le son et l'image et grâce à lui nous proposerons cette année encore un live stream de la conférence.

    Un grand merci à nos sponsors

    Kernel Recipes ne pourrait pas exister sans le soutien fidèle de ses sponsors : Meta, ARM, Collabora, HAProxy, Igalia, jumptrading, The Linux Foundation, Cyberzen, Linux Pratique. Ils nous permettent de conserver la conférence accessible à tous et proposer un environnement propice aux échanges.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    •