Vue normale

Reçu hier — 1 novembre 2025

L’échéance approche : voici comment empêcher LinkedIn d’alimenter son IA avec vos données

1 novembre 2025 à 15:29

Le 3 novembre, LinkedIn mettra à jour ses conditions d’utilisation. Parmi les nouveautés notables, le réseau social professionnel se réserve la possibilité d’utiliser certaines données de ses utilisateurs européens pour entraîner ses modèles d’IA générative. Une démarche que chacun peut refuser via les paramètres de son compte, en quelques clics.

Reçu avant avant-hier

Comment LinkedIn a modernisé l’infra LDAP de son cluster Hadoop

31 octobre 2025 à 15:39

En l’absence d’environnement de test, autant construire un nouveau cluster plutôt que d’adapter l’ancien.

LinkedIn a suivi ce raisonnement dans le cadre de la modernisation de l’infrastructure LDAP-Kerberos sécurisant sa plate-forme Hadoop.

La démarche a eu pour contexte une migration massive vers Azure Linux, qui a remplacé CentOS 7 (voir notre article à ce sujet).

Un socle 389 Directory Server

Le cluster Hadoop de LinkedIn réunit aujourd’hui environ 10 milliards d’objets. Sa taille avoisine les 5 exaoctets. L’infrastructure LDAP-Kerberos qui lui est adossée a son propre cluster. Les deux briques sont cohébergées pour éviter les appels réseau. La première, fondée sur des serveurs 389-ds, sert de data store à la seconde.

L’ensemble gère environ 1 million de requêtes par minute, pour trois grands cas d’usage :

  • Stocker les principaux Kerberos du périmètre Hadoop
  • Effectuer les recherches d’utilisateurs et de groupes sur les hôtes Linux du cluster Hadoop
  • Alimenter le plan de contrôle HDFS pour mettre en œuvre les permissions d’accès aux fichiers

Divers points de défaillance unique dans l’ancienne infra

Dans l’ancienne configuration, l’infra LDAP-Kerberos se répartissait sur 2 datacenters. Un cluster comprenait :

  • Des instances primaires gérant les opérations d’écriture
  • Des workers gérant les opérations de lecture
  • Des hubs gérant la réplication des données des instances primaires vers les workers

Le trafic en écriture était dirigé vers une instance primaire dans un datacenter, lequel répliquait les transactions vers une instance primaire dans l’autre datacenter.
Chaque datacenter hébergeait un hub et plusieurs workers en scale-out. L’équilibrage de la charge entre les workers était assurée par HAProxy. Les clients accédaient à l’annuaire via une URL qui résolvait les adresses IP de 4 instances HAProxy en utilisant un DNS round-robin.

Ce système présentait des limites :

  • Points de défaillance unique au niveau des instances primaires (risque d’échec des écritures lorsque l’une d’elles tombe) et des hubs (risque de désynchronisation des workers)
  • Activités de maintenance complexifiées par ces points de défaillance
  • Instances paramétrées manuellement à l’aide d’un savoir informel
  • Absence d’environnement de test
  • Cluster utilisant RHEL/CentOS, que LinkedIn avait presque entièrement abandonné

LinkedIn adopte une topologie en étoile

Pour éliminer les points de défaillance unique, 4 instances primaires ont été configurées en étoile. Deux dans chaque datacenter, chacune répliquant vers et depuis toutes les autres. Cette architecture favorise la maintenance, ainsi que le basculement d’un datacenter à l’autre.

Chaque datacenter héberge 3 hubs. Tous réceptionnent le trafic de réplication de l’ensemble des instances primaires (pas seulement celles situées dans le même datacenter). Ils peuvent ensuite répliquer vers tous les workers de leur datacenter respectif.

Pour le trafic en lecture, LinkedIn n’a pas effectué de changements majeurs. La répartition se fait toutefois désormais à l’appui de 8 instances HAProxy (4 dans chaque datacenter).

Éviter les conflits en écriture : l’astuce CNAME

Le modèle de cohérence de LDAP proscrivait tout acheminement du trafic en écriture vers plusieurs instances primaires en simultané (risque de conflits). L’option backup de HAProxy donc a été envisagée pour le diriger systématiquement vers la même instance primaire et ne basculer vers une autre qu’en cas d’indisponibilité. Elle n’a cependant pas été retenue vu la délicatesse de faire fonctionner un serveur d’annuaire sécurisé par GSS-API (authentification Kerberos pour LDAP lui-même) derrière un load balancer.

Lorsqu’un client utilise GSS-API pour accéder à un serveur d’annuaire, il s’appuie sur un principal de service qui inclut le nom DNS du service. Ce nom, il l’obtient par une recherche inversée sur l’adresse IP finale détectée pour le serveur d’annuaire.
Pour que l’authentification du client réussisse, le serveur doit avoir un keytab qui contient le principal de service en question. Le problème pour LinkedIn a été que le client utilise le nom DNS du load balancer dans le principal de service, et qu’il utilise ce load balancer en tant que proxy. Le nom DNS du load balancer doit donc être présent dans le keytab.
Ce n’est pas problématique tant qu’on peut faire en sorte que la recherche DNS inversée pour toutes les adresses IP d’instances du load balancer résolve le même nom. Ce n’était pas possible avec le système de découverte de services par DNS mis en place chez LinkedIn.

Il a donc été décidé d’utiliser un CNAME pointant vers l’instance primaire voulue. Pour gérer les actions de maintenance et les incidents, il fallait un mécanisme automatisé par lequel ce CNAME serait « basculé » vers une autre instance primaire. LinkedIn l’a concrétisé avec un service externe qui contrôle en continu les ports kadmind (749) et ldaps (636) et bascule si nécessaire en mettant à jour le DNS.

Standardiser pour automatiser

Pour simplifier davantage la maintenance, LinkedIn a migré cette infrastructure LDAP-Kerberos sur sa stack de déploiement standardisée. Les deux composantes y ont été définies comme services, avec des commandes de contrôle utilisées par l’agent de déploiement. Cela a permis d’automatiser des tâches comme la création d’index LDAP, le paramétrage de la réplication et le rafraîchissement des certificats TLS.

La réplication est intégrée dans la commande « start » pour le service LDAP. Elle découvre automatiquement les fournisseurs pour une instance donnée en s’appuyant sur la topologie de déploiement. Ainsi, un worker tentera de découvrir les hubs situés dans le même datacenter que lui, puis de négocier avec eux des accords de réplication. Une fois la jonction établie, le fournisseur pousse régulièrement les changements vers le consommateur, de manière incrémentale.

Deux tâches cron pour superviser les workers

LinkedIn a construit un cluster de test et un cluster de préprod, ce dernier étant intégré à un CI/CD pour effectuer les tests d’intégration.

La migration a démarré par le trafic en lecture (le plus simple à gérer grâce à l’usage existant de HAProxy). Pour s’assurer que les workers de l’ancien et du nouveau cluster restent synchronisés, une réplication a été paramétrée entre l’ancienne instance primaire et la nouvelle. Le trafic a alors été progressivement redirigé en modifiant les workers enregistrés dans HAProxy.

Afin que tous les workers soient à jour, LinkedIn a introduit un mécanisme de supervision du délai de réplication. Il implique deux tâches cron. L’une horodate, toutes les 30 minutes, un enregistrement LDAP x sur l’ancienne instance primaire. L’autre s’exécute sur les workers : toutes les minutes, elle calcul le délai de réplication. La formule : temps actuel – (valeur de x dans ce worker + 30 minutes).

Une minute d’interruption pour basculer les écritures

Pour le trafic en écriture, il a d’abord été envisagé d’exploiter le dual write afin de parvenir à un basculement sans interruption. L’idée a été abandonnée à défaut d’une manière simple d’activer ce mécanisme sur TCP avec un proxy. Il s’agissait par ailleurs d’éviter la complexité d’un système de commit/rollback pour assurer la persistance des écritures entre les deux clusters.

Partant, LinkedIn a toléré une interruption d’environ 1 minute. Il s’est basé sur l’URL utilisée par les clients produisant du trafic en écriture. Cette URL contenait un enregistrement DNS A pointant vers l’adresse IP de l’ancienne instance primaire. Il a fait en sorte d’éteindre cette instance puis d’intervertir l’enregistrement DNS avec un enregistrement CNAME pointant vers le nouveau cluster. Grandes étapes de la démarche :

  • Réduire le TTL de l’enregistrement à 1 minute
  • Arrêter la réplication entre l’ancienne instance primaire et la nouvelle
  • Éteindre l’ancienne instance
  • Créer, dans le système DNS, une transaction unique qui supprime l’ancien enregistrement et crée le nouveau
  • Valider les écritures vers le nouveau cluster une fois les changements DNS propagés

La définition d’un TTL d’une minute a offert une forme de garantie, en facilitant le retour du trafic en écriture vers l’ancien cluster en cas de problème.
Pour couvrir le cas où il aurait fallu revenir complètement à l’ancien cluster, LinkedIn s’est appuyé sur une sauvegarde périodique du changelog de réplication des nouvelles instances primaires. Ce backup aurait contenu les transactions réalisées sur les 14 derniers jours. Un script idempotent aurait alors appliqué une diff.

Illustration principale © Alexey Novikov – Adobe Stock

The post Comment LinkedIn a modernisé l’infra LDAP de son cluster Hadoop appeared first on Silicon.fr.

LinkedIn intègre les données de ses utilisateurs dans l’entraînement de son IA générative

21 septembre 2025 à 22:00

À partir du 3 novembre 2025, LinkedIn commencera à utiliser certaines données personnelles de ses membres pour l’entraînement de ses modèles d’intelligence artificielle générative. L’annonce a été faite le 18 septembre par la plateforme, dans un billet officiel de Blake Lawit, son Chief Global Affairs & Legal Officer, suivi d’une notification adressée aux utilisateurs informant d’une mise à jour des conditions d’utilisation.

Les informations utilisées pour entraîner l’IA de la plateforme incluent les données de profil (nom, photo, parcours professionnel et formation, recommandations de compétences, localisation), les messages publics et les réponses aux publications, ainsi que les contributions aux groupes et certains échanges avec les recruteurs. Les questions posées à l’IA de LinkedIn sont également prises en compte.

En revanche, les messages privés et les informations salariales ne feront pas partie des données collectées. LinkedIn précise également que, lorsqu’il existe un doute sur l’âge d’un utilisateur – par exemple en cas de scolarisation dans un établissement secondaire – ses données ne seront pas utilisées, même si l’option de partage est activée.

Les messages privés et les informations salariales ne seront pas collectés

Les membres disposent d’une option leur permettant de refuser l’utilisation de leurs données à des fins d’entraînement. Cette préférence peut être modifiée dans les paramètres du compte, via la section dédiée intitulée « Utiliser mes données pour entraîner les modèles d’IA de création de contenu ».

En septembre 2024, suite à une interpellation de l’ICO, le régulateur britannique, LinkedIn avait mis en pause l’utilisation des données de ses membres au Royaume-Uni pour l’entraînement de ses modèles d’intelligence artificielle, après avoir discrètement activé par défaut le consentement de ses utilisateurs à travers le monde pour cette même utilisation de leurs informations. En parallèle, il avait cessé les collectes de données de ses utilisateurs au Canada, en Chine continentale, à Hong Kong, dans l’espace économique européen et en Suisse.

« Nous sommes heureux que LinkedIn ait pris en compte nos préoccupations et modifié son approche pour permettre aux utilisateurs de s’opposer plus facilement au traitement et de disposer d’une fenêtre plus longue pour le faire.[…] Nous avons clairement indiqué que lorsque les organisations prévoient d’utiliser les informations des utilisateurs pour former des modèles d’IA générative, elles doivent mettre en place des garanties efficaces avant de commencer à utiliser les données personnelles pour la formation des modèles, notamment en fournissant un moyen clair et simple pour que les utilisateurs puissent s’opposer au traitement. » a réagi un porte-parole de l’ICO.

 

 

The post LinkedIn intègre les données de ses utilisateurs dans l’entraînement de son IA générative appeared first on Silicon.fr.

LinkedIn intègre les données de ses utilisateurs dans l’entraînement de son IA générative

21 septembre 2025 à 22:00

À partir du 3 novembre 2025, LinkedIn commencera à utiliser certaines données personnelles de ses membres pour l’entraînement de ses modèles d’intelligence artificielle générative. L’annonce a été faite le 18 septembre par la plateforme, dans un billet officiel de Blake Lawit, son Chief Global Affairs & Legal Officer, suivi d’une notification adressée aux utilisateurs informant d’une mise à jour des conditions d’utilisation.

Les informations utilisées pour entraîner l’IA de la plateforme incluent les données de profil (nom, photo, parcours professionnel et formation, recommandations de compétences, localisation), les messages publics et les réponses aux publications, ainsi que les contributions aux groupes et certains échanges avec les recruteurs. Les questions posées à l’IA de LinkedIn sont également prises en compte.

En revanche, les messages privés et les informations salariales ne feront pas partie des données collectées. LinkedIn précise également que, lorsqu’il existe un doute sur l’âge d’un utilisateur – par exemple en cas de scolarisation dans un établissement secondaire – ses données ne seront pas utilisées, même si l’option de partage est activée.

Les messages privés et les informations salariales ne seront pas collectés

Les membres disposent d’une option leur permettant de refuser l’utilisation de leurs données à des fins d’entraînement. Cette préférence peut être modifiée dans les paramètres du compte, via la section dédiée intitulée « Utiliser mes données pour entraîner les modèles d’IA de création de contenu ».

En septembre 2024, suite à une interpellation de l’ICO, le régulateur britannique, LinkedIn avait mis en pause l’utilisation des données de ses membres au Royaume-Uni pour l’entraînement de ses modèles d’intelligence artificielle, après avoir discrètement activé par défaut le consentement de ses utilisateurs à travers le monde pour cette même utilisation de leurs informations. En parallèle, il avait cessé les collectes de données de ses utilisateurs au Canada, en Chine continentale, à Hong Kong, dans l’espace économique européen et en Suisse.

« Nous sommes heureux que LinkedIn ait pris en compte nos préoccupations et modifié son approche pour permettre aux utilisateurs de s’opposer plus facilement au traitement et de disposer d’une fenêtre plus longue pour le faire.[…] Nous avons clairement indiqué que lorsque les organisations prévoient d’utiliser les informations des utilisateurs pour former des modèles d’IA générative, elles doivent mettre en place des garanties efficaces avant de commencer à utiliser les données personnelles pour la formation des modèles, notamment en fournissant un moyen clair et simple pour que les utilisateurs puissent s’opposer au traitement. » a réagi un porte-parole de l’ICO.

The post LinkedIn intègre les données de ses utilisateurs dans l’entraînement de son IA générative appeared first on Silicon.fr.

🚀 Comment j'ai RÉVOLUTIONNÉ ma privacy LinkedIn en 4 clicks et ce que ça m'a appris sur le leadership transformationnel 💡

Par :Korben
20 septembre 2025 à 09:09

Qu’en pensez-vous ? Êtes-vous d’accord ? 👇

Ce matin, en sirotant mon matcha latte artisanal (support local businesses!!! 💚), j’ai eu une ÉPIPHANIE qui a changé ma vie.

J’étais en train de scroller LinkedIn quand soudain 💥 j’ai réalisé que mes données étaient utilisées pour entraîner l’IA de Microsoft. Cette révélation m’a frappé comme une tonne de briques (métaphore puissante, je sais). Car oui, LinkedIn utilise maintenant nos données par défaut pour entraîner ses modèles d’IA générative.

Mais ATTENDEZ.

C’est là que ça devient INSPIRANT. 🌟

Au lieu de me plaindre comme 99% des gens (be the 1%!!!), j’ai décidé d’être PROACTIF et j’ai transformé ce défi en OPPORTUNITÉ DE CROISSANCE PERSONNELLE. Voici donc mon framework propriétaire “The P.R.I.V.A.C.Y Protocol™” que j’ai développé en 3 minutes 47 secondes (oui, j’ai chronométré parce que #datadriven).

P - Prendre conscience (mindfulness is KEY 🧘‍♂️)

R - Réagir avec sagesse (pas avec émotion!!!)

I - Implémenter les changements

V - Valoriser ses données personnelles

A - Agir maintenant (URGENCY creates RESULTS)

C - Célébrer ses victoires (self-care isn’t selfish!)

Y - Yearning for more (toujours avoir faim de succès 🦁)

Laissez-moi maintenant vous partager mon PARCOURS TRANSFORMATIONNEL en 4 étapes qui ont LITTÉRALEMENT changé ma trajectoire de vie !

ÉTAPE 1: Désactiver les annonces sur Linkedin

Ce click m’a appris que parfois, dans la vie ET dans le business, il faut savoir dire NON. C’est donc la première chose à faire et moi j’y vois une métaphore du LEADERSHIP: Savoir protéger son équipe (ici, mes données) des influences extérieures toxiques.

Fun fact : Saviez-vous que 87% des CEOs ne connaissent pas ce réglage? (source: mon intuition de thought leader)

ÉTAPE 2: Couper les données tierces pour les publicités

WOW. Juste WOW. 🤯

Ce moment m’a rappelé quand Steve Jobs a dit “Stay hungry, stay foolish” (RIP la légende 🕊️). Sauf que moi je dis “Stay private, stay empowered” car LinkedIn partage plus de données avec Microsoft pour la publicité. Donc c’est le seul moyen de les en empêcher ! Et vous savez quoi? C’est une OPPORTUNITÉ d’apprendre à établir des LIMITES SAINES.

Histoire vraie: Mon chat Elon (oui, comme Musk, je suis disruptif même dans le naming de mes animaux) m’a regardé faire ce changement et a miaoulé. Coïncidence? Je ne crois pas aux coïncidences. L’UNIVERS me parlait. 🐱✨

ÉTAPE 3: Bloquer la mesure des perfs publicitaires

Les VRAIS leaders mesurent leur succès différemment. Pas en clics. Pas en impressions. Mais en IMPACT HUMAIN.

Cette étape m’a enseigné l’importance du DÉTACHEMENT. Comme le dit le Dalaï Lama (que j’ai rencontré spirituellement lors d’une méditation LinkedIn Live), “le vrai bonheur vient de l’intérieur”. C’est pourquoi mes données aussi doivent rester à l’intérieur. CQFD.

Petit reminder: Si vous ne protégez pas vos données, qui le fera ? (hint: personne, soyez votre propre héros 🦸‍♂️)

ÉTAPE 4: Stopper le partage de contenu pour entrainer les IA génératives

Car oui LinkedIn va bientôt utiliser nos posts pour entraîner l’IA. Vous devez donc ANTICIPER comme un vrai leader !

Mais écoutez ça…

J’ai transformé ce moment en MASTERCLASS de croissance personnelle. En désactivant ce paramètre, j’ai réalisé que JE SUIS LE CEO DE MES DONNÉES. Et vous savez quoi ? Vous l’êtes aussi! 💪

Anecdote inspirante: Ma grand-mère de 94 ans (oui, elle est sur LinkedIn, #nevertooolate) m’a appelé en PLEURANT de joie quand je lui ai montré ces réglages. Elle m’a dit “tu es le Ghandi de la privacy digitale”. J’ai pleuré. Elle a pleuré. Même ma plante de bureau a pleuré (l’arrosage automatique s’est déclenché mais je préfère y voir un signe).

LE PLOT TWIST QUI VA VOUS CHOQUER 😱

Après avoir fait ces 4 changements, quelque chose d’INCROYABLE s’est produit…

Mon taux d’engagement a EXPLOSÉ de 0.0001%!!! 📈

Coïncidence? Je pense que NON.

MES 7 LEARNINGS CLÉS (parce que les listes impaires convertissent mieux):

  1. La privacy est le nouveau luxe (notez ma phrase, c’est le Bitcoin de 2026)
  2. Chaque click compte (littéralement, j’ai compté: 4 clicks)
  3. L’IA nous observe (mais on peut l’observer en retour #reverseengineering)
  4. Microsoft ❤️ vos données (mais votre amour-propre doit être plus fort)
  5. Le RGPD est votre ami (même si personne ne sait ce que ça veut dire vraiment)
  6. Les thought leaders qui ne protègent pas leurs données ne sont pas de vrais thought leaders (controversial ? peut-être. Vrai ? définitivement)
  7. Ce post va devenir viral (manifestation positive 🙏)

ACTION ITEMS POUR VOUS (parce que je CARE 💙 sur vous):

  • ✅ Likez ce post si vous êtes TEAM PRIVACY
  • ✅ Commentez “PRIVACY WARRIOR” si vous avez fait les changements
  • ✅ Partagez à votre réseau (ils me remercieront plus tard)
  • ✅ Suivez-moi pour plus de contenus qui DISRUPTENT
  • ✅ Activez la cloche (Ah non, merde, c’est pas pour Linkedin ça…)

UN DERNIER MOT (promis c’est le dernier… ou pas 😏)

Si vous êtes arrivé jusqu’ici, BRAVO. Vous faites partie du TOP 1% des lecteurs LinkedIn (étude inventée par moi-même). Selon Bloomberg , LinkedIn devient de plus en plus “cringe”, mais vous savez quoi ? Le cringe d’aujourd’hui est le GÉNIE de demain et rappelez-vous… on se moquait d’Einstein aussi.

Mon conseil ? Soyez comme l’eau. Fluide. Adaptable. Et surtout, gardez vos données pour vous comme Bruce Lee gardait ses secrets de kung-fu. 🥋

P.S.: Si ce post vous a TRANSFORMÉ, tapez “AMEN” dans les commentaires. Si ce post ne vous a pas transformé, c’est que vous n’êtes pas PRÊT pour ce niveau de conscience. Travaillez sur votre mindset et revenez dans 6 mois. 🧠

P.P.S.: Mon prochain post: “Comment j’ai utilisé ChatGPT pour écrire ce post sur la protection contre l’IA et pourquoi c’est une métaphore du capitalisme tardif”. Stay tuned!

P.P.P.S.: N’oubliez pas: vous n’êtes pas vos données. Vous êtes une MACHINE À IMPACT. Une LÉGENDE en devenir. Un PHARE dans la tempête digitale. 🌊⚡

P.P.P.P.S.: J’organise un webinar GRATUIT (valeur 5000€) sur “Privacy Leadership for Disruptive Innovators”. Les 10 premiers inscrits recevront mon ebook “J’ai désactivé 4 paramètres LinkedIn et ma vie a changé” (PDF de 3 pages dont 2 de remerciements).

#Privacy #ThoughtLeadership #DisruptOrDie #LinkedInTips #DataProtection #MindsetMatters #GrowthHacking #DigitalDetox #Innovation #Leadership #Inspiration #MotivationMonday #TuesdayThoughts #WednesdayWisdom #ThursdayThrowback #FridayFeeling #WeekendVibes #AlwaysBeClosing #PrivacyIsTheNewBlack #DataIsTheNewOil #ButPrivacyIsTheNewGold #IAmThe1Percent #LinkedInFamous #Influencer #Viral #Engage #Transform #Disrupt #Inspire #Lead #Win

🚀💡🔥✨🎯💪🏆🌟⚡🎨🧠💎🦄🌈🔮

Restons connectés !! 🤝 Et merci à Rodrigo Ghedin qui m’a inspiré ce post parodique !

❌