Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
À partir d’avant-hierFlux principal

Un des plus grands mystères du web pourrait être résolu : l’algorithme de Google a fuité

30 mai 2024 à 15:43

2 500 pages d'un document interne à Google ont fuité. Elles dévoilent les secrets de l'algorithme de Google Search, qui fait régner sa loi sur Internet depuis plusieurs décennies. Après avoir initialement gardé le silence, l'entreprise confirme que cette fuite est authentique.

Une nouvelle méthode efficace de comptage d’éléments distincts dans un flux de données

Par : Korben
17 mai 2024 à 09:53

Des chercheurs viennent de pondre un nouvel algorithme révolutionnaire pour compter les éléments distincts dans un flux de données. Ça s’appelle le CVM et c’est super malin !

Imaginez un peu le truc, vous recevez des tonnes de données en continu, genre des milliards d’entrées, et vous voulez savoir combien y a d’éléments uniques là-dedans. Facile à dire mais pas évident à faire ! Parce que si vous essayez de tout stocker en mémoire pour comparer, bonjour la galère et l’explosion de RAM. C’est là que le CVM entre en scène !

Le principe est simple comme bonjour (enfin, quand on vous l’explique !). Au lieu de tout garder, on va échantillonner aléatoirement les données qui arrivent. Un peu comme quand vous piquez des frites dans l’assiette de votre pote pour goûter parce que vous, vous avez pris une salade. Sauf qu’ici, c’est un échantillon représentatif qu’on veut.

Concrètement, on conserve un petit sous-ensemble des éléments dans une mémoire limitée. Et quand ça déborde, on vire aléatoirement la moitié ! Hop, un petit coup de pile ou face et on libère de l’espace. Mais attention, c’est pas fini ! On repart pour un tour en ajustant la probabilité de garder un élément. Ainsi, à la fin, chaque rescapé a la même probabilité d’être là. Vous me suivez ? Non ? On s’en fiche, l’essentiel c’est que ça marche !

Les chercheurs qui ont inventé ça ont prouvé mathématiquement que leur bidule était précis et peu gourmand en mémoire. Genre vraiment précis, à quelques pourcents près. C’est dingue quand même, avec une poignée d’octets, on peut estimer des millions d’éléments distincts !

Et vous savez quoi ? L’algo est tellement simple qu’un étudiant pourrait l’implémenter. Pas besoin d’être un crack en maths ou en informatique, c’est à la portée de tous. Bon après, faut quand même en vouloir pour se fader les preuves théoriques. Mais ça ce n’est pas notre problème !

En gros, le CVM c’est une avancée notable, que ce soit pour analyser les logs, détecter des anomalies, mesurer une audience ou je ne sais quoi, il y a des tonnes d’applications. On nage en plein dans le Big Data !

Je peux déjà vous voir les data scientists qui me lisent, en train de vous frotter les mains et dégainer votre plus beau Python pour tester ce truc. Les entreprises vont pouvoir économiser des téraoctets de stockage et des heures de calcul, tout ça grâce à un petit algorithme simple mais efficace.

C’est quand même beau de voir comment avec une idée futée, on peut résoudre de grands problèmes. C’est encore une fois un bel exemple d’élégance algorithmique.

Bref, chapeau bas aux chercheurs de l’Institut Indien de Statistiques, de l’Université de Nebraska-Lincoln et de l’Université de Toronto qui ont pondu cette méthode de comptage. Les détails, c’est par ici que ça se passe : Computer Scientists Invent an Efficient New Way to Count

Une promo pCloud pour la journée de la famille 2024

Par : Korben
14 mai 2024 à 13:00

— En partenariat avec pCloud

Quoi de mieux que de protéger sa famille ET faire des économies en même temps ? Pas grand-chose (bon OK l’Euromillion c’est bien aussi). Et c’est ce que je vais vous proposer avec l’aide de pCloud, partenaire du site depuis plusieurs années, qui va vous gâter avec une remise allant jusqu’à 65% !

pCloud vous connaissez peut-être déjà, j’en ai parlé plusieurs fois. Mais si ce n’est pas le cas, il s’agit d’un service de stockage qui nous vient de Suisse et qui existe depuis 2013. Et qui dit Suisse dit souvent qualité et bonne réputation (pensez au chocolat, à la raclette ou encore au fameux Älplermagronen). C’est aussi le cas de pCloud, reconnu depuis de nombreuses années comme un des services les plus fiables en ce qui concerne le stockage de données sécurisées (20 millions d’utilisateurs).

Bon l’étiquette « Suisse » ce n’est pas juste pour la vanne facile. Vous le savez peut-être, mais c’est l’un des pays qui possèdent les lois les plus hardcores en ce qui concerne les données personnelles. Ils respectent du coup le RGPD ainsi que plusieurs normes ISO, et leurs partenaires sont tous certifiés. Quant au stockage vous pouvez choisir entre 2 centres, l’un au Luxembourg et l’autre au Texas.

En rapport avec la journée de la famille (le 15 mai), l’outil helvète propose donc une remise assez massive sur l’abonnement familial (quasi 2/3 du prix). Disponible du 13 au 18 mai aux formats 2 To, 5 To (nouvelle formule en édition limitée) ou 10 To. Soit moins de 399€ au lieu de 1119€ sur l’offre 2 To, 599€ pour la 5 To ou 1049€ au lieu de 2480 sur celle à 10 To. Avec en plus le service de chiffrement pCloud Encryption inclus. Je le rappelle, mais un abonnement chez eux, c’est à vie. Celui-ci peut convenir pour une famille jusqu’à 5 personnes, chacun ayant son espace personnel pour y faire ce qu’il veut.

pCloud à -65% journée de la famille 2024

Et pour faciliter la vie de tout le monde, chaque religion d’OS ou de plateforme est supportée (Windows, macOS/iOS, Linux, Android …). Qui dit famille, dit gens de tous les âges. pCloud propose donc une interface ultra simple pour que tout le monde s’y retrouve facilement (versioning, architecture en arbre classique, visionneuses diverses …). Pour les mobiles on trouve aussi une fonctionnalité de synchronisation qui permet d’envoyer automatiquement des fichiers sur son disque virtuel et donc libérer de l’espace régulièrement sans devoir y penser. Plutôt pratique au quotidien ! Surtout accompagné de la sauvegarde automatisée multiple (pCloud backup). Bref l’outil fait tout pour vous.

Si vous l’utilisez de manière collaborative avec vos proches, les fichiers (texte, vidéo, audio, streaming …) pourront être synchro entre les appareils de tout le monde. Vous pourrez aussi partager certains contenus avec des gens de l’extérieur (parce qu’il y a des humains hors de votre cercle intime … enfin parait qu’il y a des gens qui ont des amis/collègues/etc., mais j’ai des doutes). Niveau compatibilité avec d’autres services, vous avez les grands classiques comme Dropbox, Google Drive, OneDrive, Facebook …

Vous vous posez la question de la sécurité ? Bonne question. Sachez que tout est chiffré en mode confidentialité zéro connaissance, donc vous restez l’unique personne à connaitre vos clés de chiffrement privées. Les serveurs tournent avec l’algorithme AES-256, le protocole TLS/SSL … et vont backups sont en 5 exemplaires. Autant dire que ça peut résister à une tonne de problématiques diverses. Pas toutes, mais pas loin.

Comme vous l’avez compris, c’est un service que j’utilise moi-même depuis longtemps (j’en parlais déjà en 2018) et qui a fait ses preuves ! Et je rappelle que le paiement c’est un one-shot. Une fois que c’est réglé, c’est bon jusqu’à la fin de votre vie … quelle que soit l’inflation d’ici là ^^. Avoir pCloud c’est comme avoir votre disque dur externe, sans les inconvénients de celui-ci : pas de matériel à remplacer, pas de casse possible, pas de vol, un accès à tout moment et de partout, etc.

Vous n’êtes pas encore 100% certain de vous ? N’hésitez pas à tester la version gratuite pour vous faire une idée concrète ! Vous aurez droit à 10 Gigas d’espace, de quoi faire. Et pour la belle promo actuelle (ne tardez pas elle ne dure que 5 jours !), cela vous reviendra à moins de 2.7€/mois pour l’ensemble de votre famille (calculé sur une période de 10 ans, mais à vie ça veut dire beaucoup plus donc encore moins cher).

Allez tchusssss !

Profitez de la promo familiale à -65% !

❌
❌