Vue lecture

Reins - Un Ollama sur mobile sans faire tourner Ollama sur mobile

Vous voulez utiliser Ollama sur votre iPhone ou Android pour lancer vos petits LLM en local ? Ce serait super cool non ? Bah j’ai une mauvaise nouvelle pour vous… votre smartphone n’a pas assez de mémoire vive pour faire ça…

Le problème est simple… les LLM bouffent un max de RAM. Par exemple, un LLaMA 7B, c’est dans les 12 GB de RAM. Et même quantifié en int4 pour gagner de la place, vous tombez à environ 3,5 GB. Et ça, c’est juste le modèle hein… Faut y ajouter le contexte, l’OS, les autres apps, et votre smartphone à 8 GB de RAM commence à suer de la raie.

Google a bien sûr sorti Gemini Nano pour Android, leur petit LLM optimisé pour mobile mais c’est compatible avec une poignée de smartphone car il faut un NPU dédié, assez de RAM, et une architecture très récente. Les autres, vous irez vous faire voir…

Du coup, une solution “pragmatique”, c’est de laisser votre Mac, votre PC, ou un petit serveur faire tourner Ollama chez vous, et d’utiliser votre smartphone comme simple client pour vous y connecter à distance. Vous gardez vos données locales, vous profitez de toute la puissance des modèles lourds, et votre iPhone ne chauffe pas comme un radiateur.

Et pour ça, il existe tout un tas d’apps mobiles qui font office de client Ollama. Des apps comme Enchanted sur iOS, My Ollama , Heat , et même les solutions cross-platform comme Ollamb codé en Flutter. Et aujourd’hui, je vous parle de Reins , une app développée par Ibrahim Cetin qui se démarque par des fonctionnalités que j’ai trouvées bien pensées.

Les fonctionnalités sont conçues pour des cas d’usage du monde réel. Vous pouvez ainsi définir un prompt system différent par conversation ce qui est pratique si vous avez un chat pour le code, un pour l’écriture, un pour la traduction et j’en passe… Vous éditez et régénérez les prompts à la volée et vous pouvez changer de modèle en cours de conversation sans tout perdre.

Reins supporte également l’envoi d’images, ce qui est utile si vous utilisez un modèle vision comme LLaVA. Vous pouvez aussi tweaker les paramètres avancés tels que la température, seed, taille du contexte, tokens max…etc. Et le streaming fonctionne en temps réel, comme ça pas besoin d’attendre une réponse complète avant de la voir.

Bien sûr, la question de la sécurité se pose. Il faut quand même exposer votre serveur Ollama sur Internet pour y accéder de l’extérieur donc pensez HTTPS obligatoire, tunnel ngrok temporaire si vous testez, VPN Tailscale ou Wireguard si vous voulez du permanent et sécurisé. Bref, les précautions classiques.

Vous pouvez télécharger Reins sur l’App Store, en APK ou récupérer les builds macOS/Linux sur GitHub .

Merci à Lorenper pour l’info.

  •  

Pourquoi l’UE s’apprête à lancer un débat enflammé : vie privée vs IA ?

Face à la vague de l’IA, le Vieux Continent est-il à la traîne ? C’est ce que semblent penser certains élus à Bruxelles qui tentent de modifier le RGPD pour permettre un usage moine restrictif des ChatGPT et consorts.
 [Lire la suite]

Les bons plans n’attendent pas : abonnez-vous à notre canal WhatsApp Frandroid Bons Plans ! (zéro spam, promis).

  •  

Facebook, TikTok, Snapchat : le Danemark va interdire les réseaux sociaux pour les moins de 15 ans

Le Danemark durcit le ton à l’égard de la Big Tech. En effet, Caroline Stage, ministre danoise des Affaires numériques, vient d’annoncer l’interdiction prochaine de la plupart des réseaux sociaux…

Cet article Facebook, TikTok, Snapchat : le Danemark va interdire les réseaux sociaux pour les moins de 15 ans est apparu en premier sur PaperGeek.

  •  

Modern client-side routing: the Navigation API  |  Web Platform  |  Chrome for Developers

La "nouvelle" Navigation API vise à remplacer l'actuelle History API qui n'a jamais été très ergonomique.

Cette nouvelle API est assez massive, elle propose – notamment pour les SPA (Single Page Application) – de centraliser la gestion de la navigation à un seul endroit.

Bien évidemment, ça ouvre la porte aux sites qui vont vouloir en faire trop, qui vont vouloir outrepasser le comportement natif du navigateur, et ça peut finir en grand n'importe quoi comme à l'époque des popups.

Heureusement il semble y avoir quelques garde-fous pour, par exemple, empêcher un site de rendre le bouton de retour natif du navigateur inopérant et ainsi vous piéger dessus.

Par contre j'imagine que rien n'empêche un site de créer des navigations programmatiques artificielles lorsque vous arrivez dessus pour qu'il faille appuyer un grand nombre de fois sur "retour" pour s'en échapper. Mais c'est techniquement déjà possible avec l'History API de toute façon.

C'est pour l'instant uniquement supporté par les navigateurs basés sur Chromium.

La documentation MDN est également disponible.


Permalink
  •  

Modern client-side routing: the Navigation API  |  Web Platform  |  Chrome for Developers

La "nouvelle" Navigation API vise à remplacer l'actuelle History API qui n'a jamais été très ergonomique.

Cette nouvelle API est assez massive, elle propose – notamment pour les SPA (Single Page Application) – de centraliser la gestion de la navigation à un seul endroit.

Bien évidemment, ça ouvre la porte aux sites qui vont vouloir en faire trop, qui vont vouloir outrepasser le comportement natif du navigateur, et ça peut finir en grand n'importe quoi comme à l'époque des popups.

Heureusement il semble y avoir quelques garde-fous pour, par exemple, empêcher un site de rendre le bouton de retour natif du navigateur inopérant et ainsi vous piéger dessus.

Par contre j'imagine que rien n'empêche un site de créer des navigations programmatiques artificielles lorsque vous arrivez dessus pour qu'il faille appuyer un grand nombre de fois sur "retour" pour s'en échapper. Mais c'est techniquement déjà possible avec l'History API de toute façon.

C'est pour l'instant uniquement supporté par les navigateurs basés sur Chromium.

La documentation MDN est également disponible.


Permalink
  •  

Google alerte sur une nouvelle génération de malwares dopés à l’intelligence artificielle

L’intégration de l’intelligence artificielle dans les cyberattaques marque une nouvelle étape dans l’évolution des menaces informatiques. Selon un rapport de Google, des logiciels malveillants exploitent désormais l’IA pour se modifier en temps réel, contourner les défenses et automatiser le vol...

  •  

Le plus grand film de streaming de Sony en 2024 : ‘Madame Web’ révélé !

Il est fascinant de constater qu’un film qui brille au box-office peut ne pas répéter son succès sur les plateformes de streaming. En fait, l’inverse peut souvent être vrai. De nombreux films qui peinent dans les salles de cinéma suscitent suffisamment de curiosité pour que le public soit prêt à les découvrir une fois qu’ils […]

Le post Le plus grand film de streaming de Sony en 2024 : ‘Madame Web’ révélé ! est apparu en premier sur Moyens I/O.

  •  

Maîtriser PEAK : Échapper à la Toile de la Spiders pour le Badge de Sécurité Web

La dernière mise à jour de PEAK a introduit un défi à la fois passionnant et redoutable pour les joueurs, en particulier ceux qui ont une peur des araignées. Désormais, vous devrez non seulement naviguer dans le jeu, mais aussi échapper à ces ennemis à huit pattes ! Bien que vous puissiez éviter les araignées […]

Le post Maîtriser PEAK : Échapper à la Toile de la Spiders pour le Badge de Sécurité Web est apparu en premier sur Moyens I/O.

  •  

Trump fait une erreur sur l’URL du site web des médicaments lors d’une conférence de presse chaotique au Bureau Ovale

Jeudi, le président Donald Trump a organisé une conférence de presse dans le Bureau ovale pour révéler un accord avec de grandes entreprises pharmaceutiques visant à réduire les prix de certains médicaments de perte de poids. Cependant, l’événement a été marqué par la confusion, avec des informations incorrectes étant partagées et même un incident où […]

Le post Trump fait une erreur sur l’URL du site web des médicaments lors d’une conférence de presse chaotique au Bureau Ovale est apparu en premier sur Moyens I/O.

  •  

La véritable histoire des noms de domaine

Vous vous êtes déjà demandé comment on est passé de six extensions de domaine en 1985 à plusieurs milliers aujourd’hui ? Ou qui a enregistré le tout premier .com de l’histoire ? Hé bien vous allez pouvoir découvrir tout ça grâce au site dotcom.press qui a compilé 40 ans d’histoire des noms de domaine dans une chronologie interactive plutôt bien foutue.

Si comme moi, vous aimez vous plonger dans l’Histoire d’Internet, allez jeter un œil !

L’idée du projet, c’est donc de raconter l’évolution technique et humaine du web à travers le prisme des noms de domaine. Car derrière chaque .com, .org ou .net, il y a une histoire faite de batailles juridiques, de décisions politiques, d’arnaques monumentales, et parfois d’anecdotes complètement WTF.

La page couvre la période allant de 1983 à 2026, avec des événements clés présentés chronologiquement. Vous découvrirez par exemple que les 5 premières extensions (.com, .org, .edu, .gov, .mil) ont été définies en octobre 1984 dans la RFC 920, mais n’ont été mises en ligne qu’en 1985 accompagné de .net ajouté sur le tard. Ou encore que Network Solutions a eu le monopole complet de l’enregistrement des domaines jusqu’en 1999, quand l’ICANN a fini par leur imposer de la concurrence.

Le site explique aussi les enjeux autour des noms de domaine. Par exemple pourquoi Verisign détient toujours le monopole du .com et du .net en 2025, avec plus de 170 millions de domaines enregistrés et 1,5 milliard de dollars de revenus annuels. Ou comment le prix de gros d’un domaine est passé de 100 dollars dans les années 90 à 9 dollars en 1999, puis 6 dollars en 2000.

Il y a aussi des trucs plus exotiques comme l’histoire du .yu yougoslave volé pendant les guerres des Balkans ou comment voice.com a été acheté pour 30 millions de dollars en 2019, et n’affiche aujourd’hui qu’un texte moche et une adresse email.

Bref c’est une super timeline avec des images d’époque, des citations d’experts comme Tim Berners-Lee (évidemment), et des liens vers des tas de ressources complémentaires si vous voulez creuser un sujet.

Voilà, je me suis dit que si vous enseignez l’informatique, ou si vous bossez dans le web, ça devrait vous plaire.

Bonne lecture !

  •  

Le mot de passe du LOUVRE était « LOUVRE », oui, oui !

Qui n'est pas au courant que, le 19 octobre dernier, le Louvre s'est fait braquer comme dans un film : vol de bijoux, dont le diadème de l'impératrice Eugénie et deux colliers, qualifiés d'objets « d'une valeur inestimable » par le ministère de la Culture ? Des révélations de Libération et CheckNews ont mis au jour de graves failles de sécurité… et un mot de passe digne du célèbre « ADMIN ». Selon les documents consultés (audits privés, appels d'offres, rapports internes), les problèmes ne datent pas d'hier. On y découvre, entre autres, des logiciels critiques non mis à jour depuis des années, des systèmes de vidéosurveillance, de contrôle d'accès et d'alarme éclatés en plusieurs couches ajoutées les unes sur les autres, ainsi que des serveurs obsolètes. Et tout ça tournait encore sous Windows Server 2003 (OS abandonné depuis 2015). […]

Lire la suite
  •  

Jusqu’à 260 euros de bonus : voici comment obtenir ce coup de pouce de Fortuneo [Sponso]

Cet article a été réalisé en collaboration avec Fortuneo

Pour la rentrée, Fortuneo se montre des plus généreux envers ses nouveaux clients et leur permet d’obtenir sous conditions jusqu’à 260 euros de bonus de bienvenue.

Cet article a été réalisé en collaboration avec Fortuneo

Il s’agit d’un contenu créé par des rédacteurs indépendants au sein de l’entité Humanoid xp. L’équipe éditoriale de Numerama n’a pas participé à sa création. Nous nous engageons auprès de nos lecteurs pour que ces contenus soient intéressants, qualitatifs et correspondent à leurs intérêts.

En savoir plus

  •  

ChatGPT Atlas : le navigateur d’OpenAI éviterait de rechercher des contenus controversés

Lancé le mois dernier, le navigateur d’IA d’OpenAI permet d’effectuer des recherches par le biais d’un agent d’IA. Mais celui-ci aurait tendance à éviter de fouiller des sujets impliquant des…

Cet article ChatGPT Atlas : le navigateur d’OpenAI éviterait de rechercher des contenus controversés est apparu en premier sur PaperGeek.

  •  

Cloudflare lance un registre ouvert pour authentifier les bots Web

Cloudflare a dévoilé une proposition ambitieuse qui pourrait transformer la manière dont les plateformes Web identifient et gèrent le trafic automatisé. L’entreprise américaine — pilier de l’infrastructure Internet mondiale — veut introduire un format de registre ouvert pour authentifier les bots et agents Web, une approche décentralisée basée sur des clés cryptographiques vérifiables, plutôt que […]

L’article Cloudflare lance un registre ouvert pour authentifier les bots Web est apparu en premier sur BlogNT : le Blog des Nouvelles Technologies.

  •