Comment Perplexity.ai ouvre la voie à l'avenir de la recherche
Joanne Chen est General Partner chez Foundation Capital.
Sep 06, 2023, 06:02pm
Au cours des deux dernières décennies, les moteurs de recherche tels que Google et Bing ont été nos principales portes d'entrée sur Internet. Pourtant, au fil du temps, les "10 liens bleus" qui les caractérisent ont été de plus en plus noyés sous les publicités et les contenus optimisés par les algorithmes. Ces sites, qui reposent sur des modèles de revenus basés sur la publicité, ressemblent davantage à des commissaires priseurs de l'attention des utilisateurs qu'à des guides dignes de confiance sur le Web.
Aravind Srinivas et ses cofondateurs de Perplexity.ai construisent une alternative. Au lieu de saisir des mots clés et de trier un enchevêtrement de liens, les utilisateurs posent leurs questions directement à Perplexity.ai et reçoivent des réponses concises et précises, étayées par un ensemble de sources sélectionnées. Alimenté par de grands modèles de langage (LLM), ce "moteur de réponses" place les utilisateurs, et non les annonceurs, au centre de ses préoccupations. Cette évolution promet de transformer la manière dont nous découvrons, accédons et consommons les connaissances en ligne et, partant, la structure de l'internet telle que nous la connaissons aujourd'hui.
Arracher la loyauté des utilisateurs aux géants de la recherche n'est pas une mince affaire. Pourtant, Aravind, armé d'un doctorat de Berkeley et d'une expérience professionnelle chez OpenAI et DeepMind, m'a longtemps semblé être l'entrepreneur idéal pour relever ce défi. Dans cette conversation, éditée pour plus de clarté et de longueur, Aravind et moi discutons des origines de Perplexity, de son approche des opérateurs historiques et de la conception de l'interface, et de ses conseils aux autres fondateurs d'IA.
Commençons par votre parcours. Qu'est-ce qui vous a amené à fonder Perplexity ?
Je suis né à Chennai, en Inde. Notre culture valorise l'érudition, plus encore que la réussite financière. Prenons l'exemple du cricket, qui est le sport le plus populaire en Inde et qui est particulièrement apprécié à Chennai. Pour ma famille et mes amis, regarder le cricket n'est pas seulement une question de divertissement. Nous nous passionnons pour les statistiques, nous connaissons par cœur les moyennes, les taux de réussite et les taux d'économie de chaque joueur.
Cette volonté d'apprendre et de comprendre a façonné mon éducation. J'ai travaillé dur pour être admis dans les IIT (Instituts indiens de technologie) et j'ai ensuite plongé dans la recherche sur l'apprentissage profond, ce qui m'a conduit à mon doctorat à l'Université de Californie à Berkeley. Des films comme Pirates de la Silicon Valley et The Social Network ont éveillé très tôt mon intérêt pour l'entrepreneuriat. Mais une fois arrivé à Berkeley, je me suis rendu compte que la plupart des créateurs d'entreprises étaient des étudiants de la CJ. Je ne pouvais plus suivre cette voie. J'ai donc cherché des exemples d'entrepreneurs issus du monde universitaire dont je pourrais m'inspirer.
Un tournant s'est produit en 2019 lors de mon stage chez DeepMind à Londres. Ils avaient une bibliothèque incroyable et, le soir, lorsque j'avais fini de me concentrer sur mon projet, je lisais des livres sur les débuts de Google et j'ai été très inspiré par Larry Page. J'ai été fasciné par l'évolution du PageRank et par la façon dont elle a conduit à une entreprise capable de créer des avancées incroyables comme les transformateurs, une nouvelle architecture pour les modèles d'apprentissage profond. J'ai contacté l'inventeur des transformateurs, Ashish Vaswani, pour lui proposer un stage. Ensemble, nous avons travaillé au développement de modèles d'apprentissage profond pour la vision et à l'universalisation des transformateurs en tant que blocs de calcul.
Bien que ce travail soit fascinant, je n'avais pas d'idée de démarrage claire. L'apprentissage profond me semblait encore très académique. Pourtant, à l'été 2022, des startups d'IA générative comme Jasper et GitHub Copilot commençaient à générer des revenus réels. L'engouement croissant des utilisateurs grand public m'a convaincu que mes intérêts n'étaient plus seulement académiques. C'était enfin le bon moment pour créer une entreprise. J'ai eu la chance de bénéficier du soutien d'investisseurs comme Elad Gil et Nat Friedman, ainsi que de trois excellents cofondateurs, Denis (Yarats), Johnny (Ho) et Andy (Konwinski). Ils y croyaient tous quand il n'y avait rien de concret. C'est ainsi qu'est née Perplexity.
Qu'est-ce qui vous a attiré dans le problème de la recherche ?
Comme je l'ai dit, je suis un grand fan de Larry Page et de Google. J'ai toujours eu envie de faire quelque chose de la même ampleur et de la même ambition que Google. Être érudit, précis et sincère, avoir la réponse à portée de main et pouvoir en rappeler les sources : ce sont des choses que j'apprécie et que je m'efforce d'incarner. Construire un produit qui m'aide, ainsi que les gens qui m'entourent, à devenir plus intelligents chaque jour et à accroître le capital de connaissances de la planète revêt pour moi une signification personnelle profonde. C'est bien plus qu'un simple moyen de gagner de l'argent.
Avant d'opter pour la recherche, vous avez exploré d'autres problèmes.
Oui, nous nous sommes d'abord concentrés sur la traduction du langage naturel en langage SQL. C'est une idée qui nous a été proposée par notre premier investisseur, Elad Gil. Notre objectif était de construire un copilote pour les analystes de données. Étant moi-même un "data nerd", l'idée de permettre à un plus grand nombre de personnes d'être des "data nerds" a vraiment résonné en moi.
Pourquoi n'avez-vous pas poursuivi cette idée ?
À l'époque, la technologie n'était pas suffisamment avancée. Codex était impressionnant, mais il n'était pas à la hauteur des capacités de GPT-3.5 Turbo ou de GPT-4. En outre, le marché SQL est très fragmenté, ce qui rend difficile l'entrée et l'établissement d'un point d'ancrage sur ce marché. Les grandes entreprises d'entreposage qui pouvaient s'offrir nos services étaient souvent enfermées dans Snowflake ou Databricks, tandis que les petites entreprises ne disposaient pas de suffisamment de données pour s'éloigner des feuilles de calcul de base. Chaque entreprise avait également ses propres méthodes de stockage de données, ce qui compliquait nos efforts pour créer une solution unique.
Bien que cette idée n'ait pas abouti, l'expérience nous a permis de grandir. Nous avons partagé notre prototype, BirdSQL, sur Twitter, et les réactions ont été extrêmement positives. Il a si bien fonctionné que Jack Dorsey, bien qu'inactif sur la plateforme depuis longtemps, est soudain sorti de son hibernation et a tweeté à son sujet. Son soutien a attiré l'attention et le trafic sur notre produit et nous a aidés à surmonter le problème du démarrage à froid, personne ne sachant qui nous étions. Cette croissance virale précoce a été la clé de notre succès final.
Vous avez décrit Perplexity comme un "moteur de réponses". Pouvez-vous expliquer ce que vous entendez par ce terme et en quoi il diffère d'un moteur de recherche traditionnel ?
Bien sûr. L'approche traditionnelle de la recherche consistait à renvoyer dix liens bleus, que les utilisateurs devaient ensuite parcourir pour trouver l'information qu'ils recherchaient. Au cours des dernières années, ce modèle a évolué pour fournir des réponses directes aux questions des utilisateurs. C'est ce que j'entends par "moteur de réponse" : les utilisateurs peuvent poser n'importe quelle question directement et recevoir une réponse réelle, et pas seulement une liste de pages web qui peuvent ou non contenir la réponse. Google a commencé à s'engager dans cette voie vers 2020 en utilisant une simple extraction de texte. L'objectif de Perplexity est de répondre à des questions plus complexes qui nécessitent de synthétiser le contenu de plusieurs pages et de fournir des réponses rapides et précises à l'aide de LLM.
Pendant deux décennies, nous avons tous été conditionnés à utiliser des mots-clés pour effectuer des recherches sur le web, car c'est ainsi que les principaux moteurs de recherche ont été conçus. Aujourd'hui, les LLM changent la façon dont nous interagissons avec les ordinateurs pour trouver et consommer l'information. En plus de fournir des réponses directes et concises, les LLM peuvent poser des questions de clarification et jouer le rôle de copilote pendant que vous naviguez sur le web. Au fil du temps, ils pourront également vous aider à faire avancer les choses en exécutant des tâches. Telle est la vision de Perplexity : permettre à chacun d'accéder à une connaissance et à une productivité infinies, et améliorer leur vie en leur permettant d'interagir avec Internet de manière plus intuitive et plus efficace.
Les moteurs de recherche ont fortement influencé l'économie actuelle de l'internet, en l'optimisant essentiellement pour la publicité. Comment les moteurs de réponse pourraient-ils nous permettre de créer un modèle alternatif ?
Les LLM modifieront certainement la dynamique publicitaire actuelle du web - espérons-le pour le mieux ! En effet, ces modèles offrent un gain de pertinence plus important que toute autre technologie de ciblage antérieure. Il sera encore plus facile d'atteindre les gens, car les requêtes auront une plus grande intention. Si j'étais un annonceur, je m'efforcerais de décrire mon produit aussi précisément que possible sur mon site web, de manière à ce qu'un gestionnaire de droits d'auteur le considère comme digne d'être cité. Au lieu d'optimiser pour les clics, j'optimiserais pour un contenu de haute qualité.
J'essaie encore de comprendre ce que signifie une citation sponsorisée. En tant qu'ancien doctorant, j'aborde le problème d'un point de vue académique. Certaines revues publieront votre article si vous payez, mais leur réputation est bien moindre que celle des revues à comité de lecture. Dans la prochaine itération de l'internet, les sources d'information claires et fiables ne citeront idéalement que le contenu fourni par d'autres sources vérifiées. Dans ce scénario, le LLM sera le juge. Il existe également d'autres moyens par lesquels les gens voudront interagir avec les requêtes et les vérifier, au-delà des citations. J'y ai réfléchi, mais je n'ai pas encore tout à fait trouvé la solution.
Construire un moteur de réponses n'est pas une mince affaire. Comment avez-vous commencé ?
Nous avons commencé par créer une base de données en récupérant les données de Twitter et en alimentant la recherche à partir de ces données. C'est devenu BirdSQL. Nous nous appuyons également sur un index de recherche existant qui extrait le contenu du web et l'organise. Perplexity exploite une couche d'abstraction supplémentaire au-dessus de ce contenu, que nous synthétisons et organisons encore davantage. Au fur et à mesure de notre croissance, nous avons commencé à construire notre propre index.
Que pensez-vous des autres acteurs de l'écosystème de la recherche ?
C'est une excellente question. Permettez-moi de l'illustrer par une anecdote. Un vendredi après-midi, nous avons conclu un tour de table de démarrage avec notre société de capital-risque, NEA. Ensuite, je suis allé de Sand Hill Road à Blue Bottle à Palo Alto avec mon cofondateur, Denis, juste pour me détendre. Puis j'ai vu que quelqu'un m'avait envoyé un article de Verge contenant des fuites de captures d'écran de la nouvelle interface de chat de Bing. Denis et moi nous sommes immédiatement inquiétés. Nous nous sommes dit : "Oh, notre contrat contient une clause de diligence raisonnable de 30 jours ! La NEA va se retirer de l'affaire". Heureusement, notre associé, Pete Sonsini, nous a appelés le lendemain pour nous rassurer. Il nous a dit : "Nous vous faisons confiance, vous allez vous en sortir." Cela nous a donné la confiance nécessaire pour continuer.
En fin de compte, il ne s'est rien passé de grave. Notre croissance est restée exponentielle, tandis que celle de Bing a stagné. Nous avons eu l'impression qu'ils avaient raté une occasion, plutôt que d'être confrontés à des problèmes à cause de leur lancement.
Pourquoi pensez-vous que ce soit le cas ?
À mon avis, le produit Bing était confus. Il était également limité aux comptes Microsoft et au navigateur Edge, et n'était donc pas largement accessible. Il tentait d'intégrer plusieurs fonctionnalités dans un seul produit, comme la recherche, le chat et les conversations multi-tours utilisant le GPT-4, ce qui alourdissait l'expérience de l'utilisateur. En revanche, nous nous sommes concentrés sur la création d'un moteur de réponses avec des citations et avons évité les conversations libres. Cette orientation claire nous a permis de créer un produit utile, alors que le produit de Bing, malgré le battage médiatique, était moins clair quant à ses cas d'utilisation exacts.
À l'instar de Bing, Google est également confronté à un dilemme, car l'amélioration de l'expérience de recherche générative pourrait nuire à ses recettes publicitaires. Par exemple, une requête telle que "planifier un voyage à Tokyo" sur Google, même si la recherche générative est activée, affichera toujours des publicités parce que l'industrie du voyage paie beaucoup d'argent à Google pour distribuer ses liens. Nous avons réalisé qu'il serait possible de rivaliser avec Google parce qu'il a tout intérêt à protéger ses revenus publicitaires, ce qui limite sa capacité à fournir des réponses directes. Notre principal concurrent était Microsoft, mais cela semble désormais gérable.
Une plainte typique concernant ChatGPT est que ses réponses ne sont pas dignes de confiance. Comment Perplexity garantit-il l'exactitude des réponses ?
Nous disposons d'une incroyable équipe de recherche et d'IA, dirigée par Denis. L'exactitude des réponses est étroitement liée au classement des recherches, qui est un problème notoirement difficile. Chez Perplexity, nous utilisons une version plus moderne du PageRank pour construire une carte de confiance du web. Par exemple, des sites comme le New York Times sont généralement plus fiables que les articles de Substack, qui peuvent être plus orientés vers l'opinion. Nous utilisons l'heuristique et l'apprentissage basé sur les données des requêtes passées pour améliorer nos résultats. Si Google se concentrait uniquement sur la fourniture de réponses correctes, il pourrait améliorer considérablement son produit de recherche avec un minimum d'efforts. Ce sont les intérêts commerciaux qui l'en empêchent.
Avec chaque nouveau produit technologique grand public, il y a un point de basculement où il devient la norme pour un sous-ensemble de comportements. Combien de temps faudra-t-il, selon vous, pour que les alternatives à la recherche des grandes entreprises technologiques soient connues du grand public ?
J'espère que ce sera bientôt ! Pour l'instant, il semble que le monde soit toujours satisfait de Google, car son trafic n'a pas changé de manière significative. Tout comme Google et Facebook ont transformé la manière dont les gens consomment l'information, l'abandon des moteurs de recherche traditionnels finira par se produire. Cependant, jusqu'à ce que notre produit atteigne la parité totale avec la recherche Google, puis devienne 10 fois meilleur, les gens s'en tiendront au statu quo. Il faudra peut-être quelques mois ou un an pour y parvenir. Même dans ce cas, de nombreuses personnes continueront à utiliser Google par habitude, de la même manière qu'elles utilisent encore Yahoo et MSN. Des progrès constants et réfléchis nous aideront à nous intégrer dans les flux de travail quotidiens des utilisateurs.
Parlons de l'interface. ChatGPT était, à la base, une innovation en matière d'interface qui a stimulé l'adoption massive par les consommateurs. Que pensez-vous de l'interface utilisateur de Perplexity ?
Nous avons la chance d'avoir d'excellentes équipes de conception et de produits dirigées par des personnes très talentueuses, Johnny et Henry (Modisett). Notre approche générale consiste à minimiser le nombre de boutons et de choix que les utilisateurs doivent faire au cours d'une interaction donnée avec le produit. Google et Apple sont de grandes sources d'inspiration à cet égard. La recherche de base de Google est si simple, n'est-ce pas ? Les gens se plaignent parfois que Google n'ajoute pas assez de nouvelles fonctionnalités, mais ils ne se rendent pas toujours compte que cela crée plus de responsabilités et de confusion pour les utilisateurs.
Chez Perplexity, notre philosophie est de faire nous-mêmes le travail difficile pour rendre les choses aussi simples que possible pour nos utilisateurs. Nous préférons supprimer des éléments plutôt que d'en ajouter. Nous poussons les mises à jour vers la production et observons les modèles d'interaction. Si une fonctionnalité n'est pas utilisée, nous la supprimons, même si certaines personnes s'en plaignent. En tant que fondateur, il est essentiel d'avoir une boussole solide, qui vous donne le courage de dire "non" à certaines choses.
Un autre aspect essentiel de la conception d'une interface est son intuitivité. Les utilisateurs ne doivent pas avoir besoin d'un manuel pour utiliser votre produit. Il doit être explicite. C'est pourquoi, lorsque les gens trouvent Perplexity sur Google, ils sont directement dirigés vers notre produit, sans longues explications ni nécessité de se connecter. Une autre philosophie de l'entreprise consiste à éliminer le plus de frictions possible.
Pour l'instant, l'expérience de Perplexity se déroule principalement sur le web. Nous nous concentrons davantage sur le mobile et sur la création d'une expérience de recherche véritablement native pour le mobile. Des fonctionnalités telles que le glissement vers la gauche ou la droite pour supprimer des fils de discussion et l'interaction vocale ne peuvent être utilisées que sur mobile. La barre est très haute, car tout doit fonctionner de manière transparente.
Quel est le ou les éléments du produit Perplexity qui vous empêchent de dormir ?
J'utilise beaucoup notre produit, donc s'il ne fonctionne pas comme prévu, je le sais tout de suite. Au départ, j'avais la mentalité d'un hacker qui suggérait une solution pour chaque problème. Au fil du temps, après avoir été repoussé par l'un de nos cofondateurs, j'ai commencé à réfléchir à la situation dans son ensemble : comment pouvons-nous résoudre un plus grand nombre de problèmes à l'aide d'une solution plus générale ? C'est la meilleure façon d'apporter des améliorations évolutives et durables.
J'essaie toujours de voir les choses du point de vue de nos utilisateurs et de discuter avec le plus grand nombre d'entre eux possible. Lorsqu'il a créé Google, Larry Page avait pour philosophie que "l'utilisateur n'a jamais tort". C'est simple mais profond. Lorsque des personnes se plaignent que quelque chose ne fonctionne pas pour elles, je réponds au plus grand nombre possible de leurs messages DM. Et je fais de mon mieux pour insuffler cette mentalité à tous les employés de notre entreprise. Ne reprochez pas aux utilisateurs de ne pas formuler correctement leurs questions ou de ne pas savoir qu'il existe un bouton pour partager quelque chose. C'est à nous d'y remédier et de rendre le produit plus intuitif.
Une autre de mes grandes préoccupations est de faire connaître notre existence et d'élargir notre base d'utilisateurs. Nous voulons y parvenir en proposant un produit vraiment excellent sur lequel les utilisateurs peuvent compter. Certains disent qu'ils trouvent Perplexity génial, mais qu'ils hésitent à passer à autre chose parce que nous n'avons que quelques mois d'existence. Gagner la confiance des utilisateurs pour qu'ils se sentent à l'aise pour passer à autre chose est un défi important.
Si vous deviez repartir de zéro et fonder une entreprise qui exploite les LLM aujourd'hui, que construiriez-vous ?
Je referais la même chose. Il n'y a rien de plus ambitieux que de changer la façon dont les gens recherchent des informations et deviennent plus intelligents. Les manuscrits, la presse à imprimer, les bibliothèques, les moteurs de recherche, et maintenant les moteurs de réponse et les chatbots. C'est un moment qui n'arrive qu'une fois par génération.
Avez-vous un dernier conseil à donner à vos collègues fondateurs ?
Cela peut paraître cliché, mais commencez par ce que vous aimez. Il faut du temps pour trouver le juste milieu entre ce que vous aimez et ce que le marché demande. Vous finirez par converger vers ce point. Le marché vous y poussera. Mais il est préférable de partir d'un lieu de passion plutôt que de poursuivre ce qu'un investisseur en capital-risque ou le marché vous dit de faire. Par conséquent, donnez la priorité à ce qui vous passionne le plus au début. Si c'est déjà le cas, restez patient. La concurrence est féroce, et tout ce que vous construisez est probablement tenté par beaucoup d'autres. Restez concentré, poussez-vous et ayez un fort penchant pour l'action. Ne vous contentez pas d'élaborer une stratégie sur un tableau blanc. Mettez votre produit sur le marché, recueillez les réactions des utilisateurs et faites évoluer votre idée en public.