Chargement...

Wolfram Alpha, moteur de recherche en langage naturel

Wolfram Alpha. Deux mots qui reviennent très régulièrement sur le web depuis quelques temps. Ce nouveau moteur de recherche suscite beaucoup d’intérêt et est sur le point d’être présenté aux internautes qui sont, pour beaucoup, très impatients de le tester. Réponse à des questions formulées en langage naturel, exécution de calculs mathématiques complexes, interface radicalement différente des moteurs actuels… Faisons les présentations.

Wolfram Alpha est un moteur de recherche qui a été élaboré par Stephen Wolfram, un scientifique  Britannique, créateur de Wolfram Research et de Mathematica (qui constitue d’ailleurs le cœur de ce moteur). Celui ci se distingue fortement des moteurs de recherche actuels.

Comme le fait remarquer Stephen Wolfram à l’occasion d’un article annonçant la venue prochaine du moteur, la particularité des moteurs de recherche d’aujourd’hui réside dans leur incapacité à répondre à une question qui n’a pas été formulée littéralement auparavant, ou de trouver une information qui n’a pas été exprimée de manière explicite auparavant sur le web. En effet, lorsque l’on tape une question dans Google, certains résultats correspondent parfaitement. Mais ceux-ci sont généralement des titres de sujets de discussion sur des forums où les internautes ont posé une question aux autres membres… Le moteur a trouvé une correspondance entre la requête de l’utilisateur et le contenu d’une page présente dans son index, mais ne répond en rien à la question posée. Le cas du forum est un exemple, et la pensée de Stephen Wolfram va bien au delà de la simple concordance exacte des requêtes. Lorsqu’il évoque le fait que les moteurs ne sont pas capables de répondre à une problématique qui n’a pas été traitée, il entend ceci au sens plus large que l’exemple du forum que je viens de présenter. Wolfram Alpha quant à lui, en croisant de nombreuses données, se révèle en mesure de répondre à des sujets alors jamais abordés, en « produisant » l’information à partir des données collectées, et traitées à l’aide d’algorithmes.

Stephen Wolfram montre que pour palier à ce problème, le recours à des procédés visant à comprendre le langage naturel ont été introduits. On pourrait évoquer Powerset, moteur de recherche sémantique fonctionnant notamment sur la base du contenu de Wikipédia et qui donne parfois de très bons résultats (sélection dans les documents des passages répondant à la question posée). La technologie employée par Wolfram Alpha diffèrerait cependant des standards sémantiques tels que l’OWL (Web Ontology Language) ou le RDF, et aurait recours à des millions de lignes d’algorithmes… La BBC avance que selon certains experts, Wolfram Alpha serait un outil qui pourrait se révéler aussi important que Google.

Les changements escomptés sont majeurs : d’une part, la recherche fonctionne en formulant des questions en langage naturel et non en tapant des mots clés. D’autre part, le moteur propose ensuite les résultats d’une manière très particulière. Lorsque l’on fait une recherche sur Google, Yahoo ! et  Live Search, on est frappé par la ressemblance frappante des pages de résultats de ces trois moteurs… Les liens vers les pages sont proposés les uns à la suite des autres et se limitent à 10 par pages. L’internaute est donc sollicité pour rechercher la réponse aux questions qu’il se pose dans les résultats proposés. Wolfram Alpha quant à lui ne présente pas l’information de cette façon. Comme en témoigne cette copie d’écran disponible sur le site Search Engine Land (en effet une poignée de chanceux ont eu le privilège de tester ce moteur en avant-première !), l’information y est présentée de manière synthétique et structurée. La réponse à la question nous est directement délivrée.

Page de résultat d'une recherche sur Wolfram Alpha

La copie d’écran ci-contre présente le résultat pour la question « quel est le PIB français ». Différentes informations sont alors rassemblées et présentées sur une page de cette manière.

Le fonctionnement de Wolfram Alpha diffère également dans le sens où contrairement aux moteurs actuels qui constituent leurs  index en crawlant le web à l’aide de robots, celui-ci récupère des informations auprès de différentes sources. Les pages du web ne sont pas stockées dans des datacenters comme c’est le cas avec Google. Danny Sullivan (Search Engine Land) emploie l’expression « encyclopédie de statistiques et de faits » pour mettre en évidence la différence entre ce moteur et les outils de recherche classiques.

De nombreux calculs pointus peuvent être effectués par ce moteur (dans le cadre de la manipulation des données, mais également dans le cadre de calculs mathématiques sur la base de formules saisies par les utilisateurs), ce qui le rend particulièrement intéressant. Par exemple, en entrant une fonction dans le moteur, celui-ci retourne la dérivée de celle-ci, son intégrale… Bien d’autres calculs complexes sont envisageables.

Les questions posées à Wolfram Alpha donnent lieu à des réponses très pertinentes. Sur le blog du moteur, la situation suivante est mise en avant : si l’on questionne Wolfram Alpha sur la distance entre la terre et la lune, le moteur nous retourne d’une part une valeur « moyenne » (si je peux me permettre d’employer ce terme) ainsi que la valeur en temps réel… compte tenu du fait que cette distance change chaque minute! Cette valeur est déterminée en fonction de paramètres orbitaux connus de la lune. Cet exemple donne un assez bon aperçu des capacités de ce moteur.

Wolfram Alpha est en mesure de répondre à des questions concrètes, basées sur des faits (« Quelle est la distance entre la terre et la lune ? »), mais n’est pas en mesure de s’exprimer sur des sujets plus sensibles ou plus subjectifs. Il s’agit ici de recherches « factuelles ». Ce moteur ne peut donc pas être considéré comme un Google-Killer, ni comme un véritable concurrent « direct ». C’est un formidable outil qui s’avérera certainement être un nouveau moyen de rechercher de l’information au quotidien, mais de manière complémentaire aux moteurs actuels. Google a donc de beaux jours devant lui… En revanche, des sites comme Wikipédia pourraient ressentir un certain impact avec la sortie du nouveau moteur. Sur le blog de Wolfram Alpha, un témoignage de ReadWriteWeb est rapporté. Celui-ci résume assez bien la situation :

“[Wolfram|]Alpha, however, will probably be a worthy challenger for Wikipedia and many textbooks and reference works. Instead of looking up basic encyclopedic information there, users can just go to [Wolfram|]Alpha instead, where they will get a direct answer to their question, as well as a nicely presented set of graphs and other info.”


—From ReadWriteWeb

L’éventualité d’un Google-killer est écartée, mais pas celle d’un Wilkipédia-killer…

Pour plus d’informations sur Wolfram Alpha, la vidéo ci-dessous concerne l’intervention de Stephen Wolfram à l’université d’Harvard:

Pour une présentation synthétique :

Mais aussi, les datacenters de Wolfram Alpha :

D’autres articles suivront sur eRankBlog dès la sortie de Wolfram Alpha !

Articles connexes:

Sources : Abondance, Search Engine Land, BBC, Wolfram Alpha (blog), Wolfram blog

Laisser un commentaire

Votre email ne sera jamais partagé. Champs requis *

*
*

Powered by WP Hashcash

Plan du site - Mentions légales