Recherche sémantique… à la recherche du sens


La manière dont nous recherchons l'information sur le web a complètement changé en quelques années. Le web sémantique entend doter le web avec de l'intelligence, comprendre comment les données sont reliés, à contextualiser l'information et à rendre les résultats de recherche significatif au sein de cette surabondante masse de données. 

Problèmes de mémoire

Internet atteint aujourd’hui des proportions gargantuesques, considérant que le web indexé contient au moins 4,73 billions de pages (http://www.worldwidewebsize.com).Chaque site a sa propre logique, liaisons et terminologie. Dans ce contexte, la moindre recherche peut être source de confusion et devenir totalement frustrante. Les internautes pensent en termes de documents où les données ont du sens dans un contexte spécifique, tandis que les ordinateurs «pensent» en termes de données, essentiellement numériques. Résultat personne ne se comprend. Et la mémoire d’internet reste en grande partie inaccessible.

L’information vs le savoir

Aujourd’hui, la plupart des contenus disponibles sur le web sont conçus pour être lus par des hommes, pas par des machines. Si celles-ci sont capables d’analyser les pages web mises en forme et d’effectuer des traitements de routine, elles n’ont pour l’instant pas la possibilité de traiter la sémantique. La plupart des moteurs de recherche ne comprennent rien aux requêtes qu’ils reçoivent. Pas plus qu’ils ne comprennent les résultats qu’ils renvoient. Il suffit de taper quelques phrases dans un moteur comme Google pour se rendre compte que les moteurs ne traitent pas de sémantique. Ils travaillent principalement grâce à des outils statistiques. Les recherches booléennes composées de mots-clés renvoient une quantité incalculable de pages qui sont classées en fonction de critères quantitatifs. Pas de recherches de groupes nominaux, pas de suggestion de mots clés voisins… Résultat, tout prend du temps. 

Le web intelligent

Avec la recherche sémantique, l’ensemble du web est considéré comme une base de données et permet d’améliorer l’expérience online des utilisateurs, de réduire leur frustration face au chaos informationnel. L’étape principale de la construction de la recherche sémantique consiste à structurer et à qualifier les données, par le biais de méta-données et d’annotation, etc., afin de créer des champs sémantiques. L’étape suivante consiste à créer de la logique entre toutes ces données, à les connecter, les relier pour les rendre intelligentes.

Dans un tel environnement, les machines deviennent alors capables de comprendre les données affichées, de créer des liaisons entre chaque donnée et chaque information pour leur donner du sens et apporter des réponses pertinentes aux utilisateurs. A chaque information, une autre se déclenche, logiquement. Les moteurs de recherche sont alors à même de répondre à des questions précises “Je cherche un hôtel à New York pour moins de 70 dollars la nuit, équipé pour les enfants en bas âge et qui accepte les chiens” en ne retenant que le sens de l’information pour fournir aux utilisateurs une information riche, contextualisée et fortement qualifiée.

La recherche sémantique est une révolution qui devrait permettre aux machines de faire des liens, de devenir véritablement intelligentes. Plus on va pouvoir interroger les différents flux d’information, plus on va être en mesure de faire émerger des tendances nouvelles.

Les promesses de la recherche sémantique


Les technologies sémantiques permettent un gain en ressources, temps et coût. 

Avec la recherche sémantique, on élargit les capacités d’analyses en profondeur. Elle permet d’améliorer radicalement l’analyse de la perception d’une marque et de dégager des tendances plus explicites et plus pertinentes. 

Conclusions

Plus les entreprises organiseront leurs données et leurs informations sémantiquement, plus la différence se creusera entre les bases de données sémantiques et non-sémantiques. Une fois le contenu facilement et rapidement accessible, chacun sera à même de fournir des informations plus précises et plus pertinentes, pour une meilleure expérience utilisateur.