lundi 19 décembre 2011

McCray & Tse (2003). Comprendre les recherches infructueuses dans les systèmes de recherche des sites de santé

Votre avis :  
Souvent quand on recherche une information sur internet, il arrive que nous n’arrivions pas à la trouver. Est-ce dû au fait qu’on se débrouille mal avec l’outil qui nous est proposé, ou est-ce dû à l’outil en lui même ? Rassurez-vous sur votre niveau en informatique, souvent, il s’agit d’un problème du moteur de recherche !
C’est ce que les auteurs ont observés dans un grand nombre de requêtes sur des sites de santé Américains. Le but est de fournir des recommandations pour la construction des systèmes de recherche, particulièrement de santé. Leurs conclusions s’articulent autour du fait que les recherches infructueuses sont souvent dues aux systèmes de recherche limités ou avec des erreurs et au contenu des sites plutôt qu’à un comportement de l’utilisateur, bien que certains problèmes viennent bien d’une mauvaise utilisation du moteur de recherche, ceux ci semblent minimaux.
Pourquoi les requêtes dans les moteurs de recherche amènent parfois à aucune réponse ? On a déjà identifiés quelques problèmes connus : 
  • Erreurs dans la chaine de caractères (exemple : jec herche un einformation)
  • Erreurs de terminologie (exemple : jeux sérieux au lieu de serious game)
  • Taille des mots (les mots courts ne sont pas pris en compte, les mots trop long sont peu utilisés et donc on a moins de chance de les trouver)
  • Sortir du champ (exemple : cherche une information sur une école dans un forum de santé, pour exagérer un peu)
Avec ces erreurs, on a déjà une bonne chance de ne pas avoir les résultats escomptés à notre recherche.
Une autre étude a montré que les recherches ne dépassent pas en moyenne 1,7 mots.

Les erreurs de recherche ont été classifiés dans 4 catégories, dont seulement une est due aux erreurs de formulation des utilisateurs, les autres sont dues au design et à la performance des systèmes de recherche.

Dans les requêtes sur des sites de santé qu’ils ont analysés, les auteurs on trouvé que souvent (une fois sur trois !), alors même que l’utilisateur a bien formulé sa recherche, n’est pas sorti du champ, le système ne trouve aucune réponse, il n’y a tout simplement pas l’information sur le site, qui s’avère donc incomplet, d’où les erreurs.
Les problèmes dus aux utilisateurs sont souvent de plusieurs sortes en même temps (à la fois une mauvaise épellation et une abréviation, par exemple).
Le tableau suivant résume les problèmes dus au contenu (in scope veut dire que la recherche était bien dans le sujet, mais qu’il n’y a pas l’information sur le site ; out of scope veut dire que le site n’est pas suffisamment clair sur les informations qu’il fournit), aux utilisateurs et au système.

Les problèmes des utilisateurs sont : mauvaise épellation des mots, utilisation d’abréviations non reconnues, problèmes dans le découpage des caractères (chaine de caractères), mots tronqués/incomplets, des ellipses de langage, des acronymes et un langage qui ne correspond pas au langage médical. Les problèmes du système sont : non prise en compte des caractères non alpha-numériques, la résolution impossible des problèmes de découpage des caractères (phrases sans espace), la prise en compte des opérateurs (AND, OR, NOT), les mots qui sont pris indépendamment des autres alors que l’ordre importe, la compréhension du langage naturel, une adresse non signifiante, une non prise en compte des langues différentes, les problèmes dans les recherches de références.
Dans ces résultats, on remarque néanmoins que ce qui est marqué comme un problème du système peut être un problème d’utilisateur (exemple : les opérateurs, les mots pris indépendamment des autres (l’utilisateur peut utiliser un opérateur “ ”), les découpages de caractères…)

Pour pallier aux problèmes utilisateurs, il a déjà été proposé d’inclure des propositions alternatives dans les moteurs de recherche, pendant la frappe. Le problème est déjà que les sites étudiés ne proposent des alternatives que dans 2 cas sur 3, et ensuite que les utilisateurs n’utilisent ces alternatives, quand elles sont disponibles, seulement 1 fois sur 2 environ. Il faut également pouvoir développer des systèmes de recherches « intelligents » qui savent transformer les formulations de non spécialistes (problèmes de langage naturel, d’acronymes, etc.) en une proposition qui corresponde à la formulation utilisée sur le site.


Source : McCray, A.T. & Tse, T. (2003). Understanding Search Failures in Consumer Health Information Systems. Symposium proceedings, 1, 430-434


Aucun commentaire :

Enregistrer un commentaire