Skip to content

Etape 3 Recherche de passages textuels

Isabelle Eysseric edited this page Oct 7, 2022 · 6 revisions

Question-Answering (GitHub)   •  Question-Answering (Wiki)
isabelleysseric (GitHub)   •  isabelleysseric.com (Portfolio)   •  isabelle-eysseric (LinkedIn)


Co-équipiers: Isabelle Eysseric, Nicolas Garde et David Poisson



Enter a question: Who is the president of the united states ?
Requête: (content:presid AND content:unit AND content:state)
Nombre de documents retourné: 936

Segmentation

( Voir fichier recherche_infos.py ou annexe - Résultats )

On utilise la fenêtre de mot (highlighting) de la librairie Whoosh. Elle nous sort les passages contenant les mots clé.


Priorisation des passages

( Voir fichier recherche_infos.py ou annexe - Résultats )

À l’aide de l’algorithme inclue dans la librairie Whoosh, on attribue des scores à chaque passage et on récupère celui qui a le plus haut score. Elle nous trie les passages les plus probables de la requête en fonction du nombre de mots clé dans celui-ci.