Professional Documents
Culture Documents
Plan de la prsentation
Introduction Problmatique
Introduction
La vocation dun systme de recherche dinformation est de fournir lutilisateur des informations utiles
Virus informatique Virus biologique
Q=virus
Requte
Collection documents
SRI
Introduction
Le systme tiens compte de la requte utilisateur et des informations qui le dcrivent
Virus informatique
Profil utilisateur
SRI
Doc 1
Doc M
Personnalisation de linformation
12/06/2011jz 12/06/2011 R2I 12-14 juin 2011
Profil utilisateur
Problmatique
Comment modlisation l'utilisateur ?
Comment inclure lutilisateur dans le processus d'accs l'information ?
12/06/2011
Representation du Profil Vectorielle (Gowan 2003) Hirarchique (Micarelli et al.2004) Multidimensionnlle (Kostadinov 2003)
Explicite (Kraft et al.2005) Implicite (Gauch et al.2003)
Construction du Profil
12/06/2011
(Haveliwala et al.2002), (Zemirli et al. 2008) compte tenu de la requte et du profil utilisateur dans le calcul de pertinence de documents
(Gowan 2003),(Liu et al.2004) Le score final est la combinaison de score de similarit entre le document et le profil avec le score dappariement initial du document
12/06/2011 R2I 12-14 juin 2011 7
Contribution
Ide directrice
Les Rseaux Baysiens constituent un outil puissant pour la reprsentation des connaissances
Les utiliser pour la prsentation des diffrentes informations participantes la dfinition du modle de recherche
Dfinition dun module dappariement intgrant le profil utilisateur
12/06/2011
Contribution
Dmarche adopte
1. Dfinition de la librairie des centres dintrts
chaque centre dintrt ck est dfini comme un vecteur de termes ti pondrs selon la formule BM25 (Kassab R et al. 2005)
N :le nombre total de documents de la collection ; n : le nombre de documents de la collection contenant le terme ti ; R : le nombre de documents pertinents face une requte utilisateur ; r : le nombre de documents pertinents contenant le terme ti.
12/06/2011 R2I 12-14 juin 2011 9
Contribution
2. Prsentation du modle Le modle consiste en un graphe G= (V, E) acyclique orient
requte
Documents
Termes
Centres dintrts
Nuds V englobent la requte, les documents de la collection et la librairie de centres dintrts Arcs E orients des termes constituant lespace dindexation, vers les documents, les requtes et les centres dintrts.
12/06/2011 R2I 12-14 juin 2011 10
Contribution
3. Calcul de la Pertinence
(1)
U : lensemble des configurations u possibles de termes. P(u) : la probabilit priori associe une configuration de termes
P(q/u)=
Le modle rseau baysien gnralise le modle vectoriel lquation (1) peut tre crite
1 si q=u 0 sinon
12/06/2011
11
Contribution
4. Exemple illustratif
Soit une collection= {d1, d2, d3, d4, d5} d1= {10t1, 2t2, 4t3, 5t5}, d2= {4t1, 9t2, 7t6}, d3= {5t2, 7t3, 12t4, 9t6} d4= {2t1, 11t4, 3t5, 7t6} , d5= {10t2, 15t3, 5t4, 8t5, 14t6}
Libraire des centres dintrts Requtes Q= {q1, q2, q3, q4, q5 } q1= {t1} ,q2= {t2} , q3= {t3} , q4= {t4}, q5= {t5}
Contribution
Architecture du modle
ordre de pertinence Avec intgration du profil
+ D2 D5 D4 D3 - D1
Centres dintrts Termes dindexation
t1 t2 t3 c3 t4 c4 t5 c5 t6 d5 d4 d3
Collection documents
C1 C2
d1 d2
+ D5 D2 D3 D4 - D1
Q
12/06/2011 R2I 12-14 juin 2011
Requte utilisateur
13
Conclusion
Le modle propos mesure la pertinence comme un degrs de convergence des trois concepts document, requte utilisateur et centre dintrt La prise en compte du profil utilisateur modlis par son centre dintrt dans le module dappariement permet un bon ordonnancement des rsultats.
12/06/2011
14
Perspectives
personnalise
12/06/2011
15
12/06/2011
16