Relevanz-Feedback (Vektorraum)
aus Wikipedia, der freien Enzyklopädie
Beim Relevanz-Feedback verändert ein Informationssystem (IS) allgemein interne Repräsentationen von Informationsobjekten entsprechend Relevanzbewertungen des momentanen Nutzers. Je nachdem welche internen Repräsentationen ein IS besitzt, lassen sich unterschiedliche Arten von Relevanz-Feedback unterscheiden, wobei die Bezeichnung sich nach der Repräsentation richtet, die verändert wird. Im Vektorraummodell des Information Retrievals besitzt das Information-Retrieval-System (IRS) in jedem Fall interne Repräsentationen von Anfragen (Query-Vektoren) und von Dokumenten (Dokument-Vektoren), sodass entsprechende Relevanz-Feedback-Verfahren unterscheidbar sind. Mögliche weitere Verfahren ergeben sich bei der Verwendung von Dokumentvektoren-Clustern (Cluster- und Cluster-Zentroidvektor-Relevanz-Feedback) oder bei der Verwendung von Neuronalen Netzen und insbesondere Self-Organizing Maps (SOMs) im Kontext des Vektorraummodells (Gewichtsvektoren-Relevanz-Feedback).
[Bearbeiten] Queryvektor-Relevanz-Feedback mit binären Relevanzwerten
In der Iteration t=0 läuft das Verfahren analog dem normalen Information Retrieval ab, indem der Nutzer eine Query Qjt=0 eingibt, die vom IRS mit Hilfe der Query-Indexierungsfunktion auf einen Queryvektor qjt=0 in einem Dokumentvektorenraum DVR abgebildet wird. Mit qjt=0 wird durch die Retrievalfunktion aus der Gesamtdokumentmenge eine Teilmenge DVM(qjt=0) nachgewiesen, indem z.B. eine ε-Umgebung um qjt=0 aufgebaut wird, und alle darin enthaltenen Dokumentvektoren ermittelt werden. Die Teilmenge DVM(qjt=0) wird danach durch eine Rankingfunktion auf eine geordnete Dokumentvektorenliste DVL(qjt=0) abgebildet wird, deren korrespondierende Dokumentliste DL(qjt=0) dem Nutzer als Ergebnis präsentiert wird. Bei dem Queryvektor-Relevanzfeedback bewertet der Nutzer diese Dokumente Dji ∈ DL(qjt=0), indem er ihnen einen Relevanzwert rel(Dji) zuordnet, den das IRS als Relevenzwerte rel(xji) für die korrespondierenden Dokumentvektoren xji in DVM(qjt=0) verwendet. Wird eine binäre Relevanzbewertung unterstellt, so ergibt sich eine Relevanzfunktion relVR-IR, die ein Dokument Dji aus dem Zeichenraum D(Φ) der Dokumente abbildet auf die Menge {0, 1}:
Auf diese Weise ergibt sich eine Zerlegung der Dokumentvektorenmenge DVM(qjt=0) in eine Menge der relevanten DVM(qjt=0)rel und eine Menge der nicht-relevanten DVM(qjt=0)nrel Dokumentvektoren:
DVM(qjt=0)nrel = {xji,nrelt=0 | rel(xji,nrelt=0) = 0, i = 1, ..., fnrelt=0},
DVM(qjt=0)rel ⊂ DVM(qjt=0)nrel = DVM(qjt=0).Es soll der Fall eines gemischten Queryvektor-Relevanz-Feedbacks dargestellt werden, d.h. die relevanten und die nicht-relevanten Dokumentvektoren werden zur Adaption des Queryvektors verwendet, wobei alle Dokumentvektoren einbezogen werden sollen. Hierzu werden im nächsten Schritt für die beiden Dokumentvektorenmengen DVM(qjt=0)rel und DVM(qjt=0)nrel jeweils der Schwerpunkt der Vektoren als ungewichteter arithmetischer Mittelwert berechnet, wodurch die beiden Zentroide sDVM(j,rel)t=0 und sDVM(j,nrel)t=0 erzeugt werden:
Adaptionen in Vektorräumen werden immer als Verschiebeoperationen interpretiert, wobei die Verschiebung in Richtung bzw. weg von einem Fixpunkt der Adaption durchgeführt wird. Für die gemischten Strategie bedeutet dies, dass die beiden Zentroide als Fixpunkte verwendet werden, d.h. der Queryvektor wird zunächst in Richtung des Fixpunktes sDVM(j,rel)t=0 mit einer Adaptionsrate von β verschoben, was als positive Adaption bezeichnet wird, da dieser Fixpunkt die positiven Beispiele (relevante Dokumente) repräsentiert. Es findet zudem eine negative Adaption statt, indem der Queryvektor weg von dem Fixpunkte sDVM(j,nrel)t=0 mit einer Adaptionsrate von γ verschoben wird, dem Repräsentanten der negativen Beispiele (nicht-relevante Dokumente). Zudem wird eine Form von Trägheit verwendet, indem die alte Position des Queryvektors mit einer Adaptionsrate von α in die Adaptionsgleichung eingeht. Die Position des adaptierten Queryvektors qjt=1 ergibt sich somit zu:
Die Adaption des Queryvektors qjt in einer Iteration t zu einem Queryvektor qjt+1 lässt sich somit durch eine Adaptionsfunktion relFBt beschreiben, indem qjt, die beiden Zentroidvektoren, sowie die Parameter α, β, γ als Input verwendet werden:
Von der konkreten Adaptionsgleichung unabhängiger lässt sich die Adaptionsfunktion durch die Menge der relevanten Dokumentvektoren sowie die Menge der nicht-relevanten Dokumentvektoren formulieren:
Mit dem neuen Queryvektor qjt+1 wird eine neue Retrievaloperation durchgeführt, indem eine neue ε-Umgebung erzeugt wird, in der alle Dokumentvektoren innerhalb dieser Umgebung ermittelt werden, die in der ersten Iteration t=0 noch nicht ermittelt wurden. Die entsprechende Dokumentvektorenmenge wird mit DVM(qjt=1) bezeichnet, die durch eine Rankingfunktion auf eine geordnete Dokumentvektorenliste DVL(qjt=1) abgebildet wird, deren korrespondierende Dokumentliste DL(qjt=1) dem Nutzer präsentiert wird. Der Nutzer kann diese Dokumente wieder bewerten, wodurch die nächste Iteration eingeleitet wird, oder er kann das Verfahren stoppen, was auch von Seiten des IRS geschehen kann, wenn in einer Iteration keine neuen Dokumente nachgewiesen werden können.
[Bearbeiten] Pseudo-Relevanz-Feedback, Query-Relevanz-Feedback
Bei diesem Verfahren werden keine expliziten Relevanzwerte vom Nutzer verlangt, sondern es werden die wichtigsten Terme aus den wichtigsten Dokumenten, die durch qjt=0 nachgewiesen werden, verwendet werden, um den Queryvektor zu reformulieren. Die wichtigsten Dokumenten sind dabei die ersten Rangplätze aus DL(qjt=0), und die wichtigsten Terme sind diejenigen mit den größten dokumentspezifischen Gewichtungen bzw. den größten Vektorkomponenten. Die Anzahl der wichtigsten Dokumente und die wichtigsten Terme pro Dokument sind dabei externe Verfahrensparameter. Sind die neuen Terme ermittelt, so werden sie der Ursprungsquery Qjt=0 beigemischt, sodass eine neue Query Qjt=1 vorliegt, die mit der regulären Query-Indexierungsfunktion auf den Queryvektor qjt=1 abgebildet wird, mit dem ein neues retrieval durchgeführt wird.
Dieses Verfahren modifiziert die Query im Gegensatz zu dem obigen Verfahren, welches den Queryvektor modifiziert, sodass dies ein Beispiel eines Query-Relevanz-Feedbacks darstellt.
[Bearbeiten] Dokumentvektor-Relevanz-Feedback
to do