Relevanz-Feedback (Vektorraum)

aus Wikipedia, der freien Enzyklopädie

Du hast neue Nachrichten auf deiner Diskussionsseite.

Beim Relevanz-Feedback verändert ein Informationssystem (IS) allgemein interne Repräsentationen von Informationsobjekten entsprechend Relevanzbewertungen des momentanen Nutzers. Je nachdem welche internen Repräsentationen ein IS besitzt, lassen sich unterschiedliche Arten von Relevanz-Feedback unterscheiden, wobei die Bezeichnung sich nach der Repräsentation richtet, die verändert wird. Im Vektorraummodell des Information Retrievals besitzt das Information-Retrieval-System (IRS) in jedem Fall interne Repräsentationen von Anfragen (Query-Vektoren) und von Dokumenten (Dokument-Vektoren), sodass entsprechende Relevanz-Feedback-Verfahren unterscheidbar sind. Mögliche weitere Verfahren ergeben sich bei der Verwendung von Dokumentvektoren-Clustern (Cluster- und Cluster-Zentroidvektor-Relevanz-Feedback) oder bei der Verwendung von Neuronalen Netzen und insbesondere Self-Organizing Maps (SOMs) im Kontext des Vektorraummodells (Gewichtsvektoren-Relevanz-Feedback).

[Bearbeiten] Queryvektor-Relevanz-Feedback mit binären Relevanzwerten

In der Iteration t=0 läuft das Verfahren analog dem normalen Information Retrieval ab, indem der Nutzer eine Query Q_j^t=0 eingibt, die vom IRS mit Hilfe der Query-Indexierungsfunktion auf einen Queryvektor q_j^t=0 in einem Dokumentvektorenraum DVR abgebildet wird. Mit q_j^t=0 wird durch die Retrievalfunktion aus der Gesamtdokumentmenge eine Teilmenge DVM(q_j^t=0) nachgewiesen, indem z.B. eine ε-Umgebung um q_j^t=0 aufgebaut wird, und alle darin enthaltenen Dokumentvektoren ermittelt werden. Die Teilmenge DVM(q_j^t=0) wird danach durch eine Rankingfunktion auf eine geordnete Dokumentvektorenliste DVL(q_j^t=0) abgebildet wird, deren korrespondierende Dokumentliste DL(q_j^t=0) dem Nutzer als Ergebnis präsentiert wird. Bei dem Queryvektor-Relevanzfeedback bewertet der Nutzer diese Dokumente D_ji ∈ DL(q_j^t=0), indem er ihnen einen Relevanzwert rel(D_ji) zuordnet, den das IRS als Relevenzwerte rel(x_ji) für die korrespondierenden Dokumentvektoren x_ji in DVM(q_j^t=0) verwendet. Wird eine binäre Relevanzbewertung unterstellt, so ergibt sich eine Relevanzfunktion rel_VR-IR, die ein Dokument D_ji aus dem Zeichenraum D(Φ) der Dokumente abbildet auf die Menge {0, 1}:

rel_VR-IR = D(Φ) -> {0, 1}: D_ji |-> rel(D_ji) ≡ rel(x_ji) ∈ {0, 1}.

Auf diese Weise ergibt sich eine Zerlegung der Dokumentvektorenmenge DVM(q_j^t=0) in eine Menge der relevanten DVM(q_j^t=0)_rel und eine Menge der nicht-relevanten DVM(q_j^t=0)_nrel Dokumentvektoren:

DVM(q_j^t=0)_rel = {x_ji,rel^t=0 | rel(x_ji,rel^t=0) = 1, i = 1, ..., f_rel^t=0},

DVM(q_j^t=0)_nrel = {x_ji,nrel^t=0 | rel(x_ji,nrel^t=0) = 0, i = 1, ..., f_nrel^t=0},

DVM(q_j^t=0)_rel ⊂ DVM(q_j^t=0)_nrel = DVM(q_j^t=0).

Es soll der Fall eines gemischten Queryvektor-Relevanz-Feedbacks dargestellt werden, d.h. die relevanten und die nicht-relevanten Dokumentvektoren werden zur Adaption des Queryvektors verwendet, wobei alle Dokumentvektoren einbezogen werden sollen. Hierzu werden im nächsten Schritt für die beiden Dokumentvektorenmengen DVM(q_j^t=0)_rel und DVM(q_j^t=0)_nrel jeweils der Schwerpunkt der Vektoren als ungewichteter arithmetischer Mittelwert berechnet, wodurch die beiden Zentroide s_DVM(j,rel)^t=0 und s_DVM(j,nrel)^t=0 erzeugt werden:

s_DVM(j,rel)^t=0 = 1/f_rel^t=0 · ∑_i x_ji,rel^t=0, ∀ x_ji,rel^t=0 ∈ DVM(q_j^t=0)_rel; s_DVM(j,nrel)^t=0 = 1/f_nrel^t=0 · ∑_i x_ji,nrel^t=0, ∀ x_ji,nrel^t=0 ∈ DVM(q_j^t=0)_nrel.

Adaptionen in Vektorräumen werden immer als Verschiebeoperationen interpretiert, wobei die Verschiebung in Richtung bzw. weg von einem Fixpunkt der Adaption durchgeführt wird. Für die gemischten Strategie bedeutet dies, dass die beiden Zentroide als Fixpunkte verwendet werden, d.h. der Queryvektor wird zunächst in Richtung des Fixpunktes s_DVM(j,rel)^t=0 mit einer Adaptionsrate von β verschoben, was als positive Adaption bezeichnet wird, da dieser Fixpunkt die positiven Beispiele (relevante Dokumente) repräsentiert. Es findet zudem eine negative Adaption statt, indem der Queryvektor weg von dem Fixpunkte s_DVM(j,nrel)^t=0 mit einer Adaptionsrate von γ verschoben wird, dem Repräsentanten der negativen Beispiele (nicht-relevante Dokumente). Zudem wird eine Form von Trägheit verwendet, indem die alte Position des Queryvektors mit einer Adaptionsrate von α in die Adaptionsgleichung eingeht. Die Position des adaptierten Queryvektors q_j^t=1 ergibt sich somit zu:

q_j^t=1 = α · q_j^t=0 + β · s_DVM(j,rel)^t=0 - γ · s_DVM(j,nrel)^t=0, α, β, γ ≥ 0.

Die Adaption des Queryvektors q_j^t in einer Iteration t zu einem Queryvektor q_j^t+1 lässt sich somit durch eine Adaptionsfunktion rel_FB^t beschreiben, indem q_j^t, die beiden Zentroidvektoren, sowie die Parameter α, β, γ als Input verwendet werden:

rel_FB^t: DVR x DVR x DVR x R⁺ x R⁺ x R⁺ -> DVR: (q_j^t, s_DVM(j,rel)^t, s_DVM(j,nrel)^t, α, β, γ) |-> q_j^t+1.

Von der konkreten Adaptionsgleichung unabhängiger lässt sich die Adaptionsfunktion durch die Menge der relevanten Dokumentvektoren sowie die Menge der nicht-relevanten Dokumentvektoren formulieren:

rel_FB^t: DVR x DVR^f(rel,t) x DVR^f(nrel,t) -> DVR: (q_j^t, DVM(q_j^t=0)_rel, DVM(q_j^t=0)_nrel) |-> q_j^t+1.

Mit dem neuen Queryvektor q_j^t+1 wird eine neue Retrievaloperation durchgeführt, indem eine neue ε-Umgebung erzeugt wird, in der alle Dokumentvektoren innerhalb dieser Umgebung ermittelt werden, die in der ersten Iteration t=0 noch nicht ermittelt wurden. Die entsprechende Dokumentvektorenmenge wird mit DVM(q_j^t=1) bezeichnet, die durch eine Rankingfunktion auf eine geordnete Dokumentvektorenliste DVL(q_j^t=1) abgebildet wird, deren korrespondierende Dokumentliste DL(q_j^t=1) dem Nutzer präsentiert wird. Der Nutzer kann diese Dokumente wieder bewerten, wodurch die nächste Iteration eingeleitet wird, oder er kann das Verfahren stoppen, was auch von Seiten des IRS geschehen kann, wenn in einer Iteration keine neuen Dokumente nachgewiesen werden können.

[Bearbeiten] Pseudo-Relevanz-Feedback, Query-Relevanz-Feedback

Bei diesem Verfahren werden keine expliziten Relevanzwerte vom Nutzer verlangt, sondern es werden die wichtigsten Terme aus den wichtigsten Dokumenten, die durch q_j^t=0 nachgewiesen werden, verwendet werden, um den Queryvektor zu reformulieren. Die wichtigsten Dokumenten sind dabei die ersten Rangplätze aus DL(q_j^t=0), und die wichtigsten Terme sind diejenigen mit den größten dokumentspezifischen Gewichtungen bzw. den größten Vektorkomponenten. Die Anzahl der wichtigsten Dokumente und die wichtigsten Terme pro Dokument sind dabei externe Verfahrensparameter. Sind die neuen Terme ermittelt, so werden sie der Ursprungsquery Q_j^t=0 beigemischt, sodass eine neue Query Q_j^t=1 vorliegt, die mit der regulären Query-Indexierungsfunktion auf den Queryvektor q_j^t=1 abgebildet wird, mit dem ein neues retrieval durchgeführt wird.

Dieses Verfahren modifiziert die Query im Gegensatz zu dem obigen Verfahren, welches den Queryvektor modifiziert, sodass dies ein Beispiel eines Query-Relevanz-Feedbacks darstellt.

[Bearbeiten] Dokumentvektor-Relevanz-Feedback

to do

Von „http://de.wikipedia.org../../../r/e/l/Relevanz-Feedback_%28Vektorraum%29_88ef.html“

Kategorie: Dokumentation

Relevanz-Feedback (Vektorraum)

aus Wikipedia, der freien Enzyklopädie

[Bearbeiten] Queryvektor-Relevanz-Feedback mit binären Relevanzwerten

[Bearbeiten] Pseudo-Relevanz-Feedback, Query-Relevanz-Feedback

[Bearbeiten] Dokumentvektor-Relevanz-Feedback

Views

Navigation

Mitmachen

Suche