New Immissions/Updates:
boundless - educate - edutalab - empatico - es-ebooks - es16 - fr16 - fsfiles - hesperian - solidaria - wikipediaforschools
- wikipediaforschoolses - wikipediaforschoolsfr - wikipediaforschoolspt - worldmap -

See also: Liber Liber - Libro Parlato - Liber Musica  - Manuzio -  Liber Liber ISO Files - Alphabetical Order - Multivolume ZIP Complete Archive - PDF Files - OGG Music Files -

PROJECT GUTENBERG HTML: Volume I - Volume II - Volume III - Volume IV - Volume V - Volume VI - Volume VII - Volume VIII - Volume IX

Ascolta ""Volevo solo fare un audiolibro"" su Spreaker.
CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Relevanz-Feedback (Vektorraum) - Wikipedia

Relevanz-Feedback (Vektorraum)

aus Wikipedia, der freien Enzyklopädie

Beim Relevanz-Feedback verändert ein Informationssystem (IS) allgemein interne Repräsentationen von Informationsobjekten entsprechend Relevanzbewertungen des momentanen Nutzers. Je nachdem welche internen Repräsentationen ein IS besitzt, lassen sich unterschiedliche Arten von Relevanz-Feedback unterscheiden, wobei die Bezeichnung sich nach der Repräsentation richtet, die verändert wird. Im Vektorraummodell des Information Retrievals besitzt das Information-Retrieval-System (IRS) in jedem Fall interne Repräsentationen von Anfragen (Query-Vektoren) und von Dokumenten (Dokument-Vektoren), sodass entsprechende Relevanz-Feedback-Verfahren unterscheidbar sind. Mögliche weitere Verfahren ergeben sich bei der Verwendung von Dokumentvektoren-Clustern (Cluster- und Cluster-Zentroidvektor-Relevanz-Feedback) oder bei der Verwendung von Neuronalen Netzen und insbesondere Self-Organizing Maps (SOMs) im Kontext des Vektorraummodells (Gewichtsvektoren-Relevanz-Feedback).

[Bearbeiten] Queryvektor-Relevanz-Feedback mit binären Relevanzwerten

In der Iteration t=0 läuft das Verfahren analog dem normalen Information Retrieval ab, indem der Nutzer eine Query Qjt=0 eingibt, die vom IRS mit Hilfe der Query-Indexierungsfunktion auf einen Queryvektor qjt=0 in einem Dokumentvektorenraum DVR abgebildet wird. Mit qjt=0 wird durch die Retrievalfunktion aus der Gesamtdokumentmenge eine Teilmenge DVM(qjt=0) nachgewiesen, indem z.B. eine ε-Umgebung um qjt=0 aufgebaut wird, und alle darin enthaltenen Dokumentvektoren ermittelt werden. Die Teilmenge DVM(qjt=0) wird danach durch eine Rankingfunktion auf eine geordnete Dokumentvektorenliste DVL(qjt=0) abgebildet wird, deren korrespondierende Dokumentliste DL(qjt=0) dem Nutzer als Ergebnis präsentiert wird. Bei dem Queryvektor-Relevanzfeedback bewertet der Nutzer diese Dokumente DjiDL(qjt=0), indem er ihnen einen Relevanzwert rel(Dji) zuordnet, den das IRS als Relevenzwerte rel(xji) für die korrespondierenden Dokumentvektoren xji in DVM(qjt=0) verwendet. Wird eine binäre Relevanzbewertung unterstellt, so ergibt sich eine Relevanzfunktion relVR-IR, die ein Dokument Dji aus dem Zeichenraum D(Φ) der Dokumente abbildet auf die Menge {0, 1}:

relVR-IR = D(Φ) -> {0, 1}: Dji |-> rel(Dji)rel(xji) ∈ {0, 1}.

Auf diese Weise ergibt sich eine Zerlegung der Dokumentvektorenmenge DVM(qjt=0) in eine Menge der relevanten DVM(qjt=0)rel und eine Menge der nicht-relevanten DVM(qjt=0)nrel Dokumentvektoren:

DVM(qjt=0)rel = {xji,relt=0 | rel(xji,relt=0) = 1, i = 1, ..., frelt=0},

DVM(qjt=0)nrel = {xji,nrelt=0 | rel(xji,nrelt=0) = 0, i = 1, ..., fnrelt=0},

DVM(qjt=0)relDVM(qjt=0)nrel = DVM(qjt=0).

Zerlegung der Dokumentvektorenmenge beim Relevanz-Feedback mit binären Relevanzwerten

Es soll der Fall eines gemischten Queryvektor-Relevanz-Feedbacks dargestellt werden, d.h. die relevanten und die nicht-relevanten Dokumentvektoren werden zur Adaption des Queryvektors verwendet, wobei alle Dokumentvektoren einbezogen werden sollen. Hierzu werden im nächsten Schritt für die beiden Dokumentvektorenmengen DVM(qjt=0)rel und DVM(qjt=0)nrel jeweils der Schwerpunkt der Vektoren als ungewichteter arithmetischer Mittelwert berechnet, wodurch die beiden Zentroide sDVM(j,rel)t=0 und sDVM(j,nrel)t=0 erzeugt werden:

sDVM(j,rel)t=0 = 1/frelt=0 · ∑i xji,relt=0, ∀ xji,relt=0DVM(qjt=0)rel; sDVM(j,nrel)t=0 = 1/fnrelt=0 · ∑i xji,nrelt=0, ∀ xji,nrelt=0DVM(qjt=0)nrel.

Adaptionen in Vektorräumen werden immer als Verschiebeoperationen interpretiert, wobei die Verschiebung in Richtung bzw. weg von einem Fixpunkt der Adaption durchgeführt wird. Für die gemischten Strategie bedeutet dies, dass die beiden Zentroide als Fixpunkte verwendet werden, d.h. der Queryvektor wird zunächst in Richtung des Fixpunktes sDVM(j,rel)t=0 mit einer Adaptionsrate von β verschoben, was als positive Adaption bezeichnet wird, da dieser Fixpunkt die positiven Beispiele (relevante Dokumente) repräsentiert. Es findet zudem eine negative Adaption statt, indem der Queryvektor weg von dem Fixpunkte sDVM(j,nrel)t=0 mit einer Adaptionsrate von γ verschoben wird, dem Repräsentanten der negativen Beispiele (nicht-relevante Dokumente). Zudem wird eine Form von Trägheit verwendet, indem die alte Position des Queryvektors mit einer Adaptionsrate von α in die Adaptionsgleichung eingeht. Die Position des adaptierten Queryvektors qjt=1 ergibt sich somit zu:

qjt=1 = α · qjt=0 + β · sDVM(j,rel)t=0 - γ · sDVM(j,nrel)t=0, α, β, γ ≥ 0.

Queryvektor-Adaption bei gemischter Feedbackstrategie

Die Adaption des Queryvektors qjt in einer Iteration t zu einem Queryvektor qjt+1 lässt sich somit durch eine Adaptionsfunktion relFBt beschreiben, indem qjt, die beiden Zentroidvektoren, sowie die Parameter α, β, γ als Input verwendet werden:

relFBt: DVR x DVR x DVR x R+ x R+ x R+ -> DVR: (qjt, sDVM(j,rel)t, sDVM(j,nrel)t, α, β, γ) |-> qjt+1.

Von der konkreten Adaptionsgleichung unabhängiger lässt sich die Adaptionsfunktion durch die Menge der relevanten Dokumentvektoren sowie die Menge der nicht-relevanten Dokumentvektoren formulieren:

relFBt: DVR x DVRf(rel,t) x DVRf(nrel,t) -> DVR: (qjt, DVM(qjt=0)rel, DVM(qjt=0)nrel) |-> qjt+1.

Mit dem neuen Queryvektor qjt+1 wird eine neue Retrievaloperation durchgeführt, indem eine neue ε-Umgebung erzeugt wird, in der alle Dokumentvektoren innerhalb dieser Umgebung ermittelt werden, die in der ersten Iteration t=0 noch nicht ermittelt wurden. Die entsprechende Dokumentvektorenmenge wird mit DVM(qjt=1) bezeichnet, die durch eine Rankingfunktion auf eine geordnete Dokumentvektorenliste DVL(qjt=1) abgebildet wird, deren korrespondierende Dokumentliste DL(qjt=1) dem Nutzer präsentiert wird. Der Nutzer kann diese Dokumente wieder bewerten, wodurch die nächste Iteration eingeleitet wird, oder er kann das Verfahren stoppen, was auch von Seiten des IRS geschehen kann, wenn in einer Iteration keine neuen Dokumente nachgewiesen werden können.

Anwendung der Retrievalfunktion auf neuen Queryvektor

[Bearbeiten] Pseudo-Relevanz-Feedback, Query-Relevanz-Feedback

Bei diesem Verfahren werden keine expliziten Relevanzwerte vom Nutzer verlangt, sondern es werden die wichtigsten Terme aus den wichtigsten Dokumenten, die durch qjt=0 nachgewiesen werden, verwendet werden, um den Queryvektor zu reformulieren. Die wichtigsten Dokumenten sind dabei die ersten Rangplätze aus DL(qjt=0), und die wichtigsten Terme sind diejenigen mit den größten dokumentspezifischen Gewichtungen bzw. den größten Vektorkomponenten. Die Anzahl der wichtigsten Dokumente und die wichtigsten Terme pro Dokument sind dabei externe Verfahrensparameter. Sind die neuen Terme ermittelt, so werden sie der Ursprungsquery Qjt=0 beigemischt, sodass eine neue Query Qjt=1 vorliegt, die mit der regulären Query-Indexierungsfunktion auf den Queryvektor qjt=1 abgebildet wird, mit dem ein neues retrieval durchgeführt wird.

Dieses Verfahren modifiziert die Query im Gegensatz zu dem obigen Verfahren, welches den Queryvektor modifiziert, sodass dies ein Beispiel eines Query-Relevanz-Feedbacks darstellt.


[Bearbeiten] Dokumentvektor-Relevanz-Feedback

to do

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu