Benutzer:Mathias Schindler/dpa
aus Wikipedia, der freien Enzyklopädie
Ein Verkaufsargument des Brockhaus Multimedial aus dem Hause BIFAB ist der Online-Zugriff auf "2 Millionen" Bilder der deutschen Presseagentur dpa.
Zu jedem Artikel assoziiert ist ein Hyperlink auf die "dpa-Bilddatenbank". Eine freie Suche ist nicht möglich (meines Wissens).
Die Hyperlinks gehen auf die Domain www.brockhaus-multimedial.de
[Bearbeiten] URL
Eine solche klassische URL ist beispielsweise
http://www.brockhaus-multimedial.de/cgi-bin/dpalink/dpacopy.pl?necessary=Wikipedia&optional=Wikipedia-projekt+Dvd-ausgabe+Wikipedia-text+Handelsversion+Wikis+Internetprojekt+Wiki+%DCberarbeiten+Internetnutzer+%DCberarbeitung&theme=0&OS=Windows&t=3298412&product=bmm2005&lock=917230
segmentiert sieht das dann so aus:
Host, Domain und Top-Level-Domain
- /cgi-bin/dpalink/
Verzeichnis der Inhalte
- dpacopy.pl
Dateiname des Perl-Skriptes, das für die Bereitstellung der Treffer veantwortlich ist
- ?
Ab hier beginnen die Variablen
- necessary=Wikipedia
Dies scheint der Haupt-Terminus (identisch zum Artikellemma) zu sein.
- &
Trennzeichen für Variablen
- optional=Wikipedia-projekt
Optionale Suchbegriffe, die offenbar aus dem Artikeltext stammen. Interessant ist hier, daß auch Begriffe auftauchen, die in alten Versionen standen und zwischenzeitlich entfernt wurden. Diese Liste könnte also beispielsweise separat in den Metadaten des BMM liegen und bei Erstellung (semi-manuell) gepflegt werden. Das ist Spekulation.
- +Dvd-ausgabe
- +Wikipedia-text
- +Handelsversion
- +Wikis
- +Internetprojekt
- +Wiki
- +%DCberarbeiten
Sonderzeichen werden encodiert wie üblich.
- +Internetnutzer
- +%DCberarbeitung
- &theme=0
- &OS=Windows
Vermutlich das Betriebssystem des Benutzers.
- &t=3298412
Das hier könnte ein Timestamp sein, der das Ablaufen der Freigabe dieser URL regelt.
- &product=bmm2005
Es könnte ein Produktname sein. In diesem Fall hat jemand die Änderung nicht nachgetragen oder man ist dort ehrlich, was das Erscheinungsdatum angeht.
- &lock=917230
Das könnte eine Prüfziffer sein, die die Verwendung handgeschriebener URLs verweigern soll.
[Bearbeiten] Variablen
Wenn keine Artikel im ersten Anlauf gefunden werden, bietet die Website zusätzliche Suchoptionen an.
- Reine Stichwortsuche
- Stichworte und Powerwebbegriffe
- Stichworte und Themengebiet
- &method=N&lock=807549
- &method=NO&lock=873030
- &method=NT&lock=881215
Die einzigen Variablen, die sich ändern, sind die Prüfziffer lock und method. N Stichwort O "Powerwebbegriffe" und T für Themengebiet.
Einzelbildansichten werden wie folgt übergeben:
- bigview=237656305&set=1&lock=843564
Das konkrete Bild dazu liegt unter
- ?picloc=/report/lgt//dpa/j2006/m01/t20/032901_4.jff&lock=205118
lock ändert sich hier übrigens auch mit anderen getesteten Bildern nicht.
- picloc=/report/lgt//dpa/j2005/m08/t08/048501_5.jff&lock=205118
- picloc=/report/lgt//dpa/j2005/m08/t05/063201_5.jff&lock=205118
Fügt man ein "theme=0" hinzu, wird der Zugang verweigert.
Einen Zusammenhang zwischen Bigview und dem Dateinamen konnte ich noch nicht finden.
j2005 dürfte das Jahr sein, m08 der Monat und t der Tag.
Das Datum bezieht sich offenbar auf den Moment der Archivierung/Zugänglichmachung, nicht auf den Tag der Erstellung wie bei diesem Schwarzweiss-Bild aus dem letzten Jahrtausend:
- dpacopy.pl?picloc=/report/lgt//dpa/j2005/m08/t09/084201_4.jff&lock=205118
Bei älteren Bildern ist eine andere Verzeichnisstruktur sichtbar, bei der sich offenbar auch die Prüfsumme wieder ändert:
- dpacopy.pl?picloc=/dpaba/src//ba/j2002/m06/t19/009101_4.jff&lock=219851
- dpacopy.pl?picloc=/dpaba/src//ba/j2002/m11/t28/001101_4.jff&lock=219851
- dpaba = dpa-Bildarchiv
- src = üblicherweise source
- ba = Bildarchiv
Eine wilde Theorie ist nun, daß für die Berechnung der Prüfsumme Zahlen keine Rolle spielen, sondern vermutlich Buchstaben und ihre Position.