Wikipedia:Download/xml2sql
aus Wikipedia, der freien Enzyklopädie
Hier stehen mehrere Möglichkeiten, den XML-Dump in einen SQL-Dump umzuwandeln.
Siehe auch: meta:Importing a Wikipedia database dump into MediaWiki, meta:Processing MediaWiki XML with STX
Weitere Konvertierungsprogramme und -skripte in anderen Sprachen sind stets willkommen (z.B. wurde bereits nach einem Konverter in PHP gefragt).
[Bearbeiten] Perl
Folgendes Perl-Script kann den XML-Dump der aktuellen Seitenversionen in einen MySQL-Dump der "cur"-Tabelle umwandeln. Fehlermeldungen, die mit "duplicate key" beginnen, kann man ignorieren. Es handelt sich um kleinere Fehler im XML-Dump.
Das Script arbeitet als Filter, also z.B.
bzip2 -cd pages_current.xml.bz2 | ./xml2sql.pl | mysql -uXXX -pYYY wikidb
Es wird hier nicht angezeigt, weil Darstellungsfehler den Code verfälschen würden. Erst-Autor des Skripts: Jah 8. August 2005.
Hier folgt als Kommentar das Script, man kann es aus dem Wiki-Quelltext dieser Seite kopieren (oben auf Bearbeiten klicken):
[Bearbeiten] Java
Das hier verlinkte Java-Programm wandelt den XML-Dump der aktuellen Seitenversionen in einen SQL-Dump für die MediaWiki-Versionen bis 1.4 um. Es benötigt Java Version 1.5, der Quelltext (für Misstrauische) und eine "Bedienungsanleitung" liegt bei. Es liefert alle im Dump vorhandenen Angaben eines Artikels (id, namespace, title, text, comment, userid, username, timestamp, isredirect, restrictions, isminor).
Über Rückmeldungen zum Erfolg der Programmanwendung freut sich der Autor.
- SirJective, letzte Änderung des Programms: 24. Februar 2006
- xml2sql.zip (59 kb)
Von Brion Vibber stammt der mwdumper, der XML-Dumps in die Datenbankschemen 1.4 und 1.5 konvertieren kann. Probleme werden meist auf wikitech-l (englisch) diskutiert.