Wikipedia:WikiProjekt Georeferenzierung/Wikipedia-World
aus Wikipedia, der freien Enzyklopädie
NEWS: At the moment (07-02-13) we have (Source:info.php):
164.497 entries without duplicates (input):
419.494 entries with duplicates (result):
Database-Dumps See here for code to decode the CSV file. The SQL-file has not this bug. |
This page in English: Wikipedia:WikiProjekt Georeferenzierung/Wikipedia-World/en
Dank der freien Verfügbarkeit der gesammelten Daten und dank der unzähligen Helfer bei der Verortung der Artikel war es möglich, die Positionsbeschreibung von Orten über Längen- und Breitengrad in den verbreitetsten Sprachen als Karten nutzbar zu machen. Damit lassen sich auch gut die internationalen Aspekte in der Wikipedia zeigen.
Diese Seite soll anschließend in alle betreffenden Sprachen übersetzt werden, um einen möglichst leichten Einstieg zu liefern und das Projekt möglichst bekannt zu machen. Dafür suchen wir auch Leute, die neben der Tätigkeit in der deutschsprachigen Wikipedia auch noch in anderssprachigen Wikipedias aktiv sind, um das Projekt dort bekannt zu machen.
Inhaltsverzeichnis |
[Bearbeiten] Projektbeschreibung
Dieses ist eine internationale Koordinierungsseite für die mehrsprachige Nutzung und Auswertung der im Projekt Georeferenzierung, en:Wikipedia:WikiProject Geographical coordinates und anderem gesammelten Koordinaten. Wir suchen noch in den Sprachen pl,ja,it,zh,sv... nach Kategorien in der sämtliche verwendete Geotags stehen (siehe Interwikilinks in der Kategorie:Vorlage mit Koordinate), um weitere Sprachen aufnehmen zu können.
Später sollen möglichst viele Sprachvarianten ausgewertet und in einer gemeinsamen Datenbank zusammengeführt werden. Dafür ist auch eine Abstimmung über die zu verwendenden Georeferenz-Vorlagen nötig.
Im Moment gibt es folgende Anwendungen, die alle auf einer zentralen Datenbank auf dem Toolserver basieren, dabei sind die beiden letzen Anwendungen auch über den geohack aufrufbar:
[Bearbeiten] Suchmaschine
http://tools.wikimedia.de/~kolossos/wp-world/place-search.php?la=de
[Bearbeiten] Einfache Kartenansicht
Mit Hilfe von einfachem HTML+CSS gibt es eine einfache Karte ohne Hintergrund in den folgenden Sprachen:
Englisch, Deutsch, Spanisch, Französisch, Italienisch, Japanisch, Niederländisch, Polnisch, Portugiesisch, Russisch, Schwedisch.
Die Kartenansicht ist auch über eine Weltkarte aufrufbar, bei der man einfach nur auf den gewünschten Punkt der Erde klicken muß.
[Bearbeiten] Google-Earth-Wikipedia-Einblendung
[Bearbeiten] Statisch
[Bearbeiten] Dynamisch
Dabei befinden sich die Daten in einer Datenbank und werden nach dem Blickfeld des Nutzers und der Artikellänge gefiltert und über Google Earth gelegt. Der Datenbankzugriff erfolgt jeweils nach einem einsekündigem Stillstand des Betrachter-Standpunktes.
Ein Klick auf eines der Symbole und ein darauf folgendes Klicken auf den Wikipedia-Link ermöglicht das bequeme Lesen der Wikipedia-Artikel.
Folgende Sprachen stehen zur Auswahl:
Englisch, Deutsch, Spanisch, Französisch, Italienisch, Japanisch, Niederländisch, Polnisch, Portugiesisch, Russisch, Schwedisch.
[Bearbeiten] Expertenmodus
Die Ansicht läßt sich wie folgt vielseitig anpassen. Wenn man in Google Earth den aufgeführten Netzwerklink mit einem Klick auf die rechte Maustaste zum Bearbeiten öffnet, so erscheint eine URL(http://tools.wikimedia.de/~kolossos/geoworld/marks.php?LANG=de)
, mit der es möglich ist durch anhängen, weitere Parameter zu übergeben (s. Screenshot):
- thumbs
URL&thumbs=yes
Damit erscheinen statt der Icons kleine Vorschaubilder, welches aus dem jeweils ersten Bild der jeweiligen Artikel gewonnen wurden, siehe Sreenshot Im Moment werden allerdings nur *.jpg-Dateien aus der deutschen Wikipedia und den Commons und ohne Sonderzeichen unterstützt, trotzdem bekommt man durch die 22.000 Bilder schon einen recht guten Eindruck von Regionen oder Städten. Direkter Aufruf
- pop
URL&pop=1000
bewirkt die Darstellung ausschließlich mit Städten z.B. über 1000 EinwohnerURL&pop=-1
bewirkt die Darstellung ohne Städte, somit kommen Sehenswürdigkeiten besser zur Geltung.
- style
URL&style=world_cultur
bewirkt die Darstellung einer Spezialkarte ausschließlich mit Objekten z.B. aus dem Weltkulturerbe. Die vollständige Liste der Styles befindet sich in der oben rechts angegebenen info.php. Da Objekt immer nur einem Typ zugeordnet sind das natürlich nur bedingt zuverlassig.
- photo
URL&photo=no
zeigt nur Artikel an, welche noch kein Photo haben. Ideal um in einer Region auf Photosafari zu gehen.URL&photo=yes
zeigt nur Artikel an, welche schon ein Photo haben, dabei zählen allerdings auch schon einfache Stadtwappen oder Lagepläne als solches.
- source
URL&source=de
zeigt nur Orte an, die aus der deutschen Wikipedia gelesen wurden. Alle Input-Sprachen werden unterstützt.
- notsource
URL¬region=de
Bewirkt das Gegenteil von "source", zeigt nur Orte an, die z.B. nicht aus der deutschen Wikipedia gelesen wurden. Kann zur Kontrolle dienen.
- region
URL®ion=DE
zeigt nur Orte in Deutschland an.URL®ion=DE-SN
zeigt nur sächsiche Orte an. Vorraussetzung, der Ort wurde richtig mit einer Region getaggt.
- notregion
URL¬region=DE
Bewirkt das Gegenteil von "region", zeigt nur Orte an, die nicht als auch Deutschland stammend markiert sind.URL¬region=DE-SN
dito. für Sachsen. Ideal um eine Region nach Fehlern abzusuchen.
[Bearbeiten] Geotag-Generierung
Ein weiterer Anwendungsfall für die Interwikilinks ist das automatische Generieren von Geotags aus den Informationen von anderssprachigen Wikipedias. So wurde als erstes Beispiel die englischen Geokoordinaten genutzt, um für die deutschsprachigen Artikel, die noch keine Koordinaten besaßen, die Liste: Wikipedia:WikiProjekt Georeferenzierung/Artikel ohne Koordinate/da in engl WP mit Georeferenz-Vorlagen zu erzeugen. Die darin befindlichen Koordinaten wurden schon zu einem Großteil per Hand eingepflegt. Auch eine Automatisierung der Einpflegung über einen Bot erscheint in Zukunft denkbar. Dieser Schritt sollte allerdings mit der letzte sein, um möglichst wenige Fehler auf diese Weise zu duplizieren.
[Bearbeiten] Weltkarte der Wikipoints-Dichteverteilung
Image: Dichte der Koordinateneinträge in logarithmischer Skala. Draufklicken für Vergrößerung. |
Die obige Abbildung kann in Echtzeit aus der Datenbank generiert werden. Dazu gibt es 3 Variable, welche mit der URL übergeben werden können:
-
- Variable "so" für "source" begrenzt die Anzeige auf Artikel aus einer bestimmten WP-Sprachquelle. Dabei werden nur die Koordinaten berücksichtigt welche nicht schon aus einer anderen Sprache eingelesen wurden.
- Die Variable "la" nutzen, was dann alle verfügbaren Koordinaten für eine Sprache angibt.
- Die Variable "fa" gibt den Vergrößerungsfaktor an, dieser sollte 0.5, 1, 2, 4 oder 8 betragen. Bei Faktor =1 entspricht ein Pixel = 1 Grad. Mit steigendem Faktor wächst auch die Rechenzeit.
Beispiel: http://tools.wikimedia.de/~kolossos/wp-world/imageworld-art.php?so=pt&fa=2 gibt die Beträge aus der portugiesischen WP wieder.
[Bearbeiten] Maybe-Checker
- Maybe-Checker - Datenbankbasiertes Vorschlags-System mit Artikelanzeige und Eingrenzung auf bestimmte Kategorien, in den Sprachen Deutsch, Englisch und Tschechisch. Alle hier aufgelisteten Artikel hatten beim letzten Durchsuchen der Datenbank noch keine Koordinate, aber eine Kategorie (z.B. Ort in Deutschland, Brücke, Hotel), die darauf schließen lässt, dass es sich um einen Artikel handelt, den man georeferenzieren kann. „Maybe“ weil nicht jeder gefilterte Artikel auch unbedingt eine Geokoordinate benötigt (z.B. Liste deutscher Kirchen in Deutschland). - Man ruft den Maybe-Checker auf und schaut sich den Artikel an. Button 1) Man weiß die Koordinaten nicht. 2) Der Artikel sollte keine Koordinate bekommen. 3) Der Artikel hat mittlerweile schon eine Koordinate 4)Hab eine Koordinate gerade eingefügt. - Insbesondere der Button 2 ist interessant, weil diese Info vom Script beim nächsten Update gleich zur Vorsortierung genutzt wird, weil sonst immer wieder einige Artikel auftauchen (z.B. Fallgitter, Kopfbahnhof oder Zugbrücke).
[Bearbeiten] Datennutzung
[Bearbeiten] WikiMiniAtlas
[Bearbeiten] To-Do-Liste
Die Google Earth Anbindung mit Styles, Datenbankabfrage beschleunigenerledigtStatische KMLs erzeugenerledigt- CSV-Service ausbauen
- Internationalisierung
- alle Geotags-Vorlagen einer Sprache in einer Kategorie sammeln, welche dann über Interwikilinks mit Kategorie:Vorlage mit Koordinate verbunden wird
- Übersetzen der Type-Special-Liste (Werden zur Datenveredelung mit Hilfe der Kategorien benötigt)
- Übersetzen der Kontinent-Listen, ISO-3166-1-Kodierliste für Länder, ISO 3166-2 für Regionen
- Übersetzen der KML-Ordner-Namen
- Datenbankerweiterung auf mehr als 11 Sprachen. Welche?
Error-Liste Abarbeitungsoberfläche in Anlehnung an den Interwikilink-checker- Liste wo mehrere Artikel genau auf einer Koordinate liegen.
Maybe-Vorschlagsliste abzüglich der Artikel welche über eine andere Sprache eine Koordinate bekommen könnte.en:Template:Mapit-US-cityscale mit extraierenerledigt- letzter Schritt: Geotag-Generierung
[Bearbeiten] Ansprechpartner
- Benutzer:Stefan Kühn: Datenextraktion aus den Dumps
- Benutzer:Kolossos: Einspielen der Daten in die Datenbank, Anwendungsprogrammierung
- ALE! ¿…?: Übersetzung dieser Seite ins Englische