Wikipedia Diskussion:Personendaten/Auswertung
aus Wikipedia, der freien Enzyklopädie
[Bearbeiten] Vollständige Analyse der Personendaten
1. Bestimmung der Personenartikel
- Ausgabe: Liste von Artikeltiteln
2. Extraktion der Personedaten aus dem SQL-dump
- Ausgabe: Liste von Personendaten (Artikel, Name, Alternativname, Kurzbeschreibung, Gebursdatum, Geburtsort, Sterbedatum, Sterbeort, PNDNummer)
3. Statistik über Personenartikel ohne Personendaten und Anzahl der Personendaten
4. Bereinigung der Personendaten und Heterogenitätsübersicht
5. Vollständigkeitsübersicht
6. Weiterverarbeitung
- Ausgabe: Ausgewählte Daten z.B. Alter, Jahrzehnt, Geburtsmonat...
[Bearbeiten] Ähnliche Einträge
Kannst du auch ähnlichkeiten auswerten? Also Leute die am selben Tag geboren und am selben Tag gestorben sind, könnten evt. Doppeleinträge sein. -- sk 17:39, 17. Mai 2005 (CEST)
[Bearbeiten] Plausibilität
- Gestorben < Geboren
- Gestroben - Geboren -> älter als 100 Jahre?
- Heute - geboren -> älter als 100 Jahre? Person lebt vielleicht nicht mehr
--Atamari 18:05, 17. Mai 2005 (CEST)