Wikipedia:Categorisatievoorstel
Van Wikipedia
Let op: Er is vooralsnog geen consensus of iets dat daar in de buurt komt wat betreft categorisatie van artikelen over personen op wikipedia. Wees daarom terughoudend bij het veranderen en verwijderen van categorieën, vooral als het grote series artikelen betreft. Lees vooral:
|
Een steeds terugkerende discussie is hoe gedetailleerd de indeling van de categorieën moet zijn: kiezen we voor {"Categorie:Nederlands wielrenner"}, {"Categorie:Nederlander", "Categorie:Wielrenner"} of {"Categorie:Nederland", "Categorie:Wielersport", "Categorie:Persoon"} (of nog iets anders)? Op verschillende plaatsen wordt hierover (heftig) van gedachten gewisseld.
- Wikipedia:De Kroeg
- Wikipedia:Categorieënschema
- Overleg Categorie:Persoon
- Overleg Categorie:Schrijver
- Overleg Wikipedia:Categorieën
Omdat de discussie hierdoor erg versnipperd was geraakt en bovendien niet iedereen op de hoogte bleek te zijn van het feit dat er een discussie plaatsvond, volgt hieronder een beknopte samenvatting van de tot nog toe besproken mogelijkheden en de voor- en nadelen van deze mogelijkheden. Nieuwe voorstellen kunnen hieronder worden toegevoegd. Op Overleg Wikipedia:Categorisatievoorstel is er ruimte voor discussie, nieuwe argumenten, steunbetuigingen, etc. Wanneer er na verloop van tijd (2 weken?) meerdere alternatieven zijn die op enige steun kunnen rekenen, zal er vermoedelijk een stemming georganiseerd gaan worden. Hier staan de mogelijkheden en bijbehorende voor- en nadelen zo objectief mogelijk bij elkaar.
[bewerk] Samenvatting
Indertijd is er gestemd over: moet een schrijver ingedeeld worden naar Nationaliteit of naar taal. Gekozen werd voor nationaliteit (met 7 van de in totaal 16 stemmen). Gevolg was dat impliciet werd aangenomen dat dus het categorisatievoorschrift voor personen zou moeten zijn: {nationaliteit beroep} met als gevolg talloze nieuwe categorieën volgens dit stramien. Het lijkt verstandig een en ander centraal (hier) nog eens op een rijtje te zetten.
De volgende zeven mogelijkheden worden hieronder toegelicht:
- Kleinste gemene deler
- Alleen hoofdgroepen
- Volgens één dimensie
- Verschillende schema's naast elkaar
- Sleutelwoorden (in feite gelijk aan hoofdgroepen)
- Geen categorieën
- Niks besluiten, laat maar gaan
[bewerk] Kleinste gemene deler (I)
Doel is een zodanige categorisatie dat uiteindelijk ieder artikel met ca 5 tot 30 andere artikelen in een subn-categorie beland zodanig dat er overzichtelijk genavigeerd kan worden middels categorieen. Joop Zoetemelk komt dan in de categorie {Nederlandse Wielrenners} of {wielrenners, nederlands} of zelfs {Nederlandse tourwinnaars} of {tourwinnaars, nederlands}
[bewerk] voordelen
- Het aantal artikelen op een categorie-pagina is beperkt, wat de overzichtelijkheid voor navigatiedoeleinden ten goede komt.
- Voor een toevallige passant die niet weet om te gaan met de zoekfunctie is het eenvoudig om een overzicht van een beperkt aantal verwante artikelen op zijn scherm te krijgen.
- Het aantal categorieën bij een artikel blijft beperkt als het NPOV-bezwaar niet wordt meegenomen.
[bewerk] nadelen
- Volgorde van categorisatie speelt een belangrijke rol en is (onnodig) onderwerp van discussie en niet echt NPOV!
- Het is moeilijker te onderhouden. Wanneer een land besluit zich te delen (tamelijk recent voorbeeld: Tsjechie en Slowakijke), moet elke categorie worden gesplitst (Tsjechoslowaakse beeldhouwers naar Tsjechische beeldhouwers en Slowaakse, enz.) maar dit komt niet dermate vaak voor dat dat echt een bezwaar zal zijn.
- Het leidt tot een onoverzichtelijke brij aan categorieën, waarin nauwelijks meer valt te navigeren. Dit kan nooit de bedoeling van categorisatie zijn geweest.
- Weliswaar is het mogelijk categorienschema's te gebruiken voor navigatie maar daarmee wordt wel het kind met het badwater weggegooid: het is niet meer mogelijk een groter overzicht te krijgen (bijvoorbeeld als je niet meer weet of een schrijver nou Iers, Engels of Amerikaans is).
- Het aantal mogelijke categorieën voor personen: (aantal nationaliteiten) * (aantal beroepsgroepen) * (man + vrouw = 2). Dit levert duizenden categorieën op (hoewel waarschijnlijk niet alle categorieën aan de orde zullen komen).
Een atoomfysicus uit de Jordaan (in Amsterdam) in de 50-er jaren komt dus in de categorieen:
- {atoomfysicus uit de Jordaan, 50-er jaren}
Om neutraal te blijven zou je kunnen stellen dat alle permutaties ook mee gecategoriseerd moeten worden waarmee {jaren-50, Jordaans atoomfysicus}, {atoomfysicus, jaren-50, Jordaans} enz. er bij zouden moeten komen, want hoe bepaal je anders de volgorde.
[bewerk] Hoofdgroepen (II)
Categorisatie naar hoofdgroepen houdt in dat er geen combinaties van categorieën worden gemaakt maar uitsluitend enkelvoudige categorieën. Ter verduidelijking: in dit voorstel zou Joop Zoetemelk ingedeeld worden in de categorieën "Nederland", "Man", "Wielersport", "Tourwinnaar".
[bewerk] voordelen
- De structuur is helder. Bij gecombineerde categorieën ontstaat altijd de vraag of de structuur "beroep -> nationaliteit -> geslacht" of "beroep -> geslacht -> nationaliteit" (of nog iets anders) moet zijn. Volgorde van categorisatie speelt geen rol.
- In deze indeling kan men vrij eenvoudig elk overzicht maken dat men wil hebben. Is men geïnteresseerd in een overzicht van alle beschreven Nederlandse mannen, dan kan dit overzicht snel verkregen worden door de interne zoekfunctie te zoeken naar "Categorie:Nederland" en "Categorie:Man". Wil men daarentegen alle wielrenners hebben (ongeacht de nationaliteit), dan zoekt men op "Categorie:Man" en "Categorie:Wielersport".
- Het aantal mogelijke categorieën: (aantal nationaliteiten) + (aantal mogelijke broepen) + 2 = enkele honderden. Dit is nog overzichtelijk te maken.
[bewerk] nadelen
- Een categorie kan veel pagina's bevatten: op de pagina Categorie:Man zullen al snel enkele duizenden namen kom te staan.
- Het gebruik van de zoekfunctie vereist enige ervaring. Toevallige passanten op de site zullen vermoedelijk niet weten hoe zij de hierboven beschreven doorsneden van categorieën moeten maken.
- Het is onmogelijk om op een eenvoudige wijze een overzicht te zien van Nederlands politici.
Een atoomfysicus uit de Jordaan (in Amsterdam) in de 50-er jaren komt dus in de categorieen:
- {natuurkundige}, {Amsterdam}, {jaren-50}, {Nederlands persoon}
[bewerk] Eén dimensie (III)
Dit houdt in dat er binnen een categorie alleen subcategorieën worden gemaakt die categoriseren langs dezelfde dimensie. Hierdoor ontstaan een aantal onafhankelijke boomstructuren. In feite is dit een verfijning van de hoofdgroepen indeling. Voorbeelden:
- {persoon} -> {europees persoon} -> {nederlands persoon} -> {amsterdams persoon} -> {Jordaans persoon} (prima, 1 dimensie: geografische locatie)
- {wetenschapper} -> {natuurkundige} -> {atoomfysicus} (ook ok, 1 dimensie: vakgebied)
- {moderne tijd -> {twintigste eeuw} -> {jaren-50} (ook ok, 1 dimensie: tijd)
- {wetenschapper} -> {natuurkundige} -> {Nederlands natuurkundige} (niet ok, wisseling van dimensie: eerst vakgebied, daarna nationaliteit)
- {sporter} -> {wielrenner} -> {Japans wielrenner} (niet ok, wisseling van dimensie)
Een atoomfysicus uit de Jordaan (in Amsterdam) in de 50-er jaren komt dus in de categorieen:
- {Jordaans persoon}, {atoomfysicus} en {jaren-50}.
[bewerk] voordelen
- De structuur is helder. Bij voorstel 1 ontstaat altijd de vraag of de structuur "beroep -> nationaliteit -> geslacht" of "beroep -> geslacht -> nationaliteit" (of nog iets anders) moet zijn. Dat is hier niet het geval, doordat elke boomstructuur per definitie hierarchisch is.
- Elke categorie heeft maar een beperkt aantal paden naar Categorie:Alles. Deze paden zou op de categoriepagina kunnen worden weergegeven, ter bevordering van de navigatiemogelijkheden (vergelijkbaar met Yahoo).
- Voor toevallige passanten blijft het eenvoudig om te navigeren.
- Geen NPOV-bezwaren.
[bewerk] nadelen
- Het maken van eigen overzichten met de zoekfunctie is met de huidige wiki-software lastiger dan bij voorstel 2.
- Het maken van een duidelijke hiërarchie waarbinnen men ook naar andere bomen kan gaan is niet mogelijk.
- Het is moeilijk, zo niet onmogelijk, in deze structuur zonder verder te zoeken te bepalen wie bijvoorbeeld een Thais politicus is. Dan moet men eerst een lijst met 2.000 politici doorworstelen om vervolgens een lijst met 200 Thaise personen door te worstelen. En men moet deze dan met elkaar vergelijken.
[bewerk] Verschillende schema's naast elkaar gebruiken (IV)
Dit voorstel is een compromis waarbij de bezwaren van de bovenstaande schema's hopelijk geminimaliseerd worden. We nemen als voorbeeld Peter the Meter. Hij was een mannelijk brits natuurkundige uit 1763. We categoriseren hem in de volgende categorieën:
- (categorie:Man), (categorie:Brit), (categorie:Brits natuurkundige), (categorie:Persoon), (Categorie:18e eeuw), (18e eeuws Natuurkundige),(18e eeuws persoon), (18e eeuws Brits natuurkundige), (18e eeuws wetenschapper), (Brits wetenschapper), (wetenschapper) enz. enz. Dit natuurlijk wel binnen redelijkheid, zie ook en:John Lennon
Iemand die nu op de categorie persoon klikt krijgt dan een hele waslijst van 10.000 en namen en subcategorieën. Wil iemand het verder gesorteerd hebben naar alleen de Britse personen dan klikt hij op de subcategorie Brit. Wil hij dan de Britse natuurkundigen zien dan klikt hij op de subcategorie Britse natuurkundige enzovoorts. Probleem opgelost, iedereen (of niemand) blij.
[bewerk] voordelen
- Geen oeverloze discussies over het te gebruiken schema
- Er hoeft niet al te veel meer veranderd te worden in de huidige categorisatie
- Er kunnen combinatiezoekingen gemaakt worden door mensen die de kennis hebben om dat te doen.
- Voor mensen die alles voorgekauwd willen hebben staat het voorgekauwd.
[bewerk] nadelen
- Categorisatie heeft geen duidelijke structuur en hiërarchie (dus wel want omdat voorstel 1 toegepast mag worden wordt een duidelijke hiërarchie aangebracht).
- Heel veel mogelijke categorievermeldingen per pagina (dit binnen redelijkheid).
- Er ontstaan nog veel meer categorieën dan bij ieder van de andere voorstellen.
Een atoomfysicus uit de Jordaan (in Amsterdam) in de 50-er jaren komt dus in de categorieen:
- {natuurkundige} {Amsterdam}, {jaren-50}, {Nederlands persoon}, {Jordaans persoon}, {atoomfysicus}, {atoomfysicus uit de Jordaan, 50-er jaren}, {jaren-50, Jordaans atoomfysicus}, {atoomfysicus, jaren-50, Jordaans} (van de laatste opties wordt er waarschijnlijk maar 1 toegepast 'natuurlijk' - maar welke? ) enz.
[bewerk] Aansluiten op wetenschappelijke literatuur (V)
Een schrijver van een wetenschappelijk artikel geeft zelf aan welke sleutelwoorden aan het begin van de publikatie moeten komen. Alle bibliotheek beheersystemen (ontsluitingsystemen) en zoekstructuren zijn hierop ingericht.
Het doel is te streven naar een beperkt aantal in het stramien passende sleutelwoorden per artikel
[bewerk] voordelen
- Uitgangspunten van Wikipedia - iedereen is vrij, er wordt niets voorgeschreven - worden geen geweld aangedaan.
- Aansluiting bij bestaande systemen.
[bewerk] nadelen
- Onduidelijkheid over mogelijk te gebruiken sleutelwoorden (kiezen uit een lijst?).
- Categorisatie hierarchie wordt niet gebruikt.
Voorbeeld: een biografie over een atoomfysicus uit de Jordaan (in Amsterdam) in de 50-er jaren. Sleutelwoorden hier zijn: atoomfysicus, 1954 en Amsterdam. Dan krijgt dit artikel de categorieën:
- {Atoomfysicus}, {1954} en {Amsterdam}.
[bewerk] Categorieën niet gebruiken (VI)
Aangezien het categoriseren zoveel problemen met zich mee brengt is het verstandiger het categorisatiemechanisme maar helemaal niet te gebruiken.
[bewerk] voordelen
- Geen oeverloze discussies.
- Geen inconsistente en onoverzichtelijke navigatiestructuur.
- Minder 'gekke' dingen die een barrière opwerpen voor nieuwe en minder ervaren gebruikers.
[bewerk] nadelen
- Mogelijke structurering / navigatie dus ook niet mogelijk.
Een biografie over een atoomfysicus uit de Jordaan (in Amsterdam) in de 50-er jaren. krijgt dus geen enkele categorie.
[bewerk] Categorieën alleen te gebruiken door degenen die er geen problemen bij maken (VII)
Aangezien het categoriseren zoveel problemen met zich mee brengt is het verstandiger het categorisatiemechanisme alleen te laten gebruiken door mensen die er probleemloos mee kunnen omgaan en door de mensen die er wel de zin van inzien.
[bewerk] voordelen
- Geen oeverloze discussies.
- Structuren ontstaan vanzelf, zoals de rest van wikipedia ook organisch groeit.
- Mensen die niet met de ontstane chaos kunnen omgaan, worden er ook niet mee geconfronteerd, omdat zij het fenomeen categorisatie verder dienen te negeren.
- De mensen die niet meedoen aan deze discussie kunnen rustig doorwerken (maar dat doen ze toch al wel, zoals een ieder kan zien).
- Aan deze mensen wordt niet de mening van anderen opgelegd.
- Er ontstaat een aantrekkelijke en complexe takkenbos van categorieen en verschillende "wegen die naar Rome leiden".
[bewerk] nadelen
- Er ontstaat een onaantrekkelijke en ontontwarbare wilde takkenbos.
- Zoekers naar een strakke structuur gaan misschien afhaken (dat is serieus een ernstig nadeel).
Een biografie over een atoomfysicus uit de Jordaan (in Amsterdam) in de 50-er jaren kan in allerhande categorieen belanden bijvoorbeeld:
- {Man}, {Nederlands persoon}, {20e eeuw}, {Atoomfysicus}, {Jordaan}, {Natuurkundige} {Nederlands Natuurkundige} enz.