Internet Archive
Van Wikipedia
De Internet Archive (Nederlands: het internetarchief) is een website en project met als doel om een archief bij te houden van het internet. Het project is begonnen door Brewster Kahle in 1996 en is gevestigd in het Presidio van San Francisco, Californië, Verenigde Staten.
Inhoud |
[bewerk] Collectie
De collectie omvat:
- Kopieën van websites op het World Wide Web (Wayback Machine)
- Films
- Geluidsopnames, vrijwel alleen opnames van liveconcerten van bands die dit toestaan
- Boeken
- Software
[bewerk] Wayback Machine
Het archief onderhoudt ook de Wayback Machine, met inhoud die gedoneerd wordt door Alexa Internet. Nadat een gebruiker een URL opgeeft, zorgt deze machine voor gearchiveerde versies van de website, door de jaren heen. Het archief wacht altijd zes maanden alvorens pagina's online te zetten.
De naam Wayback Machine komt uit een tekenfilmserie, genaamd Rocky and Bullwinkle Show. De hond Mr. Peabody en zijn assistent, een jongen genaamd Sherman, gebruiken een tijdmachine, genaamd de Wayback Machine om beroemde gebeurtenissen uit het verleden te bezoeken.
Zie onder externe links voor enkele voorbeelden.
[bewerk] Omvang en opslag
De totale omvang van het archief bedroeg in 2003 ongeveer 100 terabyte aan gegevens, met een groeicijfer van 12 terabyte per maand. In 2004 bereikte het een grootte van meer dan een petabyte, met een groeicijfer van 20 terabyte per maand. Dit is inclusief 40 miljard webpagina's. Een kopie van de gegevens wordt ook bijgehouden in de Bibliotheca Alexandrina in het Egyptische Alexandrië.
[bewerk] Licenties
Het meeste van hun films, boeken en geluidsopnames vallen onder het publieke domein of vallen onder de Creative Commonslicentie. De geluidssectie omvat grotendeels muziek van onafhankelijke artiesten, maar ook van meer bekendere namen, die een open beleid voeren ten aanzien van geluidsopnames van hun concerten, zoals bijvoorbeeld de Grateful Dead.
[bewerk] Controverse
[bewerk] Verwijdering van Scientologysites
Eind 2002 verwijderde de Internet Archive verschillende websites uit de Wayback Machine die kritisch waren ten aanzien van Scientology.
De foutboodschap die men kreeg, wanneer een gearchiveerde versie van de verwijderde website werd opgevraagd, liet blijken dat dit op verzoek van de website zelf was. Later werd echter opgehelderd dat advocaten van de Scientologykerk geëist hadden dat het materiaal moest worden verwijderd en dat de websites zelf helemaal niet hadden gevraagd om verwijdering.
[bewerk] Ongevraagd kopiëren
Critici wijzen op het gegeven dat de Internet Archive ongevraagd kopieën maakt van websites die niet onder een vrije licentie vallen (zoals bijvoorbeeld het publieke domein of Creative Commons). Als reactie wijst Internet Archive er op dat de opgeslagen gegevens altijd op verzoek van de websites zelf verwijderd kunnen worden of dat websites met behulp van robots.txt de toegang voor Internet Archive kunnen blokkeren.
[bewerk] Externe links
[bewerk] Algemeen
- Internet Archive (Engels)
- European Archive
- Kopie van de Internet Archive in de Bibliotheca Alexandrina (Engels)