Wikidata - een vrije databank
Wikidata speelt een centrale rol als collaboratieve, meertalige databank. Wikidata is een implementatie van Wikibase, een databank ontwikkeld door Wikimedia Duitsland in 2012. Het heeft geen fysiek, noch intrinsiek logisch datamodel. Het is een triplestore, een enkele tabel met 3 kolommen. Het datamodel wordt door de projectcoördinator of de gemeenschap van gebruikers impliciet gedefinieerd op basis van de hiërarchie van statements dat de relatie tussen entiteiten bepaalt. Een statement is een predicaat, bewering, of verklaring waarmee de relatie, via een property, tussen een subject en een object of waarde wordt beschreven.
Structuur
[edit]Objecten (entities, items) en eigenschappen (properties) worden voorgesteld door een uniek intern ID. Object-identifiers hebben een Q-prefix, properties krijgen een P-prefix. Voorbeeld: De geboorteplaats (P19) “Vilvoorde” (Q318418) van Alexander De Croo (Q476596) wordt voorgesteld als: Q476596 P19:Q318418 (bemerk de 3 kolommen).
Aan een Wikidata-record kan je ook mediabestanden in Wikimedia Commons koppelen, b.v. de foto (P18) van een persoon. Wikipedia-pagina’s in de verschillende talen over hetzelfde onderwerp worden als sitelinks gekoppeld via een uniek Q-nummer, waardoor een Wikipedia-lezer gemakkelijk kan doorklikken tussen de pagina’s in de verschillende talen “lees dit artikel in een andere taal”. De inhoud van iedere Wikipedia-taal wordt onafhankelijk opgebouwd door de gemeenschap van vrijwilligers, voor die taal.
Zowel Wikibase, de Wikidata toepassing, als de item- en property labels zijn volledig meertalig. Iedereen kan er items, zoals personen, toevoegen die worden geïdentificeerd met een unieke en permanente Wikidata ID. Alle data wordt gepubliceerd onder een CC0-licentie.
Cultureelerfgoedorganisaties en -aggregatoren zoals ODIS kunnen authority data aan Wikidata toevoegen dat verwijst naar hun eigen permanente identifier, via een permalink dat gebruik maakt van de URI-techniek, waardoor Wikidata een hub vormt die informatie verbindt en gebruikers toeleidt naar andere databronnen. Het linked open data (LOD) systeem is gebaseerd op het vijf sterren model van Tim Berners-Lee (2010).
Vrouwen van papier
[edit]Bij de start van Vrouwen van papier was het de bedoeling om data te delen via de wiki-platformen. Oorspronkelijk richtte het project zich op Wikipedia, maar onder impuls van meemoo situeerde de grootste bijdrage zich uiteindelijk in Wikidata. Wikidata laat toe om veel meer gegevens op een gestandaardiseerde en digitale manier te documenteren; een encyclopedie bevat in principe vooral tekst. Wikidata is machine-leesbaar via de RDF techniek en via diverse platformen zoals b.v. OpenRefine. Wikidata Query, Pywikibot, ListeraBot en vele andere.
Het Gezellearchief bezorgde de data uit het persoonsregister aan meemoo, die instond voor de import in Wikidata. Meemoo maakte gebruik van OpenRefine om de data voor te bereiden, maar de import bleef deels ook manueel werk. Tijdens het invoeren werd beslist om alle personen uit de registers mee te nemen, dus niet alleen vrouwen, vanwege de sterke onderlinge relaties in het netwerk van Gezelle. Zo werden meer dan 120.000 wijzigingen of aanvullingen (edits) in ruim 3000 Wikidata-lemma’s (records) uitgevoerd. Een aantal bewerkingen werden automatisch gedaan via Pywikibot scripts door het combineren van Wikidata, (Structured data on) Wikimedia Commons en Wikipedia.
Studenten van de Universiteit Gent, Humane wetenschappen, hebben een analyse gedaan over de personen en de brieven van en naar Guido Gezelle, gebruik makende van AI technieken om b.v. gevoelens te detecteren (woede, angst, verwondering, onzekerheid interesse).
Voordelen van Wikidata
[edit]- De collectie van een instelling wordt gemakkelijker vindbaar.
- De collectiebeheerder wordt aangespoord om een passend datamodel op te stellen, afhankelijk van de beschikbare metadata en de gedefinieerde properties in Wikidata. Indien nodig kunnen nieuwe Wikidata eigenschappen worden aangemaakt. Dit resulteert in flexibiliteit langs de kant van de collectie en Wikidata. De collectiebeheerder beslist welke data publiek wordt vrijgegeven.
- Wikidata Query beschikt over functionaliteiten om gegevens overzichtelijk te presenteren als een tabel, een graph, een geografische kaart, of een lijst van afbeeldingen.
- Ontbrekende Wikipedia-pagina’s schrijven of vertalen, wordt vereenvoudigd. Wikipedia heeft een ingebouwde vertaaltool.
- Het nodigt instellingen uit om na te denken over een gepaste licentie om vrije kennis kenbaar te maken.
- Wikidata is eenvoudig in alle richtingen te koppelen met Wikipedia en Wikimedia Commons (dat zijn eigen Wikibase heeft om de metadata van de media-bestanden te beschrijven).