alle Woo-documenten van 1000+ bestuursorganen vindbaar op één plek

About


Het doel van deze Woogle is om overheidsinformatie herbruikbaar te maken. Woogle is één plek waar alle documenten die vrijgegeven zijn onder de Wet open overheid (Woo), uit alle informatiecategorieën en alle bestuursorganen, makkelijk en snel te vinden zijn. Woogle probeert op het moment van toevoegen van een documentsoort van een bestuursorgaan compleet te zijn. Het actueel houden van data is daarbij alleen mogelijk voor bestuursorganen die bij ons aangesloten zijn. Waar mogelijk verwijst Woogle naar de documenten bij de bestuursorganen. Is dat niet mogelijk, dan toont Woogle ze zelf.

Ons wetenschappelijk onderzoek heeft twee diepere doelen:

  1. Het helpen van (vooral lagere) bestuursorganen om hergebruik van geopenbaarde stukken mogelijk en makkelijk te maken.
  2. Het verbeteren de digitale duurzaamheid van overheidsinformatie; zodat stukken nu én in de (verre) toekomst makkelijk en snel (terug) te vinden zijn.

Context

Dit project wordt uitgevoerd door wetenschappers aan de Universiteit van Amsterdam (Informatica en Archiefwetenschappen), in het kader van een NWO Access project naar het toegankelijk maken van informatie van lagere overheden.

Contact

Wij verwelkomen graag bestuursorganen die zich willen aansluiten bij Woogle. Voor vragen of anderszins, kan contact worden opgenomen met Maarten Marx via maartenmarx@uva.nl.

Publicaties

Voor een lijst van alle publicaties over ons project, zie deze pagina.

Privacy en persoonsgegevens.

Stukken vindbaar via Woogle kunnen (uw) persoonsgegevens bevatten. Als dat het geval is en u denkt dat dat niet terecht is raden wij aan contact op te nemen met het bestuursorgaan dat de stukken gepubliceerd heeft. Die kan dan actie ondernemen, en desgewenst ook ons benaderen via een verzoek om een document te verwijderen. Woogle volgt het privacy beleid van de Universiteit van Amsterdam.

Colofon Wooverheid

Deze zoekmachine voor Woo-dossiers is mogelijk gemaakt door een groot aantal mensen en instanties:

Het zoeksysteem is ontworpen door Maarten Marx en Jaap Kamps, en ontwikkeld door Maik Larooij en Maarten Marx. De computer waar Woogle op draait heet ehumanities en is beschikbaar gesteld door de Faculteit der Geesteswetenschappen van de Universiteit van Amsterdam.

Financieel is dit project mogelijk gemaakt door een NWO ACCESS beurs (nummer CISC.CC.016), door de Universiteit van Amsterdam via het Humane AI programma, en door een beurs van Amsterdam Data Science samen met de Vereniging voor Statenleden. Maarten Marx is werkzaam bij het IRLab van het Informatica Instituut aan de Universiteit van Amsterdam. Jaap Kamps is verbonden aan de Faculteit Geesteswetenschappen van de UvA.

Wetenschappelijk en strategisch advies is gekregen van Maarten de Rijke, Evangelos Kanoulas, Andrew Yates en Charles Juergens, allen werkzaam aan de Universiteit van Amsterdam.

2022

Verschillende maatschappelijke organisaties hebben ons enorm gesteund. Guido Enthoven van het IMI gaf strategisch advies en legde enorm veel waardevolle contacten. De eerste data in Woogle waren de 1000+ Woo-dossiers uit het Ondraaglijk Traag rapport van IMI en de Openstate Foundation. Jeroen Jonkers van de VNG heeft geholpen om Woo-coördinatoren enthousiast te maken voor dit project. Johan Schuijt en Dimitri Tokmetizis van FTM leverde waardevolle data aan en boden een mooie stageplek.

Grote dank gaat ook uit naar alle studenten die in 2022 meewerkten en de wetenschappelijke uitdagingen die de Woo-dossiers bieden aanpakten. Ruben van Heusden, aio op ons NWO project, werkte samen met Fajar Fathurrahman, Warrunny Alappatt Jackson, Pepijn Groenen, Jialin Li, Sang Pham Minh, Stefan Dijkstra, en Lukas Busch aan het probleem van het weer netjes opknippen van de aan elkaar geplakte vrijgegeven documenten. Maik Larooij bekeek de Woo-dossiers vanuit het FAIR data perspectief en stelde een simpel maar doeltreffend metadata schema voor, dat de basis werd van onze infobox. Fajar Fathurrahman heeft uitgezocht hoe we het best en snelst optische karakter herkenning (OCR) konden uitvoeren. Julián Venhuizen en Xu Shan Jiang werkten aan het automatisch maken van een infobox bij een dossier op basis van de besluitbrief. Ammar Alhashmi en Roderick Majoor zorgden dat we vast kunnen stellen hoeveel en wat voor soort informatie er is weggelakt. Yunus Demir en Chaim Elchik probeerden automatisch Woo-dossiers op te halen, wat erg vaak niet mogelijk bleek. Filipp Peresadilo maakte een eerste zoekmachine voor Woo-dossiers speciaal gemaakt voor onderzoeksjournalisten. Justin Bon en Rick Straathof werkten aan een methode die automatisch vrijgegeven documenten kon classificeren.

2023

In 2023 is dit project mede mogelijk gemaakt door het Netherlands eScience Center onder subsidienummer NLESC.SSIH.2022a.008. Surf heeft een machine beschikbaar gesteld waarop de ElasticSearch zoekmachine draait (INF-5788 Woogle). Het ACOI en het Actieplan Open Overheid (OGP) steunen ons onderzoek naar het FAIR publiceren van stukken onder de Woo.

In 2023 werkte Laura Ootes (NLeSC) aan een nieuwe zoekmachine voor Woogle, met Elasticsearch als back-end. Een groot aantal scripties hebben een bijdrage geleverd aan de data: Ramon Duursma analyseerde de bereikbaarheidsgegevens en de Woo-index, en breidde Woogle uit met enorm veel publiek beschikbare persoonsgegevens; Anne van Muscher maakte Wooverhaal, Lars Nelissen onderzocht de digitale toegankelijkheid van de PDFs, en Femke Bakker haalde met ChatGPT de tijdslijnen uit de Woo-besluit brieven. Aron de Ruyter verbeterde de zwartlak detector. Maurice Silverio maakte een zoekmachine voor Videotulen. Xu Shan Jiang ontwierp een prive mini Woogle. Hazel Ling en Oumayma Salma El Kadi werkten aan een handige manier om OCR fouten in een PDF op te sporen. Al deze scripties zijn terug te vinden op de scriptiebank van de UvA.


Sponsoren: