About

Het doel van Woogle is om overheidsinformatie vindbaar, goed toegankelijk en herbruikbaar te maken. Woogle biedt één platform waar alle documenten die vrijgegeven zijn onder de Wet open overheid (Woo), uit alle informatiecategorieën en alle bestuursorganen, makkelijk en snel te vinden zijn. Woogle probeert op het moment van toevoegen van een documentsoort van een bestuursorgaan compleet te zijn. Het actueel houden van data is daarbij alleen mogelijk voor bestuursorganen die bij ons aangesloten zijn. Waar mogelijk verwijst Woogle naar de documenten bij de bestuursorganen. Is dat niet mogelijk, dan toont Woogle ze zelf.

Ons wetenschappelijk onderzoek heeft twee diepere doelen:

Het helpen van (vooral lagere) bestuursorganen om hergebruik van geopenbaarde stukken mogelijk en makkelijk te maken.
Het verbeteren de digitale duurzaamheid van overheidsinformatie; zodat stukken nu én in de (verre) toekomst makkelijk en snel (terug) te vinden zijn.

Context

Dit project wordt uitgevoerd door wetenschappers aan de Universiteit van Amsterdam (Informatica en Archiefwetenschappen), in het kader van verschillende NWO projecten naar het (beter) toegankelijk maken van overheidsinformatie.

Contact

Wij verwelkomen graag bestuursorganen die zich willen aansluiten bij Woogle. Voor vragen of anderszins, kan contact worden opgenomen met Maarten Marx via maartenmarx@uva.nl.

Publicaties

Voor een lijst van alle publicaties over ons project, zie deze pagina.

Privacy en persoonsgegevens.

Stukken vindbaar via Woogle kunnen (uw) persoonsgegevens bevatten. Als dat het geval is en u denkt dat dat niet terecht is raden wij aan contact op te nemen met het bestuursorgaan dat de stukken gepubliceerd heeft. Die kan dan actie ondernemen, en desgewenst ook ons benaderen via een verzoek om een document te verwijderen. Woogle volgt het privacy beleid van de Universiteit van Amsterdam.

Colofon Wooverheid

Deze zoekmachine voor overheidsinformatie die onder de Woo valt is mogelijk gemaakt door een groot aantal mensen en instanties:

Het zoeksysteem is ontworpen door Maarten Marx en Jaap Kamps, en ontwikkeld door Maik Larooij en Maarten Marx. Woogle draait op verschillende computers, onder andere beschikbaar gesteld door SURF met subsidie van NWO en de Faculteit der Geesteswetenschappen en de Faculteit der Natuurwetenschappen, Wiskunde en Informatica van de Universiteit van Amsterdam.

De start van dit project is financieël mogelijk gemaakt door een NWO ACCESS beurs (nummer CISC.CC.016), door de Universiteit van Amsterdam via het Humane AI programma, en door een beurs van Amsterdam Data Science. Later hebben nog veel meer organizaties bijgedragen, zie hun logo's onder aan deze pagina.

Maarten Marx is werkzaam bij het IRLab van het Informatica Instituut aan de Universiteit van Amsterdam. Jaap Kamps is verbonden aan de Faculteit Geesteswetenschappen van de UvA en het Institute for Logic, Language and Computation (ILLC). Beide werken in Lab42 op het Science Park in Amsterdam.

Wetenschappelijk en strategisch advies is gekregen van Maarten de Rijke, Evangelos Kanoulas, Andrew Yates en Charles Juergens, allen werkzaam aan de Universiteit van Amsterdam.

2025

Sinds 1 december 2024 is Woogle onderdeel van het opengov ICAI lab, een samenwerking tussen de Rijksorganisatie voor Informatiehuishouding (RvIHH) en de Universiteit van Amsterdam.

Lente

Dit jaar werken weer een aantal studenten aan onderzoek gerelateerd aan de Woo, informatiehuishouding en AI. Jan Hutter zoekt uit hoe Retrieval Augmented Generation (RAG) ingezet kan worden om direct vragen te stellen aan een Woo dossier. Zijn werk staat bekend onder de naam "Chatten met een Woo dossier". Martijn Bakker probeert PDF documenten die niet aan de WCAG toegankelijkheidseisen voldoen om te zetten naar wel toegankelijke HTML documenten. Gregory Slager doet hier meer theoretisch onderzoek naar. Floris Bos doet een stage bij de Open State Foundation en helpt mee met het verbeteren van OpenRaadsinformatie. Haady Hassan doet een stage bij het ACOI en onderzoekt de rol van overleg in het proces van het beantwoorden van een Woo-verzoek. Jasper Hoogenhout doet een stage bij de Woo-afdeling van de UvA. David Kraakman en Daniël Drucker proberen met AI allerlei met naam genoemde entiteiten in Woo documenten te herkennen en die te linken naar hun homepage en daarmee een netwerk van verbonden personen en organisaties op te bouwen.

2024

In 2024 is Woogle mede mogelijk gemaakt door een NWO subsidie in het kader van het Open Science Fund en een subsidie van het Actieplan Open Overheid (OGP), en twee onderzoeksgrants van de Maatschappelijke Coalitie Over Informatie Gesproken.

Lente

Ook deze lente hadden we weer een geweldig team van studenten die hun scriptie schreven over Woogle-gerelateerde zaken. Daar gaan we. Pepijn van Wijk (Bachelor (BSc) Informatica) heeft een systeem gemaakt om te zoeken in videotulen. Dat zijn videos van raadsvergaderingen. Gerda Viira (MSc Information Studies) heeft gekeken welke landen in Europa ook zo mooi als Nederland hun documenten actief of passief openbaar maken. Dat viel zwaar tegen. Alleen in Estland kon ze materiaal (heel veel en in een eigen formaat) vinden. Een groot deel daarvan staat ook op Woogle. Roland van Paridon en Justin Wong werkten aan gepersonaliseerde Woogle's: toegesneden op één gemeente, en helemaal in hun eigen huisstijl. Wim Pilkes (MSc Data Science) hielp Haarlem in de keuze voor een eigen zoekmachine, en vergeleek hippe chatGPT achtige systemen gebaseerd op LLM's met "ouderwetse" traditionele Google achtige systemen als Woogle. Jasper Hoogenhout (BSc Informatiekunde) onderzocht de Woo-index, en de mogelijkheden om die te gebruiken om Woogle te vullen. En dan hadden we nog voor 5 van de 17 informatiecategorieën in de Woo een eigen scriptie. Harry Nan (Msc Data Science) keek samen met Prof Johan Wolswinkel naar de beschikkingen; Sander Oud (Msc Data Science) probeerde alle convenanten te verzamelen; Martijn Bakker (BSc Informatiekunde) deed hetzelfde voor adviezen van adviescolleges. Een flink deel daarvan staan nu in Woogle. Ondertussen haalden we ook nog wat onderzoeksrapporten op. Pascal Venema (BSc Informatiekunde) ging, in een stage bij KOOP, de handelingen automatisch koppelen aan Kamerstukken. Thom van der Ent (BSc Informatiekunde) onderzocht de (on)volledigheid van openraadsinformatie.nl door de stukken die daar staan te vergelijken met wat hij bij alle (meer dan 200) iBabs en Notubiz gemeentes kon ophalen. Meer over hun werk en hun scripties is te vinden op de wooverheid blog.

2023

In 2023 is dit project mede mogelijk gemaakt door het Netherlands eScience Center onder subsidienummer NLESC.SSIH.2022a.008. Surf heeft een machine beschikbaar gesteld waarop de ElasticSearch zoekmachine draait (INF-5788 Woogle). Het ACOI en het Actieplan Open Overheid (OGP) steunen ons onderzoek naar het FAIR publiceren van stukken onder de Woo.

Zomer

In 2023 werkte Laura Ootes (NLeSC) aan een nieuwe zoekmachine voor Woogle, met Elasticsearch als back-end. Een groot aantal scripties hebben een bijdrage geleverd aan de data: Ramon Duursma analyseerde de bereikbaarheidsgegevens en de Woo-index, en breidde Woogle uit met enorm veel publiek beschikbare persoonsgegevens; Anne van Muscher maakte Wooverhaal, Lars Nelissen onderzocht de digitale toegankelijkheid van de PDFs, en Femke Bakker haalde met ChatGPT de tijdslijnen uit de Woo-besluit brieven. Aron de Ruyter verbeterde de zwartlak detector. Maurice Silverio maakte een zoekmachine voor Videotulen. Xu Shan Jiang ontwierp een prive mini Woogle. Hazel Ling en Oumayma Salma El Kadi werkten aan een handige manier om OCR fouten in een PDF op te sporen. Al deze scripties zijn terug te vinden op de scriptiebank van de UvA.

Herfst

Ramon Duursma heeft gewerkt aan het verzamelen van beschikkingen, de Handelingen der Staten Generaal, en de raadsverslagen. Nazli Aydin heeft de zbo's geanalyseerd. Gregory Slager werkte bij de Provincie Zuid Holland aan een systeem van sjablonen voor Woo-besluiten en beschikkingen. Lars Nelissen, Lars Reddering en Gensi Eugenia werkten aan het repareren van PDFs en het maken van toegankelijke HTML versies. Roy Duineveld en Lennaert Feijtes lieten zien dat text redaction (het weglakken van bepaalde stukjes tekst) goed en veilig direct in een digitaal PDF bestand kan. Joran Verweij hielp OpenState en IMI bij het opstellen van hun jaarlijkse rapport over de doorlooptijden van Woo-verzoeken door automatisch verzoek- en besluit-datums en allerlei andere gegevens uit de Woo-besluiten te halen.

2022

Verschillende maatschappelijke organisaties hebben ons enorm gesteund. Guido Enthoven van het IMI gaf strategisch advies en legde enorm veel waardevolle contacten. De eerste data in Woogle waren de 1000+ Woo-dossiers uit het Ondraaglijk Traag rapport van IMI en de Openstate Foundation. Jeroen Jonkers van de VNG heeft geholpen om Woo-coördinatoren enthousiast te maken voor dit project. Johan Schuijt en Dimitri Tokmetizis van FTM leverde waardevolle data aan en boden een mooie stageplek.

Grote dank gaat ook uit naar alle studenten die in 2022 meewerkten en de wetenschappelijke uitdagingen die de Woo-dossiers bieden aanpakten. Ruben van Heusden, aio op ons NWO project, werkte samen met Fajar Fathurrahman, Warrunny Alappatt Jackson, Pepijn Groenen, Jialin Li, Sang Pham Minh, Stefan Dijkstra, en Lukas Busch aan het probleem van het weer netjes opknippen van de aan elkaar geplakte vrijgegeven documenten. Maik Larooij bekeek de Woo-dossiers vanuit het FAIR data perspectief en stelde een simpel maar doeltreffend metadata schema voor, dat de basis werd van onze infobox. Fajar Fathurrahman heeft uitgezocht hoe we het best en snelst optische karakter herkenning (OCR) konden uitvoeren. Julián Venhuizen en Xu Shan Jiang werkten aan het automatisch maken van een infobox bij een dossier op basis van de besluitbrief. Ammar Alhashmi en Roderick Majoor zorgden dat we vast kunnen stellen hoeveel en wat voor soort informatie er is weggelakt. Yunus Demir en Chaim Elchik probeerden automatisch Woo-dossiers op te halen, wat erg vaak niet mogelijk bleek. Filipp Peresadilo maakte een eerste zoekmachine voor Woo-dossiers speciaal gemaakt voor onderzoeksjournalisten. Justin Bon en Rick Straathof werkten aan een methode die automatisch vrijgegeven documenten kon classificeren.

Sponsoren: