Dit project wordt uitgevoerd door wetenschappers aan de Universiteit van Amsterdam (bij Informatica en Archiefwetenschappen), in het kader van een NWO Access project naar het toegankelijk maken informatie van lagere overheden.
Voor een lijst van alle publicaties over ons project, zie deze pagina.
De zoekmachine voor de Woo dossiers is mogelijk gemaakt door een groot aantal mensen en instanties. We bedanken die hier.
Het zoeksysteem is ontworpen door Maarten Marx en Jaap Kamps, en gebouwd door Maik Larooij en Maarten Marx. De computer waar Woogle op draait heet ehumanities en is beschikbaar gesteld door de Faculteit der Geesteswetenschappen van de Universiteit van Amsterdam.
Financieƫl is dit project mogelijk gemaakt door een NWO ACCESS beurs (nummer CISC.CC.016), door de Universiteit van Amsterdam via het Humane AI programma, en door een beurs van Amsterdam Data Science samen met de Vereniging voor Statenleden. Maarten Marx werkt bij het IRLab van het Informatica Instituut aan de Universiteit van Amsterdam. Jaap Kamps is verbonden aan de Faculteit Geesteswetenschappen, ook aan de UvA.
Wetenschappelijk en strategisch advies hebben we gekregen van Maarten de Rijke, Evangelos Kanoulas, Andrew Yates en Charles Juergens, alle van de Universiteit van Amsterdam.
Verschillende maatschappelijke organisaties hebben ons enorm gesteund. Guido Enthoven van het IMI gaf strategisch advies en legde enorm veel waardevolle contacten. De eerste data in Woogle waren de 1000+ Woo-dossiers uit het Ondraagelijk Traag rapport van IMI en de Openstate Foundation. Jeroen Jonkers van de VNG zorgde voor tamtam en enthousiasme bij Woo-coordinatoren. Johan Schuijt en Dimitri Tokmetizis van FTM gaven ons waardevolle data en boden een mooie stageplek.
Grote dank gaat ook uit naar alle studenten die in 2022 meewerkten en met wie het heerlijk was om de wetenschappelijke uitdagingen die de Woo dossiers bieden aan te pakken. Ruben van Heusden, aio op ons NWO project, werkte samen met Fajar Fathurrahman, Warrunny Alappatt Jackson, Pepijn Groenen, Jialin Li, Sang Pham Minh, Stefan Dijkstra, en Lukas Busch aan het probleem van het weer netjes opknippen van de aan elkaar geplakte vrijgegeven documenten. Maik Larooij bekeek de Woo dossiers vanuit het FAIR data perspectief en stelde een simpel maar doeltreffend metadata schema voor, dat de basis werd van onze infobox. Fajar Fathurrahman heeft uitgezocht hoe we het best en snelst optische karakter herkenning (OCR) konden uitvoeren. JuliƔn Venhuizen en Xu Shan Jiang werkten aan het automatisch maken van een infobox bij een dossier op basis van de besluitbrief. Ammar Alhashmi en Roderick Majoor zorgden dat we vast kunnen stellen hoeveel en wat voor soort informatie er is weggelakt. Yunus Demir en Chaim Elchik probeerden automatisch Woo-dossiers op te halen, wat erg vaak niet mogelijk bleek. Filipp Peresadilo maakte een eerste zoekmachine voor Woo dossiers speciaal gemaakt voor onderszoeksjournalisten. Justin Bon en Rick Straathof werkten aan een methode die automatisch vrijgegeven documenten kon classificeren.
Sponsoren: