Het #everynamecounts-project van Arolsen Archives gebruikt kunstmatige intelligentie om informatie te vinden over slachtoffers van nazi-vervolging

Het Arolsen Archief is het internationale centrum voor nazi-vervolging met ’s werelds meest uitgebreide archief over de slachtoffers en overlevenden van het nationaal-socialisme. De collectie bevat informatie over ongeveer 17,5 miljoen mensen en behoort tot UNESCO’s Memory of the World. Het bevat documenten over de verschillende slachtoffergroepen die het doelwit waren van het naziregime en is een belangrijke bron van kennis voor de huidige samenleving. Het Arolsen-archief bewaart ’s werelds grootste verzameling documenten over nazi-vervolging – 110 miljoen documenten en digitale objecten, waarvan een deel deel uitmaakt van UNESCO’s Memory of the World-programma – om de herinnering aan de misdaden van het Duitse terreurregime levend te houden. Een essentieel onderdeel van het werk van het Archief is om deze documenten toegankelijk te maken voor iedereen die wil zoeken naar sporen van Holocaustslachtoffers en -overlevenden, vervolging van minderheden en dwangarbeid.

Elk document dat in de archieven wordt bewaard, moet worden gecontroleerd en de informatie (bijvoorbeeld de familienaam en geboortedatum op een registratieformulier voor gevangenen) moet in een database worden gezet. Om dit proces te vergemakkelijken, heeft het Arolsen-archief “#everynamecounts” opgezet, een crowdsourcing project voor vrijwilligers om handmatig informatie uit documenten te extraheren.

Het handmatig vertalen, lezen, transcriberen, catalogiseren en valideren van deze documenten kan tientallen jaren duren. Elk document wordt onafhankelijk geïndexeerd door drie vrijwilligers en, als de ingangen niet overeenkomen, op juistheid beoordeeld door een medewerker van Arolsen Archives. In feite kunnen er maximaal vier mensen nodig zijn om vier documenten in één uur te indexeren en te valideren.

Een team van vrijwilligers van Accenture (NYSE: ACN) heeft een op kunstmatige intelligentie (AI) gebaseerde oplossing gebouwd die helpt om informatie over slachtoffers van nazi-vervolging 40 keer sneller uit documenten in de Arolsen-archieven te halen dan eerdere inspanningen.

Ian Lever, een Accenture-vrijwilliger en lid van de Jewish Employee Resource Group van het bedrijf, realiseerde zich al snel dat AI dit proces aanzienlijk zou kunnen versnellen. Binnen 10 weken zette hij samen met andere Accenture-vrijwilligers een AI-oplossing op om de documenten te indexeren. Omdat de AI de informatie sneller vastlegt en de nauwkeurigheid verhoogt, kunnen vier vrijwilligers nu ongeveer 160 documenten in één uur valideren, een 40-voudige toename van de productiviteit.

In samenwerking met het Solutions.AI-team van Accenture hebben de vrijwilligers een bestaande Accenture AI-oplossing geconfigureerd, die gebruikmaakt van optische tekenherkenning en machine learning-technologie. Het indexeert documenten die bijzonder moeilijk en vervelend zijn om voor mensen te extraheren. Deze omvatten gevangenen- en transferlijsten met tientallen rijen, concentratiekamprecords en traceerdocumenten, dit zijn vragen over de locaties en het lot van familieleden en geliefden.

Hoewel de AI het zware werk doet, blijft menselijk toezicht op het proces belangrijk, niet alleen om de nauwkeurigheid te garanderen, maar ook om de AI-oplossing te laten leren. Door informatie te bekijken en te corrigeren, “leren” vrijwilligers de oplossing om handschrifttekens en afkortingen te herkennen die typisch waren voor die tijd. Dankzij hun input heeft de AI zijn precisie geleidelijk met 10% verbeterd binnen het formulierveld van ‘moeders achternaam’. Voor het veld “religie” werkt de AI nu met een betrouwbaarheid van 99%.

Sinds Accenture de AI-oplossing in december 2021 implementeerde heeft deze AI-techniek meer dan 160.000 namen van slachtoffers van nazi-vervolging geïndexeerd, informatie uit meer dan 18.000 documenten gehaald en meer dan 60.000 documenten geclusterd in vergelijkbare groepen om identificatie en analyse te verbeteren.

Tot op heden hebben meer dan 950 Accenture-mensen zich vrijwillig aangemeld voor het project, waarbij Accenture ook het onderhoud en de verdere ontwikkeling van de AI-oplossing ondersteunt.

“We zijn overweldigd door het aantal vrijwilligers dat ons ondersteunt bij het digitaliseren van ons archief.  Onze samenwerking met het Accenture-team is uitmuntend. Het is fantastisch dat er nu een digitale oplossing is om de inhoud van documenten sneller vast te leggen, waardoor belangrijkere informatie over het lot van slachtoffers van nazi-vervolging vindbaar is in ons online archief.” Accenture is een wereldwijd bedrijf voor professionele dienstverlening met toonaangevende mogelijkheden op het gebied van digitaal, cloud en beveiliging.

Dit  is een voorbeeld project. Binnen kort kunnen met deze technieken heel wat getypte en handgeschreven documenten worden gedigitaliseerd. In Nederland werd op overeenkomstige wijze het VOC-archief gedigitaliseerd en is via internet nu te bestuderen.