fbpx

Case: Ongestructureerde data aanvullen met Machine Learning

Waarborgen B.V. houdt zich bezig met het koppelen van GPS-locaties aan ongevallen die gemeld worden bij meldkamers in Nederland. Op die manier kunnen zij een “heatmap” aan de overheid presenteren van alle gemelde ongevallen in Nederland.

Om de anonimiteit van onze klant te waarborgen, wordt in deze casus een andere tenaamstelling gebruikt.

1
het probleem

Het probleem waarmee Waarborgen B.V. bij ons op de deur klopte is het volgende. Waarborgen B.V. krijgt data van de meldkamer. Zij moeten die meldingen handmatig verwerken en GPS-locaties, buurt-, wijk- en gemeentecodes toevoegen aan deze meldingen.

Een fictief voorbeeld van waarom dit problematisch is, is het volgende verhaal:

Er is een ongeluk gebeurd vlakbij het Rijksmuseum. In de meldkamer krijgt een operator een telefoontje van een burger die 112 heeft gebeld. De operator schrijft de informatie in een notitie.

“Ongeluk bij Rijksmuseum, Museumstraat 1, 1071 XX Amsterdam. 2 gewonde fietsers..”

Uit deze melding moet een medewerker van Waarborgen B.V. de volgende data halen:

  • GPS-locatie
  • Gemeentecode
  • Buurtcode
  • Wijkcode

De medewerker van Waarborgen B.V. moet dit allemaal handmatig verwerken. Hij zoekt eerst via Google de GPS-locatie van het Rijksmuseum op. Ook haalt hij uit een database de gemeente-, wijk- en buurtcodes. Dit kan omdat het Centraal Bureau voor Statistiek gemeenten onderverdeeld in wijken en buurten. De wijk- en buurtcode bestaat uit acht cijfers; vier van de gemeentecode, twee voor de wijk en twee voor de buurt.

Dit is goed te doen als het bij een paar meldingen per dag zou blijven. Echter, het gaat vaak om documenten van meer dan 700 regels. 

Een ander probleem is dat men soms met meldingen te maken krijgt die niet specifiek zijn. Een melding die je binnen zou kunnen krijgen is de volgende:

“Ongeluk bij stadion Amsterdam. 3 betrokken auto’s. Alleen blikschade.”

Je moet nu eerst helemaal uit gaan zoeken waar het stadion van Amsterdam is. Daarna moet je het hele proces van het handmatig invullen van de locaties weer doorlopen. 

Kortom, je bent heel veel tijd kwijt.

 

Probleem Case: Ongestructureerde data aanvullen met Machine Learning

2
de oplossing

Beeproger heeft een manier bedacht om deze twee problemen van Waarborgen B.V. op te lossen. 

Eerst zijn we bezig gegaan met het automatisch koppelen van GPS-locaties met bijbehorende codes aan specifieke meldingen vanuit de meldkamer. 

“Door de database van het CBS met 7 miljoen datapunten te koppelen aan ons systeem

kunnen we heel snel automatisch de juiste locaties en codes koppelen aan meldingen met specifieke informatie zoals een postcode” zegt Leon van beeproger. 

Hierdoor wordt de tijd die besteed werd aan handmatig locaties en codes zoeken bespaard.

Daarnaast zijn we bezig gegaan met een oplossing voor de minder specifieke meldingen. 

“We hebben ons systeem gekoppeld met de Google API” zegt Leon. “Op die manier kunnen we door middel van machine learning relevante woorden voor locaties zoals namen van winkels, straatnamen etc. filteren om de melding specifieker te maken.”

Hierdoor zijn deze meldingen makkelijker te verwerken en dit bespaart ook weer een hoop tijd.

Resultaat Case: Ongestructureerde data aanvullen met Machine Learning

3
het resultaat

Het resultaat is maatwerk software die tot 90% van alle data die vanuit de meldkamer binnenkomt automatisch kan voorzien van een GPS-locatie met buurtcode, wijkcode en gemeentecode.

Het slim werken met koppelingen tussen systemen en grote datasets kan dus hele grote voordelen hebben. Dit heeft bij Waarborgen B.V. geleid tot een enorme tijdsbesparing. Daarnaast is de data die Waarborgen B.V. presenteert ook correcter omdat de foutmarge lager is.

Resultaat Case: Ongestructureerde data aanvullen met Machine Learning