Methode · Hoe meten wij APK-betrouwbaarheid

Onze databron

Alle data komt direct uit de openbare datasets van de Rijksdienst voor het Wegverkeer (RDW), publiek gemaakt onder een CC0-licentie. Wij synchroniseren deze data dagelijks en raken zelf niets aan de oorspronkelijke records aan.

• Voertuigregistratie — merk, model, bouwjaar, brandstof, gewicht, motor
• Geconstateerde gebreken — per APK-keuring de gebrekomschrijving en classificatie (afkeur of advies)

Belangrijk: wij halen alleen gebreken op, geen losse APK-keuringsrecords. Of een voertuig door de APK is heengekomen leiden we af uit de aanwezigheid van gebreken rond een APK-datum: géén gemelde gebreken op of vlak na een APK-datum betekent dat het voertuig zonder mankementen is goedgekeurd.

Onze database bevat geconstateerde gebreken vanaf juni 2020. APK-keuringen daarvoor hebben uiteraard ook plaatsgevonden, maar die historie hebben wij niet — onze analyses gaan dus alleen over de keuringen vanaf die datum.

Segmentatie en cohorten

Een afkeurpercentage zegt pas iets als je het naast vergelijkbare voertuigen legt. Daarom delen we de complete vloot eerst op in cohorten op vier dimensies:

Concreet levert dit 46.750 unieke bouwjaar-cohorten op — elk een specifieke combinatie van merk, model, bouwjaar, brandstof en gewichtsklasse.

1. Merk & model

Variant- en motoraanduidingen worden samengevoegd onder hun hoofdmodel (Volkswagen Golf 1.4 TSI Comfortline → Volkswagen Golf) op basis van een mappingbestand dat we handmatig hebben gecureerd.

2. Bouwjaar

Voertuigen worden gegroepeerd per registratiejaar. Generaties worden via year-ranges toegekend zodat we ook generatie-specifieke betrouwbaarheid kunnen tonen.

3. Brandstof

Benzine, Diesel, Hybride, Plug-in Hybride en Elektrisch worden apart geanalyseerd — slijtagepatroon en gemelde gebreken verschillen significant per aandrijflijn.

4. Gewichtsklasse

Light (<1100 kg), Compact (1100–1400), Medium (1400–1700) en Heavy (>1700). Een lichte Citytax en een SUV horen niet in dezelfde benchmark.

Leeftijdscurves

Auto's verouderen niet allemaal even snel. Een tien jaar oude Volkswagen Golf heeft logischerwijs meer gebreken dan een vijfjarige. Daarom berekenen we per cohort een leeftijdscurve: voor iedere leeftijd (1, 2, 3, … 20 jaar) tellen we wat het percentage afkeuringen op die leeftijd was. Deze curves stellen ons in staat om verschillende generaties of merken eerlijk te vergelijken op de gemeten leeftijd, in plaats van op absolute jaartallen.

In totaal berekenen we 241.836 leeftijd-specifieke datapunten over alle cohorten heen.

Veelvoorkomende gebreken per cohort

Een afkeurpercentage zegt iets over hoe vaak een voertuig wordt afgekeurd, maar niet over waarop. Daarom analyseren we per cohort welke specifieke gebreken bovengemiddeld vaak voorkomen ten opzichte van de bredere benchmark op dezelfde leeftijd. Zo zie je niet alleen dat een bepaalde generatie vaker afgekeurd wordt, maar ook waarvoor — denk aan typische zwakke plekken zoals roest op een specifieke plaats, een veelvuldig falend onderdeel of een terugkerend elektronicaprobleem.

Per gebrektype tonen we de relatieve frequentie in het cohort vergeleken met het gemiddelde, plus de classificatie die de keurmeester eraan geeft:

• Afkeur — gebrek leidde tot het falen van de APK; moet worden gerepareerd voor een nieuwe goedkeuring.
• Advies — gemeld maar niet afkeur-waardig; verdient aandacht zonder direct te leiden tot afkeur.
• Reparatieadvies — concrete aanbeveling tot reparatie binnen redelijke termijn, vaak preventief.
• Administratief — geen technisch gebrek (bijv. ontbrekend document); meestal genegeerd in onze analyses.

Op de detailpagina's tonen we deze classificaties met kleur-codering, zodat je in één oogopslag ziet of een veelvoorkomend gebrek kritiek is of een attentiepunt. Voor cohorten met te weinig observaties geldt opnieuw de drempel — onder de minimum sample-size markeren we het resultaat als insufficient_data in plaats van een onbetrouwbaar lijstje te tonen.

APK-voorspelling per voertuig

Met dezelfde cohort-aggregaten kunnen we ook vooruitkijken. Voor ieder kenteken bepalen we de leeftijd en het cohort waar het voertuig in valt en kijken we naar de gebreken die bij dat cohort op die leeftijd bovengemiddeld vaak voorkomen. Die gebreken splitsen we in twee groepen:

Eerder geconstateerd bij dit voertuig. Punten waar dit voertuig in een vorige APK al op afgekeurd is en die ook bij vergelijkbare voertuigen op deze leeftijd vaak voorkomen. Mits deugdelijk gerepareerd is de kans op directe herhaling klein, maar het blijft een aandachtspunt voor dit voertuig — slijtage- of patroongebreken kunnen na verloop van tijd terugkeren. We tonen ze daarom met een extra waarschuwing.
Statistisch verhoogd risico. Items die bij het cohort vaak voorkomen, maar nog niet eerder bij dit voertuig zijn gemeld. Geen garantie dat ze optreden, wel een nuttige attentielijst voor de eerstvolgende keuring.

Géén pass/fail-oordeel, géén tijdsmoment — alleen wat het patroon van soortgelijke voertuigen laat zien. Handig om voor de afspraak met de garage even na te lopen.

De voorspelling is alleen beschikbaar voor voertuigen waarvoor het cohort genoeg datapunten heeft — bij niche-modellen of zeer recente bouwjaren tonen we expliciet insufficient_data.

Track-record per voertuig

Naast cohort-statistieken bouwen we voor elk individueel voertuig een track-record: een directe vergelijking tussen het werkelijke gedrag van dit voertuig en het gemiddelde van vergelijkbare auto's. De metric is consistent op beide vlakken: aantal APK-punten (afkeur + advies + reparatieadvies) per voertuig per jaar.

Voor het voertuig zelf: tellen we alle geregistreerde APK-punten sinds juni 2020 en delen we door het aantal geobserveerde jaren. Voor oudere voertuigen geldt alleen de overlap met onze data-window — pre-2020 events zijn er simpelweg niet en zouden de noemer kunstmatig verhogen.

Vervolgens vergelijken we dat getal met drie geneste referentiegroepen:

• Deze uitvoering — andere auto's met identiek merk, model, brandstof, variant en carrosserie
• Deze carrosserie — alle uitvoeringen van dit model met dezelfde carrosserie
• Dit model — het volledige model+brandstof, alle varianten en carrosserieën
• Vergelijkingsbasis — peer-segment met vergelijkbare auto's (zelfde gewichtsklasse, prijsklasse, brandstof)

De afwijking wordt visueel getoond als procentuele over- of onderschrijding van elke groep. Een bar naar links betekent: dit voertuig presteert beter dan de groep. Naar rechts: slechter. Zo zie je in één oogopslag of een afwijking variant-specifiek, model-breed of segment-breed is.

Voor recente bouwjaren met minder dan 2 jaar geobserveerde data tonen we insufficient_history in plaats van een onstabiel oordeel — één APK-bevinding zou daar te veel gewicht krijgen.

AI-risicoanalyse

Naast de objectieve statistieken bieden we — op verzoek van de gebruiker — een AI-gegenereerde risicoanalyse. Dit is geen koopadvies en geen vervanging voor een professionele aankoopkeuring. Het is een interpretatie van de bovenstaande data, samengevat in begrijpelijke taal door een taalmodel (Gemini van Google).

Wat we als input naar het model sturen:

• Voertuig-eigenschappen: merk, model, bouwjaar, brandstof, gewicht, carrosserie
• De track-record-metingen (eigen punten/jaar + de drie groepsgemiddelden)
• De top verwachte gebreken uit de APK-voorspelling
• Eerder geconstateerde gebreken bij dit voertuig (datum + categorie)

Wat het model niet krijgt: kenteken, eigenaarsgegevens, locatie of identificeerbare data. Het oordeel is alleen gebaseerd op kenteken-onafhankelijke voertuigdata.

De output is gestructureerd in een vast schema: een risico-niveau (laag / gemiddeld / verhoogd), een korte samenvatting, sterke punten, aandachtspunten en praktische tips voor bezichtiging. We valideren de output tegen dit schema voor we 'm tonen — onverwachte of incomplete antwoorden worden afgewezen.

Bewust hebben we voor "risico-niveau" gekozen in plaats van "koopadvies". De analyse gaat over wat de data zegt, niet over wat een koper zou moeten doen — die afweging blijft bij de bezichtiging, onafhankelijke keuring en eigen voorkeur.

Een gegenereerde analyse is 30 dagen geldig. Bij nieuwe APK-data wordt 'ie gemarkeerd als niet meer actueel en kan opnieuw gegenereerd worden. Taalmodellen kunnen onjuiste informatie produceren — gebruik de analyse als hulpmiddel, niet als beslissingsfactor.

Beperkingen van de data

Eerlijk: hier zijn de dingen die deze methode niet kan zeggen.

Geen onderhoudsgeschiedenis. Een goed onderhouden Renault Laguna kan jarenlang door de APK gaan. Onze data zegt niets over wat een eigenaar tussendoor heeft betaald aan reparaties of aan preventie.
Selectiebias bij nicheauto's. Bij modellen met <30 voertuigen is het sample te klein om betrouwbare uitspraken te doen — die markeren we expliciet als insufficient_data.
Recente bouwjaren. Voor bouwjaren < 4 jaar oud bestaat (meestal) nog geen APK-plicht en dus geen data. Een nieuwe Tesla zonder gebreken is logisch — niet automatisch een teken van superieure betrouwbaarheid.
Geen controle voor kilometerstand of gebruiksintensiteit. Een taxi en een grootmoederauto hebben hetzelfde bouwjaar maar een totaal ander slijtageprofiel. We aggregeren beide in dezelfde cohorten.

Bronnen

RDW Open Data Portal — kentekenregistratie, APK-meldingen, gebrekendetails (Open Data, CC0)
Gekentekende voertuigen — basisregistratie van alle Nederlandse voertuigen
Geconstateerde Gebreken — alle bij APK-keuringen geregistreerde gebreken

Hoe wij APK-betrouwbaarheid meten

Onze dataset in cijfers