Journal of Personalized Medicine
DOI:
10.3390/jpm13071128
Tobias P. H. Nissen, Thomas L. Nørgaard, Katja C. Schielke, Peter Vestergaard, Amar Nikontovic, Malgorzata Dawidowicz, Jakob Grauslund, Henrik Vorum und Kristian Aasbjerg
ZIEL
Untersuchung der tatsächlichen Leistung einer Software für das maschinelle Lernen mit Support-Vektoren (RetinaLyze) zur Identifizierung einer möglichen diabetischen Retinopathie (DR) bei Diabetespatienten durch Softwareimplementierung in der klinischen Praxis.
METHODEN
Es wurden 1001 Augen von 1001 Patienten (ein Auge pro Patient) einbezogen, die am dänischen nationalen Screening-Programm teilnahmen. Drei unabhängige Augenärzte bewerteten alle Augen gemäß der Internationalen klinischen Schweregradskala für diabetische Retinopathie, wobei der genaue Schweregrad der Erkrankung durch Mehrheitsentscheidung bestimmt wurde. Die Software erkannte DR und keine DR und wurde mit den Bewertungen der Augenärzte verglichen.
ERGEBNISSE
Bei einem klinisch festgelegten Schwellenwert wies die Software eine Sensitivität, Spezifität, einen positiven prädiktiven Wert und einen negativen prädiktiven Wert von 84,9 % (95 % KI: 81,8–87,9), 89,9 % (95 % KI: 86,8 – 92,7), 92,1 % (95 % KI: 89,7–94,4) bzw. 81,0 % (95 % KI: 77,2–84,7) im Vergleich zur Einstufung durch den Menschen. Die Ergebnisse des Routine-Screenings lagen bei 87,0 % (95 % KI: 84,2–89,7), 85,3 % (95 % KI: 81,8–88, 6), 89,2 % (95 % KI: 86,3–91,7) und 82,5 % (95 % KI: 78,5–86,0) bzw. 89,2 % (95 % KI: 86,3–91,7) und 82,5 % (95 % KI: 78,5–86,0) bzw. 89,2 % (95 % KI: 86,3–91,7) und 82,5 % (95 % KI: 78,5–86,0) bzw. 89,2 % (95 % KI: 86,3–91,7) und 82,5 % (95 % KI: 78,5–86,0) bzw. 89,2 %
FAZIT
Die Software schnitt ähnlich gut ab wie die routinemäßige Benotung mit überlappenden Konfidenzintervallen, was auf eine vergleichbare Leistung der beiden Gruppen hindeutet. Die Übereinstimmung zwischen den Bewertern war zufriedenstellend. Allerdings ist es von entscheidender Bedeutung, die aktualisierte Software zusammen mit aktualisierten klinischen Verfahren zu bewerten. Es wird daher empfohlen, vor der Implementierung der Software als Entscheidungshilfe weitere klinische Tests durchzuführen.