Objectiu: Predicció personalitzada de la diabetis
Data
1074 casos (healthy, diabetis)
Dades clíniques: IMC, sexe, edat.
Polimorfismes (112): insulin-like growth factor binding protein, CD36 antigen, adiponectin receptor 2, etc.
Method
Reducció dimensional amb PCA i predicció personalitzada amb CBR.
Results
5 components principals, èxit PCA-CBR: el 89%
Les bases de dades mèdiques generalment consisteixen en un gran nombre de variables. Per tant, és tediós per al sistema de diagnòstic per fer front a tots aquests atributs. És important trobar mètodes per reduir la quantitat total d’atributs sense la pèrdua de rendiment. Una de les tècniques millor conegudes que s’ha aplicat àmpliament per reduir la dimensionalitat és l’anàlisi de components principals (PCA). Les tècniques de PCA estan dissenyades per tractar amb atributs numèrics, però el nostre conjunt de dades mèdiques conté moltes dades categòriques i es requereixen mètodes alternatius com RS-PCA. Per tant, fem servir RS-PCA (regular simplex PCA) adequat per a dades discretes. L’hibridem amb un sistema CBR per donar suport al diagnòstic mèdic. Els resultats són força prometedors ja que permeten el diagnòstic amb menys esforç computacional i emmagatzemament de memòria.