Objetivo: Predicción personalizada de la diabetes
Data
1074 casos (healthy, diabetes)
Datos clínicos: IMC, sexo, edad.
Polimorfismos(112): insulin-like growth factor binding protein, CD36 antigen, adiponectin receptor 2, etc.
Method
Reducción dimensional con PCA y predicción personalizada con CBR.
Results
5 componentes principales, éxito PCA-CBR: 89%
Las bases de datos médicas generalmente consisten en un gran número de variables. Por lo tanto, es tedioso para el sistema de diagnóstico para hacer frente a todos estos atributos. Es importante encontrar métodos para reducir la cantidad total de atributos sin la pérdida de rendimiento. Una de las técnicas mejor conocidas que se ha aplicado ampliamente para reducir la dimensionalidad es el análisis de componentes principales (PCA). Las técnicas de PCA están diseñadas para tratar con atributos numéricos, pero nuestro conjunto de datos médicos contiene muchos datos categóricos y se requieren métodos alternativos como RS-PCA. Por lo tanto, usamos RS-PCA (regular simplex PCA) adecuado para datos discretos. Lo hibridamos con un sistema CBR para apoyar el diagnóstico médico. Los resultados son bastante prometedores ya que permiten el diagnóstico con menos esfuerzo computacional y almacenamiento de memoria.