¿La epidemiología estadística se trata de logística, odds ratios, ANOVA y estadísticas descriptivas? ¿No hay aplicaciones de minería de datos / análisis?

Tenga en cuenta que la Epidemiología se ocupa de las relaciones CAUSALES, no de las asociaciones. El mundo es rico en asociaciones y pobre en significado. Por lo tanto, la minería de datos de caja negra generalmente no es recomendable a menos que tenga una cadena causal bien formulada y evalúe los resultados desde un punto de vista epidemiológico. Vea el trabajo de Judea Pearl en Diagramas Causales y para una visión general sobre la causalidad, mire el trabajo de Sander Groenlandia a finales de los 80 y principios de los 90. No desea crear un miedo a la salud injustificado … hay demasiados de los que están cerca que ya usan tablas de contingencia simples. Sin embargo recuerdo haber visto algo de trabajo sobre epidemiología del caos, ha sido hace muchos años, así que no puedo señalarle una fuente.

También puede encontrar problemas con los datos que dificultarán el uso de métodos complejos. Los datos epidemiológicos (mortalidad, morbilidad) generalmente se refieren a eventos raros, donde la posibilidad de errores de clasificación y sesgos es grande, y será muy muy ruidosa. Del mismo modo, los predictores potenciales de los resultados de salud (p. Ej., Prevalencia de virus, presión de la población, pobreza, ingresos, algún contaminante) son muy ruidosos, a menudo agregados por naturaleza. Incluso el análisis factorial puede no funcionar bien en tales datos, si se observan detenidamente los diagnósticos.

Dado que la Epidemiología es, tradicionalmente, una ciencia médica, está un poco rezagada en comparación con sus hermanas en el campo de la economía y la neurociencia, etc. que fueron inundadas por físicos y matemáticos que introdujeron técnicas más sofisticadas. Así que supongo que su aporte será muy apreciado.

Aquí hay un ejemplo ( http://arxiv.org/abs/1004.2304 ) del uso de modelos gráficos para analizar la propagación de enfermedades infecciosas en una red social. El documento considera datos sintéticos, pero fue parte de una subvención de DARPA destinada a ser utilizada con datos reales para predecir la propagación de infecciones.