jueves, 23 de julio de 2009

EPIDEMIA 8

23 DE JULIO DE 2009
La SSA publica en su portal los datos de la epidemia de influenza. Presenta una gráfica de barras, es una serie en el tiempo, también están los datos distribuidos por edad, sexo ocupación y localización geográfica. Son estadísticas descriptivas simples. Los datos están amañados, ya que para cualquier conocedor de estadísticas, lo primero que pediría seria el número de casos por fecha y la distribución por algunas variables como son el sexo, edad, ocupación y si se puede por ingreso económico, localización geográfica del caso. Sin embargo, en la gráfica de total de casos confirmados, se presenta la fecha cada dos días en el eje de las X y el número de casos en el eje de las Y y hacen una columna por cada día en cada columna, por lo que con mucho trabajo se puede tomar los datos y pasarlos a una hoja de datos como sería EXCEL, se presentan los números por día desde el 11 de marzo de 2009 hasta el 15 de julio de 2009. Desafortunadamente estos datos no están por sexo ni edad ni otras variables.
Una gran sorpresa es que los datos proporcionados no corresponde a los que el secretario de la Secretaria de Salud mostró en las conferencias de prensa:
Así el jueves 30 de abril de 2009 (en una conferencia de prensa), se dieron los datos de que había 99 casos, mientras que en la gráfica del InDRE en esa fecha ya había 3109 casos acumulados y hubo en ese día 227 casos. De la misma forma; el martes 5 de mayo de 2009 reportan 802 casos y en la gráfica anotan 4170 acumulados y se presentaron 228 nuevos caso en ese día. Se puede seguir con ese análisis con todos los datos; pero la pregunta importante es ¿Cómo pudieron engañar a la prensa nacional e internacional con esa información? La fuente de los datos que dan es la base de datos del InDRE.
Leroy cada día tomaba los datos que mencionaban en las conferencias de prensa y boletines y los utilizo para hacer una regresión lineal y así tratar de predecir cuantos casos se presentarían en el tiempo y después del trabajo realizado resultaba que eran falsos.
Se dio cuenta que tenia tres cifras de casos el 8 de julio; la primera (fuente el doctor Córdoba de la SS) 12645 casos y la segunda los calculados por Leroy 12517 por medio de regresión lineal y las cifras presentadas por el InDRE de 13476 casos. Si vemos la diferencia entre los datos calculados por Leroy y los datos dados a la prensa (12645 menos 12517) son de 128 una exactitud muy acertada, pero la diferencia entre los datos dados a la prensa (12645 menos 13476) son de 976 un error muy grande entre la cifras proporcionadas ¿Cómo puede suceder esto? Además parece que a los científicos mexicanos no les importo este error ya que nadie hasta la fecha a cuestionado los datos. Sin embargo para entender este tremendo error con un ejemplo, sería como si cuando se va acoplar una nave con el transbordador espacial, quedaran a 976 metros el uno del otro, un error tan grande así no se puede cometer en un país con grandes científicos como hay en México ¿Pero parece que sí? Leroy así defendió la ciencia mexicana.