Estadstica es una disciplina que se aplica en muchos campos de la actividad del
ser humano. Es muy frecuente encontrarse en las diferentes disciplinas del saber con incertidumbres como el pronosticar el crecimiento poblacional de un pas, el crecimiento econmico de una empresa o el crecimiento de produccin y venta de un producto especfico, el conocer la efectividad de diferentes abonos en el campo agrario, el determinar la tendencia de contaminacin del agua o el aire, la clasificacin de personal en una empresa para efectos de una buena y sana poltica laboral, etc.
Habitualmente, el propsito de la Estadstica Aplicada es el de sacar conclusiones de una poblacin en estudio, examinando solamente una parte de ella denominada muestra. Este proceso, llamado Inferencia Estadstica, suele venir precedido de otro: la Estadstica Descriptiva, en el que los datos son ordenados, resumidos y clasificados con objeto de tener una visin ms precisa y conjunta de las observaciones, intentando descubrir de esta manera posibles relaciones entre los datos, viendo cules toman valores parecidos, cules difieren grandemente del resto, destacando hechos de posible inters, entre otros.
Un modelo estadstico
Un modelo estadstico es una ecuacin matemtica que reproduce los fenmenos que observamos de la forma ms exacta posible. Para ello tiene en cuenta los datos suministrados y la influencia que el azar tiene en estas observaciones.
En el grfico superior vers cinco puntos de color. Representan a cinco municipios de una regin elegidos al azar. Para cada uno de ellos se han recogido dos valores: El nmero de habitantes censados, anotado en el eje horizontal, y el nmero de casos de gripe diagnosticados el ltimo ao, registrado en el eje vertical. El grfico resultante se denomina nube de puntos o grfico de dispersin.
Al estar los municipios alineados, el mejor modelo para representar la relacin entre nmero de habitantes y casos de gripe es una lnea recta, dada por: Casos = 0.70 x (Habitantes) - 16.61. Con ella se puede predecir el nmero de casos de gripe esperado en otro municipio con 211 habitantes de la misma regin: Casos = 0.70 x 211 16.61 = 131. Este modelo lineal es el ms sencillo que se puede ajustar, pero no siempre es el ms adecuado. Slo es vlido cuando los puntos del grfico estn distribuidos alrededor de una recta.
El coeficiente de correlacin lineal es una medida para conocer si una recta es el mejor modelo para representar lo que observamos. Sin tener en cuenta su signo positivo o negativo, cuanto ms prximo a 1 est ms apropiado ser el modelo lineal.
El experimento
Posiciona el ratn sobre cada uno de los puntos y desplzalos dejando pulsado el botn izquierdo. Cada movimiento que hagas modificar los datos del nmero de habitantes y casos de gripe del municipio. Observa cmo cambia la recta, su ecuacin y el coeficiente de correlacin. El modelo es diferente cada vez que alteras la informacin.
Cuando los puntos estn alineados de manera creciente, el modelo ser una lnea recta ascendente y el coeficiente de correlacin ser positivo, indicando que el nmero de casos de gripe aumenta en los municipios con ms poblacin. En cambio, cuando los puntos estn alineados de manera decreciente, el modelo ser una lnea recta descendente y el coeficiente de correlacin ser negativo, indicando que el nmero de casos de gripe disminuye en los municipios con ms poblacin.
Prueba a colocar los puntos en forma de herradura. Observa que el modelo es una lnea recta casi plana, prediciendo que el nmero de casos de gripe es prcticamente el mismo sea cual sea el nmero de habitantes del municipio. Es ste un buen modelo para representar la relacin entre el nmero de casos de gripe y el nmero de habitantes?
La explicacin
El modelo lineal slo es vlido cuando los puntos del grfico estn distribuidos alrededor de una recta. Cuando se distribuyen en forma de herradura, el coeficiente de correlacin es casi cero, indicando que la recta no es la mejor opcin. Si utilizamos un modelo lineal, llegaremos a la conclusin errnea de que el nmero de casos de gripe no vara con el nmero de habitantes. En estos casos es necesario recurrir a modelos estadsticos ms complejos para estudiar la relacin entre ambas variables.
Para recordar Un modelo estadstico es una ecuacin matemtica que reproduce los fenmenos que observamos de la forma ms exacta posible. El modelo es diferente cada vez que se modifica la informacin.