Está en la página 1de 17

Programa de Formacin en Investigacin, Ciencia y Tecnologa (ProFInCyT)

Anlisis de Datos I: Introduccin al SPSS y estadstica descriptiva

Unidad 1:

Introduccin al anlisis de datos: Estadstica descriptiva e inferencial

Objetivos de la unidad

1 2

Introduccin Qu es la estadstica? Estadstica descriptiva Estadstica Inferencial Uso de computadoras para procesar datos

3 4

Introduccin Qu es la estadstica?

La Estadstica tal y como la conocemos en la actualidad, es el resultado de la unin de dos disciplinas que evolucionaron de manera independiente, para luego confluir en el siglo XIX:
Clculo de Probabilidades
Nace en el siglo XVII como teora matemtica de los juegos de azar.

Estadstica
Ciencia del estado que estudia la recogida y descripcin de datos.

La estadstica es definida como:


el conjunto de mtodos que tienen por objeto la obtencin, tratamiento e interpretacin de un conjunto de datos de observacin relativos a un grupo de individuos o unidades.

Acta como disciplina puente entre los modelos matemticos y los fenmenos de la realidad.

Orgenes
Desde la antigedad, gran parte de los estados han recogido informacin sobre la poblacin y riquezas que existan en sus dominios. Desde el siglo XVII, se han tratado de interpretar fenmenos biolgicos y sociales de poblaciones a partir de datos numricos mediante procesos deductivos (Estadstica Descriptiva).
Sin embargo, desde finales del siglo XIX, aplicando mtodos inductivos (Estadstica Inferencial), la Estadstica ha visto ampliado su campo de aplicacin a prcticamente todos los sectores y disciplinas.

En resumen
Podramos decir que algunas de las temticas de las que se ocupa la Estadstica son:
Descripcin de datos (procedimientos para resumir la informacin) Anlisis de muestras (elegir muestras representativas y hacer inferencias a partir de ellas) Contrastacin de hiptesis (comparar predicciones con datos observados) Medicin de relaciones (relacin estadstica) Prediccin (mediante el estudio del historial de las variables).

Dado que el mtodo cientfico se basa en dos tipos de razonamientos: el deductivo (de lo general a lo particular) y el inductivo (de lo particular a lo general), ambos tipos de razonamientos darn lugar respectivamente a la Estadstica Descriptiva y a la Inferencial.

Estadstica descriptiva

Este tipo de estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones. Cuando se tiene un gran nmero de datos, estos deben resumirse o reducirse, ya que la mente humana no tiene la capacidad de extraer conclusiones de una serie de datos en bruto.

La estadstica descriptiva sirve de herramienta o instrumento para describir, resumir o reducir las propiedades de un conjunto de datos convirtindolos en datos manejables. Para reducir la informacin se construyen tablas, se representan grficos y se calculan parmetros estadsticos que caracterizan la distribucin, de esta forma se simplifica la complejidad de todos los datos que intervienen en la distribucin.

Estadstica Inferencial

Se trata de tcnicas que se emplean para inferir o deducir caractersticas desconocidas a partir de un conjunto de datos conocidos, apoyndose fundamentalmente en el clculo de probabilidades. Esto se debe a que es imposible, en la mayora de los casos, utilizar como datos para comprobar las hiptesis la totalidad de los fenmenos que componen la poblacin objeto de estudio.

Uno de los principales objetivos de la estadstica inferencial es estimar las propiedades de una poblacin a partir del conocimiento de slo una muestra de ella.

La estadstica inferencial se basa por lo tanto en la estadstica descriptiva, ya que la inferencia o deduccin de las propiedades de la poblacin entera se deriva de las caractersticas de la muestra que es analizada con las tcnicas de la estadstica descriptiva.

Uso de computadoras para procesar datos

A partir del advenimiento de las nuevas tecnologas, las computadoras se han convertido en un instrumento de especial relevancia a la hora de tratar con datos estadsticos. En principio, las computadores producen clculos correctos, pero no garantizan que obtendremos resultados vlidos y confiables.

Ventajas
Exactitud y velocidad: cuando el software estadstico utilizado es de calidad, se obtienen resultados correctos rpidamente. Versatilidad: Se tiene acceso a un amplio rango de tcnicas estadsticas. Grficos: Se pueden producir representaciones de los datos originales o de los resultados obtenidos que permiten una mejor visualizacin. Flexibilidad: Una vez que se ha construido la base de datos, se pueden realizar pequeos cambios y repetir el anlisis (e.g. excluir algunos casos, hacer anlisis por subgrupos o estratos, etc.)

Ventajas
Nuevas variables: Es simple generar nuevas variables (e.g. diferencia entre mediciones antes y despus de un tratamiento, calcular edad como diferencia de fechas, crear variables categricas a partir de variables numricas, recategorizar variables cualitativas, realizar transformaciones, etc.). Volumen de datos: Algunos programas pueden procesar un nmero de registros o de variables ilimitado.

Desventajas
Errores en el software: Muchos paquetes estadsticos de uso corriente presentan errores en algunos procedimientos. Los ms seguros son: SAS, SPLUS, STATA y SPSS. Versatilidad: Esta ventaja se transforma en desventaja porque al haber tantos mtodos estadsticos disponibles es fcil usar uno inapropiado.

Desventajas
Caja Negra: Se puede perder el contacto con los datos, ya que si el anlisis se realiza automticamente, se corre el riesgo de no advertir las caractersticas ms relevantes o de perder la informacin acerca de individuos con comportamiento atpico. Los resultados dependen de la calidad del archivo de datos: Si los datos estn mal registrados o tienen inconsistencias y el investigador no lo advierte, los resultados sern incorrectos.

También podría gustarte