Está en la página 1de 20

14/03/2015

Facultad de Química e Ingeniería
“Fray Rogelio Bacon”
UCA Rosario

Recolección y análisis de
datos estadísticos

Estadística
Docente a cargo: Prof. Estad. Luciana Ruiz
e-mail: lucianaruiz@uca.edu.ar

UNIDAD TEMATICA 1 : La Estadística

La Estadística moderna surgió de:

la necesidad de recopilar datos sobre bases
nacionales y

la teoría de las probabilidades.

1

14/03/2015

La recolección de estadísticas nacionales data
desde la historia más antigua:

Censos chinos (2200 A. C.)

Relevamientos egipcios, griegos y romanos de
población y renta del país.

Edad Media: registros de propiedades, nacimientos,
defunciones y matrimonios.

“Comentarios sobre las partidas de defunción en
Londres” - John Graunt (1662)

El estudio de los juegos de azar (Siglo XVII).

Correspondencia entre Pascal y Fermat, ante la
consulta de un apasionado jugador, da origen a
la Teoría de la Probabilidad.

Conjuntamente con el cálculo de probabilidades
se desarrolló la Teoría de los Errores (Gauss y
Laplace)

Quételet difundió la idea que conectaba la teoría
de probabilidad con las observaciones
estadísticas.

2

en forma rigurosa.  Benzécri con su Análisis Factorial devuelve los individuos a la Estadística. la Teoría de las Pequeñas Muestras y de la Estimación.14/03/2015 Emergencia de la Estadística Matemática.  Teoría sobre pruebas de Significatividad (Pearson): base para la teoría de las muestras y la teoría de la Estadística Inferencial.  Galton y Pearson: Padres de la Estadística moderna. 3 . El Análisis (multidimensional) de datos.  Fisher. Tukey (1977)  Los avances computacionales han revolucionado la práctica estadística.  Estadística textual. tomando los trabajos de Pearson desarrolló y estructuró.  Análisis exploratorio de datos.

muestreo). como por ejemplo:      Algunas ramas de las ciencias físicas Biología El estudio del medio natural donde evolucionan los seres vivos (Meteorología.14/03/2015 Los métodos estadísticos son ampliamente utilizados en diversas investigaciones científicas.) Psicología aplicada (método de tests. ¿Qué es la Estadística? La Estadística se puede considerar como la aplicación del método científico en el análisis de datos numéricos con el fin de tomar decisiones racionales. encuestas de opinión) Problemas industriales (control de fabricación. 4 . Ciencias Agrícolas. etc. especificación de productos.

 Recolección de datos para ensayar la teoría. La obtención de datos para el análisis estadístico es un proceso integral que incluye:  Determinación de los objetivos del estudio. 5 .  Definición de los métodos para la obtención y/o medición de los datos.  Interpretación y toma de decisiones.  Definición de la/s variable/s y de la población de interés.  Análisis de los resultados.14/03/2015 El método científico:  Formulación de la teoría o planteo del problema. Obtención de datos estadísticos.

6 .  Unidad elemental: Elemento o individuo en el que se observa la variable.  Población conceptual: Las posibles mediciones que pudieran hacerse bajo condiciones experimentales similares. Variables y unidades elementales  Variable: Característica o propiedad de interés de los elementos en estudio.  Dato (u observación): valor de la variable asociado a una unidad elemental.14/03/2015 Definición de la Población en estudio  Población concreta: Conjunto de todos los individuos u objetos de los cuales se desea obtener información.

 Diseño de experimentos. La cantidad de flujo que pasa por una válvula solenoide del sistema de control de contaminación de un automóvil es una característica importante. Fuentes de datos:  Datos publicados (Censos. Se llevó a cabo un experimento para estudiar la forma en que la rapidez de flujo dependía de la longitud de armadura. publicaciones especializadas) o registros administrativos. 7 . la carga sobre el resorte y la profundidad de la bobina. en una muestra de tamaño 100. muestreo de aceptación). Se seleccionó una muestra de 60 lotes y se determinó la cantidad de transductores en cada lote que no cumplían con las especificaciones de diseño. Unos transductores de temperatura se embarcan en lotes de 50.14/03/2015 Ejemplos:    Se determinó la cantidad de partículas contaminantes en una oblea de silicio antes de cierto proceso de lavado.  Estudios observacionales (encuestas.

Parámetro vs.14/03/2015 Censo vs. estadística  Parámetro: Valor resumen de una característica de la población (desconocido. a estimar). muestreo  Censo: Se tiene información (datos) de todos los elementos de la población.  Estudio muestral: Se cuenta sólo con información de un subconjunto de elementos de la población de interés. 8 .  Estadística: Valor resumen calculado a partir de datos muestrales (para estimar un parámetro o describir la muestra).

Las conclusiones son referidas únicamente al conjunto de elementos observados. Estadística inferencial Herramientas que permiten hacer algún tipo de inferencia (conclusión o generalización) acerca de la población a partir del estudio de información muestral.14/03/2015 Estadística descriptiva Herramientas (técnicas) para la recolección. presentación. 9 . organización. análisis e interpretación de datos. Las conclusiones son extendidas a la población de la cual proviene la muestra.

Fácil comprensión.14/03/2015 UNIDAD TEMATICA 1 : Tablas y gráficos estadísticos.  Métodos tabulares: Permiten mayor nivel de comprensión. Facilita comparaciones. Vez Ulterior S/E Enero 22 53 0 Febrero 82 17 0 Marzo 66 54 1 Abril 109 69 2 Mayo 120 77 5 Junio 139 157 8 Total 538 427 16 Para que los datos recogidos sean útiles. Presentación más concisa. debemos organizarlos. tanto para su análisis como para su presentación.  Métodos gráficos: Son más atractivos pero no permiten presentar tantos grupos de datos. 10 . Año 2005 Mes Enfermedades de Cod 02 P.

cómo.14/03/2015 Ejemplo: Población argentina según acceso al agua potable. (nota de introducción) Encabezados y sub-encabezados Columna Matríz Cuerpo de La tabla * Nota al pie Fuente 11 . Año 2001 (valores en %) Acceso Urbana* Definición amplia 98 Conexiones domiciliares 83 Rural 80 45 Total 96 79 * 90% de la población argentina Fuente: Programa de Monitoréo Conjunto OMS/UNICEF Partes de un cuadro o tabla Título: Qué. donde y cuándo.

Se registró la forma de pago de 50 ventas obteniéndose: Forma de pago Conteo Contado //// //// Débito Crédito Total //// //// //// //// //// //// //// //// / Frec.32 1 12 . absoluta Frec.14/03/2015 Tabla de distribución de frecuencias  Es una tabla resumen en la que los datos se agrupan en clases ordenadas. relativa 10 0. tarjeta de débito y tarjeta de crédito.2 24 0.48 16 50 0. Un negocio minorista brinda tres formas de pago para sus ventas: contado. Ejemplo. Distribuciones de variables cualitativas.  La distribución de una variable está dada por el conjunto de los valores (o clases) posibles de esa variable y la frecuencia con la que se presenta cada uno de ellos.

14/03/2015 Gráfico de frecuencias absolutas Gráfico de frecuencias relativas 13 .

 Lineales: para series cronológicas largas.  Sectogramas: se utilizan para mostrar % que suman el 100% o cómo se reparte un total en distintas categorías de una variable cualitativa. Las barras se orientan en forma horizontal para variables cualitativas y vertical para cuantitativas.  Pictogramas: utilizan íconos repetidos para representar las cantidades.14/03/2015 Gráficos más usuales en la presentación de datos  Barras: son simples si muestran una sola serie y subdivididas o compuestas para dos o más series. 14 .

absoluta relativa acumulada Frec. Se registró la cantidad de materias promovidas durante el 1° año de cursado de los ingresantes a la Facultad de Cs.19 861 0.14 225 0. Económicas y Estadística en 2003.21 559 0.14/03/2015 Gráfico lineal Tasas de desempleo 14 12 % 10 Francia 8 Italia 6 Paices Bajos 4 Portugal 2 0 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 Distribuciones de variables cuantitativas con pocos valores distintos.19 1170 0. relativa acumulada 15 . N° de materias promovidas Frecuencia absoluta 0 225 0.54 3 309 0.35 2 302 0.73 4 422 0.14 1 334 0.27 1592 1 Total 1592 1 Frecuencia Frec.

06 1 33 1 16 .3 10 0. Relativa Frec.3 0.85 7.70 7. Absoluta Frec.03 4 0.15 0. UNR 500 422 400 N° de alumnos 334 302 309 2 3 300 225 200 100 0 0 1 4 N° de materias promovidas Distribuciones de variables cuantitativas con muchos valores distintos. Se realizaron 33 mediciones del nivel de pH del agua de red en la localidad de Casilda: PH 7.94 2 0.15 5 0.65 – 7.61 11 0.80 – 7.14/03/2015 Ingreso 2003 según cantidad de materias promovidas durante el primer año de cursado.03 0.80 7.90 7.75 7.85 – 7.70 – 7.12 0. Acumulada 1 0. Facultad de Ciencias Económicas y Estadística.90 – 7.33 0.95 Total Frec.75 – 7.

No menos de 5 clases ni más de 15. Histograma 17 .  Obtener el ancho apropiado para cada clase: se recomienda utilizar el mismo ancho para todas.  Establecer los límites de cada clase para evitar superposiciones: se recomienda utilizar un decimal más que el que registran los datos.14/03/2015 Pasos para la construcción de la distribución de frecuencias de una variable cuantitativa:  Seleccionar un número adecuado de clases: depende del número de observaciones.

14/03/2015 Polígono de frecuencias relativas acumuladas Medidas descriptivas:  Localización o tendencia central  Dispersión o variabilidad 18 .

No utilizar el rango. es preferible la mediana o el modo.  El coeficiente de variación es útil para comparar la dispersión de 2 o más grupos de datos.  Si existen valores atípicos.14/03/2015 Localización      Modo Media aritmética Mediana Cuartiles Percentiles Dispersión     Rango Desvío Estándar Rango intercuartílico Coeficiente de variación Criterios para la selección de medidas:  El promedio es representativo del conjunto de datos si la distribución es simétrica o aproximadamente simétrica. 19 .

01 A 0 21 22 23 24 25 26 27 Turbiedad resistencia a la tracción  Diagrama de caja .5 .3 .7 14 22 .0 N= 25 8 Otro Salida C Sitio de extracción 20 .14/03/2015 Análisis exploratorio 0.1 0.03  Diagrama de puntos 0.6 .2 .02 B 0.4 .