Está en la página 1de 21

ESTADISTICA DESCRIPTIVA

La estadística se ocupa de recolectar,
organizar, resumir, presentar y
analizar datos.

Pasos en un estudio estadístico
• Plantear hipótesis sobre una población
• Los fumadores tienen “más bajas” laborales que los no fumadores
• ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

• Decidir qué datos recoger (diseño de experimentos)
– Qué individuos pertenecerán al estudio (muestras)
• Fumadores y no fumadores en edad laboral.
• Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades
crónicas?
– Qué datos recoger de los mismos (variables)
• Número de bajas
• Tiempo de duración de cada baja
• ¿Sexo? ¿Sector laboral? ¿Otros factores?

• Recoger los datos (muestreo)
– ¿Estratificado? ¿Sistemáticamente?

• Describir (resumir) los datos obtenidos
• tiempo medio de baja en fumadores y no (estadísticos) LO Q VAMOS A VER
• % de bajas por fumadores y sexo (frecuencias), gráficos,...

• Realizar una inferencia sobre la población
• Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.

• Cuantificar la confianza en la inferencia
– Nivel de confianza del 95%
– Significación del contraste: p=2%

Método científico y estadística Plantear Diseñar hipótesis experimento Obtener Recoger datos conclusiones y analizarlos .

VARIABLES y GRÁFICAS 4 .

Cualitativa – Su nivel de felicidad “declarado” • {Deprimido. mas o menos.74.}  Var. 1. Variables • Una variable es una característica observable que varía entre los diferentes individuos de una población. Ordinal – El número de hijos • {0..3. La información que disponemos de cada individuo es resumida en variables. • En los individuos de la población paraguaya.2.}  Var. . Numérica discreta – La altura • {1. B.. O}  Var..1. Muy Feliz}  Var.. AB.. Numérica continua . de uno a otro es variable: – El grupo sanguíneo • {A.62 .

Número de cigarrillos. de “cumpleaños” – Continuas: Si entre dos valores. • Altura. Intensidad del dolor • Cuantitativas o Numéricas Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos) – Discretas: Si toma valores enteros • Número de hijos. Fumar (Sí/No) – Ordinales: Si sus valores se pueden ordenar • Mejoría a un tratamiento. Dosis de medicamento administrado. Presión intraocular. son posibles infinitos valores intermedios. Num. Grado de satisfacción. Religión. Tipos de variables • Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos) – Nominales: Si sus valores no se pueden ordenar • Sexo. Grupo Sanguíneo. Nacionalidad. edad .

Si no está determinada por una fórmula (o similar) es aleatoria. • Variable aleatoria es una descripción numérica del resultado de un experimento Tipos:  Variable aleatoria Discreta  Variable aleatoria Continua 7 . Definición: • Una variable si toma siempre el mismo valor es una constante.

5 clientes Inspeccionar un Cantidad de chips 0.A Llamar a cinco posibles Cantidad de clientes 0.2. Ejemplos variable aleatoria discreta Experimento Variable aleatoria Valores posibles V.40 embarque de 40 chips defectuosos Funcionamiento de un Cantidad de clientes 0..3.1.4. restaurante durante un día Vender un automóvil Sexo Cliente 0 si es hombre y 1 si es mujer 8 .2.….1.3…….2. 1.

entre X>=0 banco llegadas de clientes Llenar una lata de bebida Cantidad de onzas 0<=x<=12.A Funcionamiento de un Tiempo en minutos. Ejemplos variable aleatoria continua Experimento Variable aleatoria Valores posibles V.1 onzas) Proyecto para construir un Porcentaje de terminado 0<=x<=100 biblioteca del proyecto 9 .1 (máx =12.

• Los posibles valores de una variable suelen denominarse modalidades. • Las modalidades pueden agruparse en clases (intervalos) – Edades: • Menos de 20 años. No) – Bien: Le gusta el cine: (Sí. más de 50 años – Hijos: • Menos de 3 hijos. 6 o más hijos • Las modalidades/clases deben formar un sistema exhaustivo y excluyente – Exhaustivo: No podemos olvidar ningún posible valor de la variable – Mal: ¿Cuál es su color del pelo: (Rubio. De 3 a 5. cine) – Bien: Le gusta el deporte: (Sí. qué le gusta: (deporte. No) – Mal: Cuántos hijos tiene: (Ninguno. Menos de 5. Más de 2) . de 20 a 50 años. Moreno)? – Bien: ¿Cuál es su grupo sanguíneo? – Excluyente: Nadie puede presentar dos valores simultáneos de la variable • Estudio sobre el ocio – Mal: De los siguientes.

Las dos exponen ordenadamente la información recogida en una muestra. 5 Hombre 4 4 3 2 Mujer 6 1 0 Hombre Mujer • Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Presentación ordenada de datos 7 6 Género Frec. .

6 95.0 No demasiado feliz 165 10.3 Válidos Muy feliz 467 30.6 27.8 27. de forma que no se pierda nada de información (o poca).9 69. pero dividido por el total – Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas Sexo del encuestado Número de hijos Porcentaje Porcentaje Porcentaje Frecuencia Porcentaje válido Frecuencia Porcentaje válido acumulado Válidos Hombre 636 41.0 Total 1504 99.9 Válidos 0 419 27.1 7 23 1.1 1 255 16.0 Total 1509 99.1 31.0 2 375 24.6 1.5 1.6 3.0 Total 1517 100.9 Total 1517 100.1 58.4 8.8 Frecuencia Porcentaje válido acumulado 6 24 1.1 1.8 Nivel de felicidad 4 127 8.5 98.1 100.2 Porcentaje Porcentaje 5 54 3.0 Perdidos No contesta Perdidos No contesta 8 .5 58.2 83.1 100.9 41.0 Ocho o más 17 1.7 24.9 44.5 100. Tablas de frecuencia • Exponen la información recogida en la muestra.6 97. – Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad – Frecuencias relativas (porcentajes): Idem.8 16.0 89.7 Total 1517 100.8 31.2 14.0 100.9 Bastante feliz 872 57.8 Mujer 881 58.5 13 .0 100.9 11.4 92.5 3 215 14.0 .

Datos desordenados y ordenados en tablas • Variable: Género Géner Frec. Frec. relat.6=60% 10=tamañ o muestral • Muestra: MHHMMHMMMH – equivale a HHHH MMMMMM . o porcentaje – Modalidades: • H = Hombre Hombr 4 4/10=0.4=40% e • M = Mujer Mujer 6 6/10=0.

5 98.8 27. + Frec. frec.6 95.2 tiene 6 hijos o menos? 5 54 3.8 • ¿Qué porcentaje de individuos 4 127 8.3% 6 24 1. sin hijos Porcent.8 = 419 + 255 1 255 16. Porcent.9 • ¿Qué cantidad de hijos es tal que al menos el 50% de la Ocho+ 17 1.7 = 674 individuos 2 375 24.9 69.1 100.2 83.0 población tiene una cantidad Total 1509 100.8 – 97. indiv.3 7 23 1.0 inferior o igual? – 2 hijos .6 97.5 ≥50% 3 215 14. (válido) acum.4 92. indiv.9 44. con 1 hijo 0 419 27. Ejemplo • ¿Cuántos individuos tienen Número de hijos menos de 2 hijos? – frec.

. o rel. Gráficos para v.) – Se pueden aplicar también a variables discretas • Diagramas de sectores (tartas. – El área de cada modalidad debe ser proporcional a la frecuencia. cualitativas • Diagramas de barras – Alturas proporcionales a las frecuencias (abs. polares) – El área de cada sector es proporcional a su frecuencia (abs.) • Pictogramas – Fáciles de entender. o rel.

20 40 60 80 Edad del encuestado . discretas 0 1 2 3 4 5 6 17 7 Ocho o más • Se deja un hueco entre barras para indicar Número de hijos los valores que no son posibles 250 – Histogramas para v. 100 54 24 23 – Diagramas barras para v. Gráficos diferenciales para variables numéricas 419 400 375 • Son diferentes en función de que las 300 255 Recuento 215 variables sean discretas o continuas. 200 127 Valen con frec. continuas 200 Recuento • El área que hay bajo el histograma entre 150 dos puntos cualesquiera indica la cantidad 100 (porcentaje o frecuencia) de individuos en 50 el intervalo. absolutas o relativas.

Diagramas integrales (OJIVAS) • Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. No los construiremos en clase. la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. Indican.) . para cada valor de la variable. Se pasan de los diferenciales a los integrales por integración y a la inversa por derivación (en un sentido más general del que visteis en bachillerato.

LAS DISTRIBUCIONES DE FRECUENCIAS • DATOS SUELTOS VS CLASES • INTERVALES Y LIMITES DE CLASES • FRONTERAS DE CLASES • TAMAÑO O AMPLITUD DE UN INTERVALO • MARCA DE CLASE .

REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIAS • DETERMINAR MAYOR Y MENOR PARA HALLAR EL RANGO • DIVIDIR EL RANGO ENTRE 5 A 20 CLASES EVITANDO LOS “ERRORES DE AGRUPAMIENTO” • DETERMINAR EL NÚMERO DE OBSERVACIONES EN CADA CLASE (RECUENTO) .

“ERRORES DE • No deseado: fronteras de AGRUPAMIENTO” clase coinciden con datos reales • DETERMINAR EL NÚMERO DE OBSERVACIONES EN CADA CLASE (RECUENTO) .REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIAS • DETERMINAR MAYOR Y MENOR PARA HALLAR EL RANGO • DIVIDIR EL RANGO • Deseado: marcas de ENTRE 5 A 20 CLASES clase coinciden con EVITANDO LOS datos reales.

AGRUPAMIENTO” • No deseado: fronteras de clase coinciden con • DETERMINAR EL datos reales NÚMERO DE OBSERVACIONES EN CADA CLASE (RECUENTO) .REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIAS • DETERMINAR MAYOR Y MENOR PARA HALLAR EL RANGO • DIVIDIR EL RANGO ENTRE 5 A 20 CLASES • Deseado: marcas de EVITANDO LOS clase coinciden con “ERRORES DE datos reales.