Está en la página 1de 73

Unidad I de Aprendizaje

Estadística Descriptiva

Manuel Treco Hernández

2022
1. Generalidades.
Población: Conjunto de elementos a los que se les estudia una característica.
Una población puede ser:
Finita: es aquella que incluye una cantidad limitada contable de observaciones,
individuos o medidas. Siempre que sea posible alcanzar (contar) el número total
de todas las posibles mediciones, se considera como finita la población.
Infinita: es aquella que incluye un gran conjunto de observaciones o mediciones
que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite
en cuanto al número de observaciones que el experimento puede generar.
Muestra: Subconjunto o parte de la población.
En Estadística en la mayoría de los casos se requieren Muestras Aleatorias que
corresponden aquellas cuyas observación, medición o individuo de la población
tenga la misma condición, chance o certeza de ser seleccionado.
Variable estadística: son características de los elementos poblacionales que se
pueden describir o medir.
Ejemplo: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura,
cantidad de nacimientos, presión, grosor, diámetro.
Datos: son realizaciones o valores que toma la variable en cada caso.
Clasificación de las Variables Estadísticas.
• Cualitativas o Atributos : Las características de los elementos poblacionales se
describen.
Ejemplo: Sexo, hábito de fumar, color de ojos, estrato ,religión, estado civil, raza.
• Cuantitativas : Las características de los elementos poblacionales se miden.
Ejemplo: Peso, edad, estatura, presión, humedad, intensidad de un sismo, número
de hermanos, cantidad de errores ortográficos por página.
Clasificación de las Variables Cuantitativas.
• Discretas: son aquellas que toman valores enteros.
Ejemplo: número de hijos, número de empleados de una empresa, número de
asignaturas aprobadas en un semestre.
• Continuas: son aquellas que toman cualquier valor dentro de un intervalo real.
Ejemplo: temperatura, peso, estatura, presión, fuerza, velocidad, humedad,
intensidad de un sismo.
Escalas de Medida.
Son sucesiones de medidas que permiten ordenar los datos jerárquicamente.
• Nominal: es aquella que identifica o etiqueta las categorías de la variable para
establece diferencia entre ellas.
Ejemplo: genero, grupos sanguíneos, colores, profesión, nomenclatura urbana,
códigos de barra.
• Ordinal: es aquella que identifica o etiqueta y ordena las categorías de la
variable.
Ejemplo: estrato, nivel de escolaridad, mejoría a un tratamiento, grado de
satisfacción, intensidad del dolor, grados militares, jerarquía en una empresa.
• Intervalo: es aquella que identifica, ordena, compara valores de la variable y el
cero(0) como medida es relativo (arbitrario).
Ejemplo: temperatura (°C), el peso, la velocidad, altura, la distancia, el tiempo.
• Razón: es aquella que identifica, ordena, compara valores de la variable y el
cero(0) como medida es absoluto (fijo).
Ejemplo: Ingreso, volumen, masa, densidad, longitud, número de hijos por
familia, cantidad de errores ortográficos por página.
Concepto de Estadística.
La Estadística es la disciplina que estudia los datos. También la podemos
conceptualizar como la disciplina de estudio de la incertidumbre.
División de la Estadística.
• Estadística Descriptiva (Deductiva): se encarga de hacer un análisis
exploratorio de los datos provenientes de una población o una muestra.
• Estadística Inferencial o Inferencia Estadística: Conjunto de técnicas,
mediante las cuales se hacen generalizaciones o se toman decisiones en base a
información parcial obtenida mediante técnicas descriptivas.
Ejemplo 1:
Un técnico de control de calidad selecciona piezas ensambladas de una línea de
montaje y registra la siguiente información sobre cada pieza:
A: defectuosa o no defectuosa
B: el número de identificación del trabajador que ensambló la pieza.
C: el peso de la pieza.
a) ¿cuál es la población?
b) La población ¿es finita o infinita?
c) ¿cuál es la muestra?
d) Clasifique las respuestas para cada una de las tres variables como datos de
atributo o cuantitativos.
Ejemplo 2:
Identifique las siguientes expresiones como variables de cualitativas o variables
cuantitativas y ubíquela en su respectiva escala de medición.
a) La resistencia a la rotura de un tipo de cuerda dado.
b) El color de cabello de los niños que se presentan a una audición de música.
c) El número de señales de alto que hay en poblaciones con menos de 5,000
habitantes.
d) Si un grifo es o no defectuoso.
e) El número de preguntas contestadas correctamente en una prueba saber pro.
f) El tiempo necesario para contestar una llamada telefónica en cierta oficina de
bienes raíces
2. Organización de datos unidimensionales.
Una tabla de frecuencias para una variable cuantitativa discreta o cualitativa
en escala ordinal, es en general como sigue:
Una tabla de frecuencias, en general para una variable cuantitativa es de la forma:
Ejemplo 3:
Una empresa que tiene 50 trabajadores se propone reestructurar las remuneraciones, se
estudia los años de servicio de los trabajadores determinándose los siguientes
resultados:

a) Organice la información en una tabla de frecuencias.


b) ¿ Qué cantidad de trabajadores tienen 8 años de servicio?
c) ¿ Qué porcentaje de trabajadores tienen 6 años de servicio?
d) Si aquellos trabajadores que tengan a lo menos seis años de servicio reciben un
aumento del 8% .¿Qué porcentaje de los trabajadores recibió dicho aumento?
e) Si todos los trabajadores que tengan a lo más cinco años de servicio reciben una
bonificación de $20,000. ¿ Qué cantidad de trabajadores recibió dicha bonificación?
Solución:
a) Distribución de frecuencias.
Años Trabajadores %trabajadores Trab. Acum %Trab. Acum
4 9 18% 9 18%
5 8 16% 17 34%
6 9 18% 26 52%
7 10 20% 36 72%
8 8 16% 44 88%
9 6 12% 50 100%
Total 50 100%

b) Hay 8 trabajadores con ocho años de servicio.


c) El 18% de los trabajadores tienen seis años de servicio.
d) El 18%+20%+16%+12%= 66% de los trabajadores recibió un 8% de aumento.
e) Hay 9+8=17 trabajadores que recibieron una bonificación de $20,000.
Ejemplo 4:
Los siguientes datos corresponden a las notas (escala de 0 a 100), obtenidas por 100
alumnos en un curso de Estadística:

a) Construya la correspondiente distribución de frecuencias de los datos.


b) ¿En qué clase se concentra el mayor número de notas?
c) ¿Cuál es la frecuencia absoluta del cuarto intervalo?
d) Interprete la frecuencia acumulada del sexto intervalo.
e) Interprete la frecuencia relativa acumulada del quinto intervalo.
a) Distribución de frecuencias de las notas.

b) La clase (57,67], concentra la mayoría de las notas.


c) La cuarta clase (47,57], tiene frecuencia absoluta 15.
d) Hay 71 alumnos con nota a lo más de 77.
e) El 57% de los alumnos tiene como nota máxima 67.
3. Distribución gráficas de datos unidimensionales.
Para el estudio geométrico de los datos usamos los gráficos estadísticos.
El comportamiento visual de los datos, nos permite resumir información usando
los siguientes elementos.
• Tendencia: los datos se ajustan a un modelo matemático conocido.
• Centralidad: representa la concentración de los datos.
• Dispersión: distribución de los datos respecto a la concentración.
• Asimetría: la extensión de los datos formando colas.
• Conglomerados: son subconjuntos de datos formando distribuciones.
• Datos atípicos: Son valores que se salen del rango normal de datos.
3.1 Gráficos de datos no agrupados.

GRÁFICO CICULAR

a4 a1

a2

a3
• Diagrama de Barras: es un conjunto de barras o alturas en el plano,
correspondientes a cada categoría o valor de la variable.
3.2 Gráficos de datos agrupados.
Cuando los datos se le hace un tratamiento como el agrupamiento en clases, los
gráficos asociados son:
• Histograma: es una secuencia finita de rectángulos de base las clases y altura la
frecuencia (absoluta o relativa), correspondiente.

Histograma
60

50

40

30

20

10

0
C1 C2 C3 C4
• Polígono de frecuencias: es una curva que se genera al unir los puntos de
frecuencias (absolutas o relativas) de las correspondientes marcas de clase. El
polígono cierra en la marca de clase antes de primera y la marca de clase
posterior a la última.

Polígono de frecuencias
60

50

40

30

20

10

0
Xi X1 X2 X3 X4 Xf
• Ojiva: es una curva creciente, que se genera al unir los puntos de frecuencias
acumuladas (absolutas o relativas), asociadas a los limites superiores de clase.
La ojiva inicia en el límite inferior de la primera clase.

Ojiva
120

100

80

60

40

20

0
e0 e1 e2 e3 e4
Ejemplo 5:
Para el ejemplo 3, realice un diagrama circular y un diagrama de barras.
Solución:
• Diagrama Circular: Porcentaje de trabajadores por años de servicio.

12% 18%

16%

16%

20%
18%

4 5 6 7 8 9
• Diagrama de barras:

Trabajadores por años de servicio


12

10

10
8 9
9
8 8
6
6
4

0
4 5 6 7 8 9
Ejemplo 6:
Con relación al ejemplo 4, realice un histograma, un polígono de frecuencias y
una ojiva.
Solución:
• Histograma: Alumnos por intervalos de notas
25

20

20
15

15 14 14
10
11

5 8
7 7
4
0
17 a 27 27 a 37 37 a 47 47 a 57 57 a 67 67 a 77 77 a 87 87 a 97 97 a 107
• Polígono de frecuencias:

25
Alumnos por nota media

20

15

10

0
12 22 32 42 52 62 72 82 92 102 112
• Ojiva:

120
Alumnos acumulados por notas
100

80

60

40

20

0
17 27 37 47 57 67 77 87 97 107
4. Medidas Resumen.
Ejemplo 7:

1 0 4 5 3 1
2 2 1 3 2 3
0 3 3 2 0 2
1 3 2 2 2 1
0 3 2 2 4 1
Ejemplo 8:
En la tabla se presenta la distribución de estatura en centímetros de 210 personas.
Determine la media aritmética de la estatura.

Solución: La media aritmética de los datos de estatura en centímetros viene dada


por:
Ejemplo 9:
Ejemplo 10:
Ejemplo 11:
En la tabla se observa que la distribución
de hijos por familia, tiene moda 1 hijo.
Ejemplo 12:
• Relación entre la media, la mediana y la moda.

Comentario: cuando los datos generan colas (derecha o izquierda), lo mejor


en estos casos, es el uso de la mediana como medida de tendencia central.
Ejemplo 12:
Ejemplo 13:
Ejemplo 14:
Se define en minutos el tiempo que le lleva arreglarse, desde que se levanta
hasta que sale de casa. A lo largo de 60 días consecutivos. Usted recoge los
tiempos (redondeados a minutos) que se muestras a continuación

61 40 39 50 27 37 44 24 62 20 42 61
31 25 42 21 20 22 29 23 36 56 40 43
63 28 69 53 50 27 40 30 29 35 39 48
64 34 51 59 42 68 45 45 23 20 69 48
61 42 65 48 43 37 29 25 60 20 62 48

Determine los cuartiles, los percentiles 50 y 65 (Ejercicio en Excel).


Ejemplo 15:
Los datos siguientes representan la cantidad de trabajadores accidentados en la unidad de
trituración de la empresa minera El Hoyo, por día, durante 52 días de trabajo en el año 2007:
0 2 0 1 3 4 0 2 1 3 0 2 2 1 0 5 2 6 1 2 1 4 1 1 0 1
1 1 2 0 5 2 0 4 3 2 4 3 2 1 6 2 3 3 5 1 3 6 1 3 4 5
Obtenga la varianza desviación estándar de los datos.
Solución: La tabla de frecuencia de los datos es:
Ejemplo 16:
La tabla representa la distribución de la talla en centímetros, de 100 personas.
Obtenga la varianza y desviación típica.

Solución:
Ajustando la tabla a las condiciones del problema.
Ejemplo 17:
Ejemplo 18:
4.4 Medidas de Forma.
Son indicadores estadísticos que permiten identificar si una distribución presenta
uniformidad o nivel de concentración de datos entorno a la región central de los datos.
• Asimetría : Es aquella que nos permite identificar si los datos se distribuyen hacia los
extremos con respecto a la media aritmética.
La asimetría presenta tres estados:
Asimetría positiva: cuando la mayoría de los datos se encuentran por encima del valor
de la media aritmética,
Simetría: cuando los datos se distribuyen aproximadamente la misma cantidad en ambos
lados de la media aritmética.
Asimetría negativa: cuando la mayor cantidad de datos se aglomeran en los valores
menores que la media aritmética.
Ejemplo19:
• Curtosis : Esta medida determina el grado de concentración que presentan los valores en la
región central de la distribución.
La Curtosis presenta 3 grados:
Platicúrtica: cuando hay una baja concentración de datos entorno a la región central.
Mesocúrtica: cuando hay una moderada o normal concentración de datos en la región central.
Leptocúrtica: cuando hay una alta concentración de datos en la región central.
Ejemplo 20:
Bibliografía:
• Castillo Isabel y Guijarro Marta(2006) Estadística Descriptiva y Cálculo de Probabilidades.
Editorial Pearson.
• Córdova Zamora, Manuel(2003) Estadística Descriptiva e Inferencial. Editorial, Librería
MOSI1ERA S.R.L. Quinta Edición.
• Devore, J. (2008) Probabilidad y Estadística para Ingeniería y Ciencias. 7ma. Edición.
Cengace Learning Editores. México.
• Johnson, R. & Kuby, P. (2012) Estadística Elemental. Engage Learning Latinoamérica. 11ª
Edición.
• Martínez Bencardino, Ciro (2014) Estadística y Muestreo. 14 ed. Colombia: ECOE
Ediciones.
• Montgomery, D. C y Runger, R. (2008) Probabilidad y Estadística Aplicadas a la Ingeniería.
2da. Edición. Limusa Wiley. México.
• Rincón Luis (2017) Estadística Descriptiva.UNAM. México.

También podría gustarte