Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
ESTADÍSTICA 2
Curso Estadística
Formato Manual de curso
Autor Cibertec
Título Estadística
Edición 2a ed.
Pie de imprenta Lima: Cibertec, 2018
Descripción física 61 páginas.
Elaborador Quispe Narváez, Edgar Ronald
Revisor García Cárdenas, Jorge Luis
Índice
Presentación 5
Red de contenidos 7
Unidad de Aprendizaje 1 9
ESTADÍSTICA DESCRIPTIVA
1.1. Tema 1 : Conceptos básicos sobre estadística 11
1.1.1. : Población y muestra 11
1.1.2. : Variables estadísticas 12
1.1.3. : Técnicas e instrumentos de recolección de datos 14
1.1.4. : Elaboración de tablas de distribución de frecuencias 15
Interpretación y elaboración de gráficos estadísticos: 20
1.1.5. :
Histograma, Polígono de frecuencia y Diagrama circular
61
Bibliografía Unidad de Aprendizaje 1
Presentación
Hoy en día, la toma de decisiones es muy importante en cualquier área de trabajo. En
esta oportunidad, el manual está orientado al área de negocios. En la actualidad, todo
profesional debe estar en constante contacto con información de naturaleza estadística.
Es más, muchas veces es necesario que un profesional de cualquier área tenga que
realizar alguna medición estadística para poder tener una idea acerca de la marcha de
una empresa, para tomar una decisión organizacional o, finalmente, para proyectar
datos a futuro. El presente curso ofrece, al futuro profesional, las herramientas
estadísticas necesarias para organizar, calcular, evaluar e interpretar información
estadística, haciendo énfasis en los fundamentos para realizar dichos procesos.
En las sesiones de clase, el curso se desarrolla en forma teórico – práctica; por lo que
las mismas tendrán exposiciones dialogadas sobre los fundamentos de los temas que
se tratarán y la resolución de ejercicios, dándole mayor énfasis a esta última parte y al
análisis e interpretación de resultados.
Red de contenidos
ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
Conceptos
Medidas de Medidas de
básicos Medidas de
tendencia distribución
sobre dispersión
central de forma
estadística
UNIDAD
1
ESTADÍSTICA DESCRIPTIVA
LOGRO DE LA UNIDAD DE APRENDIZAJE
Al término de la unidad, el alumno, trabajando de manera individual, calcula e
interpreta estadísticos de tendencia central, de dispersión y de forma, sobre la
base de un conjunto de datos no agrupados o agrupados en una Tabla de
Distribución de Frecuencias.
TEMARIO
ACTIVIDADES PROPUESTAS
Estadística descriptiva
Estadística inferencial
La inferencia estadística, por el contrario, estudia los resúmenes de datos con referencia
a un modelo de distribución probabilístico o una familia de modelos, determinando
márgenes de incertidumbre en las estimaciones de los parámetros desconocidos del
mismo. Se supone que el conjunto de datos analizados es una muestra de una población
y el interés principal es predecir el comportamiento de la población, a partir de los
resultados en la muestra. (Carmen Batanero, 2001, p. 10).
Esta división es hoy demasiado simple y han surgido diferentes corrientes dentro de la
estadística.
POBLACIÓN MUESTRA
Cierto porcentaje del ganado vacuno
El ganado vacuno de las regiones del
seleccionado de forma aleatoria de las
norte del Perú en el año 2017.
regiones del norte del Perú en el 2017.
Es toda propiedad, característica o cualidad que presentan los elementos que forman
parte de la muestra y/o población.
Variable cuantitativa
Las siguientes son ejemplos de variables discretas: número de autos vendidos por
una tienda en un día, número de alumnos asistentes a las clases de un curso de
estadística.
Las siguientes son ejemplos de variables continuas: tiempo que demora un estudiante
en realizar un examen, peso de un estudiante.
Variable cualitativa
Las variables cualitativas se denominan ordinales cuando los datos proporcionados por
la variable son susceptibles de ser ordenados a través de una jerarquía.
Cualitativa Cuantitativa
Variable
Nominal Ordinal Discreta Continua
Preferencias políticas (izquierda, centro,
derecha)
Marcas de gaseosa
Peso en Kg.
Velocidad en Km/hora
Nacionalidad
Nivel de instrucción
Grado de desnutrición
RECOLECCION DE DATOS
TÉCNICA INSTRUMENTO
1. Encuesta 1. Cuestionario, test, prueba
2. Entrevista 2. Guía de entrevista
3. Focus Group 3. Guía de moderación
4. Análisis documental 4. Ficha de registro de datos
5. Observación no experimental 5. Guía de observación
6. Observación experimental 6. Guía de observación / Ficha de
registro de datos
Aplicaciones
Donde:
𝑛 𝑛
𝐹𝑛 = ∑ 𝑓𝑖 𝐻𝑛 = ∑ ℎ𝑖
𝑖=1 𝑖=1
Sup Prim Post Post Sup Sec Sec Sup Post Sec Sup Sup
Sup Sup Sec Sup Sup Sup Sup Sup Sup Sup Prim Sup
Sup Sec Sup Sup Sec Sup Sup Sec Prim Sup Sup Sec
Ejemplo:
2 3 4 5 1 2 3 2 1
0 2 1 5 3 1 2 3 2
2 4 3 5 2 0 2 1 3
1 1 4 2 3 4 5 1 0
Resolución:
Ejemplo 1:
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Elabore la tabla de frecuencias para el variable pago por impuestos municipales año
2014.
Resolución:
Ejemplo 2:
Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen:
Resolución:
Intervalos mi fi Fi hi Hi
[33 – 42,143> 37,57 7 7 0,14 0,14
[42,143 – 51,286> 46,71 4 11 0,08 0,22
[51,286 – 60,429> 55,85 9 20 0,18 0,40
[60,429 – 69,572> 65,00 11 31 0,22 0,62
[69,572 – 78,715> 74,14 9 40 0,18 0,80
[78,715 – 87,858> 83,28 5 45 0,10 0,90
[87,858 – 97] 92,42 5 50 0,10 1
Total 50 1
Cada uno de los datos de la tabla permite obtener cierta información, dependiendo de
su ubicación:
Intervalos mi fi Fi hi Hi
[26 – 34> 30 1 1 0,022 0,022
[34 – 42> 38 2 3 0,044 0,066
[42 – 50> 46 4 7 0,089 0,154
[50 – 58> 54 10 17 0,222 0,376
[58 – 66> 62 16 33 0,356 0,732
[66 – 74> 70 8 41 0,178 0,910
[74 – 82> 78 3 44 0,067 0,977
[82 – 90] 86 1 45 0,022 1
45
1.1.5.1. Histogramas
Es aquel diagrama que se obtiene considerando los intervalos de clase con las
frecuencias absolutas o las frecuencias relativas.
Se caracteriza por ser un conjunto de barras verticales cuyas alturas dependerán de las
frecuencias que se tenga.
Son utilizados en aquellos casos donde nos interesa no solo mostrar el número de veces
que se da una característica o atributo, si no también visualizar mejor la proporción en
que aparece esa característica respecto del total.
Es aquel diagrama que se obtiene considerando las marcas de clase con las frecuencias
absolutas o las frecuencias relativas.
ACTIVIDADES PROPUESTAS
3. Aceros Arequipa ha estado buscando los factores que influyen en las ventas de
varas de acero (en millones de toneladas) que realiza en la ciudad de Lima.
Tomó una muestra de 300 establecimientos en diferentes partes de Lima y
Callao y después de realizar un estudio de mercado, la administración de la
empresa obtuvo los siguientes resultados:
Del total de encuestados el 27% dejó de comprar dicho producto.
El 90% de encuestados afirman que el producto mantiene su calidad.
El 32% no consume solamente el producto.
El 56% afirma que el producto se encuentra escaso en el mercado, y de los
que afirman esto el 84% compran otro producto.
El 95% de los consumidores paga por las varillas de ½ pulgadas entre $ 6.20
y $ 7.05 dólares.
Además, se encontró que el precio fijado en la ciudad de Lima de $ 6.10 no
se respeta, y por esta razón, existe un desabastecimiento del 90% en la
ciudad del Callao. De acuerdo a los datos anteriores, determine la población,
la muestra y las variables con sus respectivos tipos y además indique el tipo
de estimación utilizada.
Plazas Nº de hoteles
[0 - 10> 25
[10 – 30> 50
[30 – 60> 55
[60 – 100> 20
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 1 2, 13,14,15, 11, 11, 12, 16, 17, 17,1 6,16, 15, 14,
12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15,
13, 11, 12.
Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL
Trabajadores Nº de Empresas
100 - 200 25
200 - 300 37
300 - 400 12
400 - 500 22
500 - 600 21
600 - 700 13
700 - 800 5
800 - 900 3
900 - 1000 2
Puntaje [38, 44> [44, 50> [50, 56> [56, 62> [62, 68> [68, 74> [74, 80]
Nº Trabajadores 7 8 15 25 18 9 6
13. El gerente de control de calidad de una fábrica que produce asientos especiales
de fibra de vidrio, quiere identificar los problemas más importantes que se
presentan en la elaboración de estos, y poder planear soluciones a dichos
problemas de acuerdo a una estrategia basada en la prioridad del problema. Se
extrae una muestra aleatoria de los problemas de calidad obteniendo los
siguientes resultados:
Número de
Problema detectado
ocurrencias (fi)
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa
protectora 12
Otros 14
Frecuencia
Frecuencia Frecuencia
Marca de Frecuencia relativa
Clase Absoluta Acumulada
clase relativa (hi) Acumulada
(fi) (fi)
(hi)
[450 - > 8
750 10
33 0,3
12
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
Arequipa
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
Tacna
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule los intervalos de clase y marcas de clase por cada
departamento.
Determine las clases para agrupar y comparar los datos de ambas muestras
81 53 67 60 80 64 56 54 91 61
66 88 67 65 97 72 74 65 73 69
43 54 76 70 86 68 82 75 79 60
41 87 76 97 70 45 60 45 65 56
92 72 82 80 52 65 50 58 70 76
Resumen
1. Una manera de averiguar cuál es la variable de un estudio estadístico es
preguntarnos lo siguiente: ¿Qué es lo que estoy estudiando?
2. Una misma variable estadística puede tener distintas clasificaciones: puede ser
cualitativa o cuantitativa.
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o http://www.vitutor.com/estadistica/descriptiva/a_1.html
o http://www.uv.es/webgid/Descriptiva/12_conceptos_estadsticos.html
o http://colposfesz.galeon.com/est501/suma/sumahtml/conceptos/estadistica.htm
a. Media Aritmética
b. Mediana
𝑛
− 𝐹𝑚−1
𝑀𝑒 = 𝐿𝑖 + 𝑤 [ 2 ]
𝑓𝑚
Donde:
c. Moda
Para datos no agrupados, el cálculo de la moda se realiza con un conteo de los datos y
analizando cuál de ellos es el que más se repite (presenta una fi más alta).
𝑓0 − 𝑓0−1
𝑀𝑜 = 𝐿𝑖 + 𝑤 [ ]
(𝑓0 − 𝑓0−1 ) + (𝑓0 − 𝑓0+1 )
Donde:
Ejemplos:
Los datos que a continuación se muestran son las edades de las personas que han
acudido a un policlínico solicitando exámenes de despistaje de cáncer.
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
Resolución:
Intervalos mi fi Fi hi Hi
[ 26 – 34 > 30 1 1 0,022 0,022
[ 34 – 42 > 38 2 3 0,044 0,066
[ 42 – 50 > 46 4 7 0,089 0,154
[ 50 – 58 > 54 10 17 0,222 0,376
[ 58 – 66 > 62 16 33 0,356 0,732
[ 66 – 74 > 70 8 41 0,178 0,910
[ 74 – 82 > 78 3 44 0,067 0,977
[ 82 – 90 ] 86 1 45 0,022 1
Total 45 1
Luego tenemos:
45
−17
𝑀𝑒 = 58 + 8 [ 2
]
16
𝑀𝑒 = 60,75
Este resultado indica que el 50% de las personas tienen edades mayores o iguales a
60,75.
La clase modal es quinto intervalo ya que es el intervalo que tiene mayor frecuencia
absoluta.
Luego tenemos:
16 − 10
𝑀0 = 58 + 8 [ ]
(16 − 10) + (16 − 8)
𝑀𝑜 = 61,42
Este resultado nos indica que la las personas que más solicitan despistaje con cáncer
son personas con edades de 61 años.
Nota:
Se utiliza la media cuando se tiene variables con valores que tiene distribución simétrica.
La mediana no se ve afectado por la presencia de datos atípicos, por lo tanto, se
recomienda su uso bajo la presencia de ellos.
ACTIVIDADES PROPUESTAS
340, 240, 330, 240, 325, 240, 240, 305, 240, 300, 240, 290, 240, 280, 240, 280, 255,
265, 255, 265
Calcule:
a. Media.
b. Mediana.
c. Moda.
Duración Nº Anuncios
0-20 3
20-25 17
25-30 13
30-40 9
40-60 8
4. La empresa “A” tiene 100 empleados, con un sueldo promedio mensual por
empleado de $300, la empresa “B” tiene 400 empleados, con un sueldo medio
mensual de $250, la empresa “C” tiene 250 empleados y un sueldo promedio
mensual de $280, ¿Determine cuál es el sueldo medio mensual por empleado
para las 3 empresas en conjunto?
Número de
Exportaciones
empresas
(miles €)
(cientos)
0 – 10 4
10 – 20 20
20 – 40 16
40 – 50 10
Se pide:
a. Determine el importe medio. ¿El valor hallado es representativo de la distribución
de facturas?
b. Determine el importe mediano y el importe más frecuente.
c. Calcular el importe mínimo pagado por el tercio de vehículos con facturas de
mayor importe.
d. ¿Determine el importe máximo pagado por las 60 reparaciones más baratas?
e. Calcular el grado de asimetría que presenta la distribución con la mayor precisión
posible e interprete el resultado.
10. En un aparcamiento cobran por cada minuto que está estacionado el vehículo
1,5 céntimos de €. La ocupación del aparcamiento durante la semana pasada
fue la siguiente:
Tiempo de
estacionamiento Nº de vehículos
(min.)
0 - 60 1240
60 - 120 3575
120 - 180 746
180 - 240 327
240 - 360 218
360 - 1440 44
Se pide:
a. Determine el tiempo medio de estacionamiento, el más frecuente y el mediano.
b. ¿A partir de qué cantidad de tiempo un vehículo está estacionado más que el
85% de los vehículos?
c. Calcule los ingresos totales, el ingreso medio y el más frecuente.
Empresa
Duración (horas) Marca de clase
A B
700 - 900 8 10
900 - 1100 14 22
1100 -1300 26 18
1300 -1500 6 4
12. Las facturaciones sin IGV (en decenas de mil) obtenidas en el último trimestre
en 300 restaurantes de una localidad española han sido:
2-4 40
4-6 85
6-10 115
10-12 60
Ganancias
de mi fi hi Fi Hi
(en miles Soles)
[ 6 - > a
[ - > 2a 120 0.15
[ - > 0.25
[ - > 304
[ - > 0.93
[ - ]
Nº de Productos
30
25
24
25
21
20
20 18
15
15
Nº de Productos
10
0
Semana 1 Semana 2 Semana 3 Semana 4 Semana 5 Semana 6
Resumen
1. Si los datos son muy dispersos o encontramos valores extremos, es posible que
el promedio no sea representativo de los mismos. En este caso es mejor utilizar
la mediana.
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o http://www.uv.es/webgid/Descriptiva/21_introduccin.html
o http://www.uv.es/webgid/Descriptiva/22_moda.html
o http://www.uv.es/webgid/Descriptiva/23_mediana.html
o http://www.uv.es/webgid/Descriptiva/24_media_aritmtica.html
o http://www.vitutor.com/estadistica/descriptiva/a_8.html
o http://www.vitutor.com/estadistica/descriptiva/a_9.html
o http://www.vitutor.com/estadistica/descriptiva/a_10.html
1.3.1.1. Varianza
Donde:
n* = n – 1, si se trata de una muestra (n: tamaño de la muestra).
n* = n, si se trata de una población (n: tamaño de la población).
La Desviación estándar es una medida de dispersión que nos indica cuánto tienden a
alejarse los datos del promedio de una distribución, es decir, la Desviación estándar de
un conjunto de datos es una medida de cuánto se desvían los datos con respecto a su
media.
𝑆 = √𝑉
Notación:
Desviación estándar muestra : 𝑠 = √𝑠 2
Desviación estándar poblacional : 𝜎 = √𝜎 2
𝑆
𝐶𝑉 = ∙ 100%
𝑥̅
Si en una empresa “A” de 100 trabajadores el sueldo promedio es 500 soles, con una
varianza de 900 soles, y en la empresa “B” el coeficiente de variación de los sueldos es
del 5.6%, ¿qué podría afirmar acerca de la dispersión de los sueldos de las empresas
A y B?
Resolución:
Empresa A Empresa B
Total de datos : 100
Sueldo promedio : 500
Varianza : 900
Coeficiente variación: 5,6%
Desviación estándar: √900 = 30
30
Coeficiente variación: ∙ 100% = 6%
500
ACTIVIDADES PROPUESTAS
Muestra
Vida útil en horas
Empresa “A” Empresa “B”
[700 - 900> 10 3
[900 - 1100> 16 36
[1100 -1300> 26 12
[1300 -1500] 8 3
Ventas en Número de
Marca de clase
miles de dólares vendedores fi
5,0 - 7,8 3
7,8 - 10,6 10
10,6 - 13,4 28
13,4 - 16,2 9
11. La distribución de los sueldos (en dólares) de los empleados de dos empresas
A y B se tabuló en 3 intervalos de igual amplitud en cada caso, siendo las
frecuencias absolutas del primero al tercero de 10, 30, 30 y de 30, 50, 20
respectivamente en A y B. Si los sueldos mínimo y máximo son de 50 y 200 en
A y de 60 y 240 en B:
a. ¿Determine en qué empresa los sueldos son más homogéneos?
b. Si un empleado de A y otro de B ganan cada uno $130, ¿determine cuál de
ellos está mejor considerado en su centro de trabajo?
12. La siguiente tabla muestra los resultados de una encuesta de sondeo realizada
por un operador de telefonía celular a los adolescentes de los distritos de Los
Olivos y San Miguel referente al uso del sistema prepago de telefonía celular. El
estudio se refirió al tiempo de uso del sistema telefónico y al gasto de los
adolescentes en tarjetas prepago.
Relaciones Proyección
Contabilidad Proyectos
Internacionales Social
Remuneración Media 1250 1500 1750 1300
Desviación estándar 150 250 100 200
N° empleados 8 5 12 25
15. La distribución de los sueldos (en dólares) de los empleados de dos empresas
A y B se tabuló en 3 intervalos de igual amplitud en cada caso, siendo las
frecuencias absolutas del primero al tercero de 10, 30, 30 y de 30, 50, 20
respectivamente en A y B. Si los sueldos mínimo y máximo son de 50 y 200 en
A y de 60 y 240 en B.
a. Determine ¿En qué empresa los sueldos son más homogéneos?
b. Si un empleado de A y otro de B ganan cada uno $130. Determine ¿Cuál de
ellos está mejor considerado en su centro de trabajo?
[350 , 400[ 10 9
[400 , 450[ 35 36
[450 , 500[ 70 60
[500 , 550[ 40 75
[550 , 600[ 25 90
[600 , 650[ 15 24
[650 , 700] 5 6
Moda 476,92
Variancia 4773,87
Producción mensual
fi
Toneladas métricas >
[50 - 58 > 4
[58 - 66 > 8
[66 - 74 > 2
[74 - 82 > 6
[82 - 90 > 5
[90 – 98] 5
n =30
Tomando como base los datos del cuadro anterior, calcule e interprete:
a. La media o promedio.
b. La desviación estándar.
c. El coeficiente de variación.
Resumen
1. Una mayor dispersión de datos implica una menor concentración de los mismos
y viceversa.
2. Una mayor homogeneidad en los datos equivale a una menor dispersión de los
mismos y viceversa.
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad:
o http://www.vitutor.net/2/11/medidas_dispersion.html
o http://colposfesz.galeon.com/est501/distfrec/meddisp/meddisp.htm
o http://www.ecured.cu/index.php/Medidas_de_dispersi%C3%B3n
Las medidas de asimetría son indicadores que permiten establecer el grado de simetría
(o asimetría) que presenta una de datos sin tener que hacer su representación gráfica.
Como eje de simetría consideramos una recta paralela al eje de ordenadas que pasa
por la media de la distribución. Si una distribución es simétrica, existe el mismo número
de valores a la derecha que a la izquierda de la media, por tanto, el mismo número de
desviaciones con signo positivo que con signo negativo. Decimos que hay asimetría
positiva (o a la derecha) si la "cola" a la derecha de la media es más larga que la de la
izquierda, es decir, si hay valores más separados de la media a la derecha. Diremos
que hay asimetría negativa (o a la izquierda) si la "cola" a la izquierda de la media es
más larga que la de la derecha, es decir, si hay valores más separados de la media a la
izquierda (https://es.wikipedia.org/wiki/Asimetr%C3%ADa_estad%C3%ADstica).
Asimetría negativa
Asimetría positiva
Distribución simétrica
INTERPRETACIÓN
As > 0 : Asimetría positiva
As = 0 : Distribución simétrica
As < 0 : Asimetría negativa
INTERPRETACIÓN
Cr > 0 : Distribución leptocúrtica
Cr = 0 : Distribución meso-cúrtica
Cr < 0 : Distribución platicúrtica
Ejemplos:
Resolución:
ACTIVIDADES PROPUESTAS
Montos pagados mi fi Fi
[ 150 – > 4
[ 250 – > 24
[ > 30
[ > 72
[ ] 8 80
TOTAL
Peso [50, 60> [60, 70> [70, 80> [80,90> [90, 100> [100, 110> [110, 120>
fi 8 10 16 14 10 5 2
b. Los pagos diarios de los 125 empleados de una fábrica vienen dados por la
siguiente tabla:
Peso [10, 20> [20, 30> [30, 40> [40,50> [50, 60> [60, 70> [70, 80>
fi 18 20 26 24 10 15 12
Resumen
1. .
Pueden revisar los siguientes enlaces para ampliar los conceptos vistos en esta unidad: