Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRINCIPALES DEFINICIONES
1. ESTADÍSTICA
MUESTREO PROBABILÍSTICO.
1
Procedimiento:
•
Elabore el marco de muestreo.
•
Determine un tamaño de muestra “n”.
•
Seleccione “n” números aleatorios “sin reemplazo” de la tabla de números aleatorios o
generados por un computador.
• Recopile la información de cada una de las unidades de análisis seleccionadas.
• Estimar: Promedios, totales o porcentajes y su error estándar respectivo.
Ejemplo.
Población de alumnos matriculados en 5to. Año de secundaria (N). N = 7 154 alumnos1.
Conociendo la población de alumnos matriculados en 5to. Año de secundaria.
La muestra inicial estaría dado por:
Muestra inicial:
𝑍2 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁
𝑛0 = 2
𝑒 (𝑁 − 1) + 𝑍 2 ∗ 𝑝 ∗ 𝑞
Donde:
N = tamaño de la población. Entonces: N = 7 154
Z = Valor tabular de una distribución normal estandarizado, dado un nivel de confianza, con
probabilidad (1 – 𝛼). Para un 95% de nivel de confianza; entonces: Z = 1.96
Reemplazando:
1.962 ∗ 0.5 ∗ 0.5 ∗ 7 154
𝑛0 = = 365 𝐴𝑙𝑢𝑚𝑛𝑜𝑠
0.052 (7 154 − 1) + 1.962 ∗ 0.5 ∗ 0.5
365
𝑛= = 347 𝐴𝑙𝑢𝑚𝑛𝑜𝑠.
365
1 + 7154
Se requeriría encuestar a no menos de 347 estudiantes del 5to año de secundaria para poder
tener una seguridad del 95%.
UNIDAD DE Es el elemento u objeto de la población que será analizado y sobre los
ANÁLISIS cuales se obtendrán los datos.
Son aquellas medidas que describen numéricamente las características de
una población.
PARÁMETROS.
Ejemplo: La media poblacional (), la desviación estándar poblacional
(), la varianza poblacional (² )
Son aquellas medidas que describen numéricamente las características de
ESTADÍGRA
una muestra. También conocido como estimador puntual. Por ejemplo:
FOS.
La media aritmética, la mediana (Me), la moda (Mo).
1
[Fuente: MINISTERIO DE EDUCACIÓN - Censo Escolar./ http://escale.minedu.gob.pe/magnitudes]
2
VARIABLE.
Es una característica de la población que se va investigar y que puede tomar diferentes
valores.
Ejemplo.
Las horas extras trabajadas por los trabajadores de una empresa y los valores de esta
variable vendrían dadas por las diferentes horas trabajados por cada trabajador fuera de la
jornada normal: ninguna, una, dos, tres, ……….
Las variables se clasifican por su naturaleza en: cuantitativas y cualitativas.
VARIABLE CUANTITATIVA:
Es el resultado de un proceso que cuantifica, es decir, surgen cuando se puede establecer
cuanto o en qué cantidad se posee una determinada característica y es numérico.
Ejemplo:
Ingreso por familia
Número de ventas diarias de cierto establecimiento.
Longitud, tiempo, etc.
Las variables cuantitativas se dividen por su tipo en discretas y continuas.
VARIABLE CUALITATIVA.
Cuando la variable está asociada a una característica cualitativa. Es decir, son variables
cuyos valores son cualidades, categorías o atributos, que presenta la población.
Ejemplos.
Régimen de tenencia de la vivienda (Propia, Alquilada)
3
PRÁCTICA 1.
1. Identifique las siguientes variables según su clasificación, ya sea cuantitativa (discreta o
continua) y cualitativa (nominal u ordinal).
a) Ficha de productos que elabora una fábrica:
➢ Nombre del producto: ...............................................................................................
➢ Tipo de envase: .................................... ....................................................................
➢ Peso por unidad: ................................... ....................................................................
➢ Tiempo de procesamiento: ................... ....................................................................
➢ Costo por unidad: ................................. ....................................................................
➢ Precio de venta por unidad: ................... ..................................................................
Población
Muestra
Unidad de análisis
Variable
Tipo de variable
3. Estudios realizados sobre la contaminación ambiental coinciden en que los principales causantes de
la contaminación del aire son la combustión en los vehículos con motores diesel y la falta de un
mantenimiento técnico. Para tener información cuantitativa de lo mencionado anteriormente, se ha
tomado una encuesta a una muestra de 30 choferes de la ruta Portada del Sol-Santa Anita (Línea P)
encontrándose los siguientes resultados:
• El número promedio de veces que los choferes realizan una revisión técnica a sus vehículos
es 1.36 veces al año.
• La ganancia promedio por día es de 97.73 nuevos soles
• 20 choferes poseen un grado de instrucción secundario, 5 choferes poseen primaria
completa, 5 choferes poseen nivel universitario. Determine:
Población
Muestra
Unidad de análisis
Variable
Tipo de variable
4
ACTIVIDAD DE APRENDIZAJE I
Caso I:
1. Los siguientes datos pertenecen a una muestra aleatoria de 30 cibernautas de la ciudad de
Chimbote, según modo de conexión al chat a través de internet mediante una encuesta
realizada por la comunidad virtual Profesional de Marketing en enero del 2007.
C C T T T C C Cl O Cl
T T O Cl Cl Cl C Cl O Cl
C C Cl T O O Cl Cl Cl Cl
Donde:
C: “Casa” T: “Trabajo” Cl: “Cibercafé” O: Otros
a) Identificar la unidad de observación y la variable en estudio.
b) Construir una distribución de frecuencias absolutas y porcentuales.
c) Interpretar f3 y h4%
d) Construir un gráfico de barras simples para frecuencias absolutas.
e) Construir un gráfico de sectores y comentar.
Solución:
a)
➢ Unidad de observación: El cibernauta.
➢ Variable en estudio: modo de conexión al al chat a través de internet
b)
Distribución de cibernautas según el modo de conexión al chat a través de internet. Ciudad de
Chimbote. Enero de 2007.
Modo de conexión N° de cibernautas
hi hi%
(Xi) fi
Casa (C) 7 0.23 23%
Trabajo (T) 6 0.20 20%
Cibercafé (Cl) 12 0.40 40%
Otros (O) 5 0.17 17%
Total: 30 1.0 100%
Fuente: Encuesta – Comunidad Virtual Profesional de Marketing
c) Interpretación:
f3 = 12: Existen 12 de cibernautas de la ciudad de Chimbote que acceden al internet por el
modo de conexión a través de un Cibercafé.
h4% = 17%: Existe un 17% de los cibernautas de la ciudad de Chimbote que acceden al
internet por el modo de conexión a través de otras modalidades.
d)
Grafico N°03: Distribución de cibernautas según el modo de conexión al chat a través de
internet. Ciudad de Chimbote. Enero de 2007.
14
12
12
10
8 7
6
6 5
4
2
0
Casa (C) Trabajo (T) Cibercafé (Cl) Otros (O)
Fuente: Encuesta – Comunidad Virtual Profesional de Marketing.
5
e)
Grafico N°04: Distribución de cibernautas según el modo de conexión al chat a través de
internet. Ciudad de Chimbote. Enero de 2007.
Otros (O) Casa (C)
17% 23%
Cibercafé Trabajo
(Cl) (T)
40% 20%
Fuente: Encuesta – Comunidad Virtual Profesional de Marketing.
Comentario:
Del gráfico se puede observar que existe un 40% de los cibernautas que acceden por el modo
de conexión al chat a través de internet desde un cibercafé y un 17% a través de Otros medios
en la Ciudad de Chimbote.
Caso II.
2. La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14 a 15 horas
en 60 importantes locales de ventas de automóviles de cierta ciudad:
0 2 5 0 1 4 1 0 2 1 5 0 1 3 0 0 2 1 3 1
1 4 0 2 4 1 2 4 0 4 3 5 0 1 3 6 4 2 0 2
0 2 3 0 4 2 5 1 1 2 2 1 6 5 0 3 3 0 0 4
a) Determinar la variable a analizar e indicar cuál es su Naturaleza y tipo de
variable.
b) Construir un cuadro de distribución de frecuencias relativas y relativas
porcentuales e interpretar el significado de la cuarta frecuencia.
Caso III.
3. Los siguientes datos corresponden a una muestra aleatoria de 20 trabajadores del banco de
crédito del Perú según sus retenciones al sistema privado de pensiones en febrero del 2011.
100 200 150 160 179 130 135 150 155 158
180 190 170 175 120 115 140 139 145 144
Los datos fueron brindados por el departamento de personal de dicha institución.
Se pide:
a) Identificar la unidad de análisis y la variable en estudio.
b) Construya un cuadro de distribución de frecuencias ampliada. Utilice la regla de
Sturges.
c) Interprete f3, h3%, F3 y H3%.
d) Determinar qué porcentaje de trabajadores tienen una retención de 140 soles o
más, pero menos de 180 soles.
e) Determinar cuántos trabajadores tienen una retención de 160 a 200 soles.
f) Construir un histograma de frecuencias porcentuales y comente.
Solución.
a)
➢ Unidad de observación: El trabajador del BCP.
➢ Variable en estudio: Retenciones al Sistema Privado de Pensiones (SPP).
6
Paso 1: Determinamos el Rango.
Rango (R) = Valor Máximo – Valor Mínimo R = 200 – 100 = 100
Paso 2: Determinamos el Número de intervalos (m), Aplicando la regla de Sturges:
N° de intervalos (m) = 1 + 3.322*log(n) m = 1+ 3.322*log(20) = 5.293 ≈ 5
Paso 3: Determinamos la Amplitud (C).
Amplitud (C) = R/m C = 100/5 = 20
Cuadro N° 01: Distribución de los trabajadores según sus Retenciones al Sistema Privado de
Pensiones (SPP). Banco de Crédito del Perú. Febrero de 2006.
[Li – Ls> Xi fi Fi hi Hi hi% Hi%
[100 – 120> 110 2 2 0.10 0.10 10% 10%
[120 – 140> 130 4 6 0.20 0.30 20% 30%
[140 – 160> 150 7 13 0.35 0.65 35% 65%
[160 – 180> 170 4 17 0.20 0.85 20% 85%
[180 – 200] 190 3 20 0.15 1.0 15% 100%
Total: 20 1.0 100%
Fuente: Departamento de personal del BCP.
c) Interpretación:
f3 = 7: Existen 7 trabajadores que sus retenciones al Sistema Privado de Pensiones se
encuentran de 140 soles a más y a menos de 160 nuevos soles.
h3% = 35%: Existe un 35% de los trabajadores que sus retenciones al Sistema Privado de
Pensiones se encuentran de 140 soles a más y a menos de 160 soles.
F3 = 13: Existen 13 trabajadores que sus retenciones al Sistema Privado de Pensiones se
encuentran de 100 soles a más y a menos de 160 soles.
H3% = 65%: Existe un 65% de los trabajadores que sus retenciones al Sistema Privado de
Pensiones se encuentran de 100 soles a más y a menos de 160 soles.
Gráfico N° 01: Distribución porcentual de los trabajadores según sus Retenciones al Sistema
Privado de Pensiones (SPP). Banco de Crédito del Perú. Febrero de 2006.
35%
40%
10%
0%
[100 – 120> [120 – 140> [140 – 160> [160 – 180> [180 – 200]
Comentario:
Del gráfico se puede observar que existe un 35% de los trabajadores que sus retenciones al
Sistema Privado de Pensiones se encuentran de 140 soles a más y a menos de 160 soles y
existe un 10% de los trabajadores que sus retenciones al Sistema Privado de Pensiones se
encuentra de 100 soles a más y a menos de 120 soles.
7
TRABAJO PRÁCTICO 2: ESTADÍSTICA DESCRIPTIVA
(trabajo práctico a entregar de manera individual para ser calificado)
Se recomienda el uso del Software Estadístico Minitab 16 o SPSS 20.0 o Excel 2016.
1. Un restaurante de Tingo María emplea cuestionarios en los que pide a sus clientes que
evalúen el servicio, la calidad de los alimentos, los cocteles, los precios y la atmosfera del
restaurante. Cada uno de estos puntos se evalúa con una escala optima (O), muy bueno (V),
Bueno (G), regular (A) y malo (P). Emplee la estadística descriptiva para resumir los datos
siguientes respecto a la calidad de los alimentos. ¿Qué piensa acerca de la evaluación de la
calidad de los alimentos de este restaurante?
Malo Regular Bueno Malo Bueno Bueno Muy bueno Malo
Regular Bueno Bueno Bueno Muy bueno Muy bueno Regular Regular
Bueno Bueno Muy bueno Muy bueno Regular Regular Bueno Bueno
Muy bueno Regular Regular Regular Bueno Bueno Muy bueno Bueno
Optima Bueno Bueno Bueno Muy bueno Muy bueno Optima Optima
Regular Bueno Muy bueno Muy bueno Malo Malo Malo Malo
Bueno Optima Regular Regular Regular Regular Regular Regular
Bueno Regular Bueno Bueno Bueno Bueno Bueno Bueno
Optima Regular Regular Bueno Optima Malo Regular Bueno
3. Los siguientes datos corresponden a una muestra aleatoria de los gastos semanales en
dólares de turistas que se alojaron en el hotel “Sheraton” la ciudad de Lima en julio del
2013.
17 18 9 8 18 14 18 31 32 9 21 33 34 31 33 19 18 20
27 26 15 38 20 32 14 14 17 15 19 36 33 39 31 27 26 17
40 14 25 27 33 20 17 10 33 18 12 25 18 24 19 30 26 14
25 29 40 8 11 23 35 11 39 37 25 28 36 37 10 18 14 10
26 16 36 8 37 31 40 17 10 15 19 31 38 30 37 32 29 34
20 26 21 29 34 28 37 29 8 12 16 20 21 13 30 19 20 18
La información fue obtenida de los registros de clientes de dicho hotel.
8
Solución:
Del
PASOS PARA AGRUPAR DATOS Función en Excel
Ejemplo
Tamaño de muestra: ( n ) = CONTAR(Seleccionar BD[1])
Valor Máximo = MAX()
Valor Mínimo = MIN()
Rango (R)= Valor Máximo - Valor Mínimo
Aplicando la regla de STURGES:
Nº de intervalos (m) = 1+3.3*log (n)
m redondeado = REDONDEAR()
Amplitud (C ) = R/[m = redondeado]
Cuadro N° 01:
Total.
Fuente:
Gráfico N° 01:
20
18
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8
9
Apellidos y nombres……………………... …………………………………………Grupo…………
Xi fi (Xi * fi)
̅ 𝑮 ):
~ Media geométrica (𝑿
∑𝑚 𝑓 ∗ 𝑙𝑜𝑔(𝑋𝑖 )
̅ 𝑮 = 𝒂𝒏𝒕𝒊 𝒍𝒐𝒈 [ 𝑖=1 𝑖
𝑿 ]
𝒏
𝑋̅𝐺 = ______________________
Interpretación:
∑𝑛𝑖=1(𝑋𝑖 ∗ 𝑓𝑖) =
∑𝑛𝑖=1(𝑋𝑖 ∗ 𝑓𝑖)
𝑋̅ =
𝑛
̅ 𝒉)
~ Media armónica (𝑿
𝑋̅ = ______________________
n n
Interpretación: Xh = =
f1 f 2 f m
fi
+ + .... + m
x1 x2 xm
i =1 xi
̅ 𝒉 = ________________________
𝑿
~ Mediana muestral (Me):
𝑛 Interpretación:
( 2 − 𝐹𝑖−1 )
𝑀𝑒 = 𝐿𝑖 + ∗ 𝐶𝑖
𝑓𝑘
𝑀𝑒 = ______________________
Interpretación:
Mo = __________________
10
~ Varianza Muestral (𝑺𝟐 ):
(X − X ) fi
n
2
i
S2 = i =1
n −1
𝑆 2 = ____________________
Interpretación:
Interpretación:
11
Práctica 3
Muchas de las personas que invierten en bolsa lo hacen para conseguir beneficios
rápidos, por ello el tiempo en que mantienen las acciones es relativamente breve.
Preguntada una muestra de 35 inversores habituales sobre el tiempo en meses
que han mantenido sus últimas inversiones se recogieron los siguientes datos
30.0 65.3 79.1 100.1 115.3 58.1 57.2 50.1 69.1 86.0 140 75.3
35.3 66.0 82.7 101.2 118.4 60.4 72.5 55.3 70.2 90.3 104.2 125.1
48.4 68.0 84.3 102.2 119.1 73.1 95.2 102.2 130.2 77.2 110.1
Construya una tabla de frecuencias que recoja adecuadamente esta información,
y haga también alguna representación gráfica.
Solución.
mi Li Ls Xi fi Fi hi Hi hi% Hi%
1 30.0 48.3 39.2 2 2 0.06 0.06 6% 6%
2 48.3 66.7 57.5 8 10 0.23 0.29 23% 29%
3 66.7 85.0 75.8 10 20 0.29 0.57 29% 57%
4 85.0 103.3 94.2 7 27 0.20 0.77 20% 77%
5 103.3 121.7 112.5 5 32 0.14 0.91 14% 91%
6 121.7 140.0 130.8 3 35 0.09 1.00 9% 100%
Total: 35 1.00 100%
12
10
10
8
8 7
6 5
4 3
2
2
0
1 2 3 4 5 6
12
Práctica 4 y 5
4. Los siguientes datos corresponden a la inversión real anual en miles de dólares de un grupo
de pequeñas empresas. Completar la siguiente tabla de distribución de frecuencia.
[ Li - Ls > Xi fi Fi hi Hi
[20 - 24 > 0.10
[24 - 28 > 0.25
[ - 32 > 11 0.55
[32 - > 0.85
[ - 40] 1
Total
a) Identificar la unidad de análisis y la variable en estudio.
b) Interpretar el f4 y el h4%.
6. En una tabla de distribución simétrica con siete intervalos de clase de igual longitud, se
conocen los datos siguientes: C =10, f1=8 y X3*f3=1260; f2 + f5 = 62; h3=0.21, H6 =
0.96.
Reconstruir la tabla de frecuencias y determinar la media geométrica.
7. Sabiendo que la siguiente tabla de frecuencias, es simétrica, completar con los datos, dados.
Si además se sabe que la mediana es igual a 27.5. Reconstruir la tabla de frecuencias y calcular
la media aritmética.
[Li Ls> Xi fi Fi hi Hi
0.2
0.65
50 0.95
Total 60
13
8. Los intervalos y las frecuencias absolutas de los salarios quincenales de 45 empleados
desarrollan en el cuadro siguiente:
Intervalos Frecuencias
de salarios ($) Absolutas Acumulada Relativas Porcentual
[Li - Ls> fi Fi hi hi%
[26 - 34> 1 0.022 2.2%
[34 - 42> 2 0.044 4.4%
[42 - 50> 4 0.089 8.9%
[50 - 58> 10 0.222 22.2%
[58 - 66> 16 0.356 35.6%
[66 - 74> 8 0.178 17.8%
[74 - 82] 4 0.089 8.9%
Total: 45 1.000 100.0%
a) Calcule el porcentaje de empleados que tienen salarios entre $52 y $75.
b) Obtenga el salario que divide en dos partes iguales.
14
12. En una prueba de estadística se evaluaron a “n” estudiantes y se obtuvo el siguiente
cuadro estadístico.
Marca de
45 55 65 75 85
clase
Frecuencia
2n/25 3n/100 n/50 3n/50 n/100
relativa
¿Qué porcentaje de estudiantes obtuvieron una nota menor que 60 puntos o mayor
o igual a 80 puntos?
13. Dado el siguiente cuadro estadístico referente a los pesos de cierto número de
pacientes en un hospital.
Li − Ls ) f i
0 – 12 5
12 – 24 24
24 – 36 18
36 – 48 36
48 - 60 17
¿Cuántos pacientes pesan más de 19 y menos de 38 kilos?
14. En una investigación agrícola en Tulumayo- Tingo María, en Julio de 2011, se determinó la
producción total (en kilogramos) de un cierto cultivo, el cual fue sembrado en parcelas
experimentales. Los datos se tabularon en una distribución de frecuencias simétrica de cinco
intervalos de igual amplitud, siendo las frecuencias: f4 – f5 = 10, f4 – f3 – f1 = 0, el límite
superior en el cuarto intervalo por f4 es igual a 975, el límite inferior en el primer intervalo es
igual a 12.5 y n = 110.
a) Reconstruir el cuadro de frecuencias.
b) Calcular e interpretar la mediana (Me), moda (Mo).
15. Las notas de 50 alumnos de la UNAS – Tingo María, se clasifican en una tabla de distribución
de frecuencias con cuatro intervalos de clase de igual amplitud. Sabiendo además que: X2 =
50, f1 =4, F2 = 20, f3 = 25, 𝑥̅ = 62.4.
a) Calcular e interpretar la mediana (Me).
b) Determine la proporción de estudiantes cuyos puntajes se encuentran por lo menos de 35
puntos, pero a lo más 65 puntos.
15
Examen
17. Completar la siguiente tabla:
[Li-1, Ls> Xi fi Fi hi Hi
[0,10> 2 2 0.05 0.05
[10,20> 0.15
[20,30> 0.4
[30,40> 15 0.775
[40,50] 1
Total:
18. Construya la tabla de frecuencias relacionada con el siguiente gráfico, donde se
resumen datos recogidos sobre 50 personas
0.6 0.5
0.5
0.4
0.3 0.2 0.2
0.2 0.1
0.1
0
0–1 1–2 2–3 3–4
20. Se desea realizar un estudio sobre el número de hijos por familia en la provincia
de Leoncio Prado.
- Población: familias de Ciudad Real.
- Individuo: cada una de las familias.
- Muestra: elegimos una muestra aleatoria (al azar) de 1000 familias
distribuidas por toda la provincia.
- Tamaño de la muestra: 1000
- Variable: número de hijos. Es una variable cuantitativa y discreta.
21. El gobierno desea saber si el número medio de hijos por familia ha descendido
respecto a la década anterior. Para ello ha encuestado a 50 familias respecto al
número de hijos y ha obtenido los siguientes datos:
16
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
17