Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MANUAL Uso de Excel en La Educacion Megastat PDF
MANUAL Uso de Excel en La Educacion Megastat PDF
INDICE
1. DEFINICIÓN DE ESTADÍSTICA:
2. CLASIFICACION DE LA ESTADÍSTICA
3. UNIVERSO:
4. POBLACIÓN:
A. Según su extensión:
Población Finita:
Población Infinita:
5. MUESTRA
a. Es representativa.
b. Es adecuada.
6. MUESTREO
7. UNIDAD DE ESTUDIO:
8. OBSERVACIONES:
Estadísticamente son los datos que se recolectan para un estudio. Una observación
o dato es cuando una variable en si toma un valor especifico.
9. VARIABLE:
Generalmente, las variables se designan con las últimas letras mayúsculas del
abecedario: X, Y, Z; y los valores de las variables se designan con letras
minúsculas: xi , yi , etc.
Ejemplos:
Variable
Cualidad Cantidad
Cualitativa o Cuantitativa o
Atributo Número
10. PARAMETRO:
b. La varianza poblacional.
11. ESTIMADOR:
a. El promedio muestral.
b. La varianza muestral.
2. Observación
6. Otras
OBSERVACIÓN:
ENTREVISTA:
Las entrevistas utilizan una cédula para asegurar que se discuten todos los puntos,
pero dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador
puede hacer preguntas adicionales para obtener tanta información adicional como
sea posible, Las preguntas son abiertas y no hay restricciones para las respuestas.
Este método poco estructurado de hacer las preguntas puede ser útil para
entrevistas individuales o grupales con informantes claves.
ENCUESTAS:
Las encuestas pueden ser clasificadas en muchas maneras. Una dimensión es por
tamaño y tipo de muestra. Las encuestas pueden ser usadas para estudiar
poblaciones humanas o no humanas (por ejemplo, objetos animados o inanimados,
animales, terrenos, viviendas). Mientras que muchos de los principios son los
mismos para todas las encuestas, el foco aquí será en métodos para hacer
encuestas a individuos. Las encuestas pueden ser clasificadas por su método de
recolección de datos. Las encuestas por correo, telefónicas y entrevistas en persona
son las más comunes. En los métodos más nuevos de recoger datos, la información
se entra directamente a la computadora ya sea por un entrevistador adiestrado o
aún por la misma persona entrevistada. Un ejemplo bien conocido es la medición
de audiencias de televisión usando aparatos conectados a una muestra de
televisores que graban automáticamente los canales que se observan
b. Técnica delphi
c. Historias de vida
d. Escalas
e. Ensayos
f. Estudios de casos
g. Mapeo
i. Encuestas participativas.
PRÁCTICA Nº 01
Docente: Luis Alberto Rubio Jácobo
Unidad de estudio
Variable de estudio Tipo:
Población
Muestra
CASO Nº 02
Unidad de estudio
Variable de estudio Tipo:
Población
Muestra
CASO Nº 03
Unidad de estudio
Variable de estudio Tipo:
Población
Muestra
CASO Nº 04
Unidad de estudio
Variable de estudio Tipo:
Población
Muestra
CASO Nº 05
Unidad de estudio
Variable de estudio Tipo:
Población
Muestra
CASO Nº 06
Unidad de estudio
Variable de estudio Tipo:
Población
Muestra
En la Estadística se trabaja generalmente con una gran cantidad de datos los cuales por
facilidad de análisis y cálculos se organizan en Cuadros de Distribución de Frecuencias
(CDF) y Gráficos Estadísticos (GE).
Para realizar este análisis se tienen que tener en cuenta el tipo de variable que se
esta evaluando.
f. Fuente
g. Elaboración
Los intervalos son subconjuntos de la recta real Ron que están definidos por
un límite menor o inferior Li y un límite mayor o superior Ls.
C. Frecuencia:
Se denotan por fi. Está constituida por el número de veces que se repite
un valor. En el caso de intervalos es el número de observaciones
comprendidas en dicho intervalo. Estas frecuencias siempre son enteros
positivos y además la suma de todos ellos es el tamaño de la muestra
“n”.
2. Frecuencia relativa:
Se denotan por hi. Indica la relación o proporción existente entre la
frecuencia absoluta simple y el número total de datos. Estas frecuencias
son numeros fraccionarios positivos entre o y 1. Para fines
interpretativos estas frecuencias se expresan en % (hi%) . Así:
fi fi
hi ó hi(%) x100
n n
3. Frecuencia absoluta acumulada:
F1 = f 1
F2 = f1 + f2
F3 = f1 + f2 + f3
.............................................
……………………………………………………
Fj = f1 + f2 + f3 + ....... + fi
4. Frecuencia relativa acumulada:
H4 = h1 + h2 + h3 + h4
H6 = h1 + h2 + ....+ h6
Para fines interpretativos estas frecuencias se expresan en % (Hi%)
D. Marca de clase:
4. PROPIEDADES DE UN CDF:
Para la construcción de los CDF hay que tener en cuenta el tipo de variable que se
esta analizando, es decir, si es cuantitativa continua, cuantitativa discreta o
variable cualitativa.
Para la construcción de este cuadro hay que realizar los siguientes pasos:
m = 1 + 3.322 log ( n )
Este valor siempre es un número entero (Redondeo)
A = R/m
Este valor esta en función de la estructura de la base de datos (tomar el
inmediato superior)
R2 = A * m
7. GRAFICO ESTADÍSTICO
Numeración.
Excel puede crear gráficos a partir de datos previamente seleccionados en una hoja
de cálculo. El usuario puede “insertar” un gráfico en una hoja de cálculo, o crear el
gráfico en una hoja especial para gráficos. En cada caso el gráfico queda vinculado
a los datos a partir de los cuales fue creado, por lo que si en algún momento los
datos cambian, el gráfico se actualizará de forma automática. Los gráficos de Excel
contienen muchos objetos, títulos, etiquetas en los ejes que pueden ser
seleccionados y modificados individualmente según las necesidades del usuario.
Para crear un gráfico con el Asistente para Gráficos, se deben seguir los
siguientes pasos:
Se denota por x
Es la medida estadística más fácil de calcular.
La media o promedio es el punto central de un conjunto de datos.
Para calcular la media aritmética se utilizan las formulas adecuadas ya
sea sin son datos agrupados o datos no agrupados.
1.2. MEDIANA:
b. 1 moda Unimodal.
c. 2 modas Bimodal
2. MEDIDAS DE LOCALIZACIÓN:
2.1. CUARTILES:
2.2. DECILES:
Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
2.3. PERCENTILES:
3. MEDIDAS DE VARIABILIDAD:
3.1. RANGO:
3.2. VARIANZA:
4. MEDIDAS DE FORMA:
4.1. ASIMETRIA:
X Mo 3( X Me) Q3 2Q2 Q1
As As As
S S Q3 Q1
4.2. KURTOSIS:
M4
K1
(M 2 )2
M4
K2 3
(s) 2
Q3 Q1
As
2( P90 P10 )
5. FORMULAS PARA CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL:
1 fj fj 1
2 fj fj 1
n/2 Fj 1
Procedimiento: Me Li A
Ordenar la serie en forma fj
ascendente Li: limite inferior del intervalo mediano.
Cuando “n” impar: A: amplitud interválica.
MEDIANA
Me = valor central
Cuando “n” par: n / 2 es el elemento determinante
Me = promedio de los valores Fj-1: Frecuencia acumulada anterior al
centrales intervalo mediano
fj: Frecuencia abs. simple del intervalo
mediano
kn / 4 Fj 1
QK Li A
QUARTILES Seguir pasos similares a la mediana. fj
Similar a la Me. Lo único que cambia es
el elemento determinante.
kn / 10 Fj
CUANTILES
1
Seguir pasos similares a la mediana.
DK Li A
DECILES fj
Similar a la Me. Lo único que cambia es
el elemento determinante.
kn / 100 Fj 1
Seguir pasos similares a la mediana.
PK Li A
PERCENTILES fj
Similar a la Me. Lo único que cambia es
el elemento determinante.
R V max V min R LS LI
RANGO Ls: Limite superior
Li: Limite inferior
m
N
(Xi u) 2 (Yi u)2 * fi
2 i 1
2 i 1
N N
POBLACIONAL Yi : Marca de clase
Xi : Datos de la población
u : promedio poblacional u : promedio poblacional
N: Número de elementos de la
N: Número de elementos de la
población
población
fi: frecuencia absoluta simple
m
( yi y)2 * fi
VARIANZA
n
( xi x)2
s2 i 1
s2 i 1
n 1
n 1
n
( xi ) 2 m
( yi f i ) 2
Formulas 1 1
s2 xi2 i 1
s2 yi2 f i i 1
abreviadas n 1 i 1 n n 1 i 1 n
2 s s2
DESVIACION ESTANDAR
D.E. Muestral
D.E. Poblacional
s
COEFIENTE DE C.V . *100 C.V . *100
VARIACIÓN u x
C.V. Poblacional C.V. Muestral
En Excel los pasos a seguir para obtener estas medidas son las siguientes:
RUBIOJA S.A. es una de las firmas consultoras financieras más importantes del Perú.
Ofrece asesoría financiera y servicios a firmas particulares y a gobiernos regionales.
Grecia Rubio, acababa de ser encargada del departamento de personal de esta empresa.
En los tres años pasados, se han agregado otros ayudantes y hace seis semanas, se
sumó al departamento un estadístico recién graduado. Damne empezó hace poco a
revisar las prácticas de contratación del departamento. Empezó la revisión examinando
el campo más crítico, las personas en adiestramiento financiero. La firma contrata entre
60 y 130 de estas personas al año, según sea el crecimiento de la firma, el movimiento
de empleados y el número de perspectivas “notables" que encuentre. Prácticamente
todos los que están en adiestramiento financiero se contratan entre los estudiantes del
último año de escuelas superiores con especialización financiera. Damne seleccionó al
azar 100 de los 197 candidatos que habían sido contratados hace dos años y aún seguían
trabajando. Cada ficha contenía la información siguiente (los datos van en el apéndice
adjunto):
2. Edad al contratarse
6. Evaluación del rendimiento al final del segundo año. Esta evaluación produce una
puntuación numérica desde 0 (muy malo) hasta 100 (excelente).
4. Otro criterio era mantener por lo menos un tercio de los contratados que provengan
de escuelas de categoría 2. ¿Se sigue manteniendo este criterio?
5. ¿Son diferentes los rendimientos en la prueba de entrada para las diferentes
calidades de escuelas de donde provienen los candidatos? ¿Y en la Evaluación del
rendimiento del segundo año?
1 1 22 15,41 3 62 72
2 1 26 15,71 1 60 71
3 1 22 12,45 2 80 66
4 1 23 15,69 2 86 91
5 1 25 16,05 1 86 48
6 1 26 16,21 3 64 95
7 0 27 14,42 2 54 82
8 1 23 12,87 3 80 92
9 1 23 13,08 2 62 73
10 1 26 16,30 3 77 81
11 1 24 15,82 4 61 67
12 0 24 14,85 3 67 95
13 0 36 13,31 4 95 96
14 1 27 16,67 4 62 59
15 0 26 16,35 2 50 79
16 1 24 12,50 1 62 88
17 1 26 12,32 1 81 52
18 1 23 14,72 2 76 71
19 1 24 13,94 2 87 75
20 1 24 16,92 2 73 75
21 0 25 13,14 3 85 93
22 1 23 14,92 3 57 84
23 1 23 13,81 2 89 90
24 0 26 15,53 3 70 83
25 1 25 15,33 3 65 73
26 0 25 12,95 2 89 97
27 1 24 12,24 4 87 88
28 1 23 14,94 4 89 81
29 1 22 12,57 3 94 74
30 0 30 12,92 3 71 67
31 1 24 15,94 1 63 80
32 1 25 13,80 4 67 64
33 1 23 14,42 3 96 82
34 1 24 14,72 2 73 82
35 1 26 12,60 3 92 81
36 0 23 14,53 3 88 77
37 1 26 14,76 4 82 89
38 0 26 13,12 3 84 95
39 1 26 13,35 4 86 58
40 0 23 14,76 2 72 74
41 1 22 15,27 4 82 89
42 1 26 17,00 2 77 68
43 1 24 16,57 2 66 77
44 1 26 14,02 3 73 67
45 1 25 13,08 1 85 99
46 1 24 13,93 3 58 96
47 1 25 14,17 2 58 97
48 0 24 14,65 3 79 92
49 1 22 13,92 1 50 95
50 1 25 13,28 3 93 67
51 1 25 12,96 2 75 52
52 0 23 13,97 2 82 82
53 1 25 13,92 3 57 83
54 1 24 14,92 3 67 87
55 1 24 16,33 2 60 73
56 0 23 14,25 4 56 67
57 1 23 15,29 1 94 72
58 1 26 15,23 3 92 66
59 1 26 15,73 3 81 95
60 0 23 12,94 1 73 82
61 1 24 15,96 1 91 84
62 1 24 16,96 2 72 98
63 1 27 12,23 3 85 93
64 1 22 15,35 2 96 87
65 0 23 16,77 2 85 57
66 1 24 16,12 2 89 85
67 0 25 14,34 3 92 81
68 1 24 14,69 3 66 95
69 1 22 14,67 2 85 90
70 1 23 15,56 2 54 80
71 1 22 12,35 2 85 48
72 1 24 13,39 3 65 71
73 0 26 16,99 1 76 63
74 0 28 15,29 4 63 87
75 0 26 15,93 2 89 97
76 1 25 13,41 3 83 97
77 1 25 15,55 2 57 79
78 1 25 13,97 1 96 71
79 0 23 12,81 4 72 72
80 1 24 12,99 2 73 89
81 1 25 15,67 2 53 94
82 1 23 12,47 3 86 78
83 1 24 12,77 3 64 89
84 0 24 14,67 1 80 84
85 0 25 13,94 3 77 91
86 1 24 14,90 1 52 69
87 1 23 15,44 2 70 89
88 0 23 16,03 4 90 91
89 1 29 12,15 4 74 89
90 0 22 13,42 2 95 94
91 0 26 12,02 4 84 95
92 0 22 13,04 3 68 78
93 0 30 14,35 4 92 84
94 1 25 13,65 2 52 85
95 1 23 12,66 2 82 69
96 1 26 13,22 3 56 71
97 1 23 13,43 3 85 58
98 1 22 15,54 4 85 93
99 1 26 16,51 3 64 97
100 1 23 16,91 3 61 83
1. ANALISIS DE CORRELACIÓN:
n n n
n X iYi Xi Yi
r n
i 1
n
i 1
n
i 1
n
n X i2 ( X i )2 n Yi 2 ( Y1 ) 2
i 1 i 1 i 1 i 1
Interpretación:
-1 -0.7 -0.4 0 0.4 0.7 +1
2. ANALISIS DE REGRESION
PASOS A SEGUIR:
a. Realizar el diagrama de dispersión y ver el comportamiento de la
variable.
A Y BX
n n n
n X i Yi Xi Yi
B i 1
n
i 1
n
i 1
n X i2 ( X i )2
i 1 i 1
Y 0 1 X1 2 X 2 ... K XK
Para encontrar este modelo, es decir, estimar sus coeficientes también
se utiliza el Método de los Mínimos Cuadrados Ordinarios.
Los elementos de este modelo de regresión múltiple son los siguientes:
Y es la variable dependiente o variable respuesta.
A las Xs se le llama variables independientes.
Bs se les llama coeficientes de regresión.
En el ARLM se prueban las siguientes Hipótesis:
Ho: Los Bs son iguales a cero (No hay efecto de las variables
independientes en Y);
H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).
Para dar respuesta a esta Hipótesis se utiliza el análisis de varianza.
APLICACIÓN 01
Nº de Número de Consumo
LA EMPRESA HIDRANDINA de la ciudad de casa áreas de de
Trujillo, esta haciendo un estudio sobre los trabajo energía
consumos de energía (en miles de kilowatts - (miles de
kw)
hora) y el número de áreas de trabajo en un
1 2 4
conjunto de Empresas Privadas Para este
2 4 11
estudio se selecciona una muestra aleatoria 3 4 10
de 10 Empresas Privadas, en la cual se 4 3 5
obtuvo los siguientes resultados: 5 1 3
6 3 6
a. Estimar la ecuación de regresión lineal. 7 1 3
b. Evalúe el consumo (en miles de kilowatts- 8 5 18
hora), para una Empresa que tiene 6 áreas 9 5 14
10 3 7
de trabajo.
Total
Regression Analysis
r² 0.857 n 10
r 0.926 k 1
Std. Error 2.021 Dep. Var. Consumo de energía (miles de kw)
ANOVA table
Source SS df MS F p-value
Regression 196.2333 1 196.2333 48.06 .0001
Residual 32.6667 8 4.0833
Total 228.9000 9
APLICACIÓN 02:
El Gerente de la UNT está haciendo un estudio entre
Tiempo de Costo de
Nº de antigüedad mantenimiento. el gasto de mantenimiento de sus computadoras y
maquina (años) ($) el año de antigüedad de dichas maquinas. Para esto
1 1 14 recurre a la oficina de Mantenimiento y Contabilidad
2 1 16 obteniendo la siguiente información:
3 2 20
a. Estime la ecuación de regresión lineal.
4 2 24
5 3 30 b. Estime cuanto sería el costo de mantenimiento de
6 3 28 una computadora que tiene 7 años.
Total c. Calcule e interprete el valor del coeficiente de
regresión lineal “ r ”
APLICACIÓN 03:
El jefe de personal de una institución educativa cree que Edad en Nº de
existe una relación entre la tardanza al trabajo y la edad Nº años Tardanza e
del trabajador. Con el propósito de estudiar el problema un año
tomó en cuenta la edad de diez trabajadores escogidos 1 25 20
al azar y contabilizó los días de tardanza durante todo 2 50 5
un año. Los resultados fueron como se observa en la 3 35 10
tabla que sigue: 4 20 20
a. Construya el diagrama de dispersión. 5 45 8
b. Obtenga la ecuación de la recta de regresión 6 50 2
c. Si un docente tiene 38 años, ¿Cuántos tardanzas se 7 30 15
espera que falte al año?
8 40 12
d. Si un trabajador tiene 3 tardanzas al año ¿Qué edad
9 62 1
se puede esperar que tenga este trabajador?
10 40 8
e. Determinar el grado de relación entre las variables
Total
en estudio
1. LA DISTRIBUCIÓN BINOMIAL
n x n x
f ( x) P( X x) p q ,x 0,1,2,..., n
x
4. Sus parámetros son :
n : Numero de veces que se repite el experimento o tamaño de
muestra.
p : Probabilidad de éxito en cada uno de los ensayos o proporción de
interés.
5. Su notación es : X B ( n, p )
APLICACIÓN 01:
En el almacén de la Empresa MAESTROS, hay 12 artículos eléctricos de los cuales 3 de
ellos son defectuosos. Si se extrae una muestra aleatoria de 5 a partir del grupo. Cual es
la probabilidad de que:
a. Exactamente 1 sea defectuosos.
b. Ninguno sea defectuoso.
c. Menos de 2 sean defectuosos.
d. Más de 3 sean defectuosos.
SOLUCION:
Binomial distribution
5 n
0.25 p
cumulative
X P(X) probability
0 0.23730 0.23730
1 0.39551 0.63281
2 0.26367 0.89648
3 0.08789 0.98438
4 0.01465 0.99902
5 0.00098 1.00000
1.00000
0.20
0.00
0 1 2 3 4 5
X
APLICACIÓN 02:
En la UNT – Escuela de Postgrado se está aplicando un nuevo método de enseñanza del
aprendizaje del Idioma Portugués. Después de completar con la aplicación de este
método se evalúa que el 1% salio desaprobado. El director académico selecciona en
forma aleatoria estudiantes al azar de la Universidad:
a. Cual es la probabilidad de que exista más de 3 desaprobados.
b. Cual es la probabilidad de que exista menos de 3 desaprobados.
c. Cual es la probabilidad de que haya entre 2 y 4 desaprobados inclusive.
APLICACIÓN 03:
Según información de Secretaría Académica de la UNT, el 65% de los estudiantes son del
sexo masculino y el resto mujeres. Para la aplicación de una encuesta por parte de la
asistenta social, se selecciona aleatoriamente a 10 estudiantes:
a. Cual es la probabilidad de encuestar a menos de 5 hombres.
b. Cual es la probabilidad de encuestar mas de 5 hombres
c. Cual es la probabilidad de encuestar a 3 y 8 hombres inclusive.
d. Cual es la probabilidad de encuestar a ningún hombre.
2. LA DISTRIBUCIÓN POISSON
Rx = {0,1,2,3,4,5, ….}
9. Su función de probabilidad esta dada por:
e ( )x
f ( x) P( X x) , x 0,1,2,...
x!
APLICACIÓN 01:
En un estudio de Satisfacción del Cliente en la UNT, se determino que las personas llegan
aleatoriamente a la ventanilla de caja, con una tasa promedio de 24 personas por hora,
durante la hora punta comprendida entre 11:00 am y 12:00 am de cierto día. El jefe
administrativo desea calcular las siguientes probabilidades:
a. Cual es la probabilidad de que lleguen exactamente 5 personas durante esa hora?
b. Cual es la probabilidad de que lleguen mas de 5 personas durante esa hora?
c. Cual es la probabilidad de que lleguen menos de 5 personas durante esa hora?
d. Cual es la probabilidad de que lleguen más de 8 personas durante esa hora?
SOLUCION:
Poisson distribution
mean rate of
24 occurrence
cumulative
X P(X) probability
0 0.00000 0.00000
1 0.00000 0.00000
2 0.00000 0.00000
3 0.00000 0.00000
4 0.00000 0.00000
5 0.00000 0.00000
6 0.00001 0.00001
7 0.00003 0.00005
8 0.00010 0.00015
9 0.00027 0.00043
10 0.00066 0.00108
11 0.00144 0.00252
12 0.00288 0.00540
13 0.00531 0.01072
14 0.00911 0.01983
15 0.01457 0.03440
16 0.02186 0.05626
17 0.03086 0.08713
18 0.04115 0.12828
19 0.05198 0.18026
20 0.06238 0.24264
21 0.07129 0.31393
22 0.07777 0.39170
23 0.08115 0.47285
24 0.08115 0.55400
25 0.07791 0.63191
26 0.07191 0.70382
27 0.06392 0.76774
28 0.05479 0.82253
29 0.04534 0.86788
30 0.03628 0.90415
0.90415
0.08
0.06
P(X)
0.04
0.02
0.00
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
X
APLICACIÓN 02:
Si la secretaria de la Escuela de Postgrado de la UNT, recibe un promedio de 2 llamadas
cada 3 minutos por motivos académicos. Calcular lo siguiente:
a. Cual es la probabilidad de que reciba más de 3 llamadas en 3 minutos.
b. Cual es la probabilidad de que reciba menos de 2 llamadas en tres minutos.
c. Cual es la probabilidad de que reciba exactamente 2 llamadas en tres minutos.
d. Cual es la probabilidad de reciba 5 llamadas en 6 minutos.
e. Cual es la probabilidad de que reciba menos de 2 llamadas en un minuto.
APLICACIÓN 03:
En un estudio por parte del Ministerio de Transporte y Comunicaciones (MTC), se ha
determinado que en la carretera panamericana con destino a Lima, hay en promedio de
20 accidentes por semana (7 días), calcular las siguientes probabilidades:
a. Cuál es la probabilidad de que en una semana no haya ningún accidente.
b. Cual es la probabilidad de que en dos semanas haya 10 accidentes.
c. Cual es la probabilidad de que en 1semana ocurra menos de 15 accidentes.
d. Cual es la probabilidad de que en un día haya tres o menos accidentes.
e. Cual es la probabilidad de que en un día haya tres o más accidentes.
APLICACIÓN 04:
En el Centro de impresiones de la UNT se comete dos fallas en las impresiones debido a
causas externas cada vez que imprime 2,500 hojas como promedio. Con esta
información determinar:
a. La probabilidad de que en una impresión de 500 hojas, ocurra uno más errores.
b. La probabilidad de que no ocurrirán errores en una impresión de 50 hojas.
APLICACIÓN 05:
Los clientes de una empresa llegan a la tienda de venta aleatoriamente a una tasa de
300 personas por hora. Calcular la probabilidad de que:
a. Una persona llegue durante un periodo de 1 minuto
b. Por lo menos dos personas lleguen durante un periodo dado de un minuto.
c. Ninguna persona legue durante un periodo de 1 minuto
3. LA DISTRIBUCIÓN NORMAL:
CARACTERÍSTICAS
1. Tiene como parámetros a y
2. Su función de probabilidad está dada por:
2
1 X
1 2
f ( x) , X
2
Además: - +
- < <+ y >0
1. = 68.3%
2. 2 = 95.5%
3. 3 = 99%
- 3 2 1 1 2 3 +
X
Z
2. La modificación de la escala ha permitido elaborar una tabla para el cálculo de las
probabilidades; si esto no hubiera sido posible, sería necesario construir una tabla
para cada valor de y .
3. La función de densidad de la variable estandarizada es:
1
1
z2
f ( z) e2
2
4. El promedio (valor esperado) y la varianza de Z son: E(Z) = 0 , V(Z) = 1
5. Notación:
Si X es v.a. continua distribuida normalmente con media y varianza 2 , la
denotamos por : X N( , 2).
Aplicando esta notación a la variable normal estandarizada Z, escribimos:
Z N(0 , 1) , esto se interpreta como, Z tiene distribución normal con media 0
y varianza 1.
6. La superficie bajo la curva normal Z estandarizada también es igual a 1. Por
consiguiente, las probabilidades pueden representarse como áreas bajo la curva
normal escandalizada entre dos valores.
7. Debido a que la distribución normal es simétrica muchas de las tablas disponibles
contienen solo probabilidades para valores positivos de Z.
USO DE TABLA:
Si se conoce el comportamiento de una variable, es decir, se sabe que tienen una
distribución normal, para calcular las diferentes probabilidades se tiene que
estandarizar la variable. Una vez estandarizada la variable, recién utilizar la tabla de
la distribución normal estandarizada o tabla Z.
FORMULAS:
x a a
a. P( x a) P( ) P( Z )
x a a
b. P( x a) 1 P( x a) 1 P( ) 1 P( Z )
x b x a
c. P( a x b) P( x b) P( x a) P( ) P( )
APLICACIÓN 01:
El rendimiento académico de los estudiantes de la UNT-Escuela de Postgrado, tiene una
distribución normal con media igual a 15 y varianza igual a 4. Si se selecciona un
estudiante de esta Universidad, encuentre la probabilidad de que:
a. El rendimiento sea menor que 16
b. El rendimiento sea menor que 14
c. El rendimiento este entre 14 y 18
d. El rendimiento sea mayor 15.5
SOLUCION
Reemplazando valores:
APLICACIÓN 02:
Los salarios mensuales de los trabajadores administrativos de la UNT tiene un
comportamiento normal cuya media es S/. 2100 y una desviación estándar de S/. 50.
Cuantos trabajadores tienen salarios:
a. Menores de S/. 2150.
b. Menos de S/. 2200.
c. Mas de S/. 2180.
d. Entre 2080 y 2150 soles.
APLICACIÓN 03:
El tiempo de duración de los focos eléctrico de los cañones proyectores tienen una
distribución normal con una media de 1000 horas y una desviación estándar de 250
horas. Determinar la probabilidad de que:
a. Un foco tomado al azar se queme antes de las 990 horas de funcionamiento
b. Un foco se que queme entre 980 y 1120 horas de funcionamiento.
c. Un foco dure mas de 998 horas
APLICACIÓN 04:
NEUMA Perú, es una empresa que produce llantas para automóviles en nuestro país. La
vida útil de estas llantas se distribuye aproximadamente como una normal con media y
desviación estándar iguales a 32000 y 1000 millas respectivamente. Esta empresa quiere
exportar estas llantas por lo que empieza a hacer ciertos cálculos acerca de la calidad de
estas llantas, para lo cual se hace las siguientes preguntas:
a. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida útil
de 31900 millas.
b. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida útil
desde 31000 y 33000 millas.
c. Si las empresa fija una garantía de 30000 millas. ¿Qué porcentaje de esta producción
necesitará ser reemplazada?
A. ESTIMACION PUNTUAL:
Es aquel único valor que se obtiene de la muestra, es decir, que para su cálculo se
debe tener información muestral. Las formulas para calcular o realizar estas
estimaciones son las siguientes:
PROMEDIO VARIANZA PROPORCION
PARAMETRO 2
P
n n
ESTIMACION xi ( xi x )2 a
PUNTUAL x i 1 2
s 2 i 1 P̂ p
ˆ ˆ n
n n 1
B. ESTIMACIÓN INTERVÁLICA:
Al realizar una estimación, siempre se va a cometer un error. Entonces, cuando
estimamos un parámetro nunca va a ser exacto, ese valor será mayor o menor al
verdadero. Entonces se obtendrá un intervalo de valores posibles. Ese intervalo se
llama estimación interválica. A esa diferencia mayor o menor se llama error de
estimación, el cual esta en relación directa con la variabilidad del estimador y el nivel
de confianza determinado por el investigador. La estimación intervalica para un
parámetro en general, esta dada por:
ˆ Z /2
ˆ Z /2
:ˆ Z /2
Para determinar este intervalo se necesita de:
a. La estimación puntual
b. La desviación estándar del estimador.
c. Nivel de confianza, el cual será repartido para cada lado del intervalo.
:x Z /2
n
B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:
s
:x t( / 2 , n 1)
n
II. INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL
A. Si la proporción poblacional se conoce:
PQ
P: p Z /2
n
B. Si la proporción poblacional No se conoce: (entonces hay que calcularla en la
muestra)
pq
P: p Z /2
n
III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
A. Si las muestras son de tamaño n1>30 y n2>30 (grandes) y además las varianzas
poblacionales se CONOCEN:
2 2
1 2 : ( x1 x2 ) Z /2
1 2
n1 n2
B. Si las muestras son de tamaño n1<30 y n2<30 (pequeñas) y además las varianzas
poblacionales DESCONOCIDAS:
1 1
1 2 : ( x1 x2 ) t( / 2 , n1 n 2 2 ) sc2 ( )
n1 n2
Donde :
(n 1 1)s 12 (n 2 1)s 22
sc
2
, se llama varianza mancomunada
n1 n 2 2
p1 q1 p2 q2
P1 P2 : ( p1 p2 ) Z /2
n1 n2
RESPECTO AL PROMEDIO:
APLICACIÓN 01:
Los estudiantes de Administración de Empresa de una Universidad realizaron un trabajo
de aplicación respecto a los sueldos de los trabajadores de la mina YANACOCHA, para lo
cual seleccionaron una muestra aleatoria de 24 trabajadores en el cual se determinó que
el sueldo promedio semanal es de $160 y una varianza de 10 dolares 2.
a. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.
b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.
SOLUCION:
APLICACIÓN 02:
La Gerencia de la empresa HAMILTON LIGH esta interesado en conocer el contenido de
nicotina promedio de su marca de cigarrillos. Para lo cual selecciona una muestra de 14
cigarros obteniendo un promedio de 25 miligramos y una varianza de 16 miligramos 2.
a. Calcular un intervalo de confianza para el sueldo promedio con el 99% de confianza.
b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.
c. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.
APLICACIÓN 03:
Nuestro amigo BRUNO se dedica al negocio de los AUTOS, el sospecha que su margen de
beneficios mensual promedio por auto vendido está por debajo del promedio nacional de
S/. 700. Para evaluar su margen de beneficio toma información (muestra) respecto a 8
meses cuya información es la siguiente:
MES 1 2 3 4 5 6 7 8 Promedio Varianza
RESPECTO A LA PROPORCION:
APLICACION 04:
Según un vendedor de automóviles, de todos los vehículos adquiridos por los docentes
universitarios, en más del 80% de los casos el color es elegido por la mujer. Para
verificar esta hipótesis se toma una muestra de 400 parejas que han comprado autos
nuevos durante el último año, hallándose que en 310 casos el color fue en efecto elegido
por la dama. Calcular:
a. El intervalo confidencial para la proporción considerando el 99 % de confianza.
b. El intervalo confidencial para la proporción considerando el 90% de confianza.
SOLUCION
MUESTREO
Es una TÉCNICA ESTADÍSTICA por la cual se realizan inferencias a la población
examinando solo una parte de ella, ésta parte recibe el nombre de MUESTRA, la cual
debe ser estadísticamente representativa y adecuada.
Ventajas: Desventajas:
Costo reducido • Presencia del error de muestreo
Mayor rapidez y exactitud • Presencia de gran variabilidad de las obs.
Minimiza los costos.
TÉCNICAS DE MUESTREO
Existen 2 tipos de técnicas de muestreo:
A. TECNICAS PROBABILISTICAS: B. TECNICAS NO PROBABILISTICAS
Muestreo aleatorio simple • El muestreo a criterio o juicio.
Muestreo aleatorio estratificado • El muestreo por cuotas.
Muestreo sistemático • El muestreo por conveniencia.
Muestreo por conglomerados • etc
Etc.
POBLACION Z 2 P(1 P) N Z 2S 2N
FINITA n n
(Cuando se E 2 ( N 1) Z 2 P(1 P) E 2 ( N 1) Z 2 S 2
conoce N)
Z= es el valor de la distribución normal estandarizada para un nivel de confianza fijado por el investigador.
S= Desviación estándar de la variable fundamental del estudio o de interés para el investigador. Obtenida
por estudios anteriores, muestra piloto, criterio de experto o distribución de la variable de interés.
P= es la proporción de la población que cumple con la característica de interés.
E= % del estimador o en valor absoluto (unidades). Fijada por el investigador.
N= Tamaño de la población.
TABLA N° 01
VALORES DE LA DISTRIBUCIÓN NORMAL
ESTANDARIZADA(Z)
Nivel de confianza Nivel de significancia Valor Z
(1- ) ( ) Bilateral Unilateral
90% = 0.90 10% = 0.10 1.64 1.28
95% = 0.95 5% = 0.05 1.96 1.64
98% = 0.98 2% = 0.02 2.32 2.05
99% = 0.99 1% = 0.01 2.57 2.32
APLICACIÓN 01:
Cuál será el tamaño de corridas de producción adecuado si se requiere estimar el tiempo
promedio para efectuar la producción de un producto químico con una confianza del
95%. Además en un estudio piloto se encontró x 3.5 horas y s = 2.2 horas y además
el investigador asume E = 0.35 horas.
APLICANDO MEGASTAT:
APLICACIÓN 02:
El Director de la sección de control de la rabia del Dpto. de Salud Pública de la Ciudad de
Chiclayo desea obtener una muestra de los registros de dicho Dpto. acerca de las
mordidas de perro reportadas durante el año anterior, para estimar la edad media de las
personas mordidas. El director desea una seguridad del 95%, con un E=2.5 y en base a
estudios anteriores conoce que la desviación estándar es de 15 años. ¿De que tamaño
debe ser la muestra?
APLICACIÓN 04:
Se desea estimar el tiempo medio de duración de artefactos eléctricos (focos) producidos
por la empresa PHILIPSS. Se sabe por un estudio piloto de 10 focos que la desviación
estándar del tiempo de duración es de 20 meses. De que tamaño debe ser la muestra
para estimar el tiempo medio de duración con un error máximo de 4 meses y con una
confianza del 95%?.
APLICACIÓN 05:
Por estudios científicos se sabe que el Coeficiente de Inteligencia promedio para jóvenes
según la escala de Weshler es de 100 puntos con una desviación estándar de 15 puntos.
Determinar el tamaño de muestra para realizar una investigación sobre niveles de
inteligencia en la UPN, si se admite un error del 2% del promedio y una seguridad del
95%.
APLICACIÓN 06:
Se desea estimar la proporción de jóvenes de la ciudad de CHICLAYO que hacen uso de
Internet como mínimo una hora diaria con un 95% de confianza. De estudios anteriores
se conoce que P=0.70 y se desea un E = 5%. Cual debe ser el tamaño de muestra.
1. DEFINICIONES PRELIMINARES:
a. HIPÓTESIS: Es una respuesta a priori a un problema.
b. HIPÓTESIS ESTADÍSTICA: En un enunciado acerca del valor de un parámetro
poblacional.
c. PRUEBA DE HIPOTESIS: Es un procedimiento basado en la información
muestral y en la teoría de probabilidad, para determinar si una hipótesis
estadística debe ser aceptada o rechazada.
2. CLASES DE HIPOTESIS:
2.1. HIPOTESIS NULA.
Se denota por Ho.
Es una afirmación o enunciado tentativo que se realiza acerca del valor de
un parámetro poblacional.
Por lo común es una afirmación acerca del parámetro de población cuando
toma un valor específico.
2.2. HIPOTESIS ALTERNATIVA.
Se denota por H1.
Es una afirmación o enunciado contraria a la presentada en la hipótesis
nula.
Error Tipo I:
•Se comete este error cuando se rechaza la hipótesis nula, cuando es verdadera.
•Se denota por α = P(Rechazar Ho/Ho es verdadera)
Decisión
Ho Verdadera Ho Falsa
posible
Aceptar Ho Decisión Error Tipo II
correcta
Decisión
Rechazar Ho Error tipo I Correcta
n
D. Si n es menor o igual a 30 y la varianza poblacional es desconocida:
Estadístico de prueba:
x
t tt t( (distribución t de student)
s / 2 , n 1)
n
II. PRUEBA DE HIPOTESS PARA LA PROPORCION POBLACIONAL
Estadístico de prueba:
p P Zt Z
Z /2
PQ
n
Esta formula es tanto para muestras grandes como para muestras pequeñas.
III. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS
C. Si las muestras son de tamaño n1>30 y n2>30 (grandes) y además las varianzas
poblacionales se CONOCEN:
Estadístico de prueba:
( x1 x2 ) D Zt Z
Z /2
1 2
n1 n2
D. Si las muestras son de tamaño n1<30 y n2<30 (pequeñas) y además las varianzas
poblacionales DESCONOCIDAS:
( x1 x2 ) D tt t( (distribución t de student)
t / 2 , n 1)
1 1
Sc
n1 n2
Donde :
(n 1 1)s 12 (n 2 1)s 22
sc 2
, se llama varianza mancomunada
n1 n 2 2
IV. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES:
B. Si p1 y p2 se determinan a partir de muestras:
( p1 p2 ) D
Z Zt Z /2
p1 q1 p2 q2
n1 n2
Esta formula es tanto para muestras grandes como para muestras pequeñas.
T1 T2
14.290 22.088 mean
2.738 1.637 std. dev.
10 8 n
16 df
-7.7975 difference (T1 - T2)
5.3911 pooled variance
2.3219 pooled std. dev.
1.1014 standard error of difference
0 hypothesized difference
-7.08 t
2.61E-06 p-value (two-tailed)
APLICACIÓN 02::
JORGE MELENDEZ, Administrador deL BCP está interesado en saber si existe diferencia
significativa entre los tiempos de atención al cliente de los mismos empleados que
trabajan en los dos turnos: mañana y tarde. Al respecto, ayer personalmente registró los
tiempos que utilizaron los empleados para atender a sus clientes en ambos turnos. Los
tiempos en minutos que registró fueron los siguientes:
Mañana 2.10 4.10 4.70 3.70 6.00 3.90
Tarde 4.00 4.50 3.70 4.00 4.10 3.45
A la luz de estos resultados, ¿A qué conclusión llegó Jorge Meléndez?. Utilice un nivel de
confianza del 95%.
0.23 t
.8244 p-value (two-tailed)
APLICACIÓN 03:
Un fabricante de microcircuitos esta interesado en determinar si dos diseños diferentes
producen un flujo de electricidad equivalente. El ingeniero responsable ha obtenido la
siguiente información:
Diseño 1 20.3 22.5 23.3 29.1 26.5 22.1 20.8 28.6 23.3 21.5
Diseño 2 23.5 26.5 23.6 21.5 26.4 27.9 22.5 25.5 26.7 23.9
Diseño 3 29.1 26.5 22.1 25.6 23.5 26.5 25.5 26.7 20.3 22.5
Diseño 4 20.3 22.5 25.5 26.7 28.9 17.3 21.5 20.4 27.9 26.5
Con =0.01, se desea determinar si existe alguna diferencia significativa en el flujo de
electricidad entre los dos diseños.
ANOVA table
Source SS df MS F p-value
Treatment 10.833 3 3.6110 0.40 0.7558
Error 327.266 36 9.0907
Total 338.099 39
Comparison of Groups
30.00
25.00
20.00
15.00
Diseño 1 Diseño 2 Diseño 3 Diseño 4
APLICACIÓN 04:
Una compañía desea estudiar el efecto que tiene la pausa para el café, sobre la
productividad de sus obreros. Selecciona 6 obreros y mide su productividad en un día
cualquiera (sin pausa para el café), y luego mide la productividad de los mismos 6
obreros en un día que se concede la pausa para el café. Las cifras que miden la
productividad son las que siguen: Con = 0,05. ¿A qué conclusión llegará la compañía?.
TRABAJADOR 1 2 3 4 5 6
Sin pausa 23 35 29 33 43 32
Con pausa 28 38 29 37 42 30
APLICACIÓN 05:
En fecha reciente fue descubierto un neurotransmisor cerebral endógeno llamado
galanina. Según parece, éste afecta de manera directa el deseo de ingerir alimentos con
un alto contenido de grasa. Mientras más alta sea la cantidad de este neurotransmisor de
origen natural en un individuo, mayor será el apetito que este sienta por la comida con
alto contenido de grasa. Recientemente una compañía farmacéutica desarrolló una
sustancia experimental que bloquea la galanina sin alterar el apetito por otros alimentos
más saludables (es decir con menos grasas). Un neurocientífico piensa que esa sustancia
experimental será muy útil para controlar la obesidad. Se realiza un experimento para lo
cual se elige 10 mujeres obesas todas ellas voluntarias y se les administra el
medicamento experimental durante 06 meses. Se registra el peso inicial y el peso final
(después de 6 meses) de cada persona. Los pesos se presentan en la siguiente tabla.
Probar si el uso del medicamento experimental produce pérdida de peso en las personas.
Utilice un nivel de significancia de 0.05.
Persona PESO INCIAL PESO FINAL
(libras) (libras)
1 165 145
2 143 137
3 175 170
4 135 136
5 148 141
6 155 138
7 158 137
8 140 125
9 172 161
10 164 156
Fin