Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFORME FINAL
Estadística aplicada
8 de febrero de 2023
2
Contenido
INTRODUCCIÓN...................................................................................................................5
MARCO TEÓRICO.................................................................................................................6
1. Muestreo estadístico.......................................................................................................6
2. Estadística no paramétrica...........................................................................................11
3.1.1. Arreglo:.................................................................................................................31
3.2. Distancia...............................................................................................................32
verosímil. 42
CONCLUSIONES.................................................................................................................48
4
BIBLIOGRAFÍA...................................................................................................................49
5
INTRODUCCIÓN
El presente trabajo va referido al tema de la Estadística, que se puede definir como parte del
método científico que a través del análisis matemático va a permitir obtener información sobre la
realidad que nos rodea, constituye una poderosa herramienta para generar conocimiento y ha
Actualmente, es aplicada en todas las áreas del saber y, de manera determinante, en las
Ciencias Sociales. La Estadística trata de la recolección, análisis y uso de los datos el cual nos
permite tomar decisiones, solucionar problemas y diseñar procesos y productos, es por esto que
resulta vital para nosotros como alumnos de la facultad de economía de IV ciclo, tener
conocimientos en Estadística.
A continuación, presentaremos una recopilación de ejemplos sobre todos los temas que
con sus respectivas clasificaciones que iremos conociendo a través del trabajo
adecuadamente los datos y llegar a la verdad científica mediante una prueba de hipótesis adecuada.
6
MARCO TEÓRICO
1. Muestreo estadístico.
promedio de los hogares de una ciudad. La población total es de 100,000 hogares y es demasiado
hogares en la ciudad.
una muestra representativa. Pero para este caso, supongamos que nos 500
hogares.
con una plantilla de 1000 empleados, de donde le pidieron que trabaje con una muestra de 50
empleados. Además, se sabe que hay 300 empleados en el departamento de finanzas, 260 en el
tecnología.
Como decide trabajar con un muestreo aleatorio estratificado, tiene en cuenta esta
trabajadores de cada estrato que sea proporcional a la cantidad de componentes que hay en cada
estrato.
12 de tecnología.
50 F
= → F=15
1000 300
50 V
= →V =13
1000 260
50 M
= → M=10
1000 200
50 T
= →T =12
1000 240
8
En una encuesta sobre el gasto mensual en bienes y servicios de los hogares en una ciudad
determinada, se desea estimar el gasto promedio mensual por hogar utilizando un muestreo
sistemático. Donde se tiene una lista de 1.000 hogares y se decide tomar una muestra de 100
hogares. Para lo cual elige el primer hogar de la lista al azar, por ejemplo, el hogar número 3 y
luego se seleccionan cada 10º hogar de la lista, es decir el 13, 23, 33 y así sucesivamente hasta
Un equipo de economistas desea conocer las tendencias de gasto de los clientes de las
tiendas de comestibles en la ciudad Piura. Para obtener una muestra representativa, deciden utilizar
Se considera como población objetivo a los todos los clientes de las tiendas de comestibles
Se seleccionan 49 tiendas al azar para luego realizar entrevistas a cada uno de los clientes
En la provincia de Sullana se espera que el 60% estén de acuerdo con una tasa de impuesto
sobre todos aquellos que arrijan sus desechos al río Chira. Se desea hacer una investigación para
estimar la proporción de familias que están de acuerdo con dicha política, en un intervalo de
confianza cuya amplitud no sea mayor de 0.03 y un coeficiente de confianza del 95%
Z=1.96
e=0.03
p=0.6
q=0.4
2
Z pq
n= 2
e
¿Qué tamaño deberá tener una muestra para estimar dentro del 3%, la proporción de
personas que reciben el salario mínimo dentro de cierta localidad, en una población de 5000 y una
Z=1.96
e=0.03
p=0.5
q=0.5
10
N=5000
2
Z pqN
n=
( N −1 ) e2 + Z2 pq
La municipalidad de Piura desea obtener una muestra de los jóvenes que han comenzado a
trabajar, para estimar la edad media de los jóvenes. Se desea una muestra con una seguridad del
95%, con un error del 5% del promedio. En base a estudios anteriores se conoce que la edad
promedio de todos los jóvenes es de 25 años y la desviación estándar es de 5 años. ¿De qué tamaño
Z=1.96
e=0.1
S=0.5
Z 2 S2
n= 2
e
(1.96)2 (0.5)2
n= 2
=96.04=96
(0.1)
De una población, N=10000 se quiere obtener una muestra, para estimar el ingreso
promedio por persona. Se requiere que la estimación muestral no se aparte en más de $500 del
11
promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La desviación típica es de
Z=1.96
S=3000
e=500
N=10000
2 2
Z S N
n= 2 2 2
(N−1) e + Z S
2. Estadística no paramétrica
Los siguientes datos muestran el aumento en soles en los ingresos mensuales de una
muestra de 14 pequeños quioscos: 90, 120, 150, 125, 107, 130, 60, 136, 100, 110, 70, 145 y 119,
112.
Hipótesis:
Cálculos: Se asignan los signos “+” o “-” a cada valor de la muestra que es mayor o menor
secuencia:
Signo de diferencia - + + + + + - + 0 + - + + +
para la cual hay n = 13 signos, mientras que el número de veces que ocurre el signo menos
frecuente es x = 3.
es:
3
x=0 x ( )
P=P [ X ≤ 3 cuando p=1/2 ] =∑ 13 ( 0.5 ) = ( 0.5 ) [ 1+13+78+286 ]
13 13
Decisión. Dado que P = 0.04614 < 0.05, se rechaza H0 y se concluye que “el aumento
promedio en los ingresos mensuales es mayor a 100 soles, lo que podría ser un posible indicador de
se han recolectado datos de 20 puestos, la cual determino que en el pasado la mediana fue de S/85.
TABLA 1
1 140
2 35
3 90
4 120
5 25
6 50
7 150
8 80
9 80
10 160
11 92
12 310
13 75
14 100
15 68
16 65
14
17 202
18 87
19 47
20 60
Fuente: Elaboración propia con datos ficticios.
Con un nivel de significancia del 5%, ¿Se determina que hubo un cambio en la mediana
debido a la subida de los precios de muchos de los productos para la elaboración de almuerzos?
Hipótesis:
Ho=~
u=20
H 1=~
u ≠ 20
TABLA 2
Valores de Xi Di(x-~
u¿ Signo Rango
140 55 + 15
35 -50 - 14
90 5 + 3
120 35 + 11.5
25 -60 - 16
50 -35 - 11.5
150 65 + 17
80 -5 - 3
15
80 -5 - 3
160 75 + 18
92 7 + 5
310 225 + 20
75 -10 - 6
100 15 + 7
68 -17 - 8
65 -20 - 9
202 117 + 19
87 2 + 1
47 -38 - 13
60 -25 - 10
Fuente: Elaboración propia con datos ficticios
Entonces w+¿=116.5 y w −¿=93.5 por lotanto cogiengoel número menor w=93.5 ¿ ¿
TABLA 3
13 13 13 17 21
14 13 16 21 26
15 16 20 25 30
16 19 24 30 36
17 23 28 35 41
18 28 33 40 47
19 32 38 46 54
20 37 43 52 60
Fuente: Creación propia
Como n=20 y es una prueba de dos extremos entonces T=52, por lo tanto, T<w, entonces no
se rechaza la hipótesis nula, lo que afirma que no hubo un cambio con la venta de almuerzos por la
La siguiente tabla representa el pago de que le hace una empresa a u trabajador (trabaja por
diferencia en los ingresos para este trabajador es cero, al nivel de significancia α = 0.05.
TABLA 4
Hipótesis:
Cálculos:
TABLA 5
Signo de diferencia + - - + + + + -
3
P ( X ≤3 cuando p=1/2 )=∑
x=0
( 8x )(0.5) =0.3633 →2 P=2( 0.3633)→ 0.4266>0.05
8
Decisión: Dado que 0.4226 > 0.05 no se rechaza H 0 y se concluye que los ingresos son
iguales.
Se desea evaluar dos libros muy importantes que son usados en la facultad de economía de
la UNP, para ello 15 de los alumnos seleccionados calificarán sobre 10 puntos entre el libro Hal R.
18
Varian y el libro de Microeconomía de Roberts S. Pindyck. Con esta finalidad, se evalúa mediante
una encuesta a los 15 alumnos para conocer cual libro brinda información más completa, el cual
continuación:
TABLA 6
1 8.6 9.1
2 8.2 8.2
3 9.1 8.9
4 9.3 9.6
5 8.8 8.7
6 8.2 8.4
7 9.6 9.6
8 9.3 9.1
9 8.4 8.8
10 8.9 9.3
11 9.2 9.6
12 9.6 9.5
13 9.3 9.1
14 8.2 8.8
15 8.7 8.9
19
Con un nivel de significancia del 1% ¿existen evidencias que nos permitan llegar a la
conclusión de que el libro de Hal R. Varian logró mejorar los conocimientos de los estudiantes de la
H0 = Se logró mejorar el conocimiento de Hal R. Varian.
Dado que n = 13, después de descartar las dos diferencias iguales a cero. Con n = 13,
α = 0.05 y una prueba bilateral, en la tabla de valores críticos de Wilcoxon se encuentra el valor de
17.
TABLA 7
9.6 9.6 0 -
d.
w +¿=18 ¿ w=18
w−¿=73 ¿ w >k
18>17
Aproximaci ó n Normal
21
n ( n+1 ) 13 ( 14 )
μ= = =45.5
4 4
σ=
√ n ( n+ 1 )( 2 n+1 )
24 √
=
13 ( 14 )( 27 )
24
=14.3
w−μ 18−45.5
Z= = =−1.91
σ 14.3
P [ Z ≤−1.91 ] =0.4719
e. En cada una de las pruebas al ser ambos valores mayores a la prueba de significación
no se rechaza H0
La empresa Nestlé realizo una evaluación de sus dos productos más vendidos con respecto a
personas, que califiquen del 0 a 20 los dos productos de estos bienes de consumo diario Al nivel de
significancia 5%. ¿La muestra aleatoria de 15 sedes del producto vendido la mediana de chocolates
sublime y galletas morochas son diferentes? las calificaciones se dan en la siguiente tabla.
TABLA 8
22
Tabla de dos productos más vendidos con respecto a chocolates sublime y galletas morochas
2 16 16
3 18 15
4 19 16
5 17 18
6 19 17
7 20 16
8 16 16
9 18 17
10 18 17
11 18 17
12 17 17
13 19 18
14 17 16
15 19
SOLUCIÓN:
Region critica:
n1 = 15 n2 = 14 ɑ = 0.05
1. Cálculos:
TABLA 9
CALIFICACIONES RANGOS
15 1
16* 5.5
16* 5.5
16 5.5
16 5.5
16 5.5
16 5.5
16 5.5
16 5.5
17* 13.5
17* 13.5
17* 13.5
17 13.5
17 13.5
17 13.5
17 13.5
17 13.5
18* 21
18* 21
18* 21
18* 21
24
18* 21
18 21
18 21
19* 26.5
19* 26.5
19* 26.5
19* 26.5
20* 29
Fuente: Elaboración propia con datos ficticios
W1 = Sublime y W2 = Morochas
W1 = 291.50
W2 = 143.50
Los datos que siguen representan los el PBI per cápita de tres empresas distintas en cada
mes del año 2020, en miles de soles. Pruebe la hipótesis que el PBI promedio de los 3 es igual, al
TABLA 10
25
Febrero 15 18 26
Marzo 17 14 24
Abril 19 10 25
Mayo 20 8 22
Junio 16 5 28
Julio 12 3 20
Agosto 10 16 25
Septiembre 15 12 21
Octubre 19 14 24
Noviembre 18 19 27
Diciembre 26 20 32
Hipótesis:
Estadística de prueba:
12
k
R12
H= ∑
n( n+1) i=1 n 1
−3( n+1) ≈ X (2)
2
Región critica:
26
FIGURA 1:
Cálculos:
TABLA 11
17 15 14 9.5 24 27
19 19 10 4.5 25 29.5
20 22 8 3 22 25
16 13.5 5 2 28 34
12 7 3 1 20 22
15 11.5 12 7 21 24
19 19 14 9.5 24 27
18 16.5 19 19 27 33
26 31.5 20 22 32 36
H=
12
[
198 2 114.52 353.52
36(37) 12
+
12
+
12 ]
−111
H=22.09
22.09>5.99
Decisión: Dado que 22.09 > 5.99 se rechaza H 0 y se concluye que los promedios son
diferentes
TABLA 12
Semana 2 48 49 50 53 52 50 47 52
Supuestos:
Ho: p s=0
Ho: p s ≠ 0
Ordenamos:
TABLA 13
Semana 1 2 3 4 5 6 7 8
Semana 1 45 48 49 50 51 52 53 55
Semana 2 47 48 49 50 50 52 52 53
Rango x 1 2 3 4 5 6 7 8
TABLA 14
Semana 1 2 3 4 5 6 7 8
Semana 1 4 2 6 7 8 3 1 5
di
2
4 1 2.25 1 2.25 2.25 0 2.25 13
29
Usando la fórmula:
( 6 )( 13 )
r s=1− =0.8452
8 ( 8 −1 )
2
TABLA 15
Usando el r sde la tabla nos arroja un resultado de 0.738, comparando con el calculado r s=
0.8452 > 0.738, se rechaza la hipótesis nula y se lleva a la conclusión que existe una correlación
positiva considerable.
La industria McDonald's realizó una auditoría al producto más vendido en el mercado en las
diferentes sedes de los diferentes países. Los siguientes datos representan el número de unidades
30
vendidas al día de hamburguesas Big Mac® en una muestra de 20 sedes (213, 218, 228, 309, 226,
238, 236, 222, 300, 219, 246, 225, 247, 200, 223, 234, 232, 218, 254, 301)
TABLA 16
1. Prueba de hipótesis:
2. Nivel de significancia:
α=0.05
3. Estadístico de prueba:
Tabla Kolmogorov-Smirnov
4. Región critica
5. Cálculo de la prueba
TABLA 17
6. Decision estadística:
Por lo tanto, ahora comparamos el valor de la tabla y el valor calculado, en este caso vemos
Por lo tanto, esto indica que se acepta la hipótesis alternativa es la que se va a aceptar y pues
se rechazara la nula.
32
FIGURA 2
FIGURA 3
3.2. Distancia
llegar a la universidad debe ir a la ciudad B, ambas ciudades estan ubicadas en las siguientes
coordenadas:
d= √ ¿ ¿
d= √ ¿ ¿
d= √144 +25
d= √169
d=13u
34
enseñanzas. Los profesores tienen asignado un número de horas de clase, guardias y tutorías a
cubrir, de acuerdo con la siguiente matriz, en la que las filas representen los cursos:
Una fábrica de electrodomésticos ha vendido en los últimos tres años lavadoras (L) y
secadoras (S). La matriz A expresa las unidades vendidas: la matriz B da el precio de venta, en
euros, de cada electrodoméstico.
( )
480 370 2013
(
A= 3500 7500 4200 L
2200 6000 5300 S ) B= 460 360 2014
500 340 2015
a) Hallar la matriz B.A, ¿Cuánto se ingresó cada año por la venta de electrodoméstico?
( ) ( )
480 370 2013 2494800 5820000 3977000
B= 460 360 2014 x
500 340 2015
(
3500 7500 4200 L
2200 6000 5300 S ) = 2402000 5610000 3840000
2498000 5790000 3802000
Supongamos una empresa que produce dos productos X1 y X2 y se quiere conocer el valor
esperado de la cantidad total producida. Considere X1 como una variable aleatoria discreta con una
Tabla N ° 18
35
Cantidad Probabilidad
X1
P1 (X1)
2
0,3
3 0,4
4 0,3
Y X2 como una variable aleatoria discreta con una función de probabilidad dada por:
Tabla N ° 19
Cantidad Probabilidad
X2
P2 (X2)
2
0,6
3 0,4
E(Xk) ¿ ∑
∀X
X k Pk ( X k )
k
Para X1:
Para X2:
Luego:
E(X) = ( XX 12)=(1,43 )
El valor esperado de la cantidad total producida se puede calcular como la suma del valor
Por lo tanto, se espera que la empresa produzca una cantidad total promedio de 4.4 unidades
por día.
Vectores de medias
μ0 =(61 , 40 , 15 , 80 ,90.5)
t
No se rechaza H0, y se infiere que, μ0 =(61 , 40 , 15 , 80 ,90.5)
2
Si n es muy grande con respecto a p, entonces T2 tiene una distribución aproximada de X P.
Entonces se rechaza H0 con nivel de significancia α si T2 > X 2α , P ignorando el supuesto de
normalidad.
Matriz de covarianzas
Un estudio revelo la siguiente tabla de contingencia para la empresa donde se relacionan las
Horas\productividad 5 8 10
6 3 5 6
8 6 10 8
10 9 12 11
41
Xi Yi ni Xi ni Yi ni Xi Yi
ni
6 5 3 18 15 90
6 8 5 30 40 240
6 10 6 36 60 360
8 5 6 48 30 240
8 8 10 80 80 640
8 10 8 64 80 640
10 5 9 90 45 450
10 8 12 120 96 960
S
xy=¿
70
− ( )( 556
4720 596
70 70 )
¿
S xy=¿−0.199 ¿
42
Si es positiva, se dice que existe relación directa entre las variables (aumento o disminución
en x implica un aumento o disminución en y).
Si es negativa, indica relación inversa entre las variables.
Si es cero, no existe ninguna relación entre las variables.
Cuanto más alejado esté el valor de la covarianza hallado de cero, la relación entre
las variables será más intensa.
Rpta:
Si incrementamos las horas de trabajo en la empresa, la productividad se reducirá.
Si reducimos las horas de trabajo en la empresa, la productividad se incrementará.
Sea (x, y) variable aleatoria continua, bidimensional que toma todos los valores en el plano
cartesiano. Decimos que (x, y) tiene una distribución normal bivariada si su función de densidad de
−Q
2
e
F (x, y) =
2 π σ x σ y √ 1− p2
1
[( )
x− μx 2
(
( x−μx )( y−μ x ) y− μx
)]
2
−1
F(x, y)= 2 π σ σ 1− p2 −2 p +
x y√
2
2(1− p ) σx σxσy σy
e
ρ es el coeficiente de correlacion
43
μ x es lamedia de la variable x
μ y es la media de la variable y
EJERCICIO
Entre las parejas que hay en un salón de clase de la facultad de economía de la UNP, se
evaluación es (X, Y) expresados en soles, se ajusta a una distribución normal bivariante con los
siguientes parámetros.
−Q
F (x, y) = e 2
2 π (1)(2) √ 1−0
2
Se obtiene:
−1
2[ 2
(x−1) +
y
4 ]
F (x, y) = e
2 π ( 2)
Integrando:
2 1
e
−1
2 [ 2 y
(x−1) +
4 ]
∫∫ 2 π (2)
dxdy=0.2559
0 −1
FIGURA 4:
algunas de las cuales debemos tener en cuenta, ya que hacen que estas sean verdaderas con respecto
a un vector aleatorio X.
2.- Todos los subconjuntos de los componentes de X tiene una distribución normal
multivariante.
3.- Covarianzas cero implica que las correspondientes componentes son distribuidas
normalmente.
La densidad condicional de una variable aleatoria X1, dado X2 = x2 para una distribución
f ( x1 , x2 )
F ( x 1 ∕ x 2 )=f ( x1 ∕ x 2=x 2 )=
f ( x2)
Teorema. – Si la variable aleatoria X se distribuye como N_P (u,Σ) con |Σ|>0, entonces:
a) (x-u)^' Σ^(-1) (x-u) se distribuye como una distribución chi – cuadrado con p grados
Tenemos una cantidad de bolsa de valores n, las cuales son proporcionales en distintos tipos
pero no sabemos que tipo son, entonces se trata de estimar la maxima verosimilitud de k, en el
Supones: Se escogen 3 bolsas de valores y se observa los tipos A,B,A entonces tenemos
3 salientes es de:
P ( x 1 , k ) =L(k , x 1) =
En este caso salió, la primera bolsa distinta a la segunda y el tercero igual al primero
k−1 1 k−1
= 2
k k k
TABLA 20
Entonces podemos observar que k comienza a decrecer a partir de k=2, así el estimador
k ( A , B , A ) =2
47
Ahora cogemos una nueva bolsa de valor y nos sale de tipo C, entonces x 1= A , B , A , C , la
TABLA 21:
Podemos observar que para valores de k≥ 6 será decrecientes, por lo tanto, el máximo
estimador verosímil de k es
k ( A , B , A , C )=5
lo tanto, son importante todas las técnicas analíticas y numéricas de optimización que conocemos.
Los datos que siguen representan los el PBI per cápita de tres empresas distintas en cada
mes del año 2020, en miles de soles. Pruebe la hipótesis que el PBI promedio de los 3 es igual, al
Tabla de
EMPRESA A EMPRESA B EMPRESA C
distribución del
Enero 24 12 30
Febrero 15 18 26
Marzo 17 14 24
Abril 19 10 25
Mayo 20 8 22
Junio 16 5 28
Julio 12 3 20
Agosto 10 16 25
Septiembre 15 12 21
Octubre 19 14 24
Noviembre 18 19 27
Diciembre 26 20 32
k 2
12 R1
Estadística de prueba: H= ∑
n(n+1) i=1 n 1
−3(n+1)≈ X (2)
2
Región critica:
Cálculos:
Tabla de
distribución del
Creación propia
H=
12
[
198 2 114.52 353.52
36(37) 12
+
12
+
12
−111 ]
H=22.09
22.09>5.99
Decisión: Dado que 22.09 > 5.99 se rechaza H 0 y se concluye que los promedios son
diferentes
La siguiente tabla representa el pago de que le hace una empresa a u trabajador (trabaja por
comisión), durante 8 meses seguidos en el el 2020 y 2019 comprobar que la mediana de la diferencia
Tabla de
distribución del
ingreso del
51
Creación propia
Cálculos:
Tabla de
2019 1500 1200 1150 1750 1400 1100 1050 950
2020 1250 1600
distribución del 1800 1560 1200 970 1450 1000
Signo de diferencia + - - + + + + -
ingreso del
Fuente:
trabajador con
Creación propia 3
signos
P ( X ≤3 cuando p=1/2
x=0 x
()
)=∑ 8 (0.5)8=0.3633 →2 P=2( 0.3633)→ 0.4266>0.05
Decisión: Dado que 0.4226 > 0.05 no se rechaza H 0 y se concluye que los ingresos son
iguales
52
CONCLUSIONES
Los ejemplos antes realizados han sido analizados e investigados con referencia a
nuestra carrera de economía, para hacer más fácil su comprensión y entendimientos ya que gracias
a la estadística nos ha permitido entender, organizar y tomar decisiones que estén de acuerdo con
Este trabajo evidencia todos y cada uno de los temas vistos dentro del IV ciclo de la
carrera de economía; lo presentado en nuestro informe nos permitió como grupo conocer y poner en
práctica cada uno de los temas que nuestro estimado profesor nos enseñó de forma manual y usando
Conocer la teoría nos ayuda a enfocar soluciones y conocer la realidad nos ayuda a
manera simultánea las características que tienen los individuos y que cualquier análisis de más de dos
aquellas características similares que relacionan a la estadística con nuestra carrera de economía,
correspondiente a nuestro aprendizaje, ya que es una herramienta que nos permitira desarrollar
53
problemas de la vida cotidiana, teniendo como finalidad que podamos dar solución a los diferentes
problemas económicos.
BIBLIOGRAFÍA
(2014).
https://www.etsii.upv.es/conbuenpie/documentos/11398Estadistica_Apuntes_Previos.pdf
https://paulyecologia.files.wordpress.com/2016/11/estadisticas_no_parametricassiegel5b15d-
1.pdf
De, F., De, C., & Salud, L. (n.d.). Universidad Los Ángeles de Chimbote CURSO
BIOESTADÍSTICA. https://www.scientific-european-federation-osteopaths.org/wp-content/
uploads/2019/01/Coeficiente-de-correlaci%C3%B3n-de-Spearman-.pdf
Otzen, T., & Manterola, C. (2017). Técnicas de Muestreo sobre una Población a
https://doi.org/10.4067/s0717-95022017000100037
Economistas. http://nulan.mdp.edu.ar/id/eprint/2041/1/morettini.2012.pdf
https://www.fcfm.buap.mx/jzacarias/cursos/estad2/libros/book5e2.pdf
54