Estadistica Aplicada

1
“Año de la unidad, la paz y el desarrollo”
INFORME FINAL
Ángel Reyes Moscol
Christiam Jhampiers Castillo Matorel
Flor Ruth Guerrero Vélez
Jairo Emanuel Namuche Sernaque
Willy Ronaldino Yamunaque Nizama
Yhoan Ortega Pariaton
Facultad de Economía, Universidad Nacional de Piura
Estadística aplicada
Mg. Juan Manuel Panta Ipanaque
8 de febrero de 2023
2
Contenido
INTRODUCCIÓN...................................................................................................................5
MARCO TEÓRICO.................................................................................................................6
1. Muestreo estadístico.......................................................................................................6
1.1. Muestreo probabilístico..........................................................................................6
1.1.1. Muestreo aleatorio simple:.....................................................................................6
1.1.2. Muestreo aleatorio estratificado:............................................................................7
1.1.3. Aleatorio sistemático:.............................................................................................8
1.1.4. Por conglomerados:................................................................................................8
1.2. Muestreo no probabilístico.....................................................................................8
1.2.1. Variable cualitativa población infinita....................................................................8
1.2.2. Variable cualitativa población finita.......................................................................9
1.2.3. Variable cuantitativa población infinita................................................................10
1.2.4. Variable cuantitativa población finita...................................................................10
2. Estadística no paramétrica...........................................................................................11
2.1. Una sola muestra: La prueba de lo signo..............................................................11
2.2. Una sola muestra: La prueba de rango con signos Wilcoxon...............................12
2.3. Dos muestras dependientes: Las pruebas de los signos........................................15
2.4. Dos muestras dependientes: La prueba de Wilcoxon...........................................17
2.5. Dos muestras Independientes: La prueba de U de Mann -Whitney.....................20

3
2.6. K muestra independiente: La prueba H de Kruskal – Wallis...............................23
2.7. K muestra correlacionadas: La prueba F de Friedman.........................................26
2.8. Coeficiente de correlación de rango de Spearman...............................................26
2.9. Una sola muestra: La prueba de Kolmogorov – Smirnov....................................28
3. Introducción al análisis multivariante..........................................................................31
3.1. Organización de datos...........................................................................................31
3.1.1. Arreglo:.................................................................................................................31
3.2. Distancia...............................................................................................................32
3.3. Álgebra de matrices y vectores aleatorios............................................................33
3.4. Matrices definidas positivas.................................................................................33
3.5. Vectores y matrices aleatorias..............................................................................33
3.6. Vectores de medias y matrices de covarianzas.....................................................35
4. Distribución normal bivariante....................................................................................39
4.1. La Distribución Normal Bivariante......................................................................39
4.2. Propiedades adicionales de la distribución normal multivariante........................41
4.3. La densidad condicional de una distribución normal bivariante..........................42
4.4. Muestreo de una distribución Normal Multivariante y estimador máximo
verosímil. 42
4.5. La función de Verosimilitud de la Normal Multivariante....................................44
CONCLUSIONES.................................................................................................................48
4
BIBLIOGRAFÍA...................................................................................................................49
5
INTRODUCCIÓN
El presente trabajo va referido al tema de la Estadística, que se puede definir como parte del
método científico que a través del análisis matemático va a permitir obtener información sobre la
realidad que nos rodea, constituye una poderosa herramienta para generar conocimiento y ha
experimentado un vigoroso desarrollo desde sus orígenes hasta nuestros días.
Actualmente, es aplicada en todas las áreas del saber y, de manera determinante, en las
Ciencias Sociales. La Estadística trata de la recolección, análisis y uso de los datos el cual nos
permite tomar decisiones, solucionar problemas y diseñar procesos y productos, es por esto que
resulta vital para nosotros como alumnos de la facultad de economía de IV ciclo, tener
conocimientos en Estadística.
A continuación, presentaremos una recopilación de ejemplos sobre todos los temas que
hemos venido aprendiendo durante el ciclo como el muestreo estadístico, la estadística no
paramétrica, introducción al análisis multivariante y la distribución normal bivariante y cada una
con sus respectivas clasificaciones que iremos conociendo a través del trabajo
Esperamos que el presente informe ayude a nuestros compañeros a poder analizar
adecuadamente los datos y llegar a la verdad científica mediante una prueba de hipótesis adecuada.
6
MARCO TEÓRICO
1. Muestreo estadístico.
1.1. Muestreo probabilístico
1.1.1. Muestreo aleatorio simple:
Muestreo aleatorio simple: Supongamos que un economista quiere estimar el ingreso
promedio de los hogares de una ciudad. La población total es de 100,000 hogares y es demasiado
grande para medir a cada hogar individualmente.
1.1.1.1. Seleccionar la población: La población en este caso sería los 100,000
hogares en la ciudad.
1.1.1.2. Calcular la cantidad de elementos de la muestra: Para calcular la
cantidad de elementos de la muestra, se utiliza una fórmula o una tabla
estadística que determine la cantidad adecuada de elementos necesarios para
una muestra representativa. Pero para este caso, supongamos que nos 500
hogares.
1.1.1.3. Elaborar una lista de todos los 100,000 hogares en la ciudad,
asignándoles un número a cada hogar en la lista, comenzando por 1.
1.1.1.4. Seleccionar a los individuos: Finalmente, se utiliza un método aleatorio,
como el uso de un generador de números aleatorios o la selección de números
de forma manual, para seleccionar 500 números de la lista. Los hogares
correspondientes a esos números serían la muestra elegida para el análisis.
El economista mediría sus ingresos y calcularía la media para tener una
estimación del ingreso promedio en la población total.

7
1.1.2. Muestreo aleatorio estratificado:
Un economista quiere estimar la satisfacción laboral de los trabajadores en una empresa
con una plantilla de 1000 empleados, de donde le pidieron que trabaje con una muestra de 50
empleados. Además, se sabe que hay 300 empleados en el departamento de finanzas, 260 en el
departamento de ventas, 200 en el departamento de marketing y 240 en el departamento de
tecnología.
Como decide trabajar con un muestreo aleatorio estratificado, tiene en cuenta esta
clasificación o división de la población en estratos para escoger, aleatoriamente, una cantidad de
trabajadores de cada estrato que sea proporcional a la cantidad de componentes que hay en cada
estrato.
Por ejemplo, se pueden elegir 15 empleados de finanzas, 13 de ventas, 10 de marketing y
12 de tecnología.
50 F
= → F=15
1000 300
50 V
= →V =13
1000 260
50 M
= → M=10
1000 200
50 T
= →T =12
1000 240
8
1.1.3. Aleatorio sistemático:
En una encuesta sobre el gasto mensual en bienes y servicios de los hogares en una ciudad
determinada, se desea estimar el gasto promedio mensual por hogar utilizando un muestreo
sistemático. Donde se tiene una lista de 1.000 hogares y se decide tomar una muestra de 100
hogares. Para lo cual elige el primer hogar de la lista al azar, por ejemplo, el hogar número 3 y
luego se seleccionan cada 10º hogar de la lista, es decir el 13, 23, 33 y así sucesivamente hasta
completar nuestra muestra (100 hogares).
1.1.4. Por conglomerados:
Un equipo de economistas desea conocer las tendencias de gasto de los clientes de las
tiendas de comestibles en la ciudad Piura. Para obtener una muestra representativa, deciden utilizar
el enfoque de muestreo por conglomerados.
Se considera como población objetivo a los todos los clientes de las tiendas de comestibles
ubicadas en la ciudad. Cada tienda será un conglomerado.
Se estima que se requieren 49 conglomerados para realizar la muestra representativa,
tomando en cuenta que hay 875 tiendas de comestibles en la ciudad.
Se pasa a crea una lista de las tiendas de comestibles.
Se seleccionan 49 tiendas al azar para luego realizar entrevistas a cada uno de los clientes
que van a dichas tiendas.
1.2. Muestreo no probabilístico
1.2.1. Variable cualitativa población infinita

9
En la provincia de Sullana se espera que el 60% estén de acuerdo con una tasa de impuesto
sobre todos aquellos que arrijan sus desechos al río Chira. Se desea hacer una investigación para
estimar la proporción de familias que están de acuerdo con dicha política, en un intervalo de
confianza cuya amplitud no sea mayor de 0.03 y un coeficiente de confianza del 95%
Z=1.96
e=0.03
p=0.6
q=0.4
2
Z pq
n= 2
e
( 1.96 )2( 0.6)(0.4)

n= =1536.64=1537
(0.03)2
1.2.2. Variable cualitativa población finita
¿Qué tamaño deberá tener una muestra para estimar dentro del 3%, la proporción de
personas que reciben el salario mínimo dentro de cierta localidad, en una población de 5000 y una
seguridad del 95%?
Z=1.96
e=0.03
p=0.5
q=0.5
10
N=5000
2
Z pqN
n=
( N −1 ) e2 + Z2 pq
( 1.96 )2 (0.5)( 0.5)(5000)

n= 2 2
=879.57=880
(4999)(0.03) + ( 1.96 ) (0.5)(0.5)
1.2.3. Variable cuantitativa población infinita
La municipalidad de Piura desea obtener una muestra de los jóvenes que han comenzado a
trabajar, para estimar la edad media de los jóvenes. Se desea una muestra con una seguridad del
95%, con un error del 5% del promedio. En base a estudios anteriores se conoce que la edad
promedio de todos los jóvenes es de 25 años y la desviación estándar es de 5 años. ¿De qué tamaño
debe ser la muestra?
Z=1.96
e=0.1
S=0.5
Z 2 S2
n= 2
e
(1.96)2 (0.5)2
n= 2
=96.04=96
(0.1)
1.2.4. Variable cuantitativa población finita
De una población, N=10000 se quiere obtener una muestra, para estimar el ingreso
promedio por persona. Se requiere que la estimación muestral no se aparte en más de $500 del
11
promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La desviación típica es de
$3000. ¿Cuál será el tamaño óptimo?
Z=1.96
S=3000
e=500
N=10000
2 2
Z S N
n= 2 2 2
(N−1) e + Z S
( 1.96 )2 ( 3000 )2 (10000)

n= =136.42=136
(9999)(500)2+ (1.96 )2 ( 3000 )2
2. Estadística no paramétrica
2.1. Una sola muestra: La prueba de lo signo
Los siguientes datos muestran el aumento en soles en los ingresos mensuales de una
muestra de 14 pequeños quioscos: 90, 120, 150, 125, 107, 130, 60, 136, 100, 110, 70, 145 y 119,
112.
Se desea determinar si el aumento promedio en los ingresos mensuales es mayor a S/.100.
Además, no se hacen suposiciones sobre la normalidad de la distribución.
Hipótesis:
H 0=El aumento promedioen los ingresosmensuales es igual a S /.100
H 1=El aumento promedio en los ingresosmensuales es mayor a S /. 100

12
Nivel de significancia: α = 0.05
Estadística: La variable X Binomial con n = 13 y p = 0.5
Cálculos: Se asignan los signos “+” o “-” a cada valor de la muestra que es mayor o menor
a 100 respectivamente y se asigna el 0 a la medición que es igual a 100, resultando la
secuencia:
Signo de diferencia - + + + + + - + 0 + - + + +
para la cual hay n = 13 signos, mientras que el número de veces que ocurre el signo menos
frecuente es x = 3.
Sea X: número de signos negativos de los n = 13 signos. Entonces el valor calculado de P
es:
3
x=0 x ( )
P=P [ X ≤ 3 cuando p=1/2 ] =∑ 13 ( 0.5 ) = ( 0.5 ) [ 1+13+78+286 ]
13 13
P= ( 0.5 ) [ 278 ] =0.04614

13
Decisión. Dado que P = 0.04614 < 0.05, se rechaza H0 y se concluye que “el aumento
promedio en los ingresos mensuales es mayor a 100 soles, lo que podría ser un posible indicador de
un aumento en la demanda y una mejora en la economía local."
2.2. Una sola muestra: La prueba de rango con signos Wilcoxon
En una investigación sobre el nivel de venta de almuerzos vendidos en el mercado de Piura,
se han recolectado datos de 20 puestos, la cual determino que en el pasado la mediana fue de S/85.
TABLA 1
Venta de almuerzos vendidos en el mercado de Piura

13
Puesto Número de almuerzos vendidos
1 140
2 35
3 90
4 120
5 25
6 50
7 150
8 80
9 80
10 160
11 92
12 310
13 75
14 100
15 68
16 65
14
17 202
18 87
19 47
20 60
Fuente: Elaboración propia con datos ficticios.
Con un nivel de significancia del 5%, ¿Se determina que hubo un cambio en la mediana
debido a la subida de los precios de muchos de los productos para la elaboración de almuerzos?
Hipótesis:
Ho=~
u=20
H 1=~
u ≠ 20
TABLA 2
Venta de almuerzos vendidos en el mercado de Piura
Valores de Xi Di(x-~
u¿ Signo Rango
140 55 + 15
35 -50 - 14
90 5 + 3
120 35 + 11.5
25 -60 - 16
50 -35 - 11.5
150 65 + 17
80 -5 - 3
15
80 -5 - 3
160 75 + 18
92 7 + 5
310 225 + 20
75 -10 - 6
100 15 + 7
68 -17 - 8
65 -20 - 9
202 117 + 19
87 2 + 1
47 -38 - 13
60 -25 - 10
Fuente: Elaboración propia con datos ficticios
Entonces w+¿=116.5 y w −¿=93.5 por lotanto cogiengoel número menor w=93.5 ¿ ¿
TABLA 3
Tabla de Valores críticos de T para la prueba de rangos con signos de Wilcoxon

.005 .01 .025 .05
(una cola) (una cola) (una cola) (una cola)
n
.01 .02 .05 .10
(dos colas) (dos colas) (dos colas) (dos colas)
5 * * * 1
6 * * 1 2
7 * 0 2 4
8 0 2 4 6
9 2 3 6 8
10 3 5 8 11
11 5 7 11 14
12 7 10 14 17
16
13 13 13 17 21
14 13 16 21 26
15 16 20 25 30
16 19 24 30 36
17 23 28 35 41
18 28 33 40 47
19 32 38 46 54
20 37 43 52 60
Fuente: Creación propia
Como n=20 y es una prueba de dos extremos entonces T=52, por lo tanto, T<w, entonces no
se rechaza la hipótesis nula, lo que afirma que no hubo un cambio con la venta de almuerzos por la
subida de precios de sus insumos.
2.3. Dos muestras dependientes: Las pruebas de los signos.
La siguiente tabla representa el pago de que le hace una empresa a u trabajador (trabaja por
comisión), durante 8 meses seguidos en el el 2020 y 2019 comprobar que la mediana de la
diferencia en los ingresos para este trabajador es cero, al nivel de significancia α = 0.05.
TABLA 4
Tabla de distribución del ingreso del trabajador
2019 1500 1200 1150 1350 1400 1100 1050 950

100
2020 1250 1600 1800 1560 1200 970 1450 0
Hipótesis:
H 0=Tiene ingresosiguales en ambos años

17
H 1=No tiene ingresosiguales en ambos años
Nivel de significancia: α = 0.05
Estadística de prueba: La variable aleatoria Binomial X con p = 0.5
Cálculos:
TABLA 5
Tabla de distribución del ingreso del trabajador con signos

2019 1500 1200 1150 1750 1400 1100 1050 950
2020 1250 1600 1800 1560 1200 970 1450 1000
Signo de diferencia + - - + + + + -
3
P ( X ≤3 cuando p=1/2 )=∑
x=0
( 8x )(0.5) =0.3633 →2 P=2( 0.3633)→ 0.4266>0.05
8
Decisión: Dado que 0.4226 > 0.05 no se rechaza H 0 y se concluye que los ingresos son
iguales.
2.4. Dos muestras dependientes: La prueba de Wilcoxon.
Se desea evaluar dos libros muy importantes que son usados en la facultad de economía de
la UNP, para ello 15 de los alumnos seleccionados calificarán sobre 10 puntos entre el libro Hal R.
18
Varian y el libro de Microeconomía de Roberts S. Pindyck. Con esta finalidad, se evalúa mediante
una encuesta a los 15 alumnos para conocer cual libro brinda información más completa, el cual
ayudará para la carrera.
El examen de referencia fue calificado sobre 10 puntos y los resultados se muestran a
continuación:
TABLA 6
Tabla de evaluación entre los libros Hal R. Varian y Microeconomía de R. Pindyck.

ALUMNO LIBROS
S Hal R. Varian Microeconomía de Roberts S. Pindyck
1 8.6 9.1
2 8.2 8.2
3 9.1 8.9
4 9.3 9.6
5 8.8 8.7
6 8.2 8.4
7 9.6 9.6
8 9.3 9.1
9 8.4 8.8
10 8.9 9.3
11 9.2 9.6
12 9.6 9.5
13 9.3 9.1
14 8.2 8.8
15 8.7 8.9
19
Con un nivel de significancia del 1% ¿existen evidencias que nos permitan llegar a la
conclusión de que el libro de Hal R. Varian logró mejorar los conocimientos de los estudiantes de la
Universidad Nacional de Piura?
a) Formule la hipótesis nula y alternativa
b) Obtenga el valor estadístico de la prueba
c) Determine el valor del tamaño de la muestra
d) Determine el valor critico de la prueba
e) Decida el rechazo o no de la hipótesis nula

H0 = Se logró mejorar el conocimiento de Hal R. Varian.
H1 = No se logró mejorar el conocimiento de Hal R. Varian.
 Dado que n = 13, después de descartar las dos diferencias iguales a cero. Con n = 13,
α = 0.05 y una prueba bilateral, en la tabla de valores críticos de Wilcoxon se encuentra el valor de
17.
TABLA 7
Tabla de evaluación entre el libro Hal R. Varian y el libro de Microeconomía de R. Pindyck.

20
Antes Después Diferencia Rango

8.6 9.1 -0.5 12
8.2 8.2 0 -
9.1 8.9 0.2 5
9.3 9.6 -0.3 8
8.8 8.7 0.1 1.5
8.2 8.4 -0.2 5
9.6 9.6 0 -
9.3 9.1 0.2 5
8.4 8.8 -0.4 10
8.9 9.3 -0.4 10
9.2 9.6 -0.4 10
9.6 9.5 0.1 1.5
9.3 9.1 0.2 5
8.2 8.8 -0.6 13
8.7 8.9 -0.2 5

d.
w +¿=18 ¿ w=18
w−¿=73 ¿ w >k
18>17
Aproximaci ó n Normal
21
n ( n+1 ) 13 ( 14 )
μ= = =45.5
4 4
σ=
√ n ( n+ 1 )( 2 n+1 )
24 √
=
13 ( 14 )( 27 )
24
=14.3
w−μ 18−45.5
Z= = =−1.91
σ 14.3
P [ Z ≤−1.91 ] =0.4719
2 P=2 ( 0.4719 )=0.9538 → 0.9538>0.01 … … … … No se rechaza H 0
e. En cada una de las pruebas al ser ambos valores mayores a la prueba de significación
no se rechaza H0
2.5. Dos muestras Independientes: La prueba de U de Mann -Whitney.
La empresa Nestlé realizo una evaluación de sus dos productos más vendidos con respecto a
chocolates sublime y galletas morochas. Pidiendo a un grupo de consumidores que consiste en 15
personas, que califiquen del 0 a 20 los dos productos de estos bienes de consumo diario Al nivel de
significancia 5%. ¿La muestra aleatoria de 15 sedes del producto vendido la mediana de chocolates
sublime y galletas morochas son diferentes? las calificaciones se dan en la siguiente tabla.
TABLA 8
22
Tabla de dos productos más vendidos con respecto a chocolates sublime y galletas morochas
CONSUMIDOR SUBLIME MOROCHAS

1 18 16
2 16 16
3 18 15
4 19 16
5 17 18
6 19 17
7 20 16
8 16 16
9 18 17
10 18 17
11 18 17
12 17 17
13 19 18
14 17 16
15 19
SOLUCIÓN:
Hipótesis: H0: u1= u2 contra H1: u1 ≠ u2
Nivel de significancia: ɑ = 0.05
Estadística de prueba: U de Mann – Whitney (no se supone normalidad)

23
Region critica:
n1 = 15 n2 = 14 ɑ = 0.05
por lo que se obtiene un valor critico de 59.
Si u <= 59 la hipótesis H0 se rechazara.
1. Cálculos:
TABLA 9
CALIFICACIONES RANGOS
15 1
16* 5.5
16* 5.5
16 5.5
16 5.5
16 5.5
16 5.5
16 5.5
16 5.5
17* 13.5
17* 13.5
17* 13.5
17 13.5
17 13.5
17 13.5
17 13.5
17 13.5
18* 21
18* 21
18* 21
18* 21
24
18* 21
18 21
18 21
19* 26.5
19* 26.5
19* 26.5
19* 26.5
20* 29
W1 = Sublime y W2 = Morochas
W1 = 291.50
W2 = 143.50
U1 = 291.50 – (15)(16) /2 = 171.50
U2 = 143.50 – (14)(15) /2 = 38.50
Luego se elige el U menor el cual es igual a: 38.50
2. Decisión: Dado que U = 38.50 < 59

Por lo tanto, la hipótesis nula se rechaza y se acepta la hipótesis alternativa.
2.6. K muestra independiente: La prueba H de Kruskal – Wallis.
Los datos que siguen representan los el PBI per cápita de tres empresas distintas en cada
mes del año 2020, en miles de soles. Pruebe la hipótesis que el PBI promedio de los 3 es igual, al
nivel de significancia α = 0.05.
TABLA 10
25
Tabla de distribución del PBI per cápita

MESES EMPRESA A EMPRESA B EMPRESA C
Enero 24 12 30
Febrero 15 18 26
Marzo 17 14 24
Abril 19 10 25
Mayo 20 8 22
Junio 16 5 28
Julio 12 3 20
Agosto 10 16 25
Septiembre 15 12 21
Octubre 19 14 24
Noviembre 18 19 27
Diciembre 26 20 32
 Hipótesis:
H 0=El promedio del PBI de los 3 paises es igual
H 1=El promedio del PBI de los3 paises no es igual
 Nivel de significancia: α = 0.05
 Estadística de prueba:
12
k
R12
H= ∑
n( n+1) i=1 n 1
−3( n+1) ≈ X (2)
2
 Región critica:
26
FIGURA 1:
Gráfica de la región critica de las hipótesis h0 y h1
 Cálculos:
TABLA 11
Tabla de distribución del PBI per cápita con rangos
EMPRESA A Rangos EMPRESA B Rangos EMPRESA C Rangos

24 27 12 7 30 35
15 11.5 18 16.5 26 31.5
17 15 14 9.5 24 27
19 19 10 4.5 25 29.5
20 22 8 3 22 25
16 13.5 5 2 28 34
12 7 3 1 20 22
10 4.5 16 13.5 25 29.5
15 11.5 12 7 21 24
19 19 14 9.5 24 27
18 16.5 19 19 27 33
26 31.5 20 22 32 36

27
n1 =12 n2 =12 n3 =12
r 1=198 r 2=114.5 r 3 =353.5
H=
12
[
198 2 114.52 353.52
36(37) 12
+
12
+
12 ]
−111
H=22.09
22.09>5.99
 Decisión: Dado que 22.09 > 5.99 se rechaza H 0 y se concluye que los promedios son
diferentes
2.7. K muestra correlacionadas: La prueba F de Friedman.
2.8. Coeficiente de correlación de rango de Spearman.
En la siguiente tabla se muestra la cantidad de horas de trabajo que hicieron 8 trabajadores
en la primera semana de diciembre y la segunda semana de diciembre:
TABLA 12
Tabla de la cantidad de horas de trabajo que hicieron 8 trabajadores en la primera semana

de diciembre
Semana 1 2 3 4 5 6 7 8
Semana 1 50 48 52 53 55 49 45 51
Semana 2 48 49 50 53 52 50 47 52

28
Calcular el coeficiente de correlación por rangos de Spearman y pruebe, con un nivel de
significación de 5% si es estadísticamente significativo.
Supuestos:
 Ho: p s=0
 Ho: p s ≠ 0
Ordenamos:
TABLA 13
Semana 1 2 3 4 5 6 7 8
Semana 1 45 48 49 50 51 52 53 55
Semana 2 47 48 49 50 50 52 52 53
Rango x 1 2 3 4 5 6 7 8
Rango y 1 2 3 4.5 4.5 6.5 6.5 8
Desarrollamos diferencias de rangos:
TABLA 14
Semana 1 2 3 4 5 6 7 8
Semana 1 4 2 6 7 8 3 1 5
Semana 2 2 3 4.5 8 6.5 4.5 1 6.5
di 2 -1 1.5 1 1.5 1.5 0 -1.5
di
2
4 1 2.25 1 2.25 2.25 0 2.25 13
29
Usando la fórmula:
( 6 )( 13 )
r s=1− =0.8452
8 ( 8 −1 )
2
TABLA 15
Tabla de valores críticos del coeficiente de correlación de rangos r sde Spearman
n ∝=0.10 ∝=0.05 ∝=0.02 ∝=0.01
5 .900 ---- ---- ----
6 .829 .886 .943 ----
7 .714 .786 .893 .929
8 .643 .738 .833 .881
9 .600 .700 .783 .833
10 .564 .648 .745 .794
Usando el r sde la tabla nos arroja un resultado de 0.738, comparando con el calculado r s=
0.8452 > 0.738, se rechaza la hipótesis nula y se lleva a la conclusión que existe una correlación
positiva considerable.
2.9. Una sola muestra: La prueba de Kolmogorov – Smirnov.
La industria McDonald's realizó una auditoría al producto más vendido en el mercado en las
diferentes sedes de los diferentes países. Los siguientes datos representan el número de unidades
30
vendidas al día de hamburguesas Big Mac® en una muestra de 20 sedes (213, 218, 228, 309, 226,
238, 236, 222, 300, 219, 246, 225, 247, 200, 223, 234, 232, 218, 254, 301)
Al nivel de significancia 5% ¿La muestra aleatoria de 20 sedes del producto vendido no
tiene una distribución normal?
TABLA 16
Tabla de número de unidades vendidas al día de hamburguesas

213 218 228 309 226 238 236 222 300 219
246 225 247 200 223 234 232 318 254 301
1. Prueba de hipótesis:
Ho: la muestra aleatoria tiene una distribución normal
H1: la muestra aleatoria no tiene una distribución normal
2. Nivel de significancia:
α=0.05
3. Estadístico de prueba:
Tabla Kolmogorov-Smirnov
Valor de la tabla es de 0.29408
4. Región critica
5. Cálculo de la prueba
TABLA 17
Tabla de número de unidades vendidas al día de hamburguesas

Orden Datos Fo(Orden/ Z Fh[0.5-P(Z)] Diferencia | Fo-Fh|
31
n)=Sn P(Z) Fh=? Dc | Fo-Fh|

1 200 0.05 -1.29 0.4015 0.0985 -0.0485 0.0485
2 213 0.1 -0.91 0.3186 0.1814 -0.0814 0.0814
3 218 0.15 -0.77 0.2794 0.2206 -0.0706 0.0706
4 219 0.2 -0.74 0.2703 0.2297 -0.0297 0.0297
5 222 0.25 -0.65 0.2422 0.2578 -0.0078 0.0078
6 223 0.3 -0.62 0.2324 0.2676 0.0324 0.0324
7 225 0.35 -0.56 0.2123 0.2877 0.0623 0.0623
8 226 0.4 -0.53 0.2019 0.2981 0.1019 0.1019
9 228 0.45 -0.48 0.1844 0.3156 0.1344 0.1344
10 232 0.5 -0.36 0.1406 0.3594 0.1406 0.1406
11 234 0.55 -0.30 0.1179 0.3821 0.1679 0.1679
12 236 0.6 -0.24 0.0948 0.4052 0.1948 0.1948
13 238 0.65 -0.19 0.0753 0.4247 0.2253 0.2253
14 246 0.7 0.04 0.016 0.484 0.216 0.216
15 247 0.75 0.07 0.0279 0.4721 0.2779 0.2779
16 254 0.8 0.28 0.1103 0.3897 0.4103 0.4103
17 300 0.85 1.61 0.4463 0.0537 0.7963 0.7963
18 301 0.9 1.64 0.4495 0.0505 0.8495 0.8495
19 309 0.95 1.87 0.4693 0.0307 0.9193 0.9193
20 318 1 2.13 0.4834 0.0166 0.9834 0.9834
El valor calculado es de 0.9834
6. Decision estadística:
Por lo tanto, ahora comparamos el valor de la tabla y el valor calculado, en este caso vemos
que el valor calculado es mayor al valor de la tabla.
0.9834 > 0.29408
Por lo tanto, esto indica que se acepta la hipótesis alternativa es la que se va a aceptar y pues
se rechazara la nula.
32
3. Introducción al análisis multivariante.
3.1. Organización de datos
3.1.1. Arreglo: Los datos multivariantes surgen de una investigación de un fenómeno
social o fisco, seleccionado de un número p≥ 1 de variables o características a analizar.
Usaremos la notación x ij para indicar el valor particular de la i-ésima variable que es
observada en el i-ésimo individuo o ensayo.
Si tenemos n medidas de p variables, estas pueden representarse como sigue:
FIGURA 2
Representación de organización de datos
FIGURA 3
Arreglo rectangular, llamado X, de p filas y n columnas

33
3.2. Distancia
Un estudiante universitario de la facultad de economía, se encuentra en la ciudad A y para
llegar a la universidad debe ir a la ciudad B, ambas ciudades estan ubicadas en las siguientes
coordenadas:
A (-7, 2) kms y B (5, 7) km, hallar su distancia:
d= √ ¿ ¿
d= √ ¿ ¿
d= √144 +25
d= √169
d=13u
34
3.3. Álgebra de matrices y vectores aleatorios.
En un colegio se imparten los cursos de microeconomía en 1°, 2° y 3° de ciertas
enseñanzas. Los profesores tienen asignado un número de horas de clase, guardias y tutorías a
cubrir, de acuerdo con la siguiente matriz, en la que las filas representen los cursos:
3.4. Matrices definidas positivas.
Una fábrica de electrodomésticos ha vendido en los últimos tres años lavadoras (L) y
secadoras (S). La matriz A expresa las unidades vendidas: la matriz B da el precio de venta, en
euros, de cada electrodoméstico.
2013 2014 2015 L S
( )
480 370 2013
(
A= 3500 7500 4200 L
2200 6000 5300 S ) B= 460 360 2014
500 340 2015
a) Hallar la matriz B.A, ¿Cuánto se ingresó cada año por la venta de electrodoméstico?
( ) ( )
480 370 2013 2494800 5820000 3977000
B= 460 360 2014 x
500 340 2015
(
3500 7500 4200 L
2200 6000 5300 S ) = 2402000 5610000 3840000
2498000 5790000 3802000
3.5. Vectores y matrices aleatorias.
Supongamos una empresa que produce dos productos X1 y X2 y se quiere conocer el valor
esperado de la cantidad total producida. Considere X1 como una variable aleatoria discreta con una
función de probabilidad dada por:
Tabla N ° 18
35
Función de probabilidad de la variable X1
Cantidad Probabilidad
X1
P1 (X1)
2
0,3
3 0,4
4 0,3
Nota. Elaboración propia con datos ficticios.
Y X2 como una variable aleatoria discreta con una función de probabilidad dada por:
Tabla N ° 19
Función de probabilidad de la variable X2
Cantidad Probabilidad
X2
P2 (X2)
2
0,6
3 0,4
Nota. Elaboración propia con datos ficticios.
El valor esperado de la cantidad total producida se calcularía utilizando:

36
E(Xk) ¿ ∑
∀X
X k Pk ( X k )
k
Para X1:
E (X1) = (2) (0,3) + (3) (0,4) + (4) (0,3) = 3
Para X2:
E (X2) = (1) (0,6) + (2) (0,4) = 1,4
Luego:
E(X) = ( XX 12)=(1,43 )
El valor esperado de la cantidad total producida se puede calcular como la suma del valor
esperado de cada producto:
E (X1 + X2) = E (X1) + E (X2)
E (X1 + X2) = 3 + 1,4
Por lo tanto, se espera que la empresa produzca una cantidad total promedio de 4.4 unidades
por día.
3.6. Vectores de medias y matrices de covarianzas
Vectores de medias
Se estudian 5 variables de calidad de un producto, se desea determinar si,
μ1=61 , μ2=40 , μ3=15 , μ4 =¿ 80, μ5=90.5
Con un nivel de significancia del 5%.

37
μ0 =(61 , 40 , 15 , 80 ,90.5)
Con: n = 20, p = 5, α =0.05

38
39
t
No se rechaza H0, y se infiere que, μ0 =(61 , 40 , 15 , 80 ,90.5)
Prueba de hipótesis para μ con muestra muy grande.
2
Si n es muy grande con respecto a p, entonces T2 tiene una distribución aproximada de X P.
Entonces se rechaza H0 con nivel de significancia α si T2 > X 2α , P ignorando el supuesto de
normalidad.
Resolviendo, p-valor = 0.125 y no se rechaza H0.

40
Matriz de covarianzas
Un estudio revelo la siguiente tabla de contingencia para la empresa donde se relacionan las
horas de trabajo y la productividad que se tenían en la fábrica
Horas\productividad 5 8 10
6 3 5 6
8 6 10 8
10 9 12 11
41
a) Hallar el grado de asociación entre las horas trabajadas y la productividad correspondiente:
Xi Yi ni Xi ni Yi ni Xi Yi
ni
6 5 3 18 15 90
6 8 5 30 40 240
6 10 6 36 60 360
8 5 6 48 30 240
8 8 10 80 80 640
8 10 8 64 80 640
10 5 9 90 45 450
10 8 12 120 96 960
10 10 11 110 110 1100
∑ ¿70 ∑ ¿596 ∑ ¿556 ∑ ¿ 4720
 Con los valores encontrados en la tabla, reemplazamos en la formula siguiente:

S
xy=¿
n ( n )(
∑ x i y ini − ∑ xi ni ∑ y ini
n ) ¿
S
xy=¿
70
− ( )( 556
4720 596
70 70 )
¿
S xy=¿−0.199 ¿
42
El signo de la covarianza define la naturaleza de la asociación:
 Si es positiva, se dice que existe relación directa entre las variables (aumento o disminución
en x implica un aumento o disminución en y).
 Si es negativa, indica relación inversa entre las variables.
 Si es cero, no existe ninguna relación entre las variables.
Cuanto más alejado esté el valor de la covarianza hallado de cero, la relación entre
las variables será más intensa.
Rpta:
 Si incrementamos las horas de trabajo en la empresa, la productividad se reducirá.
 Si reducimos las horas de trabajo en la empresa, la productividad se incrementará.
4. Distribución normal bivariante
4.1. La Distribución Normal Bivariante.
Sea (x, y) variable aleatoria continua, bidimensional que toma todos los valores en el plano
cartesiano. Decimos que (x, y) tiene una distribución normal bivariada si su función de densidad de
probabilidad conjunta (fdp) está definida por la expresión siguiente:
−Q
2
e
F (x, y) =
2 π σ x σ y √ 1− p2
[( ) ( x−μx ) ( y−μ x ) y−μ x

( )]
2 2
1 x−μx
Q= −2 p +
(1− p 2) σx σxσ y σy
1
[( )
x− μx 2
(
( x−μx )( y−μ x ) y− μx
)]
2
−1
F(x, y)= 2 π σ σ 1− p2 −2 p +
x y√
2
2(1− p ) σx σxσy σy
e
-∞< X < ∞ -∞ <Y < ∞
 ρ es el coeficiente de correlacion
43
 μ x es lamedia de la variable x
 μ y es la media de la variable y
 σ x es la desviacion estándar de la variable aleatoria x
 σ y es la desviacion estándar de la variable aleatoria y
EJERCICIO
Entre las parejas que hay en un salón de clase de la facultad de economía de la UNP, se
presenta una evaluación de un trabajo sobre la crisis económica, la distribución conjunta de la
evaluación es (X, Y) expresados en soles, se ajusta a una distribución normal bivariante con los
siguientes parámetros.
X= evaluación de los hombres, con μ x=1 y σ x =1
Y= evaluación de las mujeres, con μ y =0 yσ y =2
ρ, coeficiente de correlación lineal 0
Calcular P (0<x<2, -1≤y≤ 1)
Sustituyendo los valores dados, en la formula de la distribución normal bivariada:
−Q
F (x, y) = e 2
2 π (1)(2) √ 1−0
2
[( ) ( x−1 ) ( y−0 ) y−0

( )]
2 2
1 x−1
Q= (1−0) 2
−2(0) + 2
1 (1)(2) 2
44
Se obtiene:
−1
2[ 2
(x−1) +
y
4 ]
F (x, y) = e
2 π ( 2)
Integrando:
P (0<x<2, -1≤y≤ 1)=
2 1
e
−1
2 [ 2 y
(x−1) +
4 ]
∫∫ 2 π (2)
dxdy=0.2559
0 −1
Hay una probabilidad del 25.59% de que 0<x<2, -1≤y≤ 1
FIGURA 4:
4.2. Propiedades adicionales de la distribución normal multivariante.
Con respecto a las propiedades adicionales de la distribucion normal bivariante tenemos
algunas de las cuales debemos tener en cuenta, ya que hacen que estas sean verdaderas con respecto
a un vector aleatorio X.
1.- Combinaciones lineales de los componentes de X son distribuidas normalmente.

45
2.- Todos los subconjuntos de los componentes de X tiene una distribución normal
multivariante.
3.- Covarianzas cero implica que las correspondientes componentes son distribuidas
normalmente.
4.- las distribuciones condicionales de los componentes son normales multivariantes.
4.3. La densidad condicional de una distribución normal bivariante.
La densidad condicional de una variable aleatoria X1, dado X2 = x2 para una distribución
normal bivariante, es definido por:
f ( x1 , x2 )
F ( x 1 ∕ x 2 )=f ( x1 ∕ x 2=x 2 )=
f ( x2)
Donde f ( x 2 ) es la distribucion marginal y f ( x 1 , x 2 ) es densidad normal bivariante
Teorema. – Si la variable aleatoria X se distribuye como N_P (u,Σ) con |Σ|>0, entonces:
a) (x-u)^' Σ^(-1) (x-u) se distribuye como una distribución chi – cuadrado con p grados
de libertad, es decir como x_p^2.
b) La distribución N_P (u,Σ) asigna la probabilidad de 1 - ∝ al elipsoide solido {X:(x-
μ)^' Σ^(-1) (x-μ)≤x_((P,1-a))^2 } donde x_((1-a))^2 denota un valor percentil (1 - ∝)*100% de la
distribución x_p^2. Es decir P{(x-μ)^' Σ^(-1) (x-μ)≤x_((P,1-a))^2 }=1 - ∝

46
4.4. Muestreo de una distribución Normal Multivariante y estimador máximo verosímil.
Tenemos una cantidad de bolsa de valores n, las cuales son proporcionales en distintos tipos
pero no sabemos que tipo son, entonces se trata de estimar la maxima verosimilitud de k, en el
numero de tipos de bolsa, a partir de las siguientes observaciones de n bolsas de valores.
Supones: Se escogen 3 bolsas de valores y se observa los tipos A,B,A entonces tenemos
x 1= A , B , A , como k es el tipo de bolsa entonces la probabilidad de observar 2 tipos de bolsa en los
3 salientes es de:
P ( x 1 , k ) =L(k , x 1) =
En este caso salió, la primera bolsa distinta a la segunda y el tercero igual al primero
k−1 1 k−1
= 2
k k k
Ahora asignamos valores para k
TABLA 20
Tabla de cantidad de bolsa de valores n

k 2 3 4 5 …..
k−1 0,25 0,22 0,1875 0,16 …..
2
k
Entonces podemos observar que k comienza a decrecer a partir de k=2, así el estimador
máximo de verosímil de k es:
k ( A , B , A ) =2
47
Ahora cogemos una nueva bolsa de valor y nos sale de tipo C, entonces x 1= A , B , A , C , la
verosimilitud de la muestra es: P ( x 2 , k ) =L(k , x 2)
k−1 1 k−2 (k−1)(k −2)

=
k k k k
3
48
Asignamos nuevos valores para k:
TABLA 21:
Asignación de nuevos valores de cantidad de bolsa de valores n

k 3 4 5 6 7 8
8−1 1 8−2
0.0740 0,938 0,96 0,926 0,875 0,0820
8 8 8
Podemos observar que para valores de k≥ 6 será decrecientes, por lo tanto, el máximo
estimador verosímil de k es
k ( A , B , A , C )=5
El problema para hallar el estimador máximo verosímil es un problema de optimización. Por
lo tanto, son importante todas las técnicas analíticas y numéricas de optimización que conocemos.
4.5. La función de Verosimilitud de la Normal Multivariante.
La prueba de Kruskal -Wallis
Los datos que siguen representan los el PBI per cápita de tres empresas distintas en cada
mes del año 2020, en miles de soles. Pruebe la hipótesis que el PBI promedio de los 3 es igual, al
nivel de significancia α = 0.05.
Tabla de
EMPRESA A EMPRESA B EMPRESA C
distribución del
PBI per cápita

49
Enero 24 12 30
Febrero 15 18 26
Marzo 17 14 24
Abril 19 10 25
Mayo 20 8 22
Junio 16 5 28
Julio 12 3 20
Agosto 10 16 25
Septiembre 15 12 21
Octubre 19 14 24
Noviembre 18 19 27
Diciembre 26 20 32
 Hipótesis: H 0=El promedio del PBI de los 3 paises es igual
H 1=El promedio del PBI de los3 paises no es igual
k 2
12 R1
 Estadística de prueba: H= ∑
n(n+1) i=1 n 1
−3(n+1)≈ X (2)
2
 Región critica:
 Cálculos:
Tabla de
distribución del
PBI per cápita con

50
EMPRESA A Rangos EMPRESA B Rangos EMPRESA C Rangos

24 27 12 7 30 35
15 11.5 18 16.5 26 31.5
17 15 14 9.5 24 27
19 19 10 4.5 25 29.5
20 22 8 3 22 25
16 13.5 5 2 28 34
12 7 3 1 20 22
10 4.5 16 13.5 25 29.5
15 11.5 12 7 21 24
19 19 14 9.5 24 27
18 16.5 19 19 27 33
26 31.5 20 22 32 36
Fuente:
Creación propia
n1 =12 r 1=198 n2 =12 r 2=114.5 n3 =12 r 3 =353.5
H=
12
[
198 2 114.52 353.52
36(37) 12
+
12
+
12
−111 ]
H=22.09
22.09>5.99
 Decisión: Dado que 22.09 > 5.99 se rechaza H 0 y se concluye que los promedios son
diferentes
La prueba de signos para dos muestras
La siguiente tabla representa el pago de que le hace una empresa a u trabajador (trabaja por
comisión), durante 8 meses seguidos en el el 2020 y 2019 comprobar que la mediana de la diferencia
en los ingresos para este trabajador es cero , al nivel de significancia α = 0.05.
Tabla de
distribución del
ingreso del
51
2019 1500 1200 1150 1350 1400 1100 1050 950

2020 1250 1600 1800 1560 1200 970 1450 1000
Fuente:
Creación propia
 Hipótesis: H 0=Tiene ingresos iguales en ambos años
H 1=No tiene ingresos iguales en ambos años
 Estadística de prueba: La variable aleatoria Binomial X con p = 0.5
 Cálculos:
Tabla de
2019 1500 1200 1150 1750 1400 1100 1050 950
2020 1250 1600
distribución del 1800 1560 1200 970 1450 1000
Signo de diferencia + - - + + + + -
ingreso del
Fuente:
trabajador con
Creación propia 3
signos
P ( X ≤3 cuando p=1/2
x=0 x
()
)=∑ 8 (0.5)8=0.3633 →2 P=2( 0.3633)→ 0.4266>0.05
 Decisión: Dado que 0.4226 > 0.05 no se rechaza H 0 y se concluye que los ingresos son
iguales
52
CONCLUSIONES
 Los ejemplos antes realizados han sido analizados e investigados con referencia a
nuestra carrera de economía, para hacer más fácil su comprensión y entendimientos ya que gracias
a la estadística nos ha permitido entender, organizar y tomar decisiones que estén de acuerdo con
los análisis efectuados.
 Este trabajo evidencia todos y cada uno de los temas vistos dentro del IV ciclo de la
carrera de economía; lo presentado en nuestro informe nos permitió como grupo conocer y poner en
práctica cada uno de los temas que nuestro estimado profesor nos enseñó de forma manual y usando
programas como el Colab para obtener mayor practica en su desarrollo.
 Conocer la teoría nos ayuda a enfocar soluciones y conocer la realidad nos ayuda a
contextualizar y a diferenciar soluciones.
 Se llega a la conclusión que el análisis multivariante tiene la finalidad de analizar de
manera simultánea las características que tienen los individuos y que cualquier análisis de más de dos
variables puede ser considerado Análisis Multivariante.
 El trabajo ha tenido como objetivo visualizar, encontrar e interpretar como grupo,
aquellas características similares que relacionan a la estadística con nuestra carrera de economía,
también no ha permitido tomar decisiones optimas a la hora de desarrollar los ejercicios.
 Se puede concluir que la estadística es una pieza muy fundamental en lo
correspondiente a nuestro aprendizaje, ya que es una herramienta que nos permitira desarrollar
53
problemas de la vida cotidiana, teniendo como finalidad que podamos dar solución a los diferentes
problemas económicos.
BIBLIOGRAFÍA
INTRODUCCIÓN A LA ESTADÍSTICA Y A LAS PROBABILIDADES Dra Teresa Carot Sánchez.
(2014).
https://www.etsii.upv.es/conbuenpie/documentos/11398Estadistica_Apuntes_Previos.pdf
‌Siegel, A., & Primera. (n.d.).
https://paulyecologia.files.wordpress.com/2016/11/estadisticas_no_parametricassiegel5b15d-
1.pdf
‌De, F., De, C., & Salud, L. (n.d.). Universidad Los Ángeles de Chimbote CURSO
BIOESTADÍSTICA. https://www.scientific-european-federation-osteopaths.org/wp-content/
uploads/2019/01/Coeficiente-de-correlaci%C3%B3n-de-Spearman-.pdf
‌Otzen, T., & Manterola, C. (2017). Técnicas de Muestreo sobre una Población a
Estudio. International Journal of Morphology, 35(1), 227–232.
https://doi.org/10.4067/s0717-95022017000100037
‌Lic, C., & Morettini. (2012). UNIVERSIDAD NACIONAL DE MAR DE LA PLATA - FACULTAD
E CIENCIAS ECONOMICAS Y SOCIALES Casos Prácticos de Estadística para
Economistas. http://nulan.mdp.edu.ar/id/eprint/2041/1/morettini.2012.pdf
‌Beaver, M., & Beaver. (n.d.). Introducción a la probabilidad y estadística.
https://www.fcfm.buap.mx/jzacarias/cursos/estad2/libros/book5e2.pdf
‌
54

Estadistica Aplicada

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Aplicada

Cargado por

Copyright:

Formatos disponibles

1

“Año de la unidad, la paz y el desarrollo”

Ángel Reyes Moscol

Christiam Jhampiers Castillo Matorel

Flor Ruth Guerrero Vélez

Jairo Emanuel Namuche Sernaque

Willy Ronaldino Yamunaque Nizama

Yhoan Ortega Pariaton

Facultad de Economía, Universidad Nacional de Piura

Mg. Juan Manuel Panta Ipanaque

1.1. Muestreo probabilístico..........................................................................................6

1.1.1. Muestreo aleatorio simple:.....................................................................................6

1.1.2. Muestreo aleatorio estratificado:............................................................................7

1.1.3. Aleatorio sistemático:.............................................................................................8

1.1.4. Por conglomerados:................................................................................................8

1.2. Muestreo no probabilístico.....................................................................................8

1.2.1. Variable cualitativa población infinita....................................................................8

1.2.2. Variable cualitativa población finita.......................................................................9

1.2.3. Variable cuantitativa población infinita................................................................10

1.2.4. Variable cuantitativa población finita...................................................................10

2.1. Una sola muestra: La prueba de lo signo..............................................................11

2.2. Una sola muestra: La prueba de rango con signos Wilcoxon...............................12

2.3. Dos muestras dependientes: Las pruebas de los signos........................................15

2.4. Dos muestras dependientes: La prueba de Wilcoxon...........................................17

2.5. Dos muestras Independientes: La prueba de U de Mann -Whitney.....................20

2.6. K muestra independiente: La prueba H de Kruskal – Wallis...............................23

2.7. K muestra correlacionadas: La prueba F de Friedman.........................................26

2.8. Coeficiente de correlación de rango de Spearman...............................................26

2.9. Una sola muestra: La prueba de Kolmogorov – Smirnov....................................28

3. Introducción al análisis multivariante..........................................................................31

3.1. Organización de datos...........................................................................................31

3.3. Álgebra de matrices y vectores aleatorios............................................................33

3.4. Matrices definidas positivas.................................................................................33

3.5. Vectores y matrices aleatorias..............................................................................33

3.6. Vectores de medias y matrices de covarianzas.....................................................35

4. Distribución normal bivariante....................................................................................39

4.1. La Distribución Normal Bivariante......................................................................39

4.2. Propiedades adicionales de la distribución normal multivariante........................41

4.3. La densidad condicional de una distribución normal bivariante..........................42

4.4. Muestreo de una distribución Normal Multivariante y estimador máximo

4.5. La función de Verosimilitud de la Normal Multivariante....................................44

experimentado un vigoroso desarrollo desde sus orígenes hasta nuestros días.

hemos venido aprendiendo durante el ciclo como el muestreo estadístico, la estadística no

paramétrica, introducción al análisis multivariante y la distribución normal bivariante y cada una

Esperamos que el presente informe ayude a nuestros compañeros a poder analizar

1.1. Muestreo probabilístico

1.1.1. Muestreo aleatorio simple:

Muestreo aleatorio simple: Supongamos que un economista quiere estimar el ingreso

grande para medir a cada hogar individualmente.

1.1.1.1. Seleccionar la población: La población en este caso sería los 100,000

1.1.1.2. Calcular la cantidad de elementos de la muestra: Para calcular la

cantidad de elementos de la muestra, se utiliza una fórmula o una tabla

estadística que determine la cantidad adecuada de elementos necesarios para

1.1.1.3. Elaborar una lista de todos los 100,000 hogares en la ciudad,

asignándoles un número a cada hogar en la lista, comenzando por 1.

1.1.1.4. Seleccionar a los individuos: Finalmente, se utiliza un método aleatorio,

como el uso de un generador de números aleatorios o la selección de números

de forma manual, para seleccionar 500 números de la lista. Los hogares

correspondientes a esos números serían la muestra elegida para el análisis.

El economista mediría sus ingresos y calcularía la media para tener una

estimación del ingreso promedio en la población total.

1.1.2. Muestreo aleatorio estratificado:

Un economista quiere estimar la satisfacción laboral de los trabajadores en una empresa