Está en la página 1de 54

1

“Año de la unidad, la paz y el desarrollo”

INFORME FINAL

Ángel Reyes Moscol

Christiam Jhampiers Castillo Matorel

Flor Ruth Guerrero Vélez

Jairo Emanuel Namuche Sernaque

Willy Ronaldino Yamunaque Nizama

Yhoan Ortega Pariaton

Facultad de Economía, Universidad Nacional de Piura

Estadística aplicada

Mg. Juan Manuel Panta Ipanaque

8 de febrero de 2023
2

Contenido
INTRODUCCIÓN...................................................................................................................5

MARCO TEÓRICO.................................................................................................................6

1. Muestreo estadístico.......................................................................................................6

1.1. Muestreo probabilístico..........................................................................................6

1.1.1. Muestreo aleatorio simple:.....................................................................................6

1.1.2. Muestreo aleatorio estratificado:............................................................................7

1.1.3. Aleatorio sistemático:.............................................................................................8

1.1.4. Por conglomerados:................................................................................................8

1.2. Muestreo no probabilístico.....................................................................................8

1.2.1. Variable cualitativa población infinita....................................................................8

1.2.2. Variable cualitativa población finita.......................................................................9

1.2.3. Variable cuantitativa población infinita................................................................10

1.2.4. Variable cuantitativa población finita...................................................................10

2. Estadística no paramétrica...........................................................................................11

2.1. Una sola muestra: La prueba de lo signo..............................................................11

2.2. Una sola muestra: La prueba de rango con signos Wilcoxon...............................12

2.3. Dos muestras dependientes: Las pruebas de los signos........................................15

2.4. Dos muestras dependientes: La prueba de Wilcoxon...........................................17

2.5. Dos muestras Independientes: La prueba de U de Mann -Whitney.....................20


3

2.6. K muestra independiente: La prueba H de Kruskal – Wallis...............................23

2.7. K muestra correlacionadas: La prueba F de Friedman.........................................26

2.8. Coeficiente de correlación de rango de Spearman...............................................26

2.9. Una sola muestra: La prueba de Kolmogorov – Smirnov....................................28

3. Introducción al análisis multivariante..........................................................................31

3.1. Organización de datos...........................................................................................31

3.1.1. Arreglo:.................................................................................................................31

3.2. Distancia...............................................................................................................32

3.3. Álgebra de matrices y vectores aleatorios............................................................33

3.4. Matrices definidas positivas.................................................................................33

3.5. Vectores y matrices aleatorias..............................................................................33

3.6. Vectores de medias y matrices de covarianzas.....................................................35

4. Distribución normal bivariante....................................................................................39

4.1. La Distribución Normal Bivariante......................................................................39

4.2. Propiedades adicionales de la distribución normal multivariante........................41

4.3. La densidad condicional de una distribución normal bivariante..........................42

4.4. Muestreo de una distribución Normal Multivariante y estimador máximo

verosímil. 42

4.5. La función de Verosimilitud de la Normal Multivariante....................................44

CONCLUSIONES.................................................................................................................48
4

BIBLIOGRAFÍA...................................................................................................................49
5

INTRODUCCIÓN

El presente trabajo va referido al tema de la Estadística, que se puede definir como parte del

método científico que a través del análisis matemático va a permitir obtener información sobre la

realidad que nos rodea, constituye una poderosa herramienta para generar conocimiento y ha

experimentado un vigoroso desarrollo desde sus orígenes hasta nuestros días.

Actualmente, es aplicada en todas las áreas del saber y, de manera determinante, en las

Ciencias Sociales. La Estadística trata de la recolección, análisis y uso de los datos el cual nos

permite tomar decisiones, solucionar problemas y diseñar procesos y productos, es por esto que

resulta vital para nosotros como alumnos de la facultad de economía de IV ciclo, tener

conocimientos en Estadística.

A continuación, presentaremos una recopilación de ejemplos sobre todos los temas que

hemos venido aprendiendo durante el ciclo como el muestreo estadístico, la estadística no

paramétrica, introducción al análisis multivariante y la distribución normal bivariante y cada una

con sus respectivas clasificaciones que iremos conociendo a través del trabajo

Esperamos que el presente informe ayude a nuestros compañeros a poder analizar

adecuadamente los datos y llegar a la verdad científica mediante una prueba de hipótesis adecuada.
6

MARCO TEÓRICO

1. Muestreo estadístico.

1.1. Muestreo probabilístico

1.1.1. Muestreo aleatorio simple:

Muestreo aleatorio simple: Supongamos que un economista quiere estimar el ingreso

promedio de los hogares de una ciudad. La población total es de 100,000 hogares y es demasiado

grande para medir a cada hogar individualmente.

1.1.1.1. Seleccionar la población: La población en este caso sería los 100,000

hogares en la ciudad.

1.1.1.2. Calcular la cantidad de elementos de la muestra: Para calcular la

cantidad de elementos de la muestra, se utiliza una fórmula o una tabla

estadística que determine la cantidad adecuada de elementos necesarios para

una muestra representativa. Pero para este caso, supongamos que nos 500

hogares.

1.1.1.3. Elaborar una lista de todos los 100,000 hogares en la ciudad,

asignándoles un número a cada hogar en la lista, comenzando por 1.

1.1.1.4. Seleccionar a los individuos: Finalmente, se utiliza un método aleatorio,

como el uso de un generador de números aleatorios o la selección de números

de forma manual, para seleccionar 500 números de la lista. Los hogares

correspondientes a esos números serían la muestra elegida para el análisis.

El economista mediría sus ingresos y calcularía la media para tener una

estimación del ingreso promedio en la población total.


7

1.1.2. Muestreo aleatorio estratificado:

Un economista quiere estimar la satisfacción laboral de los trabajadores en una empresa

con una plantilla de 1000 empleados, de donde le pidieron que trabaje con una muestra de 50

empleados. Además, se sabe que hay 300 empleados en el departamento de finanzas, 260 en el

departamento de ventas, 200 en el departamento de marketing y 240 en el departamento de

tecnología.

Como decide trabajar con un muestreo aleatorio estratificado, tiene en cuenta esta

clasificación o división de la población en estratos para escoger, aleatoriamente, una cantidad de

trabajadores de cada estrato que sea proporcional a la cantidad de componentes que hay en cada

estrato.

Por ejemplo, se pueden elegir 15 empleados de finanzas, 13 de ventas, 10 de marketing y

12 de tecnología.

50 F
= → F=15
1000 300

50 V
= →V =13
1000 260

50 M
= → M=10
1000 200

50 T
= →T =12
1000 240
8

1.1.3. Aleatorio sistemático:

En una encuesta sobre el gasto mensual en bienes y servicios de los hogares en una ciudad

determinada, se desea estimar el gasto promedio mensual por hogar utilizando un muestreo

sistemático. Donde se tiene una lista de 1.000 hogares y se decide tomar una muestra de 100

hogares. Para lo cual elige el primer hogar de la lista al azar, por ejemplo, el hogar número 3 y

luego se seleccionan cada 10º hogar de la lista, es decir el 13, 23, 33 y así sucesivamente hasta

completar nuestra muestra (100 hogares).

1.1.4. Por conglomerados:

Un equipo de economistas desea conocer las tendencias de gasto de los clientes de las

tiendas de comestibles en la ciudad Piura. Para obtener una muestra representativa, deciden utilizar

el enfoque de muestreo por conglomerados.

Se considera como población objetivo a los todos los clientes de las tiendas de comestibles

ubicadas en la ciudad. Cada tienda será un conglomerado.

Se estima que se requieren 49 conglomerados para realizar la muestra representativa,

tomando en cuenta que hay 875 tiendas de comestibles en la ciudad.

Se pasa a crea una lista de las tiendas de comestibles.

Se seleccionan 49 tiendas al azar para luego realizar entrevistas a cada uno de los clientes

que van a dichas tiendas.

1.2. Muestreo no probabilístico

1.2.1. Variable cualitativa población infinita


9

En la provincia de Sullana se espera que el 60% estén de acuerdo con una tasa de impuesto

sobre todos aquellos que arrijan sus desechos al río Chira. Se desea hacer una investigación para

estimar la proporción de familias que están de acuerdo con dicha política, en un intervalo de

confianza cuya amplitud no sea mayor de 0.03 y un coeficiente de confianza del 95%

Z=1.96

e=0.03

p=0.6

q=0.4

2
Z pq
n= 2
e

( 1.96 )2( 0.6)(0.4)


n= =1536.64=1537
(0.03)2

1.2.2. Variable cualitativa población finita

¿Qué tamaño deberá tener una muestra para estimar dentro del 3%, la proporción de

personas que reciben el salario mínimo dentro de cierta localidad, en una población de 5000 y una

seguridad del 95%?

Z=1.96

e=0.03

p=0.5

q=0.5
10

N=5000

2
Z pqN
n=
( N −1 ) e2 + Z2 pq

( 1.96 )2 (0.5)( 0.5)(5000)


n= 2 2
=879.57=880
(4999)(0.03) + ( 1.96 ) (0.5)(0.5)

1.2.3. Variable cuantitativa población infinita

La municipalidad de Piura desea obtener una muestra de los jóvenes que han comenzado a

trabajar, para estimar la edad media de los jóvenes. Se desea una muestra con una seguridad del

95%, con un error del 5% del promedio. En base a estudios anteriores se conoce que la edad

promedio de todos los jóvenes es de 25 años y la desviación estándar es de 5 años. ¿De qué tamaño

debe ser la muestra?

Z=1.96

e=0.1

S=0.5

Z 2 S2
n= 2
e

(1.96)2 (0.5)2
n= 2
=96.04=96
(0.1)

1.2.4. Variable cuantitativa población finita

De una población, N=10000 se quiere obtener una muestra, para estimar el ingreso

promedio por persona. Se requiere que la estimación muestral no se aparte en más de $500 del
11

promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La desviación típica es de

$3000. ¿Cuál será el tamaño óptimo?

Z=1.96

S=3000

e=500

N=10000

2 2
Z S N
n= 2 2 2
(N−1) e + Z S

( 1.96 )2 ( 3000 )2 (10000)


n= =136.42=136
(9999)(500)2+ (1.96 )2 ( 3000 )2

2. Estadística no paramétrica

2.1. Una sola muestra: La prueba de lo signo

Los siguientes datos muestran el aumento en soles en los ingresos mensuales de una

muestra de 14 pequeños quioscos: 90, 120, 150, 125, 107, 130, 60, 136, 100, 110, 70, 145 y 119,

112.

Se desea determinar si el aumento promedio en los ingresos mensuales es mayor a S/.100.

Además, no se hacen suposiciones sobre la normalidad de la distribución.

Hipótesis:

H 0=El aumento promedioen los ingresosmensuales es igual a S /.100

H 1=El aumento promedio en los ingresosmensuales es mayor a S /. 100


12

Nivel de significancia: α = 0.05

Estadística: La variable X Binomial con n = 13 y p = 0.5

Cálculos: Se asignan los signos “+” o “-” a cada valor de la muestra que es mayor o menor

a 100 respectivamente y se asigna el 0 a la medición que es igual a 100, resultando la

secuencia:

Signo de diferencia - + + + + + - + 0 + - + + +

para la cual hay n = 13 signos, mientras que el número de veces que ocurre el signo menos

frecuente es x = 3.

Sea X: número de signos negativos de los n = 13 signos. Entonces el valor calculado de P

es:
3

x=0 x ( )
P=P [ X ≤ 3 cuando p=1/2 ] =∑ 13 ( 0.5 ) = ( 0.5 ) [ 1+13+78+286 ]
13 13

P= ( 0.5 ) [ 278 ] =0.04614


13

Decisión. Dado que P = 0.04614 < 0.05, se rechaza H0 y se concluye que “el aumento

promedio en los ingresos mensuales es mayor a 100 soles, lo que podría ser un posible indicador de

un aumento en la demanda y una mejora en la economía local."

2.2. Una sola muestra: La prueba de rango con signos Wilcoxon

En una investigación sobre el nivel de venta de almuerzos vendidos en el mercado de Piura,

se han recolectado datos de 20 puestos, la cual determino que en el pasado la mediana fue de S/85.

TABLA 1

Venta de almuerzos vendidos en el mercado de Piura


13

Puesto Número de almuerzos vendidos

1 140

2 35

3 90

4 120

5 25

6 50

7 150

8 80

9 80

10 160

11 92

12 310

13 75

14 100

15 68

16 65
14

17 202

18 87

19 47

20 60
Fuente: Elaboración propia con datos ficticios.

Con un nivel de significancia del 5%, ¿Se determina que hubo un cambio en la mediana

debido a la subida de los precios de muchos de los productos para la elaboración de almuerzos?

Hipótesis:

Ho=~
u=20

H 1=~
u ≠ 20

TABLA 2

Venta de almuerzos vendidos en el mercado de Piura

Valores de Xi Di(x-~
u¿ Signo Rango

140 55 + 15

35 -50 - 14

90 5 + 3

120 35 + 11.5

25 -60 - 16

50 -35 - 11.5

150 65 + 17

80 -5 - 3
15

80 -5 - 3

160 75 + 18

92 7 + 5

310 225 + 20

75 -10 - 6

100 15 + 7

68 -17 - 8

65 -20 - 9

202 117 + 19

87 2 + 1

47 -38 - 13

60 -25 - 10
Fuente: Elaboración propia con datos ficticios
Entonces w+¿=116.5 y w −¿=93.5 por lotanto cogiengoel número menor w=93.5 ¿ ¿

TABLA 3

Tabla de Valores críticos de T para la prueba de rangos con signos de Wilcoxon


.005 .01 .025 .05
(una cola) (una cola) (una cola) (una cola)
n
.01 .02 .05 .10
(dos colas) (dos colas) (dos colas) (dos colas)
5 * * * 1
6 * * 1 2
7 * 0 2 4
8 0 2 4 6
9 2 3 6 8
10 3 5 8 11
11 5 7 11 14
12 7 10 14 17
16

13 13 13 17 21
14 13 16 21 26
15 16 20 25 30
16 19 24 30 36
17 23 28 35 41
18 28 33 40 47
19 32 38 46 54
20 37 43 52 60
Fuente: Creación propia

Como n=20 y es una prueba de dos extremos entonces T=52, por lo tanto, T<w, entonces no

se rechaza la hipótesis nula, lo que afirma que no hubo un cambio con la venta de almuerzos por la

subida de precios de sus insumos.

2.3. Dos muestras dependientes: Las pruebas de los signos.

La siguiente tabla representa el pago de que le hace una empresa a u trabajador (trabaja por

comisión), durante 8 meses seguidos en el el 2020 y 2019 comprobar que la mediana de la

diferencia en los ingresos para este trabajador es cero, al nivel de significancia α = 0.05.

TABLA 4

Tabla de distribución del ingreso del trabajador

2019 1500 1200 1150 1350 1400 1100 1050 950


100
2020 1250 1600 1800 1560 1200 970 1450 0
Fuente: Elaboración propia con datos ficticios

Hipótesis:

H 0=Tiene ingresosiguales en ambos años


17

H 1=No tiene ingresosiguales en ambos años

Nivel de significancia: α = 0.05

Estadística de prueba: La variable aleatoria Binomial X con p = 0.5

Cálculos:

TABLA 5

Tabla de distribución del ingreso del trabajador con signos


2019 1500 1200 1150 1750 1400 1100 1050 950

2020 1250 1600 1800 1560 1200 970 1450 1000

Signo de diferencia + - - + + + + -

Fuente: Elaboración propia con datos ficticios

3
P ( X ≤3 cuando p=1/2 )=∑
x=0
( 8x )(0.5) =0.3633 →2 P=2( 0.3633)→ 0.4266>0.05
8

Decisión: Dado que 0.4226 > 0.05 no se rechaza H 0 y se concluye que los ingresos son

iguales.

2.4. Dos muestras dependientes: La prueba de Wilcoxon.

Se desea evaluar dos libros muy importantes que son usados en la facultad de economía de

la UNP, para ello 15 de los alumnos seleccionados calificarán sobre 10 puntos entre el libro Hal R.
18

Varian y el libro de Microeconomía de Roberts S. Pindyck. Con esta finalidad, se evalúa mediante

una encuesta a los 15 alumnos para conocer cual libro brinda información más completa, el cual

ayudará para la carrera.

El examen de referencia fue calificado sobre 10 puntos y los resultados se muestran a

continuación:

TABLA 6

Tabla de evaluación entre los libros Hal R. Varian y Microeconomía de R. Pindyck.


ALUMNO LIBROS
S Hal R. Varian Microeconomía de Roberts S. Pindyck

1 8.6 9.1

2 8.2 8.2

3 9.1 8.9

4 9.3 9.6

5 8.8 8.7

6 8.2 8.4

7 9.6 9.6

8 9.3 9.1

9 8.4 8.8

10 8.9 9.3

11 9.2 9.6

12 9.6 9.5

13 9.3 9.1

14 8.2 8.8
15 8.7 8.9
19

Fuente: Elaboración propia con datos ficticios

Con un nivel de significancia del 1% ¿existen evidencias que nos permitan llegar a la

conclusión de que el libro de Hal R. Varian logró mejorar los conocimientos de los estudiantes de la

Universidad Nacional de Piura?

a) Formule la hipótesis nula y alternativa

b) Obtenga el valor estadístico de la prueba

c) Determine el valor del tamaño de la muestra

d) Determine el valor critico de la prueba

e) Decida el rechazo o no de la hipótesis nula


H0 = Se logró mejorar el conocimiento de Hal R. Varian.

H1 = No se logró mejorar el conocimiento de Hal R. Varian.

 Dado que n = 13, después de descartar las dos diferencias iguales a cero. Con n = 13,

α = 0.05 y una prueba bilateral, en la tabla de valores críticos de Wilcoxon se encuentra el valor de

17.

TABLA 7

Tabla de evaluación entre el libro Hal R. Varian y el libro de Microeconomía de R. Pindyck.


20

Antes Después Diferencia Rango


8.6 9.1 -0.5 12
8.2 8.2 0 -

9.1 8.9 0.2 5

9.3 9.6 -0.3 8

8.8 8.7 0.1 1.5

8.2 8.4 -0.2 5

9.6 9.6 0 -

9.3 9.1 0.2 5

8.4 8.8 -0.4 10

8.9 9.3 -0.4 10

9.2 9.6 -0.4 10

9.6 9.5 0.1 1.5

9.3 9.1 0.2 5

8.2 8.8 -0.6 13

8.7 8.9 -0.2 5


Fuente: Elaboración propia con datos ficticios

d.

w +¿=18 ¿ w=18

w−¿=73 ¿ w >k

18>17

Aproximaci ó n Normal
21

n ( n+1 ) 13 ( 14 )
μ= = =45.5
4 4

σ=
√ n ( n+ 1 )( 2 n+1 )
24 √
=
13 ( 14 )( 27 )
24
=14.3

w−μ 18−45.5
Z= = =−1.91
σ 14.3

P [ Z ≤−1.91 ] =0.4719

2 P=2 ( 0.4719 )=0.9538 → 0.9538>0.01 … … … … No se rechaza H 0

e. En cada una de las pruebas al ser ambos valores mayores a la prueba de significación

no se rechaza H0

2.5. Dos muestras Independientes: La prueba de U de Mann -Whitney.

La empresa Nestlé realizo una evaluación de sus dos productos más vendidos con respecto a

chocolates sublime y galletas morochas. Pidiendo a un grupo de consumidores que consiste en 15

personas, que califiquen del 0 a 20 los dos productos de estos bienes de consumo diario Al nivel de

significancia 5%. ¿La muestra aleatoria de 15 sedes del producto vendido la mediana de chocolates

sublime y galletas morochas son diferentes? las calificaciones se dan en la siguiente tabla.

TABLA 8
22

Tabla de dos productos más vendidos con respecto a chocolates sublime y galletas morochas

CONSUMIDOR SUBLIME MOROCHAS


1 18 16

2 16 16

3 18 15

4 19 16

5 17 18

6 19 17

7 20 16

8 16 16

9 18 17

10 18 17

11 18 17

12 17 17

13 19 18

14 17 16

15 19  

Fuente: Elaboración propia con datos ficticios

SOLUCIÓN:

Hipótesis: H0: u1= u2 contra H1: u1 ≠ u2

Nivel de significancia: ɑ = 0.05

Estadística de prueba: U de Mann – Whitney (no se supone normalidad)


23

Region critica:

n1 = 15 n2 = 14 ɑ = 0.05

por lo que se obtiene un valor critico de 59.

Si u <= 59 la hipótesis H0 se rechazara.

1. Cálculos:

TABLA 9

CALIFICACIONES RANGOS

15 1
16* 5.5
16* 5.5
16 5.5
16 5.5
16 5.5
16 5.5
16 5.5
16 5.5
17* 13.5
17* 13.5
17* 13.5
17 13.5
17 13.5
17 13.5
17 13.5
17 13.5
18* 21
18* 21
18* 21
18* 21
24

18* 21
18 21
18 21
19* 26.5
19* 26.5
19* 26.5
19* 26.5
20* 29
Fuente: Elaboración propia con datos ficticios

W1 = Sublime y W2 = Morochas

W1 = 291.50

W2 = 143.50

U1 = 291.50 – (15)(16) /2 = 171.50

U2 = 143.50 – (14)(15) /2 = 38.50

Luego se elige el U menor el cual es igual a: 38.50

2. Decisión: Dado que U = 38.50 < 59


Por lo tanto, la hipótesis nula se rechaza y se acepta la hipótesis alternativa.

2.6. K muestra independiente: La prueba H de Kruskal – Wallis.

Los datos que siguen representan los el PBI per cápita de tres empresas distintas en cada

mes del año 2020, en miles de soles. Pruebe la hipótesis que el PBI promedio de los 3 es igual, al

nivel de significancia α = 0.05.

TABLA 10
25

Tabla de distribución del PBI per cápita


 MESES EMPRESA A EMPRESA B EMPRESA C
Enero 24 12 30

Febrero 15 18 26

Marzo 17 14 24

Abril 19 10 25

Mayo 20 8 22

Junio 16 5 28

Julio 12 3 20

Agosto 10 16 25

Septiembre 15 12 21

Octubre 19 14 24

Noviembre 18 19 27

Diciembre 26 20 32

Fuente: Creación propia

 Hipótesis:

H 0=El promedio del PBI de los 3 paises es igual

H 1=El promedio del PBI de los3 paises no es igual

 Nivel de significancia: α = 0.05

 Estadística de prueba:

12
k
R12
H= ∑
n( n+1) i=1 n 1
−3( n+1) ≈ X (2)
2

 Región critica:
26

FIGURA 1:

Gráfica de la región critica de las hipótesis h0 y h1

 Cálculos:

TABLA 11

Tabla de distribución del PBI per cápita con rangos

EMPRESA A Rangos EMPRESA B Rangos EMPRESA C Rangos


24 27 12 7 30 35

15 11.5 18 16.5 26 31.5

17 15 14 9.5 24 27

19 19 10 4.5 25 29.5

20 22 8 3 22 25

16 13.5 5 2 28 34

12 7 3 1 20 22

10 4.5 16 13.5 25 29.5

15 11.5 12 7 21 24

19 19 14 9.5 24 27

18 16.5 19 19 27 33

26 31.5 20 22 32 36

Fuente: Creación propia


27

n1 =12 n2 =12 n3 =12

r 1=198 r 2=114.5 r 3 =353.5

H=
12
[
198 2 114.52 353.52
36(37) 12
+
12
+
12 ]
−111

H=22.09

22.09>5.99

 Decisión: Dado que 22.09 > 5.99 se rechaza H 0 y se concluye que los promedios son

diferentes

2.7. K muestra correlacionadas: La prueba F de Friedman.

2.8. Coeficiente de correlación de rango de Spearman.

En la siguiente tabla se muestra la cantidad de horas de trabajo que hicieron 8 trabajadores

en la primera semana de diciembre y la segunda semana de diciembre:

TABLA 12

Tabla de la cantidad de horas de trabajo que hicieron 8 trabajadores en la primera semana


de diciembre
Semana 1 2 3 4 5 6 7 8
Semana 1 50 48 52 53 55 49 45 51

Semana 2 48 49 50 53 52 50 47 52

Fuente: Creación propia


28

Calcular el coeficiente de correlación por rangos de Spearman y pruebe, con un nivel de

significación de 5% si es estadísticamente significativo.

Supuestos:

 Ho: p s=0

 Ho: p s ≠ 0

Ordenamos:

TABLA 13

Semana 1 2 3 4 5 6 7 8

Semana 1 45 48 49 50 51 52 53 55

Semana 2 47 48 49 50 50 52 52 53

Rango x 1 2 3 4 5 6 7 8

Rango y 1 2 3 4.5 4.5 6.5 6.5 8

Fuente: Creación propia

Desarrollamos diferencias de rangos:

TABLA 14

Semana 1 2 3 4 5 6 7 8

Semana 1 4 2 6 7 8 3 1 5

Semana 2 2 3 4.5 8 6.5 4.5 1 6.5

di 2 -1 1.5 1 1.5 1.5 0 -1.5

di
2
4 1 2.25 1 2.25 2.25 0 2.25 13
29

Usando la fórmula:

( 6 )( 13 )
r s=1− =0.8452
8 ( 8 −1 )
2

TABLA 15

Tabla de valores críticos del coeficiente de correlación de rangos r sde Spearman

n ∝=0.10 ∝=0.05 ∝=0.02 ∝=0.01

5 .900 ---- ---- ----

6 .829 .886 .943 ----

7 .714 .786 .893 .929

8 .643 .738 .833 .881

9 .600 .700 .783 .833

10 .564 .648 .745 .794

Fuente: Creación propia

Usando el r sde la tabla nos arroja un resultado de 0.738, comparando con el calculado r s=

0.8452 > 0.738, se rechaza la hipótesis nula y se lleva a la conclusión que existe una correlación

positiva considerable.

2.9. Una sola muestra: La prueba de Kolmogorov – Smirnov.

La industria McDonald's realizó una auditoría al producto más vendido en el mercado en las

diferentes sedes de los diferentes países. Los siguientes datos representan el número de unidades
30

vendidas al día de hamburguesas Big Mac® en una muestra de 20 sedes (213, 218, 228, 309, 226,

238, 236, 222, 300, 219, 246, 225, 247, 200, 223, 234, 232, 218, 254, 301)

Al nivel de significancia 5% ¿La muestra aleatoria de 20 sedes del producto vendido no

tiene una distribución normal?

TABLA 16

Tabla de número de unidades vendidas al día de hamburguesas


213 218 228 309 226 238 236 222 300 219
246 225 247 200 223 234 232 318 254 301

Fuente: Creación propia

1. Prueba de hipótesis:

Ho: la muestra aleatoria tiene una distribución normal

H1: la muestra aleatoria no tiene una distribución normal

2. Nivel de significancia:

α=0.05

3. Estadístico de prueba:

Tabla Kolmogorov-Smirnov

Valor de la tabla es de 0.29408

4. Región critica

5. Cálculo de la prueba

TABLA 17

Tabla de número de unidades vendidas al día de hamburguesas


Orden Datos Fo(Orden/ Z Fh[0.5-P(Z)] Diferencia | Fo-Fh|
31

n)=Sn P(Z) Fh=? Dc | Fo-Fh|


1 200 0.05 -1.29 0.4015 0.0985 -0.0485 0.0485
2 213 0.1 -0.91 0.3186 0.1814 -0.0814 0.0814
3 218 0.15 -0.77 0.2794 0.2206 -0.0706 0.0706
4 219 0.2 -0.74 0.2703 0.2297 -0.0297 0.0297
5 222 0.25 -0.65 0.2422 0.2578 -0.0078 0.0078
6 223 0.3 -0.62 0.2324 0.2676 0.0324 0.0324
7 225 0.35 -0.56 0.2123 0.2877 0.0623 0.0623
8 226 0.4 -0.53 0.2019 0.2981 0.1019 0.1019
9 228 0.45 -0.48 0.1844 0.3156 0.1344 0.1344
10 232 0.5 -0.36 0.1406 0.3594 0.1406 0.1406
11 234 0.55 -0.30 0.1179 0.3821 0.1679 0.1679
12 236 0.6 -0.24 0.0948 0.4052 0.1948 0.1948
13 238 0.65 -0.19 0.0753 0.4247 0.2253 0.2253
14 246 0.7 0.04 0.016 0.484 0.216 0.216
15 247 0.75 0.07 0.0279 0.4721 0.2779 0.2779
16 254 0.8 0.28 0.1103 0.3897 0.4103 0.4103
17 300 0.85 1.61 0.4463 0.0537 0.7963 0.7963
18 301 0.9 1.64 0.4495 0.0505 0.8495 0.8495
19 309 0.95 1.87 0.4693 0.0307 0.9193 0.9193
20 318 1 2.13 0.4834 0.0166 0.9834 0.9834
Fuente: Creación propia

El valor calculado es de 0.9834

6. Decision estadística:

Por lo tanto, ahora comparamos el valor de la tabla y el valor calculado, en este caso vemos

que el valor calculado es mayor al valor de la tabla.

0.9834 > 0.29408

Por lo tanto, esto indica que se acepta la hipótesis alternativa es la que se va a aceptar y pues

se rechazara la nula.
32

3. Introducción al análisis multivariante.

3.1. Organización de datos

3.1.1. Arreglo: Los datos multivariantes surgen de una investigación de un fenómeno

social o fisco, seleccionado de un número p≥ 1 de variables o características a analizar.

Usaremos la notación x ij para indicar el valor particular de la i-ésima variable que es

observada en el i-ésimo individuo o ensayo.

Si tenemos n medidas de p variables, estas pueden representarse como sigue:

FIGURA 2

Representación de organización de datos

FIGURA 3

Arreglo rectangular, llamado X, de p filas y n columnas


33

3.2. Distancia

Un estudiante universitario de la facultad de economía, se encuentra en la ciudad A y para

llegar a la universidad debe ir a la ciudad B, ambas ciudades estan ubicadas en las siguientes

coordenadas:

A (-7, 2) kms y B (5, 7) km, hallar su distancia:

d= √ ¿ ¿

d= √ ¿ ¿

d= √144 +25

d= √169

d=13u
34

3.3. Álgebra de matrices y vectores aleatorios.

En un colegio se imparten los cursos de microeconomía en 1°, 2° y 3° de ciertas

enseñanzas. Los profesores tienen asignado un número de horas de clase, guardias y tutorías a

cubrir, de acuerdo con la siguiente matriz, en la que las filas representen los cursos:

3.4. Matrices definidas positivas.

Una fábrica de electrodomésticos ha vendido en los últimos tres años lavadoras (L) y
secadoras (S). La matriz A expresa las unidades vendidas: la matriz B da el precio de venta, en
euros, de cada electrodoméstico.

2013 2014 2015 L S

( )
480 370 2013
(
A= 3500 7500 4200 L
2200 6000 5300 S ) B= 460 360 2014
500 340 2015

a) Hallar la matriz B.A, ¿Cuánto se ingresó cada año por la venta de electrodoméstico?

( ) ( )
480 370 2013 2494800 5820000 3977000
B= 460 360 2014 x
500 340 2015
(
3500 7500 4200 L
2200 6000 5300 S ) = 2402000 5610000 3840000
2498000 5790000 3802000

3.5. Vectores y matrices aleatorias.

Supongamos una empresa que produce dos productos X1 y X2 y se quiere conocer el valor

esperado de la cantidad total producida. Considere X1 como una variable aleatoria discreta con una

función de probabilidad dada por:

Tabla N ° 18
35

Función de probabilidad de la variable X1

Cantidad Probabilidad

X1
P1 (X1)

2
0,3

3 0,4

4 0,3

Nota. Elaboración propia con datos ficticios.

Y X2 como una variable aleatoria discreta con una función de probabilidad dada por:

Tabla N ° 19

Función de probabilidad de la variable X2

Cantidad Probabilidad

X2
P2 (X2)

2
0,6

3 0,4

Nota. Elaboración propia con datos ficticios.

El valor esperado de la cantidad total producida se calcularía utilizando:


36

E(Xk) ¿ ∑
∀X
X k Pk ( X k )
k

Para X1:

E (X1) = (2) (0,3) + (3) (0,4) + (4) (0,3) = 3

Para X2:

E (X2) = (1) (0,6) + (2) (0,4) = 1,4

Luego:

E(X) = ( XX 12)=(1,43 )
El valor esperado de la cantidad total producida se puede calcular como la suma del valor

esperado de cada producto:

E (X1 + X2) = E (X1) + E (X2)

E (X1 + X2) = 3 + 1,4

Por lo tanto, se espera que la empresa produzca una cantidad total promedio de 4.4 unidades

por día.

3.6. Vectores de medias y matrices de covarianzas

Vectores de medias

Se estudian 5 variables de calidad de un producto, se desea determinar si,

μ1=61 , μ2=40 , μ3=15 , μ4 =¿ 80, μ5=90.5

Con un nivel de significancia del 5%.


37

μ0 =(61 , 40 , 15 , 80 ,90.5)

Con: n = 20, p = 5, α =0.05


38
39

t
No se rechaza H0, y se infiere que, μ0 =(61 , 40 , 15 , 80 ,90.5)

Prueba de hipótesis para μ con muestra muy grande.

2
Si n es muy grande con respecto a p, entonces T2 tiene una distribución aproximada de X P.
Entonces se rechaza H0 con nivel de significancia α si T2 > X 2α , P ignorando el supuesto de
normalidad.

Resolviendo, p-valor = 0.125 y no se rechaza H0.


40

Matriz de covarianzas

Un estudio revelo la siguiente tabla de contingencia para la empresa donde se relacionan las

horas de trabajo y la productividad que se tenían en la fábrica

Horas\productividad 5 8 10

6 3 5 6

8 6 10 8

10 9 12 11
41

a) Hallar el grado de asociación entre las horas trabajadas y la productividad correspondiente:

Xi Yi ni Xi ni Yi ni Xi Yi

ni

6 5 3 18 15 90

6 8 5 30 40 240

6 10 6 36 60 360

8 5 6 48 30 240

8 8 10 80 80 640

8 10 8 64 80 640

10 5 9 90 45 450

10 8 12 120 96 960

10 10 11 110 110 1100

∑ ¿70 ∑ ¿596 ∑ ¿556 ∑ ¿ 4720

 Con los valores encontrados en la tabla, reemplazamos en la formula siguiente:


S
xy=¿
n ( n )(
∑ x i y ini − ∑ xi ni ∑ y ini
n ) ¿

S
xy=¿
70
− ( )( 556
4720 596
70 70 )
¿

S xy=¿−0.199 ¿
42

El signo de la covarianza define la naturaleza de la asociación:

 Si es positiva, se dice que existe relación directa entre las variables (aumento o disminución
en x implica un aumento o disminución en y).
 Si es negativa, indica relación inversa entre las variables.
 Si es cero, no existe ninguna relación entre las variables.
Cuanto más alejado esté el valor de la covarianza hallado de cero, la relación entre
las variables será más intensa.
Rpta:
 Si incrementamos las horas de trabajo en la empresa, la productividad se reducirá.
 Si reducimos las horas de trabajo en la empresa, la productividad se incrementará.

4. Distribución normal bivariante

4.1. La Distribución Normal Bivariante.

Sea (x, y) variable aleatoria continua, bidimensional que toma todos los valores en el plano

cartesiano. Decimos que (x, y) tiene una distribución normal bivariada si su función de densidad de

probabilidad conjunta (fdp) está definida por la expresión siguiente:

−Q
2
e
F (x, y) =
2 π σ x σ y √ 1− p2

[( ) ( x−μx ) ( y−μ x ) y−μ x


( )]
2 2
1 x−μx
Q= −2 p +
(1− p 2) σx σxσ y σy

1
[( )
x− μx 2
(
( x−μx )( y−μ x ) y− μx
)]
2
−1
F(x, y)= 2 π σ σ 1− p2 −2 p +

x y√
2
2(1− p ) σx σxσy σy
e

-∞< X < ∞ -∞ <Y < ∞

 ρ es el coeficiente de correlacion
43

 μ x es lamedia de la variable x

 μ y es la media de la variable y

 σ x es la desviacion estándar de la variable aleatoria x

 σ y es la desviacion estándar de la variable aleatoria y

EJERCICIO

Entre las parejas que hay en un salón de clase de la facultad de economía de la UNP, se

presenta una evaluación de un trabajo sobre la crisis económica, la distribución conjunta de la

evaluación es (X, Y) expresados en soles, se ajusta a una distribución normal bivariante con los

siguientes parámetros.

X= evaluación de los hombres, con μ x=1 y σ x =1

Y= evaluación de las mujeres, con μ y =0 yσ y =2

ρ, coeficiente de correlación lineal 0

Calcular P (0<x<2, -1≤y≤ 1)

Sustituyendo los valores dados, en la formula de la distribución normal bivariada:

−Q

F (x, y) = e 2
2 π (1)(2) √ 1−0
2

[( ) ( x−1 ) ( y−0 ) y−0


( )]
2 2
1 x−1
Q= (1−0) 2
−2(0) + 2
1 (1)(2) 2
44

Se obtiene:

−1
2[ 2
(x−1) +
y
4 ]
F (x, y) = e
2 π ( 2)

Integrando:

P (0<x<2, -1≤y≤ 1)=

2 1
e
−1
2 [ 2 y
(x−1) +
4 ]
∫∫ 2 π (2)
dxdy=0.2559
0 −1

Hay una probabilidad del 25.59% de que 0<x<2, -1≤y≤ 1

FIGURA 4:

4.2. Propiedades adicionales de la distribución normal multivariante.

Con respecto a las propiedades adicionales de la distribucion normal bivariante tenemos

algunas de las cuales debemos tener en cuenta, ya que hacen que estas sean verdaderas con respecto

a un vector aleatorio X.

1.- Combinaciones lineales de los componentes de X son distribuidas normalmente.


45

2.- Todos los subconjuntos de los componentes de X tiene una distribución normal

multivariante.

3.- Covarianzas cero implica que las correspondientes componentes son distribuidas

normalmente.

4.- las distribuciones condicionales de los componentes son normales multivariantes.

4.3. La densidad condicional de una distribución normal bivariante.

La densidad condicional de una variable aleatoria X1, dado X2 = x2 para una distribución

normal bivariante, es definido por:

f ( x1 , x2 )
F ( x 1 ∕ x 2 )=f ( x1 ∕ x 2=x 2 )=
f ( x2)

Donde f ( x 2 ) es la distribucion marginal y f ( x 1 , x 2 ) es densidad normal bivariante

Teorema. – Si la variable aleatoria X se distribuye como N_P (u,Σ) con |Σ|>0, entonces:

a) (x-u)^' Σ^(-1) (x-u) se distribuye como una distribución chi – cuadrado con p grados

de libertad, es decir como x_p^2.

b) La distribución N_P (u,Σ) asigna la probabilidad de 1 - ∝ al elipsoide solido {X:(x-

μ)^' Σ^(-1) (x-μ)≤x_((P,1-a))^2 } donde x_((1-a))^2 denota un valor percentil (1 - ∝)*100% de la

distribución x_p^2. Es decir P{(x-μ)^' Σ^(-1) (x-μ)≤x_((P,1-a))^2 }=1 - ∝


46

4.4. Muestreo de una distribución Normal Multivariante y estimador máximo verosímil.

Tenemos una cantidad de bolsa de valores n, las cuales son proporcionales en distintos tipos

pero no sabemos que tipo son, entonces se trata de estimar la maxima verosimilitud de k, en el

numero de tipos de bolsa, a partir de las siguientes observaciones de n bolsas de valores.

Supones: Se escogen 3 bolsas de valores y se observa los tipos A,B,A entonces tenemos

x 1= A , B , A , como k es el tipo de bolsa entonces la probabilidad de observar 2 tipos de bolsa en los

3 salientes es de:

P ( x 1 , k ) =L(k , x 1) =

En este caso salió, la primera bolsa distinta a la segunda y el tercero igual al primero

k−1 1 k−1
= 2
k k k

Ahora asignamos valores para k

TABLA 20

Tabla de cantidad de bolsa de valores n


k 2 3 4 5 …..
k−1 0,25 0,22 0,1875 0,16 …..
2
k
Fuente: Creación propia

Entonces podemos observar que k comienza a decrecer a partir de k=2, así el estimador

máximo de verosímil de k es:

k ( A , B , A ) =2
47

Ahora cogemos una nueva bolsa de valor y nos sale de tipo C, entonces x 1= A , B , A , C , la

verosimilitud de la muestra es: P ( x 2 , k ) =L(k , x 2)

k−1 1 k−2 (k−1)(k −2)


=
k k k k
3
48

Asignamos nuevos valores para k:

TABLA 21:

Asignación de nuevos valores de cantidad de bolsa de valores n


k 3 4 5 6 7 8
8−1 1 8−2
0.0740 0,938 0,96 0,926 0,875 0,0820
8 8 8
Fuente: Creación propia

Podemos observar que para valores de k≥ 6 será decrecientes, por lo tanto, el máximo

estimador verosímil de k es

k ( A , B , A , C )=5

El problema para hallar el estimador máximo verosímil es un problema de optimización. Por

lo tanto, son importante todas las técnicas analíticas y numéricas de optimización que conocemos.

4.5. La función de Verosimilitud de la Normal Multivariante.

La prueba de Kruskal -Wallis

Los datos que siguen representan los el PBI per cápita de tres empresas distintas en cada

mes del año 2020, en miles de soles. Pruebe la hipótesis que el PBI promedio de los 3 es igual, al

nivel de significancia α = 0.05.

Tabla de
  EMPRESA A EMPRESA B EMPRESA C
distribución del

PBI per cápita


49

Enero 24 12 30
Febrero 15 18 26
Marzo 17 14 24
Abril 19 10 25
Mayo 20 8 22
Junio 16 5 28
Julio 12 3 20
Agosto 10 16 25
Septiembre 15 12 21
Octubre 19 14 24
Noviembre 18 19 27
Diciembre 26 20 32

 Hipótesis: H 0=El promedio del PBI de los 3 paises es igual

H 1=El promedio del PBI de los3 paises no es igual

 Nivel de significancia: α = 0.05

k 2
12 R1
 Estadística de prueba: H= ∑
n(n+1) i=1 n 1
−3(n+1)≈ X (2)
2

 Región critica:

 Cálculos:

Tabla de

distribución del

PBI per cápita con


50

EMPRESA A Rangos EMPRESA B Rangos EMPRESA C Rangos


24 27 12 7 30 35
15 11.5 18 16.5 26 31.5
17 15 14 9.5 24 27
19 19 10 4.5 25 29.5
20 22 8 3 22 25
16 13.5 5 2 28 34
12 7 3 1 20 22
10 4.5 16 13.5 25 29.5
15 11.5 12 7 21 24
19 19 14 9.5 24 27
18 16.5 19 19 27 33
26 31.5 20 22 32 36
Fuente:

Creación propia

n1 =12 r 1=198 n2 =12 r 2=114.5 n3 =12 r 3 =353.5

H=
12
[
198 2 114.52 353.52
36(37) 12
+
12
+
12
−111 ]
H=22.09
22.09>5.99

 Decisión: Dado que 22.09 > 5.99 se rechaza H 0 y se concluye que los promedios son

diferentes

La prueba de signos para dos muestras

La siguiente tabla representa el pago de que le hace una empresa a u trabajador (trabaja por

comisión), durante 8 meses seguidos en el el 2020 y 2019 comprobar que la mediana de la diferencia

en los ingresos para este trabajador es cero , al nivel de significancia α = 0.05.

Tabla de

distribución del

ingreso del
51

2019 1500 1200 1150 1350 1400 1100 1050 950


2020 1250 1600 1800 1560 1200 970 1450 1000
Fuente:

Creación propia

 Hipótesis: H 0=Tiene ingresos iguales en ambos años

H 1=No tiene ingresos iguales en ambos años

 Nivel de significancia: α = 0.05

 Estadística de prueba: La variable aleatoria Binomial X con p = 0.5

 Cálculos:

Tabla de
2019 1500 1200 1150 1750 1400 1100 1050 950
2020 1250 1600
distribución del 1800 1560 1200 970 1450 1000
Signo de diferencia + - - + + + + -
ingreso del
Fuente:
trabajador con
Creación propia 3
signos
P ( X ≤3 cuando p=1/2
x=0 x
()
)=∑ 8 (0.5)8=0.3633 →2 P=2( 0.3633)→ 0.4266>0.05

 Decisión: Dado que 0.4226 > 0.05 no se rechaza H 0 y se concluye que los ingresos son

iguales
52

CONCLUSIONES

 Los ejemplos antes realizados han sido analizados e investigados con referencia a

nuestra carrera de economía, para hacer más fácil su comprensión y entendimientos ya que gracias

a la estadística nos ha permitido entender, organizar y tomar decisiones que estén de acuerdo con

los análisis efectuados.

 Este trabajo evidencia todos y cada uno de los temas vistos dentro del IV ciclo de la

carrera de economía; lo presentado en nuestro informe nos permitió como grupo conocer y poner en

práctica cada uno de los temas que nuestro estimado profesor nos enseñó de forma manual y usando

programas como el Colab para obtener mayor practica en su desarrollo.

 Conocer la teoría nos ayuda a enfocar soluciones y conocer la realidad nos ayuda a

contextualizar y a diferenciar soluciones.

 Se llega a la conclusión que el análisis multivariante tiene la finalidad de analizar de

manera simultánea las características que tienen los individuos y que cualquier análisis de más de dos

variables puede ser considerado Análisis Multivariante.

 El trabajo ha tenido como objetivo visualizar, encontrar e interpretar como grupo,

aquellas características similares que relacionan a la estadística con nuestra carrera de economía,

también no ha permitido tomar decisiones optimas a la hora de desarrollar los ejercicios.

 Se puede concluir que la estadística es una pieza muy fundamental en lo

correspondiente a nuestro aprendizaje, ya que es una herramienta que nos permitira desarrollar
53

problemas de la vida cotidiana, teniendo como finalidad que podamos dar solución a los diferentes

problemas económicos.

BIBLIOGRAFÍA

INTRODUCCIÓN A LA ESTADÍSTICA Y A LAS PROBABILIDADES Dra Teresa Carot Sánchez.

(2014).

https://www.etsii.upv.es/conbuenpie/documentos/11398Estadistica_Apuntes_Previos.pdf

‌Siegel, A., & Primera. (n.d.).

https://paulyecologia.files.wordpress.com/2016/11/estadisticas_no_parametricassiegel5b15d-

1.pdf

‌De, F., De, C., & Salud, L. (n.d.). Universidad Los Ángeles de Chimbote CURSO

BIOESTADÍSTICA. https://www.scientific-european-federation-osteopaths.org/wp-content/

uploads/2019/01/Coeficiente-de-correlaci%C3%B3n-de-Spearman-.pdf

‌Otzen, T., & Manterola, C. (2017). Técnicas de Muestreo sobre una Población a

Estudio. International Journal of Morphology, 35(1), 227–232.

https://doi.org/10.4067/s0717-95022017000100037

‌Lic, C., & Morettini. (2012). UNIVERSIDAD NACIONAL DE MAR DE LA PLATA - FACULTAD

E CIENCIAS ECONOMICAS Y SOCIALES Casos Prácticos de Estadística para

Economistas. http://nulan.mdp.edu.ar/id/eprint/2041/1/morettini.2012.pdf

‌Beaver, M., & Beaver. (n.d.). Introducción a la probabilidad y estadística.

https://www.fcfm.buap.mx/jzacarias/cursos/estad2/libros/book5e2.pdf


54

También podría gustarte