Está en la página 1de 19

UNIVERSIDAD TECNICA PARTICULAR DE LOJA

Nombre: Samanta Tapia García.


Fecha: 27 de junio del 2021.
Materia: Prácticum IV: Estadística.
Tema: Taller EVA 1 Estadística.

a) Revise la Unidad 3 de la guía didáctica.


b) Revise el REA 3 colocado en CANVAS.
c) Descargue la ENEMDU de diciembre, 2021. Apoyarse con el software estadístico de
su preferencia (ver enlace de referencia https://www.ecuadorencifras.gob.ec/empleo-
diciembre-2019/).
d) Calcule la media, mediana, moda, desviación estándar y varianza (muestral)
para la variable ingresos de asalariados, tanto del sector público, como del sector
privado.

• Considere que la ENEMDU ya es una muestra de la población.


• Tome en cuenta que debe depurar la base de datos y utilizar la información de
los individuos que son asalariados.
• Considerando que la tabulación de la encuesta puede mostrar datos
“mentirosos”, elimine las observaciones cuya información sea inferior a un
cuarto del salario mínimo vital del año 2021.

Media

La media es la suma de los valores de la muestra, divididos entre el número total de


valores de la muestra. La media de una muestra se determina de la siguiente manera:

Suma de todos los valores de la muestra


Media de la muestra=
Número de valores de la muestra

X́ =
∑X
n
Sector Público Sector Privado

Datos: Datos:

∑ X= 3813669 ∑ X= 5430658
n = 3692 n = 9730
Reemplazamos en la fórmula Reemplazamos en la fórmula

3813669 5430658
X́ = X́ =
3692 9730

X́ =1032,95 X́ =558,14

La media del sector público es 1032,95. La media del sector privado es 558

Mediana

Es el punto medio de los valores una vez que se han ordenado de menor a mayor o de
mayor a menor. La mediana se determina de la siguiente manera:

n+1
Mediana=
2

Datos Sector Público: La mediana del Sector Público es 800.

n = 3692 Datos Sector Privado:

Reemplazamos en la fórmula n = 9730

3692+1 Reemplazamos en la fórmula


Mediana=
2
9730+1
Mediana=
3693 2
Mediana=
2
9731
Mediana=
Mediana=1846.5 2

La mediana es el valor intermedio que Mediana=4865,5


ocupa la posición 1846 y 1847, ósea el
La mediana es el valor intermedio que
valor correspondiente a 800.
ocupa la posición 4865 y 4866, ósea el
Mediana=800 valor correspondiente a 400.
Mediana=400 La mediana del Sector Privado es 40

Moda

Es el valor de la observación que aparece con mayor frecuencia.

Sector Público Sector Privado

Moda=800 Moda=400

La moda del Sector Público es 800. La moda del Sector Privado es 400.

Varianza

Es la media aritmética de las desviaciones de la media elevadas al cuadrado. La


varianza muestral se determina de la siguiente manera:

s2=
∑ (X− X́)2
n−1

Datos Sector Público Datos Sector Privado

∑ (X − X́ )2=¿ 1834255063 ∑ (X − X́ )2=¿ 2692467121


n = 3692 n = 9730

Reemplazamos los datos en la fórmula: Reemplazamos los datos en la fórmula:

2692467121
s2=
1834255063 s2=
3691 9729

s2=496953,42 s2=276746,54

La varianza del Sector Público es La varianza del Sector Privado es

496953,42. 276746,54.

Desviación Estándar

Es la raíz cuadrada de la varianza. Se determina de la siguiente manera:

∑ ( X− X́)2
s=
√ n−1
La desviación estándar del Sector
Público es 704,95.

Datos del Sector Privado


Datos del Sector Público

2 s2=276746,54
s =496953,42
Reemplazamos los datos en la fórmula:
Reemplazamos los datos en la fórmula:
s= √276746,54
s= √ 496953,42
s=526,08.
s=704,95
La desviación estándar del Sector
Privado es 526,08.

e) Tabule (ordene) la variable ingresos y determine los siguientes percentiles: 5, 10,


25, 50, 75, 90 y 95.

Percentiles

Los percentiles dividen un conjunto de observaciones en 100 partes iguales. La


ubicación del percentil se determina de la siguiente manera:

P
LP =(n+1)
100

Datos Sector Público

n = 3692

Reemplazamos los datos en la fórmula.

Cuando la localización no arroja un número entero se debe agregar la distancia


entre los valores. Por ejemplo, en el percentil 10 la fórmula de localización indica
que este se ubica entre la posición 369 y 370, con 0.3 de distancia entre ellos. El
primer valor es 435 y el segundo 436. De esta manera, la diferencia entre estos valores
es 1. Al localizar el percentil 10, hay que desplazarse una distancia de 0.3 entre el
primero y segundo valor; así, 0.3(1) = 0.3. Para completar el procedimiento, se debe
sumar 0.3 al primer valor e indicar que el percentil 10 es 435.3 .
Ubicació
XPercentil Fórmula n Percentil
Percentil 5 (3693)*(5/100) 184,7 361,4
Percentil 10 (3693)*(10/100) 369,3 435,3
Percentil 25 (3693)*(25/100) 923,3 600,0
Percentil 50 (3693)*(50/100) 1846,5 800,0
Percentil 75 (3693)*(75/100) 2769,8 1219,4
Percentil 90 (3693)*(90/100) 3323,7 1800,0
Percentil 95 (3693)*(95/100) 3508,4 2282,4

Datos Sector Privado

n = 9730

Reemplaza
mos los
datos en la
fórmula. Ubicació
XPercentil Fórmula n Percentil
Percentil 5 = (9731)*(5/100) 486,55 160
Percentil 10 = (9731)*(10/100) 973,1 200
Percentil 25 = (9731)*(25/100) 2432,75 320
Percentil 50 = (9731)*(50/100) 4865,5 400
Percentil 75 = (9731)*(75/100) 7298,25 603
Percentil 90 = (9731)*(90/100) 8757,9 1000
Percentil 95 = (9731)*(95/100) 9244,45 1400

f) Agrupe los datos de los asalariados del sector público y privado por grupos de
ingresos. Aplique la distribución de frecuencias y grafique un histograma.

Distribución de Frecuencias

Es la agrupación de datos en clases mutuamente excluyentes, que muestra el número de


observaciones que hay en cada clase. Para determinar la distribución de frecuencias se
debe seguir 5 pasos:

Paso 1: Definir el número de clases.

Para determinar la cantidad de clases (k) se debe aplicar la regla de 2 a la k. Esta guía
sugiere que se elija el menor número (k) para el número de clases, de tal manera que 2k
sea mayor que el número de observaciones (n).
Paso 2: Determinar el intervalo o ancho de clase.

El intervalo o ancho de clase debería ser el mismo para todas las clases. Todas las clases
juntas deben cubrir por lo menos la distancia del valor más bajo al más alto de los datos.
Expresado esto en una fórmula sería:

H−L
i≥
k

Donde i es el intervalo de clase; H, el máximo valor observado; L, el mínimo valor


observado, y k, el número de clases.

Paso 3: Establezca los límites de cada clase.

Se empleará el formato de $700 hasta $1 400 y de $1 400 hasta $2 100 y así


sucesivamente. Con este formato resulta claro que $1 399 pertenece a la primera clase y
$1 400 a la segunda.

Paso 4: Anotar los números de elementos en cada clase.

Teniendo ordenado de menor a mayor los datos ya no resulta necesario poner estos en
cada clase, sino más bien al señalar el límite inferior y superior de cada clase, dentro de
ellos ya estarían los elementos de cada clase.

Paso 5: Contar el número de elementos de cada clase.

El número de elementos que hay en cada clase recibe el nombre de frecuencia de clase.

Distribución de Frecuencias Sector Público

Paso 1: Definir el número de clases.

Teniendo presente que el n es 3692 y en base a la fórmula 2k .

Si se supone que K = 11, lo cual significa que utilizará 11 clases, entonces 211 =2048,
algo menos que 3692. De ahí que 11 no representa suficientes clases.

Si k = 12, entonces 212=4096 ,que es mayor a 3692. Por lo tanto, el número de clases
que se recomienda son 12.

Paso 2: Determinar el intervalo o ancho de clase.

Aplicando la fórmula:
H−L
i≥
k

8200−100
i≥
12

i ≥675

En la práctica, por lo general este tamaño de intervalo se redondea a una cifra


conveniente, tal como un múltiplo de 10 o 100. En este caso, el valor de $700 podría
emplearse sin inconvenientes.

Paso 3: Establezca los límites de cada clase.

Límites de clase
100-700
700-1400
1400-2100
2100-2800
2800-3500
3500-4200
4200-4900
4900-5600
5600-6300
6300-7000
7000-7700
7700-8400

Paso 4: Anotar los números de elementos en cada clase.

Como ya se tiene ordenado las observaciones de menor a mayor, no es necesario anotar


cada valor en cada clase sino tener señalado el límite inferior y superior de cada clase y
proceder al siguiente paso.

Paso 5: Contar el número de elementos de cada clase.

Límite de clase Frecuencia de clase


100-700 1370
700-1400 1583
1400-2100 522
2100-2800 124
2800-3500 43
3500-4200 25
4200-4900 11
4900-5600 7
5600-6300 5
6300-7000 0
7000-7700 0
7700-8400 2

Histograma

Es una representación gráfica de la distribución de frecuencias. Las clases se señalan en


el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se
representan por medio de las alturas de las barras, que se dibujan de manera adyacente.

Histograma del Sector Público

Distribución de Frecuencias Sector Privado

Paso 1: Definir el número de clases.

Teniendo presente que el n es 9730 y en base a la fórmula 2k .

Si se supone que K = 13, lo cual significa que utilizará 13 clases, entonces 213=8192 ,
algo menos que 9730. De ahí que 13 no representa suficientes clases.

Si k = 14, entonces 214=16384 ,que es mayor a 9730. Por lo tanto, el número de clases
que se recomienda son 14.

Paso 2: Determinar el intervalo o ancho de clase.

Aplicando la fórmula:

H−L
i≥
k

15000−100
i≥
14
i ≥1064,28

En la práctica, por lo general este tamaño de intervalo se redondea a una cifra


conveniente, tal como un múltiplo de 10 o 100. En este caso, el valor de $1100 podría
emplearse sin inconvenientes.

Paso 3: Establezca los límites de cada clase.

Límites de clase
100-1200
1200-2300
2300-3400
3400-4500
4500-5600
5600-6700
6700-7800
7800-8900
8900-10000
10000-11100
11100-12200
12200-13300
13300-14400
14400-15500

Paso 4: Anotar los números de elementos en cada clase.

Como ya se tiene ordenado las observaciones de menor a mayor, no es necesario anotar


cada valor en cada clase sino tener señalado el límite inferior y superior de cada clase y
proceder al siguiente paso.

Paso 5: Contar el número de elementos de cada clase.

Límites de clase Frecuencia de clase


100-1200 9164
1200-2300 442
2300-3400 76
3400-4500 27
4500-5600 15
5600-6700 1
6700-7800 0
7800-8900 1
8900-10000 2
10000-11100 1
11100-12200 0
12200-13300 0
13300-14400 0
14400-15500 1

Histograma del Sector Privado

g) Realice una prueba de hipótesis estadística para comprobar si la media


poblacional del ingreso es diferente de 386 dólares. Utilice un nivel de significancia
de 0,05.

Prueba de Hipótesis

Es un procedimiento basado en evidencia de la muestra y la teoría de la probabilidad


para determinar si la hipótesis es una afirmación razonable.

Existe un procedimiento de cinco pasos que sistematiza la prueba de una hipótesis:

Paso 1: Establecer las hipótesis nula y alternativa.

H0: μ=386
H1: μ ≠386

Paso 2: Seleccionar un nivel de significancia.

Nivel de significancia: 0.05

Paso 3: Identificar el estadístico de la prueba.

Dado que la ENEMDU ya es una muestra de la población, se debe tener en cuenta que
no contamos con la información de la población en sí, sino solo de una muestra de ella.
En este caso los datos que conocemos es la media del ingreso muestral y la desviación
estándar de la muestra de los empleados asalariados del sector público y privado. Por
ello vamos a trabajar con la prueba de la media poblacional de la desviación estándar de
la población desconocida.

Datos:

μ=386

n= 13422

s= 618.26

X́ =688.74

Estadístico t

X́−μ
t=
s/ √ n

Reemplazamos los datos

688,74−386
t=
618,26/ √ 13422

302,74
t=
618,26
115,85

302,74
t=
5.33

t = 56.80

Dado que sale una T muy grande, para comprobar la eficacia de los resultados se
procede a realizar el mismo ejercicio pero ahora solo con la muestra del sector privado.

558.14−386
t=
526.06/ √ 9730

t = 5.33

Paso 4: Formular una regla para tomar decisiones.

En el primero caso tenemos gl = n-1 entonces gl = 13422 -1 = 13421

En el segundo caso tenemos gl = n-1 entonces gl = 9730-1 = 9729


En ambos casos tenemos que los gl son mayores a 200 (que es el máximo de la tabla)
por lo que se toma el valor de infinito, con un nivel de significancia del 0.05. En base a
ello tenemos un Valor crítico de 1.96.

Paso 5: Se toma una muestra; se llega a una decisión.

Si t>1,96 se rechaza la Ho y se acepta la H1.

Dado que T = 5.33 se rechaza la Ho y se acepta la H1. Por lo que, se plantea que la
media poblacional es diferente a $386.

CON SPSS

Se dice que:

Si el nivel de significancia es mayor que 0.05 no se rechaza la hipótesis nula, pero si es


menor se rechaza la hipótesis nula. En este caso tenemos una sig de 0.000, por lo que, es
menor y se rechaza la hipótesis nula y se acepta la hipótesis alternativa, se puede decir
entonces que la media poblacional del ingreso es diferente de 386 dólares.

h) Realice una prueba de hipótesis estadística para comprobar si la media


poblacional de ingreso de los asalariados del sector público es mayor a la media
poblacional de los asalariados del sector privado. Utilice un nivel de significancia
de 0,01.

Paso 1: Establecer las hipótesis nula y alternativa.


H0: μ1 ≥ μ2
H1: μ1 < μ2

Paso 2: Seleccionar un nivel de significancia.

Nivel de significancia: 0.01

Paso 3: Identificar el estadístico de la prueba.

Datos:

n1 =3692 x́ 1=¿ 1032.95 S1=¿704.95 n =9730¿ x́ 2=¿ 558.14 S2=¿526.07 ¿


2

x́1 −x́2
Z=
S 21 S 22
√ +
n1 n2

1032.95−558.14
Z=
704.952 526.072
√ 3692
+
9730

351−345
Z=
282 212
√ +
60 54

Z = 1.30

Z = 37.18

Paso 4: Formular una regla para tomar decisiones.

Se observa que este valor de Z es muy grande, ni siquiera se encuentra en la tabla,


entonces quiere decir que el área a la derecha de ese valor es cero y este sería el valor de
P, por lo que no se apoya a la hipótesis nula y se concluye que la media poblacional de
ingreso de los asalariados del sector público es menor a la media poblacional de los
asalariados del sector privado.

Paso 5: Se toma una muestra; se llega a una decisión.

Se observa que este valor de Z es muy grande, ni siquiera se encuentra en la tabla,


entonces quiere decir que el área a la derecha de ese valor es cero y este sería el valor de
P, por lo que no se apoya a la hipótesis nula y se concluye que la media poblacional de
ingreso de los asalariados del sector público es menor a la media poblacional de los
asalariados del sector privado.

CON EXCEL

Prueba z para medias de dos muestras

Publico Privado
Media 1032,954767 558,1354573
Varianza (conocida) 496953,42 276746,54
Observaciones 3692 9730
Diferencia hipotética de las medias 0
z 37,18554352
P(Z<=z) una cola 0
Valor crítico de z (una cola) 2,326347874
Valor crítico de z (dos colas) 0
Valor crítico de z (dos colas) 2,575829304

En base al estadístico z, tenemos que el valor

1. Valor P ≤ α Rechazar Ho al nivel α .

2. Valor P ¿ α No rechazar Ho al nivel α .

En este caso tenemos un valor P de 0, por lo que, P ≤ α y se debe rechazar Ho.

En cuanto al valor crítico tenemos que si el valor absoluto del valor Z es mayor que el
valor crítico, hay que rechazar la hipótesis nula. De lo contrario, no se puede rechazar la
hipótesis nula. En este caso tenemos un Z (37.18) mayor al valor critico (2.57), por lo
que se rechaza la Ho.

i) Realice una prueba de hipótesis estadística para comprobar si la varianza


poblacional de los asalariados del sector público es diferente de la varianza
poblacional de los asalariados del sector privado. Utilice un nivel de significancia
de 0,10.

Paso 1: Establecer las hipótesis nula y alternativa.

H0: σ 12=σ 22

H1: σ 12 ≠ σ 22

Paso 2: Seleccionar un nivel de significancia.

Nivel de significancia: 0.10.


Paso 3: Identificar el estadístico de la prueba.

Datos:

n1 =3692 S21=¿ 496953,4174n2 =9730 S22=¿ 276746,5435

S 21
F= 2
S2

496953,42
F=
276746,54

F = 1.795

Paso 4: Formular una regla para tomar decisiones.

El valor crítico de F de una prueba de dos colas se determina dividiendo el nivel de


significancia entre dos y después se consultan los grados de libertad apropiados.

Nivel de significancia: 0.10 / 2 = 0.05 entonces α= 0,05

gl en el numerador = n1-1 =3692-1 = 3691

gl en el denominador = n2-1 =9730 -1 = 9729

En la práctica si n es moderadamente grande el valor critico es igual a 1.96 para el 95%


de confianza.

Paso 5: Se toma una muestra; se llega a una decisión.

Si F>1.96 se rechaza la Ho y se acepta la H1.

Dado que F es 1.80, es decir, es menor a 1.96 entonces se acepta la Ho, por lo que se
plantea que la varianza poblacional de los asalariados del sector público es igual de la
varianza poblacional de los asalariados del sector privado.

CON SPSS
En base al cuadro, podemos ver que con el estadístico F hay una significancia de 0.00.
Entonces:

Si F> 0.05 se rechaza la Ho y se acepta la H1.

En este caso la significancia es menor de 0.05 por lo que se acepta la Ho, entonces se
dice que la varianza poblacional de los asalariados del sector público es igual de la
varianza poblacional de los asalariados del sector privado.

j) Realice el mismo procedimiento que el literal f), con la variable edad; es decir,
cree la variable grupos etarios, tanto para asalariados del sector público, como
para asalariados del sector privado. Utilice la técnica de distribución de
frecuencias; grafique un histograma.

Sector
PublicoXLimi Frecuen
tes de Clase cia
18-23,5 64
23,5-29 414
29-34,5 550
34,5-40 730
40-45,5 561
45,5-51 561
51-56,5 406
56,5-62 322
62-67,5 69
67,5-73 12
73-78,5 2
78,5-84 1
Sector
PrivadoXLímites Frecuenc
de clase ia
13-18,08 132
18,08-23,16 1139
23,16-28,24 1808
28,24-33,32 1566
33,32-38,4 1398
38,4-43,48 1200
43,48-48,56 877
48,56-53,64 701
53,64-58,72 458
58,72-63,8 268
63,8-68,88 124
68,88-73,96 44
73,96-79,04 12
79,04-84,12 3
k) Realice un breve reporte del análisis de datos realizado

Para el presente análisis, se descargó la base de datos de la ENEMDU (enero-marzo


2021). Y se decidió trabajar con las variables:
 P42: categoría de ocupación (esta variable sirvió para determinar al sector
público y privado).
 P66: ingresos asalariados/ domésticos ( esta variable sirvió para determinar el
ingreso de los asalariados).
 P03: Edad.
Antes de empezar con el análisis estadístico cabe destacar que:
Una vez depurada la base de datos el número de observaciones del sector
público son 3692 mientras que del sector privado son 9730, es decir, tenemos un
número de observaciones mayor en el sector privado.
En cuanto al análisis estadístico:
Al analizar el ingreso, tenemos que la media del sector público es $1032,95,
mientras que la media del sector privado es $558,14, por lo que, en un inicio se
podría decir que en el sector público en promedio existe un mayor ingreso que
en el sector privado. Sin embargo, al realizar la prueba de hipótesis para
comprobar si la media del ingreso del sector público es mayor a la media del
sector privado se rechazó esta hipótesis. Respecto al ingreso mismo tenemos que
la media poblacional del ingreso tanto del sector público como privado es
diferente de 386 dólares.
En cuanto a la moda, tenemos que en el sector público la moda es de $800
mientras que en el sector privado es de $400, por lo que, el ingreso más repetido
es mayor en el sector público que en el privado.
Respecto a los ingresos por distribución de frecuencias tenemos que en el sector
público la mayor concentración (1583) está en un salario entre $700 a $1400,
mientras que en el sector privado la mayor concentración (9164) está en un
salario entre $100 a $1200.
En consideración a la edad, se puede decir que en el sector público hay una
mayor concentración de personas de 34 a 40 años (730) mientras que en el sector
privado existe, una mayor concentración de personas de 23 a 28 años (1808).

También podría gustarte