Está en la página 1de 19

ESTADISTICA II

DESARROLLO Y CONSOLIDACIÓN DEL TRABAJO COLABORATIVO

PARTE 1

POLITECNICO GRANCOLOMBIANO

PROFESOR:
GRACIELA SANCHEZ

RAUL ANTONIO BELTRAN VALBUENA


JESSICA GREYCHEN GOMEZ CARVAJAL
JENIFFER ALEXANDRA PRIETO RODRIGUEZ
DAMILES DEL CARMEN POLO NISPERUZA

Sea el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre las


características generales de las personas que respondieron en un mes en particular.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


Parte 1

Tamaño de muestra
Utilizando la variable edad (P6040), realice lo siguiente:

● Realice un histograma y describa la información según la forma y la curtosis


de los datos.

Ahora veamos la medida de forma la curtosis (o apuntamiento) la cual mide cuan


escarpada o achatada esta una curva o distribución.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


El coeficiente de curtosis viene dado por la siguiente ecuación:
∑𝑁
𝑖=1 (𝑋𝑖 −𝑋)4
Curtosis= −3
𝑁𝑆 4

Siendo
𝑥=la media
S=desviación típica

La curva se puede clasificar en 3 grupos según el signo de la curtosis, es decir


según el signo de la distribución.
➢ Leptocurtica: la curtosis>o. los datos están muy concentrados en la media
siendo una curva muy apuntada
➢ Mesocurtica: : la curtosis=0 la distribución es normal
➢ platicurtica: la curtosis<o. muy poca concentración de datos en la media
presentando una forma muy hachada.
Del resumen de los datos se tienen que

Media = 30,525 Desviación Estándar = 19,6759

(24−30.525)4 (1−30.525)4
Luego Curtosis=((320)(19.67594 + ⋯ + (320)(19.67594 ) − 3 = - 0.749137

Luego respecto a la información de los datos (edad “p6040”) Según la forma la


curtosis es platicurtica muy poca concentración de datos en la media presentando
una forma muy hachada. Es decir el valor de curtosis no se encuentra dentro del
rango esperado para datos provenientes de una distribución normal.

● Realice una descripción numérica y descripción como es la población.

La población consta de 31 variables las cuales están clasificadas como numéricas


y categóricas dichas variables están clasificados como directorios, secuencias
orden, hogar, Registro p6016, p6020 edad p6040, clase , mes Dpto. Entre otras,
algunas variables tienen un tamaño de 320 datos

● Calcule una nueva variable que sea el

A partir de la variable 𝑃6040𝑛𝑒𝑤 vamos a generar una nueva variable la cual seria
𝑃60402/3

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


● Teniendo en cuenta la variable anterior realice el cálculo del tamaño de
muestra, utilizando la siguiente fórmula:

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


Donde, se tiene lo siguiente:

Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se


establezca.

S: Es la desviación estándar de la variable.

Es el margen de error absoluto.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un


margen de error de absoluto que no supere 0.5.

Del resumen de los datos anteriores se tiene:

µ=9.2162

S=4.4333

=0.5

N=320

Con un nivel de confianza del 95% es decir α=0.05 entonces el cuantil de la


distribución normal estándar seria 𝑍𝛼/2 =𝑍0.05/2= 1.96

Así reemplazando en la ecuación anterior se tiene:


𝑍 2 𝑆2 (1.96)2 (4.4333)2
𝑛0 = = =302.01≅ 302 es decir
𝛿2 (0.5)2

𝑛0 = 302

● Teniendo en cuenta los resultados anteriores, realice una selección de


elementos para una muestra, utilizando el algoritmo del coordinado negativo.

Veamos la implementación del algoritmo del coordinado negativo. Para realizar


una selección de elemento para una muestra.

Para extraer la muestra de tamaño n de un universo de N objetos.

Generar N realizaciones de una variable aleatoria 𝜀𝑘 (k ∈ U) con distribución


uniforme (0,1).

Asignar 𝜀𝑘 al elemento k-´esimo de la población.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


Ordenar la lista de elementos descendente (o ascendentemente) con respecto a
este número aleatorio 𝜀𝑘 .

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


A continuación, seleccionar los n primeros (o los n últimos) elementos. Esta
selección corresponde a la muestra realizada.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1
● Compara la media poblacional, con la media muestral y determine la
variación relativa.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


Calculemos la media poblacional

µ=9.21623

Calculemos la media muestral

𝑥=9.23267

De aquí podemos observar que la media de la población es menor que la media de


la muestra esto es µ=9.21623 < 𝑥=9.23267

Ahora calculemos el CV es decir coeficiente de variación y de ese modo verificamos


en cuál de los dos casos varia mas

𝐶𝑉𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 =0.4586 esto es del 45.86%

𝐶𝑉𝑚𝑢𝑒𝑠𝑡𝑟𝑎 =0.4632 esto es del 46.32%

De los resultados de los coeficientes de variación anteriores se tiene que

𝐶𝑉𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 =0.4586 < 𝐶𝑉𝑚𝑢𝑒𝑠𝑡𝑟𝑎 =0.4632

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere
utilizar la base de la hoja “muestra” y realizar lo siguiente:

● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados, ¿Existen
diferencias?

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


30
0

25 1
2
20
3
4
15
5
10 6
7
5
8
0 9
Hombre Mujer

(Grafico # 1)
Del gráfico de frecuencia anterior se tiene existen mucha diferencia en cuanto a
la comparación entre las variables escolaridad (ESC) y sexo (P6020) hombres y
mujeres, es decir el nivel de escolaridad en mujeres se encuentra entre 0 a 19
mientras que en los hombres de 0 a 20, también se puede ver que 30 mujeres
se encuentran en un nivel de escolaridad 10, y 17 mujeres tienen nivel de
escolaridad 0 del total que son 157. Por otro lado se puede ver que hay 27
hombres con un nivel de escolaridad 5 y 24 hombres con nivel de escolaridad
1, del total que son 207 mujeres.

● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas


variables. Realice lectura de resultados.
Veamos un estudio descriptivo de las variables anteriores escolaridad (ESC) y sexo
(P6020)

En cuanto a la escolaridad (ESC) para el sexo masculino estas variables consta de


157 hombres la consta un niveles de escolaridad de (0 a 20) puede observarse que
en esa columna hay unas casillas en NA

Veamos la lectura de datos:


DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1
DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1
En cuanto a la escolaridad (ESC) para el sexo femenino estas variables constan de
207 mujeres con niveles de escolaridad de (0 a 19) puede observarse que en esa
columna hay unas casillas en NA

Veamos la lectura de datos:

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1
● Asumiendo que los datos son normales, calcule un intervalo de confianza del
95% y determine, la escolaridad de los hombres y de las mujeres de forma
individual.

Calculemos un intervalo de confianza del 95% para la escolaridad de los hombres


y de las mujeres de forma individual

 Hombres
Intervalo de confianza para la media. Varianza Desconocida

Un intervalo de confianza del (1 - α) 100% para µ está dado por

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


𝑆 𝑆
𝑥̅ - 𝑡(𝛼,𝑛−1) ≤ µ ≤ 𝑥̅ + 𝑡(𝛼,𝑛−1)
2 √𝑛 2 √𝑛

Donde 𝑡(𝛼,𝑛−1) es el punto de la distribución t, con (n -1) grados de libertad, que


2
deja a su derecha un área de α/2.

Del resumen de los datos se tienen:


n =148

𝑋̅= 7.42568
S= 4.80234
Para α=0.05 entonces 𝑡(𝛼,𝑛−1) = 𝑡(0.05,148−1) = 1.976233
2 2

Reemplazando en la ecuación anterior se tiene:

4.80234 4.80234
7.42568- (1.976233) ≤ µ ≤ 7.42568 + (1.976233)
√148 √148

6.64556≤ µ ≤ 8.2058

Por lo que el intervalo pedido para la escolaridad de los hombres es [6.64556,


8.2058], es decir la media verdadera se encuentra en algún lugar entre 6.64556 y
8.2058

 mujeres
Intervalo de confianza para la media. Varianza Desconocida

Un intervalo de confianza del (1 - α) 100% para µ está dado por

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


𝑆 𝑆
𝑥̅ - 𝑡(𝛼,𝑛−1) ≤ µ ≤ 𝑥̅ + 𝑡(𝛼,𝑛−1)
2 √𝑛 2 √𝑛

Donde 𝑡(𝛼,𝑛−1) es el punto de la distribución t, con (n -1) grados de libertad, que


2
deja a su derecha un área de α/2.

Del resumen de los datos se tienen:


n =158

𝑋̅= 7.72785
S= 5.07855
Para α=0.05 entonces 𝑡(𝛼,𝑛−1) = 𝑡(0.05,158−1) = 1.975189
2 2

Reemplazando en la ecuación anterior se tiene:

5.078553 5.078553
7.72785- (1.975189) ≤ µ ≤ 7.72785 + (1.975189)
√158 √158
6.92981≤ µ ≤ 8.52588

Por lo que el intervalo pedido para la escolaridad de las mujeres es [6.92981,


8.52588], es decir la media verdadera se encuentra en algún lugar entre 6.92981
y 8.52588.

● Asumiendo que los datos son normales, calcule un Intervalo de confianza al


95% para la diferencia de los niveles de escolaridad para los hombres y
mujeres.

En este caso calculemos un intervalo de confianza para µ1 − µ2 Dos distribuciones


normales varianzas desconocida.

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


Un intervalo de confianza del (1 - α) 100% para µ1 − µ2 está dado por:

𝜎1 2 𝜎2 2 𝜎1 2 𝜎2 2
(𝑥̅1 − 𝑥̅2 ) -𝑍𝛼/2 √ + ≤ µ1 − µ2 ≤ (𝑥̅1 − 𝑥̅2 ) +𝑍𝛼/2 √ +
𝑛1 𝑛2 𝑛1 𝑛2

Donde 𝑍α/2. es el punto crítico de la distribución z que deja a su derecha un área


de α/2.

Luego del resumen de los datos anteriores se tiene

𝑥̅1 =7.42568

𝑥̅2 =7.72785

𝜎1 2 =20.0913

𝜎2 2 =25.7916

𝑛1 =148

𝑛2 =158

Con un nivel de confianza del 95% se tiene α=0.05 entonces 𝑍α/2. = 𝑍0.05/2. =1.96

Luego reemplazando los datos en la ecuación anterior se tiene:

(20.0913) (25.7916)
(7.42568-7.72785) – (1.96) √ + ≤ µ1 − µ2 ≤ (7.42568-7.72785)
148 158

(20.0913) (25.7916)
+ (1.96) √ +
148 158

-1.37389≤ µ1 − µ2 ≤ 0.769557

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1


Por lo que el intervalo al 95% para la diferencia de los niveles de escolaridad para
los hombres y mujeres es.

(-1.37389, 0.769557)

DESARROLLO Y CONSOLIDACION TRABAJO COLABORATIVO - PARTE 1

También podría gustarte