Está en la página 1de 6

Henry Andrés Gómez Ramírez

Cod: 2150148

Prueba teórica de Métodos Cuantitativos (Estadística).

Maestría Economía y Desarrollo. UIS.

1. Se quiere determinar el salario promedio de los trabajadores de Bucaramanga,


para el añ o 2019. Explicar el procedimiento a seguir para obtener dicha
informació n. Indicar supuestos y metodología.

Para realizar este aná lisis, primero se debería esperar a la finalizació n del añ o para
poder captar la variació n del salario de los trabajadores de la ciudad. Luego de esto,
por medio de un muestreo aleatorio (el tipo de MA dependerá de cualquier necesidad
extra de aná lisis fuera de lo afirmado en el enunciado) se saca una muestra con
informació n del salario obtenido de los trabajadores de Bucaramanga con una
frecuencia mayor a 30 datos por mes (Entre má s datos se pueda recopilar, mucho
mejor será la muestra).
n

Luego de recopilada la informació n, a través del estadístico de la muestra


∑ X i se
X́ = i =1
n
obtendrá el salario promedio de los trabajadores para Bucaramanga en el 2019.

2. Se afirma que la tasa de desempleo del departamento de Santander ha


disminuido. Formular el procedimiento para probar dicha hipó tesis. Aportar
informació n reciente al respecto.

Para probar dicha afirmació n, se tiene la informació n del nivel X́ del desempleo
muestral en Santander por medio de una muestra aleatoria n en el periodo . Ademá s,
tener informació n que por estudios previos (Censos de població n) arroje los niveles
de desempleo poblacional en el departamento con un valor µ promedio anterior a la
tasa de desempleo muestral X́ , con una desviació n del desempleo de σ. Se plantea que
el desempleo poblacional de Santander µ toma un valor de X.

Con dicha informació n se puede plantear la hipó tesis


H 0=μ ≥ X

H 1=μ< X
Donde H 0 es la hipó tesis nula donde normalmente la tasa de desempleo poblacional
de Santander es estadísticamente igual o mayor al valor que toma. La hipó tesis
alternativa H 1 es la afirmació n puesta en el anunciado, donde la tasa de desempleo
muestral es menor al valor de tasa poblacional establecido en un valor X.

Para probar esta hipó tesis se establece que el nivel de significancia es de 5% (α=0.05)
y se plantea el estadístico Z con media muestral X́ poblacional µ muestra n y
desviació n poblacional σ.

X́−µ
Z=
σ
√n
La regla de decisió n se da en afirmar que si el valor del estadístico Z es menor al valor
Z∝ crítico a un nivel de significancia del 5% se rechaza la hipó tesis nula, lo que
significa que estadísticamente el desempleo de Santander visto en la muestra en un
periodo es menor que el desempleo poblacional X determinado para Santander en los
anteriores periodos (lo que muestra que en el departamento la tasa de desempleo ha
caído). En caso contrario, la informació n mostraría que estadísticamente el desempleo
mostrado muestralmente es igual o mayor al desempleo poblacional anterior (se
acepta la hipó tesis nula)

Tasa de Desempleo Santander


20
18
16
14
12
Tasa (%)

10
8
6
4
2
0
200120022003200420052006200720082009201020112012201320142015201620172018

Tasa de Desempleo

Fuente: Elaboració n propia, Dane (2019)

Se puede revisar la informació n entregada por el Dane acerca del nivel de desempleo
en el departamento a través del tiempo, con cierta certeza se puede observar que los
niveles de la tasa de desempleo del departamento han caído, sin embargo se observa
un incremento de la tasa en el ultimo añ o (respecto al 2017), lo cual puede dar pie a
aná lisis de hipó tesis como lo planteamos en lo descrito anteriormente.

3. Se afirma que el rendimiento estudiantil de secundaria del departamento de


Santander es superior al correspondiente rendimiento del departamento de
Norte de Santander. Explicar có mo se puede probar o sustentar dicha
proposició n.

Para sustentar esta afirmació n, se puede partir de determinar como se mide el


rendimiento estudiantil de secundaria por departamento. Podríamos establecer que
este rendimiento se mide a través de pruebas estandarizadas como el ICFES 9 y 11 a
través de los promedios ponderados o por á reas del conocimiento. Supongamos que
usamos las pruebas ICFES 11 (Saber 11) en los promedios ponderados por
departamento (con muestras n1 y n2 para cada departamento), teniendo cada
promedio una media X́ y una varianza muestral S2 (Suponiendo que las varianzas de
los puntajes para departamento no son iguales). Se obtienen los promedios y
varianzas departamentales X́ 1 , S21para el departamento de Santander y X́ 2 , S22 para el
departamento de Norte de Santander.

Teniendo en cuenta la afirmació n del enunciado, establecemos la prueba de hipó tesis:

H 0= X́ 1 ≤ X́ 2

H 0= X́ 1> X́ 2

Para un nivel de significancia del 5% y establecemos el estadístico

( X́ 1− X́ 2 )
Z=
S1 S2
+
√ n1 √ n2
La regla de decisió n se da en aceptar la hipó tesis nula (que establece que el
departamento Norte de Santander tiene igual puntaje (estadísticamente hablando) o
mayor en las pruebas estandarizadas que el departamento de Santander) si el valor de
Z es menor que el valor crítico de Z a 5% de significancia. Y rechazarla (La hipó tesis
nula, que es lo que se quiere afirmar en el enunciado) si el valor de Z (se usa Z porque
se supone que las muestras son grandes, se desconoce los valores poblacionales de los
puntajes en los departamentos y las varianzas poblacionales) es mayor que el valor
crítico.

4. Tomar un conjunto de datos de su interés (tamañ o superior a 100 datos) y


calcular con ellos las estadísticas bá sicas, distribució n de frecuencias,
intervalos de confianza, principales grá ficos estadísticos. Interpretar
resultados.
Tenemos una base de datos proveniente del Centro de Estudios de Desarrollo
Econó mico (CEDE)1 de la universidad de los Andes, con informació n de violencia que
va desde el añ o 1993 hasta el 2017. Para esta base filtramos la informació n para
tomar los datos de violencia solo del añ o 2017 para los 1123 municipios que
componen Colombia. El aná lisis de estadísticas descriptivas lo haremos con las
variables de homicidios, deplazamiento_expulsió n y hurtos, que muestra la
informació n de personas que fueron asesinadas, salieron desplazadas y casos de
hurtos en dichos municipios en el añ o 2017.

Tabla. 1 Estadísticas Descriptivas

desplazados_expulsi
homicidios   on   hurto  
           
10,828138 67,163846 47,414069
Media 9 Media 84 Media 5
1,7077880 8,2488242 11,432603
Error típico 3 Error típico 35 Error típico 7
Mediana 2 Mediana 9 Mediana 4
Moda 0 Moda 0 Moda 0
Desviación 57,230012 276,42793 Desviación 383,12017
estándar 7 Desviación estándar 4 estándar 9
Varianza de la 3275,2743 Varianza de la 76412,402 Varianza de la 146781,07
muestra 6 muestra 72 muestra 2
332,60792 220,58783 649,09379
Curtosis 5 Curtosis 01 Curtosis 3
Coeficiente de 16,981645 Coeficiente de 13,004753 Coeficiente de 23,550432
asimetría 9 asimetría 7 asimetría 6
Rango 1235 Rango 5866 Rango 11174
Mínimo 0 Mínimo 0 Mínimo 0
Máximo 1235 Máximo 5866 Máximo 11174
Suma 12160 Suma 75425 Suma 53246
Cuenta 1123 Cuenta 1123 Cuenta 1123

Segú n la informació n de la tabla 1, encuentra que para el añ o 2017 en Colombia se


presentaron en total 12160 casos de homicidios, 75425 casos de desplazamiento
forzado y 53246 casos de hurto de diverso tipo. Esto significa que, en promedio, para
los 1123 municipios hubo 10.83 homicidios, 67.16 desplazados y 47.41 casos de hurto
para el añ o de 2017. Esta informació n se contrasta con desviaciones muestrales
relativamente grandes (57.23 para el caso de los homicidios, 276.43 para el caso de
los desplazamientos y 383.12 para los hurtos) provenientes de varianzas
relativamente elevadas. Aun sabiendo esto, se encuentra que la moda para las tres
variables es de cero (0) lo que puede mostrar la existencia de una gran cantidad de
1
Panel de datos CEDE
municipios en el añ o 2017 que no vivieron ninguno de los tres fenó menos, pero que
preocupa en el sentido de la existencia de otros municipios con posibles niveles
elevados de homicidios, desplazamiento o hurto que empujan los valores de la media
a los niveles observados.

Se observan distribuciones de frecuencia de la siguiente forma para las tres variables:

Tabla de Frecuencias Homicidios


clase lim inf lim sup Xi ni Ni fi Fi
1 0 103 51 1110 1110 0,99 0,99
2 103 206 154 6 1116 0,01 0,99
3 206 309 257 3 1119 0,00 1,00
4 309 412 360 1 1120 0,00 1,00
5 412 515 463 0 1120 0,00 1,00
6 515 618 566 1 1121 0,00 1,00
7 618 720 669 0 1121 0,00 1,00
8 720 823 772 0 1121 0,00 1,00
9 823 926 875 0 1121 0,00 1,00
10 926 1029 978 0 1121 0,00 1,00
11 1029 1132 1081 0 1121 0,00 1,00
12 1132 1235 1184 2 1123 0,00 1,00
        1123   1,00  

Tabla de Frecuencias Desplazados


clase lim inf lim sup Xi ni Ni fi Fi
1 0 489 244 1100 1100 0,98 0,98
2 489 978 733 14 1114 0,01 0,99
3 978 1467 1222 2 1116 0,00 0,99
4 1467 1955 1711 3 1119 0,00 1,00
5 1955 2444 2200 0 1119 0,00 1,00
6 2444 2933 2689 1 1120 0,00 1,00
7 2933 3422 3177 1 1121 0,00 1,00
8 3422 3911 3666 1 1122 0,00 1,00
9 3911 4400 4155 0 1122 0,00 1,00
10 4400 4888 4644 0 1122 0,00 1,00
11 4888 5377 5133 0 1122 0,00 1,00
12 5377 5866 5622 1 1123 0,00 1,00
        1123   1,00  

Tabla de Frecuencias Hurto


clase lim inf lim sup Xi ni Ni fi Fi
1 0 931 466 1113 1113 0,99 0,99
2 931 1862 1397 7 1120 0,01 1,00
3 1862 2794 2328 0 1120 0,00 1,00
4 2794 3725 3259 2 1122 0,00 1,00
5 3725 4656 4190 0 1122 0,00 1,00
6 4656 5587 5121 0 1122 0,00 1,00
7 5587 6518 6053 0 1122 0,00 1,00
8 6518 7449 6984 0 1122 0,00 1,00
9 7449 8381 7915 0 1122 0,00 1,00
10 8381 9312 8846 0 1122 0,00 1,00
11 9312 10243 9777 0 1122 0,00 1,00
12 10243 11174 10708 1 1123 0,00 1,00
        1123   1,00  

Donde para las tres variables se observa frecuencias muy concentradas en las clases
má s pequeñ as (de los intervalos), esto muestra que muchos municipios con bajos
niveles de estos fenó menos de violencia. Mientras que se observa pocos casos
ubicados en las clases altas de los intervalos.

Teniendo en cuenta esto, observamos que, para las variables observadas, sus
intervalos de confianza con un nivel de significancia de 5% son:

Límite Inferior Límite Superior


Homicidios 7,480935887 14,17534194
Desplazamiento 50,99644842 83,33124525
Hurtos 25,00657797 69,82156094

Teniendo en cuenta como las frecuencias está n distribuidas no vimos necesario


realizar grá ficos de frecuencia.

También podría gustarte