Está en la página 1de 6

Ejemplo 3.

Considere la situación en la que tenemos una medida de aptitud académica (escala 200-800)
que queremos modelar utilizando las calificaciones de las pruebas comprensión lectora y
lógico matemático, así como el tipo de programa en el que el estudiante está matriculado
(académico, general, o vocacional). El problema aquí es que los estudiantes que contestan
todas las preguntas en la prueba de aptitud académica reciben correctamente una puntuación
de 800, aunque es probable que estos estudiantes no sean "verdaderamente" iguales en
aptitud. Lo mismo ocurre con los estudiantes que responden a todas las preguntas
incorrectamente. Todos estos estudiantes tendrían una puntuación de 200, aunque no todos
pueden ser de igual aptitud.

Descripción de los datos

Siguiendo el ejemplo 3.

Tenemos un archivo de datos hipotético, rendimientoac.dta con 200 observaciones. La


variable de aptitud académica es apt, las calificaciones de las pruebas de lectura y matemáticas
son read y math respectivamente. La variable prog es el tipo de programa en el que se
encuentra el estudiante, es una variable categórica (nominal) que toma tres valores:
académico (prog = 1), general (prog = 2) y vocacional (prog = 3).

Veamos los datos. Tenga en cuenta que en este conjunto de datos, el valor más bajo de apt es
352. Ningún estudiante recibió una puntuación de 200 (es decir, la puntuación más baja
posible), lo que significa que aunque la censura desde abajo era posible, no ocurre en el
conjunto de datos.

1. Estime las estadísticas descriptivas, analice e interprete

. summarize apt read math

. tabulate prog

2. Elabore un histograma con 10 columnas y un valor máximo de 800 puntos, analice e

interprete.
. histogram apt, normal bin(10) xline(800)

3. Realice un análisis estadístico de las relaciones bivariadas de las variables de interés

datos, analice e interprete

. correlate read math apt

Grado de asociación es de 66 deread y math


4. Realice un gráfico de análisis de dispersión de las variables de interés, obsérvese la

colección de casos en la parte superior de cada diagrama de dispersión debido a la

censura en la distribución de apt, analice e inteprete.

. graph matrix read math apt, half jitter(2)

Existe una censura

5. Realice un análisis estadístico para identificar el truncamiento y/o censuramiento para

la variable apt. Qué puede concluir para los resultados encontrados.

. summarize apt, detail

6. Tarea, realice un análisis estadístico para determinar el mejor modelo econométrico a

estimar, considere las siguientes indicaciones:


. regress apt read math i.prog

. tobit apt read math i.prog, ul(800)

Resultado optimo

7. Evalúe y pruebe el efecto global de prog usando el comando de prueba test. A

continuación vea el efecto global de prog ¿es estadísticamente significativo?.

. test 2.prog 3.prog


. test 2.prog = 3.prog

Finalmente, es posible evaluar, el grado de ajuste y de capacidad de predicción del modelo.


Esto puede ser útil cuando se comparan modelos alternativos. Un método para hacer esto es
comparar los valores proyectados (estimados) basados en el modelo tobit con los valores
observados en el conjunto de datos.

8. Realice el siguiente procedimiento, y estime los valores proyectados de apt basados en el


modelo. Luego realice un análisis de correlación de los valores observados de apt con los
valores predichos (yhat).

. predict yhat

. correlate apt yhat

La correlación entre los valores predichos y observados de apt es 0.7825. Si cuadramos este
valor, obtenemos la correlación cuadrática múltiple, esto indica que los valores predichos
comparten alrededor del 61% (0.7825^2 = 0.6123) de su varianza con apt. Además, podemos
utilizar el comando escrito por el usuario fitstat para producir una variedad de estadísticas de
ajuste. Puede encontrar más información sobre fitstat escribiendo search fitstat (consulte
Cómo puedo usar el comando de búsqueda para buscar programas y obtener ayuda adicional
para obtener más información sobre cómo usar la búsqueda).

9. Evalúes el análisis anterior escribiendo el siguiente comando en Stata.

. fitstat

También podría gustarte