Está en la página 1de 4

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN

FACULTAD DE CIENCIAS FISICO MATEMATICAS

Maestría en Ciencia de Datos

Reporte 1

Materia: Métodos Estadísticos Básicos


Profesor: MET. Alejandra Guadalupe Cerda Ruiz

Alumno: Leobardo García Reyes


Matricula: 1616825

San Nicolás de los Garza, N.L. 17 de mayo de 2021


Reporte 1

MÉTODOS ESTADÍSTICOS BÁSICOS


MET. Alejandra Cerda

Objetivo: El alumno deberá identificar un conjunto de datos de interés, en el que se


puedan aplicar los análisis revisados a lo largo de la UA; para ello se deberá cumplir
con las características descritas en este documento.

Se deberá cargar en el espacio asignado en MS Teams el documento en PDF donde


se muestren los siguientes apartados:

a) El alumno describirá los datos con los que trabajará y lo que representan
(peso, estatura, etc.), el tipo de variable; comentando sobre el porqué de su
elección.

Medición
Variable Nemónico Tipo de variable
de dato
Ingreso mensual ingremen Cuantitativa – Continua Razón
Sexo sex Cualitativa – Discreta Nominal
Edad edad Cuantitativa – Continua Razón
Años de escolaridad anios_esc Cualitativa – Discreta Nominal
Horas trabajadas a la semana hrs_sem Cuantitativa – Continua Razón
Entidad ent Cualitativa – Discreta Nominal
Total de trabajos total_trab Cualitativa – Discreta Nominal
Estado cónyuge est_con Cualitativa – Discreta Nominal
Número de hijos num_hijos Cuantitativa – Discreta Razón

• Con estas variables sociodemográficas, se puede obtener información


estadística a nivel nacional sobre el mercado laboral mexicano con
datos del primer trimestre del 2021, que permita profundizar en el
aspecto de ingresos mensuales de una persona.

b) El alumno identificara una sola variable de respuesta del total de variables


involucradas, justificando su elección.

• La variable de respuesta que se busca estudiar, es la de Ingreso


mensual. Se busca saber si las variables Sexo, Edad, Años de
escolaridad, Horas trabajadas a la semana, Entidad, Total de trabajos,
Estado cónyuge y Números de hijos, tienen un impacto a la hora de
determinar el ingreso mensual de una persona.

Así mismo, he contemplado otras variables que podrían ayudarme en


este análisis, como son Años de experiencia laborando, Tipo de
profesión (Administrativo, de campo, etc.) o en su defecto, el Tipo de
empresa en la que trabaja (Administrativo o de fábrica, etc.),
lamentablemente no se tiene a disposición estas variables, que sin
duda alguna, nos podrían complementar este análisis estadístico.

c) Mostrar los datos. El alumno trabajara con un conjunto de mínimo 50


individuos o ítems (renglones) para un total de 6 variables por individuo,
comprendiendo 5 predictivas y una respuesta (columnas).

Observaciones ingremen sex edad anios_esc hrs_sem ent total_trab est_con num_hijos
1 0 2 51 9 0 9 1 3 3
2 0 1 84 3 0 9 1 5
3 0 2 82 0 0 9 1 5 5
4 0 1 25 9 60 9 1 6
5 0 1 14 8 0 9 1 6
6 0 2 86 4 0 9 1 4 10
7 0 2 62 6 0 9 1 5 4
8 0 1 67 9 55 9 1 5
9 0 1 30 17 0 9 1 6

350,719 0 1 0 0 0 4 0
350,720 0 2 35 0 0 4 0 2 1
350,721 0 1 61 0 0 4 0 5
350,722 0 2 60 0 0 4 0 5 5
350,723 0 1 31 0 0 4 0 1
350,724 0 2 29 0 0 4 0 1 2
350,725 0 1 6 0 0 4 0
350,726 0 2 1 0 0 4 0
350,727 0 2 71 0 0 28 0 4 8
350,728 0 1 41 0 0 28 0 6

d) Planteamiento de alcances o problemáticas que se desea resolver mediante


el análisis posterior del conjunto.

• Con esta información sociodemográfica se desea resolver incógnitas


como, ¿El ingreso mensual cambia por entidad? ¿Hay entidades que
trabajan más que otras? ¿Los hombres trabajan más que las mujeres?
¿Todas las variables son igualmente importantes para predecir la
variable Ingreso mensual?

Apoyándose con herramientas estadísticas podremos resolver las


incógnitas anteriores, como por ejemplo, la prueba de hipótesis global
para saber si todas las variables independientes tengan coeficiente de
regresión cero. Al igual que, realizar una evaluación de los coeficientes
de regresión individuales, para darnos cuenta de que variables si son
importantes para realizar una regresión múltiple o que prediga la
variable dependiente.

Un inconveniente que se puede encontrar al realizar el análisis


estadístico, es que la base de datos no esté limpia o haya campos
vacíos, lo cual llevara un proceso antes de poder analizarla. También,
se debe agregar una columna que viene en la base de datos original
con el nombre de “r_def” que dice cuales entrevistas fueron
completadas con el código “00” y tomar una decisión si solo tomar las
entrevistas completas o también las incompletas.

Otro inconveniente, es que en la variable edad hay dos categorías,


uno es el código “98” que indica “Años no especificados de 12 años y
más” y el otro es el código “99” que indica “Años no especificados
menores de 12”. Se esta manejando la variable edad como una
cuantitativa – continua, pero si estos dos códigos afectan, se tendrían
que manejar como cualitativa – discreta.

e) Fuente de procedencia de los datos

• “La Encuesta Nacional de Ocupación y Empleo (ENOE) es la principal


fuente de información sobre el mercado laboral mexicano al ofrecer
datos mensuales y trimestrales de la fuerza de trabajo, la ocupación,
la informalidad laboral, la subocupación y la desocupación. Constituye
también el proyecto estadístico continuo más grande del país al
proporcionar cifras nacionales y de cuatro tamaños de localidad, de
cada una de las 32 entidades federativas y para un total de 39
ciudades.” (Instituto Nacional de Estadística y Geografía (INEGI),
2021)

Bibliografía

Instituto Nacional de Estadística y Geografía (INEGI). (Ene - Mar de 2021).


Encuesta Nacional de Ocupación y Empleo (ENOE), población de 15 años
y más de edad. Obtenido de
https://www.inegi.org.mx/programas/enoe/15ymas/#Datos_abiertos

También podría gustarte