En la práctica, la mayor parte de los conjuntos de datos contienen
muchas observaciones, por lo que cuando la cantidad de información es muy grande resulta conveniente reducirla agrupando las observaciones en intervalos o tablas de frecuencia.
Muchas veces, no solo se representan los datos en forma agrupada
para reducir la cantidad de información sino también porque hay variables que son sensibles a la no-respuesta.
Es decir, es más probable que una persona en una encuesta conteste
cierta información cuando se le pide que se ubique en un rango, que cuando se le pide el valor exacto (ejemplo: nivel de ingreso).
M. Cornejo Sesión 3: Datos Agrupados 2 / 10
Ejemplo La siguiente tabla tiene datos de ingreso mensual en US$ de 3200 individuos en cierta ciudad:
Frecuencia relativa Definición La proporción de observaciones de cada intervalo o clase se denomina frecuencia relativa. Dı́as de ausentismo laboral en el último trimestre:
M. Cornejo Sesión 3: Datos Agrupados 5 / 10
Histograma El histograma nos permite hacernos una idea visual rápida y adecuada de la proporción de observaciones que se encuentran dentro de un determinado intervalo.
M. Cornejo Sesión 3: Datos Agrupados 6 / 10
Histograma
Un histograma sirve para:
Tener una primera vista de los datos, cómo se distribuyen. Detectar casos extremos. Detectar problemas con los datos. Ver qué es lo que sucede más frecuentemente.
M. Cornejo Sesión 3: Datos Agrupados 7 / 10
Asimetrı́a
La distribución de los datos puede ser simétrica o asimétrica .
Cuando la distribución es:
simétrica: Media=Mediana=Moda asimétrica a derecha (positiva): Media>Mediana>Moda asimétrica a izquierda (negativa): Media<Mediana<Moda
M. Cornejo Sesión 3: Datos Agrupados 8 / 10
Curtosis Definición La curtosis mide el grado de concentración que presentan los valores en la región central de la distribución.
Usando como referencia la distribución normal, la distribución puede ser:
Platicúrtica Leptocúrtica Mesocúrtica (la distribución normal) M. Cornejo Sesión 3: Datos Agrupados 9 / 10 Aplicación en Excel
Bajar de Yahoo Finance (finance.yahoo.com) el precio de cierre
ajustado de Intel entre el 4 de enero de 2016 y el 22 de julio de 2016.
Compute el retorno diario de Intel a través de la siguiente fórmula:
(Pt − Pt−1 ) Pt Rt = × 100 = − 1 × 100 Pt−1 Pt−1
Utilice el complemento de Excel “Herramienta para análisis” obtenga
los principales estadı́sticos descriptivos.
Genere una tabla de frecuencias y grafique el histograma.
Ajuste a La Calificación Del Riesgo De Mercado De Las Emisoras Más Activas Que Cotizan En La Bolsa Mexicana De Valores, Con La Implementación De Una Red Neuronal Artificial Clasificadora: Adjustment to the Market Risk Rating of the Most Active Issuers Listed on the Mexican Stock Exchange with the Implementation of an Artificial Neural Network Classifier