Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Representar información
Métodos gráficos:
Una vez que has identificado el tipo de variables con las que estas trabajando y su
escala de medición, puedes comenzar a realizar un análisis gráfico con la finalidad de
presentar la información,
resumir datos
-Tabla de distribución frecuencias para variables relativas: una tabla que muestre las
clases y el número de observaciones que hay en cada una de ellas.
1. Determina el número de clases.
El número de intervalos recomendado es de no menos de 5 y cuando mucho
20, dependiendo de la cantidad de datos. Calcula √n (donde n es el número
de datos de la muestra), y redondea a un número entero para determinar el
número adecuado de clases (k).
2. Calcula el ancho del intervalo.
Resta el valor máximo menos el valor mínimo del conjunto de observaciones.
Luego divide entre el número de clases elegido en el inciso (1).
i = H − L / k
donde i es el ancho del intervalo, H es el valor máximo, L es el valor mínimo y k
es la cantidad de clases o intervalos a construir. Si los datos de la muestra son
enteros, redondea esta cifra a un entero; si los datos tienen un decimal,
redondea esta cifra a un decimal, etc.
3. Define los límites de cada clase.
El límite inferior del primer intervalo será el valor mínimo de los datos; suma a
este valor el ancho del intervalo definido en el inciso (2) para determinar el
límite superior. Construye de esta forma el resto de los intervalos, cuidando que
exista continuidad entre ellos, pero sin traslape de valores entre los límites
superior e inferior de las clases sucesivas.
4. Verifica los intervalos.
Revisa que el número de clases sea el que se determinó en el inciso (1) y que el
valor máximo de los datos quede incluido en el último intervalo.
Construye la tabla de frecuencias siguiendo el procedimiento indicado para
datos cualitativos. (tema anterior).
Histograma:
representar las frecuencias de los valores observados de una variable cuantitativa. De
forma similar a una gráfica de barras, el histograma se construye a partir de una tabla
de frecuencias, y constituye una forma gráfica de visualizar.
Existen situaciones en las que se estudia y representa visualmente la relación entre dos
variables. Al estudiar la relación entre ellas, se hace referencia a los datos como
bivariados.
Una técnica gráfica útil para mostrar la relación entre dos variables es el Diagrama de
dispersión.
El tipo de relación entre un par de variables puede ser positiva o negativa: se trata de
una relación positiva si a medida que una de las variables incrementa su valor la otra
también lo hace, es decir, existe una relación directa entre ellas; si por el contrario,
cuando una de las variables incrementa su valor la otra disminuye (relación inversa), se
dice que la relación es negativa.
Por otro lado, el grado de la relación determina la fuerza con la que las variables se
relacionan entre sí, pudiendo ir desde una relación nula o muy baja, hasta una relación
muy alta o perfecta.
MEDIDAS NUMÉRICAS:
Las medidas numéricas nos permiten describir y resumir nuestros conjuntos de datos,
existen medidas de tendencia central (media, mediana y moda), medidas de dispersión
(varianza y desviación estándar) y medidas de posición (percentiles y cuartiles).
-Percentil:
indica el valor por debajo del cual se encuentra un porcentaje del conjunto de datos. Por ejemplo,
el valor del percentil 35 es más grande que el 35% de los datos pero más pequeño que el resto
de los datos.
cuartil:
Es el que divide al conjunto de datos en cuatro partes iguales, cada parte contiene un
25% de las observaciones.
Cuartil 1= percentil 25
Cuartil 2 = percentil 50= mediana
Cuartil 3 = percentil 75
Medidas de dispersión:
Conocer la variabilidad o dispersión de los datos nos ayuda a comprender qué tan
alejados están respecto a su valor promedio, entre más pequeña sea esa dispersión
podemos decir que los datos son más precisos.
2-Desviación estándar:
Es la raíz cuadrada positiva de la varianza
● Si a todas las observaciones se les suma la misma constante, la varianza y la
desviación estándar no varían.
● Si a todas las observaciones se les multiplica por la misma constante positiva, la
varianza se multiplica por el cuadrado de la constante y la desviación queda
multiplicada por dicha constante.
● Recuerda que entre más pequeña sea esa dispersión de los datos podemos decir
que son más precisos y que todos ellos están cercanos, disminuyendo la
incertidumbre.
3-Coeficiente de variación:
Es el que indica que tan grande es la desviación estándar en relación al promedio.
Los valores pequeños del coeficiente de variación indican poca dispersión (esto es que
los datos son precisos). Cuanto más elevado sea el CV más dispersión o variabilidad
tienen los datos. Asimismo permite comparar la dispersión entre dos poblaciones
distintas aunque ellas tengas diferentes unidades de medición.