Está en la página 1de 12

SEMANA 2) DESCRIPCIÓN GRÁFICA Y NUMÉRICA DE UNA VARIABLE.

Tipos de gráficos: por cada tipo de variable existe un tipo de gráfico.

• Variables cualitativas o categórica:


- Se listan las categorías y se obtienen el recuento de individuos de cada categoría

Se pueden graficar:

- Diagrama de barras: permite comparar rápidamente la altura de las barras de las


diferentes categorías. No tiene porque haber todas las categorías.

- Diagrama de sectores: visualizas la importancia relativa de cada categoría.


• Variables cuantitativas o numéricas
- HISTOGRAMAS: en forma de barras, donde la superficie de cada barra es
proporcional a la frecuencia de los valores representados.
-> Permite evidenciar grado de homogeneidad o grado de variabilidad de la
variable. O evidenciar que no existe un patrón.
-> construcción de un histograma:
* paso 1: ordenar los datos

* paso 2: dividir el recorrido de los datos en clases de igual amplitud.


* paso 3: construir los intervalos de clases

*paso 4: graficar. (con los intervalos haces un diagrama de barras o de forma con
una línea)
- interpretación:
* aspecto general:
- forma: mirar la forma que tiene
- centro: la mitad o el promedio: la MEDIANA
- dispersión: (¿datos acumulados o dispersos?)
- desviaciones: observaciones a típicas: (algún dato que llama la atención porque
es atípico, posteriormente tomaremos la decisión de eliminarlo porque
distorsiona los resultados o no)

Distribuciones simétricas y asimétricas:

• Una distribución es simétrica si los lados derecho e izquierdo del histograma son
aproximadamente imágenes especulares una del otro.
• Una distribución es asimétrica a la derecha: si el lado derecho del histograma se
extiende mucho más lejos que el lazo izquierdo
• Una distribución es asimétrica a la izquierda si el lado izquierdo del histograma
se extiende mucho mas lejos que el lado derecho

- DIAGRAMA DE “TALLO Y HOJAS”:

Es un grafico que permite presentar la distribución de una variable cuantitativa.

-> consiste en separar cada dato en hojas – el ultimo digito- y tallos- cifras delanteras
restantes

-> útil para conjuntos de datos de tamaño medio y que sus datos no se agrupan
alrededor de un único tallo
Construcción de un diagrama de tallos:
* Paso 1: ordenar los datos.

* Paso 2: dibujar una tabla con dos columnas, la primera columna para el tallo y
la segunda para las hojas. (cada hoja a la derecha de su tallo en orden creciente)

Redondea los intervalos entonces apuntas cuantos hay de ese intervalo


- OBSERVACIONES del diagrama de tallos:
• Permite obtener simultáneamente una distribución de frecuencias de variables
y su representación gráfica.
• Las “clases” vienen dadas, Aunque:
- El redondeo nos permite reducir el número de clases
- Para aumentar el número de clases, se puede dividir cada tallo en dos.

Intrpretacion: igual que el histograma

-diagrama de cajas:

• Análisis gráficos: cualitativos -> barra o pastel


Cuantitativos -> histogramas y tallos y hojas
• Análisis numérico: cuantitativos
3) DESCRIPCIÓN NUMÉRICA:

* solo para variables cuantitativas:

-> Medidas de centro: medida, mediana, moda

La media: se suman los valores y se divide por el número total de observaciones.

La media es sensible a la influencia d épocas observaciones extremas. Pueden


ser a típicas, pero también puede ser una distribución asimétrica esto desplaza
la media hacia la cola mas larga.

La mediana: valor de la variable que ocupa la posición central cuando los valores
de esta variable están ordenados. Es el numero tal que la mitad de las
observaciones son menores y la otra mitad mayores.

• Numero de valores impar: se posiciona en el centro (50% de valores por encima


y 50% por debajo de este)
• Numero de valores es par: será la media aritmética de los dos valores centrales.
Calculo:

La mediana es robusta a observaciones atípicas.


Media y mediana de una distribucion simétrica se encuentran muy cerca si es
igual son iguales también.

La moda: es el valor de la variable que tiene mayor frecuencia.

Cuando no se repite ningún valor hablamos de clase modal en el histograma

Puede ser bimodal o multimodal.

• Distribución simétrica y “unimodal”:Moda=Mediana=Media

• Distribución asimétrica positiva: Media es mayor que la mediana.

• Distribución asimétrica negativa: Media es menor que la mediana

Una distribucion asimétrica la media queda desplazada hacia la cola mas larga

-> Medidas de posición no centrales: Máximo, mínimo, cuartiles

- máximo y mínimo

Sea A un conjunto ordenado -> a ∈ A:

* Es el máximo de A si cualquier otro elemento de A es menor o igual que él.

* Es el mínimo de A si cualquier otro es mayor o igual que el

-los cuartiles: son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales.

* Q1, Q2,Q3 y determinan los valores correspondientes al 25%,50%,75% de los


datos.

El Q2 concide con la MEDIANA.


COMO SE CALCULAN:

- paso 1: ordenar las observaciones en orden creciente y localizar la Mediana

- paso 2:el primer cuartil es la mediana de las observaciones situadas a la


izquierda de la mediana global. Separa el primer 25% de las observaciones.

-paso 3: El tercer cuartil es la mediana de las observaciones situadas a la derecha


de la mediana global. Es mayor que el 75% de las observaciones.

-paso 4: el segundo cuartil es la mediana

Forma de resumir una distribución:

mínimo
* q1
M=*Q2
Q3
Máximo
- se pueden mostrar gráficamente en el diagrama de cajas. Para comparar
distribuciones
-> medidas de dispersión: recorrido desviación típica, varianza

- La varianza: es la medida de la distancia al cuadrado de los valores de una


variable con respecto a la media aritmética.

- La desviación típica: es la media de la distancia de los valores de una variable


con respecto a la media aritmética. Es la raíz cuadrada de la varianza.

- s y s^2 reflejan el graado de variabilidad de una variable, la diferencia son las


unidades de medida en que se expresan. La desviación típica: en unidades( las
mismas que la variable). La varianza: en unidades al cuadrado

Propiedades de desviación típica “s”

* s mide la dispersión respecto a la media, sólo se usa cuando usamos la media


como medida de centro. No es robusta.

* se utiliza normalmente para distribuciones simétricas.

*s=0 solo cuando no hay dispersión y s>0 si hay dispersión.

- El histograma de mucha más información.

-> medidas de forma: asimetría y curtosis:

- las medidas de asimetría son indicadores que permiten establecer el grado de


simetría o asimetría que presenta una distribución de probabilidad de una variable
aleatoria sin tener que hacer su representación gráfica.
- Considerando como eje de simetría una recta paralela al eje de y que pasa por la
media de la distribución tendremos una:
• Distribución simétrica cuando existe el mismo numero de valores a la derecha
que a la izquierda de la media. Por tanto, el mismo numero de desviaciones con
signo positivo que con signo negativo.
• Asimetría positiva : cuando hay mas separados de la media a la derecha.
• Asimetría negativa cuando hay valores mas separados de la media a la izquierda.

MEDIDA DE ASIMETRÍA DE FISHER:

- Para distribuciones unimodales, bajo nivel de asimetría y campaniformes.

MEDIDA DE ASIMETRIA DE PEARSON:


Misma interpretación de coeficiente con la de Fisher.

MEDIDAS DE CURTOSIS:
Es una medida de forma que mide cuan escarpada o achatada está una curva o
distribución.
Tres posibilidades:
‐Leptocúrtica, más apuntada que la normal CRT>0 (más apuntada que la normal)
‐Mesocúrtica o normal CRT=0 (normal)
‐Platicúrtica o menos apuntada que la normal CRT<0 (más achatada que la normal)

Las medidas de asimetría junto con las medidas de curtosis se utilizan para

contrastar si se puede aceptar que una distribución estadística sigue

la distribución normal. Esto es necesario para realizar varios contrastes estadísticos

en la teoría de la inferencia estadística.

También podría gustarte