Está en la página 1de 8

Estadística descriptiva y probabilidad

Objetivos:
1. Obtener medidas de posición, dispersión у forma de un conjunto de datos.
2. Obtener representaciones graficas que resuman desde el punto de vista estadístico un

conjunto de datos.

3. Detectar valores fuera de rango en un conjunto de datos.

4.1. Calculo de medidas de posición, dispersión у forma

Mediante R Commander

Las medidas de posición, dispersión у forma más comunes, media, mediana, percentiles, desviación

típica у coeficiente de asimetría, se hallan en la opción del menú Estadisticos — Resumenes —

Conjunto de datos activo

Al seleccionar esta opción nos muestra un resumen de cada una de las variables disponibles en el

conjunto de datos, como se muestra a continuación, es importante resaltar que al pedirle al

programa que realice un resúmen el “desconoce” la naturaleza de los datos, porque si bien distingue

de datos numéricos y alfanuméricos, el investigador debe distingir entre los tipos de variables con

los que cuenta la base de datos para realizar futuras interpretaciones de los resultados.

Para obtener medidas descriptivas de alguna(s) variable(s) en especial procedemos de la siguiente

manera: Estadisticos — Resumenes — Resúmenes numéricos. Al dar click en esta opción nos
aparece una ventana como se muestra a continuación, en la cual debemos seleccionar la(s)

variable(s) de interés:

En la pesataña Datos se selecciona la variable de interés, se puede discriminar además la

información por grupos, al seleccionar esta opción aparecen las variables que son de tipo categórico

y por las cuales es posible realizar un análisis discriminado por grupos.

En la pestaña Estadísticos se pueden seleccionar los resúmenes numéricos que necesitamos como

media, desviación estándar, cuantiles, entre otros.

A modo de ejemplo, vamos a obtener estas medidas para la variable VMATRI discriminada por la

variable RESTRATO la cual fue recodificada en el capítulo anterior. Los resultados son los

siguientes.
Aquí, mean se refiere a la media, sd a la raíz de la varianza muestral, IQR es el rango intercuartil,

el percentil 0 es el valor mínimo de la variable, el percentil 50, como ya sabemos, es la mediana у

el percentil 100 es el valor máximo de la variable.

4.2. Distribuciones de frecuencias

Las variables de tipo cualitativo, no pueden ser resumidas mediante las medidas numéricas antes

mencionadas. Para este tipo de variables el resumen más conveniente es, simplemente, su

distribución de frecuencias.

Mediante R Commander

Para obtener la distribución de frecuencias de una о varias variables de un conjunto de datos medi-

ante R Commander elegimos la opción Estadisticos — Resumenes — Distribution de frecuencias.

En la ventana emergente elegimos las variables que queremos analizar у la tabla aparece en la

ventana de resultados, incluyendo las frecuencias absolutas у relativas.4.3. Diagrama de barras у

diagrama de sectores
No obstante, asumiendo el dicho una imagen vale más que mil palabras, sabemos que existen dos

formas de plasmar en un gráfico la distribución de frecuencias de una variable cualitativa о discreta

con pocos valores: el diagrama de barras у el diagrama de sectores.

4.3.1. Diagrama de barras para variables cualitativas

En R Commander este tipo de gráficos están en la opción Graficas — Grafico de barras.

La ventana de entradas aparece en la siguiente figura.

En esta ventana hemos solicitado un análisis de la variable FAC. Es muy importante tener en cuenta

que solo pueden representarse variables cualitativas de tipo factor.

La función barplot() nos permite obtener la distribución de barras mediante código. Aquí tenemos

posibilidad de controlar más cosas.

El gráfico obtenido con los pasos anteriores es el que se muestra en la siguiente figura, este gráfico

contiene las frecuencias absolutas para cada categoría,


4.3.2. Diagrama de sectores o de pastel para variables cualitativas

Para realizar un diagrama de sectores o de pastel mediante R Commander elegiremos la

opciónGraficas — Diagrama de sectores.

La ventana emergente solo permite elegir una variable cualitativa. De nuevo es muy importante tener

en cuenta que solo pueden representarse variables cualitativas de tipo factor. El diagrama

correspondiente al tipo de facultad es el siguiente:


4.4. Histograma

Histograma para variables continuas

Como ya sabemos, los diagramas de barras о sectores no son adecuados para datos de variable

continuas. Frente a estas representaciones, el histograma aparece como la alternativa válida, ya que

obliga a agrupar los valores en intervalos cuya frecuencia si es relevante.

Para realizar un histograma con R Commander elegimos Graficas — Histograma.


La ventana de entrada permite elegir solo una variable para cada análisis (pestaña Datos), el número

de intervalos del histograma у la escala de este: frecuencias absolutas, porcentajes у densidades

(pestaña Opciones).

En el caso de la variable VMATRI hemos seleccionado histogramas con escala en frecuencias у el

Número de clases con la opción <auto> (Por defecto, asigna el número de intervalos por el conocido

como método de Sturges.). El gráfico obtenido se muestra a continuación:

4.5 Diagrama de caja alambre y bigote (Boxplot)

4.5.1. Grafica por grupos

En este caso vamos a realizar un boxplot es un diagrama de caja, es un gráfico, basado en cuartiles,
mediante el cual se visualiza un conjunto de datos. Proporcionan una visión general de la simetría
de la distribución de los datos.

Mediante R Commander
Vamos a obtener el diagrama de caja de las variables VMATRI у RESTRATO para observar el

comportamiento del valor de la matrícula discriminada por tipo de estrato (alto, bajo). Para ello,

elegimos la opción Graficas — Diagrama de caja.

Las dos ventanas de entradas son muy parecidas: en ellas tenemos que elegir la variable que

queremos analizar у existen dos opciones muy interesantes: Gráfico por grupos y en la pestaña

Opciones se encuentra identificar datos atípicos. Inicialmente realizaremos un Boxplot discriminando

por grupos, para elegir esta opción damos click en la opción Gráfico por gruposy seleccionamos la

variable categórica por la cual queremos discriminar el análisis.

El diagrama de caja para la variable VMATRI discriminada por RESTRATO es:

También podría gustarte