Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA DESCRIPTIVA
Es una de las dos grandes ramas en la que se divide la estadística y que tiene por objeto básico
describir lo más simplemente posible los resultados obtenidos de un conjunto de datos.
Las distintas formas para cumplimentar con esta etapa de la estadística son:
TEXTO: Incluye la descripción de un conjunto de datos, la caracterización de la distribución de
los mismos y todas las interpretaciones y conclusiones a las que se llegue en forma de texto.
TABLAS: Los datos se presentan resumidos en clasificaciones ordenadas en filas y columnas. Se
las construye tanto para comunicar, publicar información estadística, como así también para
ser utilizada en el análisis estadístico.
GRAFICOS: Es otra forma de resumir los datos, cuya interpretación es visual.
MEDIDAS DESCRIPTIVAS: Son resultados estadísticos que resumen en un solo valor o
categoría alguna característica que describe al conjunto de datos en forma única.
CLASIFICAR: Es una manera de ordenar y resumir los datos. Consiste en agrupar a las unidades
elementales en “CLASES” o “CATEGORIAS” de acuerdo a una definición común y al tipo de variable
que se trate.
1
Estadística y Análisis de Datos
Nota: (al pie del cuadro) Se detalla cualquier aclaración respecto de los datos volcados
en la tabla: Ejem.: - N/D: no disponible -
(*) : Recolección incompleta a la fecha
2
Estadística y Análisis de Datos
Estructura del cuerpo de una tabla simple o unidimensional (una sola variable):
Estructura del cuerpo de una tabla de doble entrada (en términos absolutos o relativos)
NOTACIONES:
X: variable en estudio, puede ser cuantitativa o cualitativa.
N: tamaño de la población
N: tamaño de la muestra.
xi : es el valor de la i-ésima observación (con i = 1, 2, …, n) en un conjunto de observaciones.
DS/A: datos sin agrupar.
DAS: datos en agrupación simple.
DAIC: datos agrupados en intervalos de clase.
3
Estadística y Análisis de Datos
Codificación numérica: En este ejemplo (donde no existe jerarquía entre las clases), observar que la
codificación numérica no tiene las propiedades de los números, el NUMERO solamente sirve para darle
NOMBRE a la clase o clasificación.
Son clases o clasificaciones que agrupan a otras clases o clasificaciones que no son de interés
discriminarlos.
4
Estadística y Análisis de Datos
NIVEL NIVEL
CODIFICACIÓN CODIFICACIÓN
SOCIOECONÓMICO SOCIOECONÓMICO
ALTO A 90 BAJO B 1
MEDIO ALTO MA 50 MEDIO BAJO MB 2
MEDIO M 30 MEDIO M 3
MEDIO BAJO MB 15 MEDIO ALTO MA 4
BAJO B 5 ALTO A 5
UNIDAD ELEMENTAL 1 2 3 4 5 6 7 8 9 10 11 …. n
A B M MA M B MB MB A B B …. M
DATOS CODIFICADOS 90 5 30 50 30 5 15 15 90 5 5 ….. 30
5 1 3 4 3 1 2 2 5 1 1 …. 3
Codificación numérica: En este ejemplo (donde existe jerarquía entre las clases), observa que la
codificación numérica, no solo sirve para darle NOMBRE a las clasificaciones, sino que, además, posee
alguna propiedad de los números (relación de orden: “>” o “<” entre las clases). Aunque no nos dice
nada respecto a la magnitud de esa relación.
En la última clase o clasificación quedará acumulado los n valores expresados en sus respectivos
términos.
5
Estadística y Análisis de Datos
U.E. 1 2 3 4 5 6 7 8 9 …… n
DATOS 3 4 3 0 1 1 5 3 0 ….. 1
En este caso por ser una variable cuantitativa el dato es numérico y tiene todas las propiedades de los
números. Al ser discreta, los datos se agrupan de acuerdo a los distintos valores que asumió la variable
en estudio.
U.E. 1 2 3 4 5 6 7 8 9 … n
DATOS 60,50 71,35 60,50 75,00 82,00 59,78 69,20 76,67 61,23 … 73,20
6
Estadística y Análisis de Datos
…………. 62 63 64 65 66 67 68 69 70 …… Kg
Al ser la variable cuantitativa, el dato es numérico y tiene todas las propiedades de los números. Al ser
continua, los datos se agrupan en intervalos de clase. A este tipo de agrupación se le llama DATOS
AGRUPADOS EN INTERVALOS DE CLASE: DAIC
Con la agrupación en intervalos se pierde información sobre las observaciones pero se gana en cuanto
que se hace más “manejable” el tratamiento de la variable.
Este tipo de agrupación se realiza cuando tenemos un conjunto de observaciones provenientes de una
variable cuantitativa continua o una variable cuantitativa discreta pero:
Muchos datos.
Pocos datos, pero muy dispersos (muy diferentes entre sí).
Interesa una clasificación en particular.
LIMITES: Sean Li y Ls los límites inferior y superior del i-ésimo intervalo, con i = 1, 2, …, k, donde k
denota al k-ésimo intervalo
Lo más común es considerar los límites abiertos en algún extremo
Li < xi ≤ Ls (el más usado)
Li ≤ xi < Ls
xi son los valores observados (con i = 1, 2, …, n)
MARCA DE CLASE: Será el valor que “represente” a todos los valores observados que pertenecen a
Li+Ls
esa clase de intervalo xi = con i = 1, 2, …, k
2
Por lo tanto debemos generar una columna auxiliar en nuestra tabla de distribución de frecuencias.
Muchas veces las partes de un intervalo de clase se definen previamente a criterio del investigador, o
están establecidos de acuerdo al tipo de variable que se trate.
7
Estadística y Análisis de Datos
Cuando se desea construir los intervalos desde un principio, se debe tener en cuenta las siguientes
pautas:
a) La cantidad de intervalos debe ser mayor o igual a 5 y menor o igual a 20.
b) No se debe perder la forma de la distribución de datos. Por ejemplo, se podría realizar
previamente un gráfico de dispersión.
c) Que cada clase de intervalo cumpla con los requisitos de toda clasificación: que sean mutuamente
excluyentes y exhaustivas.
d) Asegurarse que no queden intervalos entre medio con frecuencias igual a cero.
e) Tratar de que los límites sean valores amigables, enteros múltiplos de 5 o 10
f) Tratar de que todos los intervalos tengan la misma amplitud. Caso contrario se tendrá que
trabajar también con densidad de frecuencias.
VARIABLE DE
NATURALEZA VARIABLE CUALITATIVA SEGÚN NIVEL
SI
CUANTITATIVA DE MEDICION ALCANZADO
NO
Ejemplo:
PESO (Kg)
Li < Xi ≤ Ls
NIVEL DE PESO
55 - 60
60 - 65 DELGADOS
65 - 70 NORMALES
70 - 75 CON SOBREPESO
75 - 80
8
Estadística y Análisis de Datos
TIPO DE
TIPO DE AGRUPACIÓN GRÁFICO
FRECUENCIAS
Datos en agrupación SIMPLES DE BASTONES
simple
ACUMULADAS ESCALONADO
- DAS -
Datos en intervalos de HISTOGRAMA
SIMPLES
clase POLIGONO DE FRECUENCIAS
- DAIC- ACUMULADAS OJIVA
30%
Porcentaje de alumnos
25%
20%
15%
10%
5%
0%
0 1 2 3 4 5 6
Número de materias aprobadas
9
Estadística y Análisis de Datos
GRÁFICO ESCALONADO
La representación gráfica de las frecuencias acumuladas se realiza de la siguiente manera: en el eje de
las abscisas se colocan los valores de la variable y en el eje de las ordenadas los valores de las
frecuencias acumuladas. Se obtiene un gráfico escalonado. Puede observarse que el salto de la función
es igual a la frecuencia simple del valor que está al pie. Los valores están concentrados donde los saltos
son más grandes.
Ejemplo
10
Estadística y Análisis de Datos
HISTOGRAMAS: Las frecuencias simples se representan por medio de un histograma. Los requisitos
principales para construir un histograma son:
1. Las frecuencias de los intervalos se representan en el eje de las ordenadas, y los intervalos de clase
se representan en escala en el eje de las abscisas. El eje de las ordenadas debe empezar con cero y no
debe tener ninguna ruptura de la escala.
2. Un espacio, equivalente a la mitad del tamaño completo del intervalo de clase se deja en cada
extremo del eje de las abscisas.
3. Las designaciones en la escala del eje de las abscisas se colocan, generalmente, en los límites de los
intervalos de clase.
4. Para cada intervalo de clase, se considera un rectángulo con base en el intervalo y altura
proporcional a la frecuencia.
Ejemplo
Tiempo de
Marca de
duración fi ri pi Fi Ri Pi
clase
(en minutos)
11
Estadística y Análisis de Datos
120
Cantidad acumulada de procesos
100
80
60
40
20
0
0 2 4 6 8 10 12
Tiempo de duración (en minutos)
12