Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Albert Einstein
"La falacia del cuadro estadístico estriba en que es unilateral, en la medida en que representa sólo
el aspecto promedio de la realidad y excluye el cuadro total. La concepción estadística del mundo
es una mera abstracción, y es incluso falaz, en particular cuando atañe a la psicología del hombre."
Carl Jung
"No existe la suerte. Sólo hay preparación adecuada o inadecuada para hacer frente a una
estadística."
Robert Heinlein
Richard Dawkins
"Las cosas complejas y estadísticamente improbables, son por naturaleza más difíciles de explicar
que las cosas simples y estadísticamente probables."
Richard Dawkins
Henry Clay
"Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas."
Mark Twain
Günter Grass
Alphonse Allais
"Cuando las estadísticas nos dicen que la familia mexicana tiene un promedio de cuatro hijos y
medio, nos explicamos por qué siempre hay uno chaparrito."
Tom Wolf
"El tranquilo ha cambiado nuestro mundo, no tanto descubriendo nuevos hechos o desarrollos
técnicos, sino cambiando los modos de razonar, de experimentar y de formar nuestras opiniones
acerca de él."
Hacking
"Los fundamentos de la estadística están cambiando, no sólo en el sentido en que ellos fueron y
continuarán evolucionando, sino también en el sentido idiomático de que ningún sistema es
absolutamente estable."
L. J. Savage
Proverbio chino
"Tengo mis resultados hace tiempo, pero no sé cómo llegar a ellos "
C. F. Gauss
P. C. Mahalonibis
TABLA DE DE DISTRIBUCION DE FRECUENCIAS
2) Obtener el rango de los datos: distancia entre el mayor y el menor valor de los datos
k: Número de clases n k
L = R/k (Intervalo)
Se puede redefinir el intervalo, como el número de clases y los extremos de cada clase de tal
manera que las clases tengan la misma longitud y los intervalos de cada clase incluyan a
todos los datos, sean excluyentes y los valores en los extremos de cada clase sean simples.
Si ai, bi son los extremos de la clase i, entonces el intervalo de la clase i es [ai, bi)
k: número de clases
fi: frecuencia de la clase i, i=1, 2, 3, …, k
fi/n: frecuencia relativa de la clase i
Fi: frecuencia acumulada de la clase i: Fi = f1+f2+f3+…+fi
Fi/n: frecuencia acumulada relativa de la clase i
mi : marca de la clase i (es el valor central del intervalo de la clase i)
Los resultados se los organiza en un cuadro denominado Tabla de Frecuencia
ejemplo del Número de hijos de las 200 familias de una localidad
Formato de las tablas de distribución de frecuencias para las diferentes tipos de variables
Después de tener organizados los datos en una tabla, para tener una visión clara de la distribución
de esos datos, se suelen utilizar diversos tipos de gráficos. Analicemos los más frecuentes.
En ocasiones podemos ver representados los gráficos horizontalmente (la variable sobre
el eje de ordenadas y las frecuencias sobre el eje de abscisas)
El histograma permite dar una primera mirada al tipo de distribución de los datos:
1) Si las alturas de las barras son similares se dice que tiene distribución tipo “uniforme”
2) Si las alturas son mayores en la zona central se dice que tiene forma tipo “campana” y
puede ser simétrica o asimétrica, con sesgo hacia el lado positivo o al lado negativo
3) Si hay barras muy alejadas del grupo, se dice que son datos atípicos. Probablemente
estos datos se pueden atribuir a errores de medición y se los puede descartar pues no
pertenecen al grupo que se desea caracterizar
POLÍGONO DE FRECUENCIAS
Es una manera de representar el perfil de la distribución de los datos. Se obtiene uniendo mediante
segmentos de recta los puntos (marca de clase, frecuencia) Para cerrar el polígono se puede agregar
un punto a cada lado con frecuencia 0.
OJIVA:
Este gráfico se usa para representar la frecuencia acumulada, absoluta o relativa. Se lo obtiene
uniendo segmentos de recta que se extienden entre los extremos de las clases y usando los valores
de la frecuencia acumulada.
La ojiva permite responder preguntas tipo “cuantos datos son menores que” Ejemplo. ¿Cuantos
datos tienen un valor menor a 4.5? Respuesta: aproximadamente 27 datos
DIAGRAMA DE SECTORES
Para hallar la amplitud del sector circular multiplicamos 360º por la frecuencia relativa:
360º·fi=360º·ni/N.
Habitualmente siempre hablamos de la media cuando damos un valor central, aunque existen
otras dos medidas de centralización: la mediana y la moda.
MODA
Nota: Si la amplitud de los intervalos no es la misma para todos, en la expresión anterior trabajaríamos con las alturas
relativas (hi) en lugar de con las frecuencias absoluta (ni), al igual que ocurría en la representación de los histogramas.
MEDIANA
Es el valor de la variable que divide a la población en dos grupos con el mismo número de
individuos, o lo que es lo mismo, el valor de la variable que deja por debajo al 50% de la
población. Sólo es aplicable a variables cuantitativas discretas y continuas.
El cálculo de la mediana cuando se trata de datos simples es bien sencillo, ya que se
ordenan los datos de menor a mayor y la mediana será el valor central. Si los datos están
agrupados en intervalos, ya sea la variable discreta o continua, el cálculo de la mediana se
realiza, por medio de la tabla de frecuencias acumuladas, con la siguiente expresión:
donde
Li es el límite inferior de la clase mediana
ai es la amplitud de intervalo
N es el número total de datos de la distribución
Ni-1 es la frecuencia absoluta acumulada de la clase anterior a la mediana
ni el la frecuencia absoluta de la clase mediana
MEDIA ARITMÉTICA
Se llama media aritmética (habitualmente la denominamos media) a la suma de todos los
valores de la variable dividida por el número total de valores. Para su cálculo, se utiliza la
siguiente expresión:
∑𝑛𝐼=1 𝑚𝑖 ∗ 𝑛𝑖
𝑋̅ =
𝑁
Se pide:
a- Identificar tipo de variable
b- Construir la taba de frecuencias calculando las clases (K ) con la fórmula de Sturgess.
c- Dibujar el histograma de frecuencias relativas sin acumular y acumulado.
d- Dibujar el polígono de frecuencias acumuladas
e- Dibujar la Oiva de datos de frecuencias relativa acumulada
f- Calcular medidas de tendencia central media, mediana, moda
g- Obtener las medidas de dispersión varianza, desviación estándar y desviación típica
h- Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante.