Está en la página 1de 12

Citas célebres de la estadística:

Analice las siguientes citas y describa el significado de cada una y de


acuerdo a las citas porque la estadística no es considerada como una
ciencia seria.
"Conseguimos obtener así la fórmula estadística para conocer aproximadamente la posición de un
electrón en un instante determinado. Pero, personalmente, no creo que dios juegue a los dados."

Albert Einstein

"La falacia del cuadro estadístico estriba en que es unilateral, en la medida en que representa sólo
el aspecto promedio de la realidad y excluye el cuadro total. La concepción estadística del mundo
es una mera abstracción, y es incluso falaz, en particular cuando atañe a la psicología del hombre."

Carl Jung

"No existe la suerte. Sólo hay preparación adecuada o inadecuada para hacer frente a una
estadística."

Robert Heinlein

"La esencia de la vida es la improbabilidad estadística a escala colosal."

Richard Dawkins

"Las cosas complejas y estadísticamente improbables, son por naturaleza más difíciles de explicar
que las cosas simples y estadísticamente probables."

Richard Dawkins

"Las estadísticas no son un sustituto de la sentencia."

Henry Clay

"Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas."

Mark Twain

"En estadística, lo que desaparece detrás de los números es la muerte."

Günter Grass

"La estadística ha demostrado que la mortalidad de los militares aumenta perceptiblemente


durante tiempos de guerra."

Alphonse Allais

"Cuando las estadísticas nos dicen que la familia mexicana tiene un promedio de cuatro hijos y
medio, nos explicamos por qué siempre hay uno chaparrito."

Marco Aurelio Almazán


"Demostrar que la realidad nos pasa delante de los ojos como un relato, en el que hay diálogos,
enfermedades, amores, además de estadísticas y discursos."

Tom Wolf

"El tranquilo ha cambiado nuestro mundo, no tanto descubriendo nuevos hechos o desarrollos
técnicos, sino cambiando los modos de razonar, de experimentar y de formar nuestras opiniones
acerca de él."

Hacking

"Los fundamentos de la estadística están cambiando, no sólo en el sentido en que ellos fueron y
continuarán evolucionando, sino también en el sentido idiomático de que ningún sistema es
absolutamente estable."

L. J. Savage

"Conjeturar es barato; conjeturar erróneamente es caro."

Proverbio chino

"Tengo mis resultados hace tiempo, pero no sé cómo llegar a ellos "

C. F. Gauss

"La estadística es el único tribunal de apelación para juzgar el nuevo conocimiento."

P. C. Mahalonibis
TABLA DE DE DISTRIBUCION DE FRECUENCIAS

Es un instrumento en forma de tabla cuya finalidad es la agrupación de datos y facilitar su


interpretación.

Recomendaciones para construir la Tabla de Frecuencias

Sea X una muestra de tamaño n

1) Identificar el tipo de variable y la unidad de medida de los datos

2) Obtener el rango de los datos: distancia entre el mayor y el menor valor de los datos

R =R= Vmax(X(n)) – Vmin(X(1)) (Rango de los datos)

3) obtener el número de clases o intervalos (k), para agrupar los datos.

Sugerencia para elegir k Sean n: número de datos

k: Número de clases n k

tabla para obtener el número de clases (K).

Datos muestrales Clases Ley de Sturges


Menos de 50 datos 5a7 K=1+3.32*log10(50) = K=raíz(50)
Entre 50 y 100 6 a 10 K=1+3.32*log10(100) = K=raíz(100)
Entre 100 y 250 7 a 12 K=1+3.32*log10(250) = K=raíz(250)
Más de 250 10 a 20 K=1+3.32*log10(300) = K=raíz(300)

4) Obtener el intervalo o longitud de las clases,

L = R/k (Intervalo)

Se puede redefinir el intervalo, como el número de clases y los extremos de cada clase de tal

manera que las clases tengan la misma longitud y los intervalos de cada clase incluyan a

todos los datos, sean excluyentes y los valores en los extremos de cada clase sean simples.

Si ai, bi son los extremos de la clase i, entonces el intervalo de la clase i es [ai, bi)

5) Realizar el conteo de datos para obtener la frecuencia en cada clase

Notación n: número de datos

k: número de clases
fi: frecuencia de la clase i, i=1, 2, 3, …, k
fi/n: frecuencia relativa de la clase i
Fi: frecuencia acumulada de la clase i: Fi = f1+f2+f3+…+fi
Fi/n: frecuencia acumulada relativa de la clase i
mi : marca de la clase i (es el valor central del intervalo de la clase i)
Los resultados se los organiza en un cuadro denominado Tabla de Frecuencia
ejemplo del Número de hijos de las 200 familias de una localidad
Formato de las tablas de distribución de frecuencias para las diferentes tipos de variables

VARIABLE CUANTITATIVA DISCRETA


Xi ni fi pi Ni Fi Pi
0 20 0.10 10% 20 0.10 10%
1 80 0.40 40% 100 0.50 50%
2 60 0.30 30% 160 0.80 80%
3 30 0.15 15% 190 0.95 95%
4 10 0.05 5% 200 1 100%
200 1 100%

VARIABLE CUANTITATIVA CONTINUA


Clase i INTERVALO Marca Frec. Frec. Frec. Frec. Abs. Frec. Rel. Frec.
de clase Abs. Rel. (fi) Rel. % Acum. Acum. Rel. %
c1 Li Li+1 (mi) (ni) (pi) (Ni) (Fi) (Pi)
c2 [34.0 34.2) (Li+Li+1)/2 2 0.042 4.2% 2 0.042 4.2%
c3 [34.2 34.4) 9 0.188 18.8% 11 0.229 22.9%
[34.4 34.6) 5 0.104 10.4% 16 0.333 33.3%
[34.6 34.6) 7 0.146 14.6% 23 0.479 47.9%
[34.8 35.0) 9 0.188 18.8% 32 0.667 66.7%
[35.0 35.2) 5 0.104 10.4% 37 0.771 77.1%
[35.2 35.4) 9 0.188 18.8% 46 0.958 95.8%
cn [35.4 35.6) 2 0.042 4.2% 48 1 100%
48 1 100%
Longitud en (mm) de las piezas fabricadas por una máquina a lo largo de un día.

Donde: ni = frecuencias absolutas mi = marca de clase fi = frecuencias relativas

pi = frecuencias relativas % Ni = frec. abs. Acum. Fi = frecuencias rel. %

Pi = frecuencias relativas porcentuales acumuladas


HISTOGRAMA DE FRECUENCIAS:

Es la manera más común de representar gráficamente la distribución de frecuencia de los datos.


Se lo construye dibujando rectángulos cuya base corresponde a cada intervalo de clase, y su altura
según el valor de la frecuencia. Puede ser la frecuencia absoluta o la frecuencia relativa.

Después de tener organizados los datos en una tabla, para tener una visión clara de la distribución
de esos datos, se suelen utilizar diversos tipos de gráficos. Analicemos los más frecuentes.

Se utiliza para variables cualitativas y cuantitativas discretas. Habitualmente se representa


sobre el eje horizontal las distintas modalidades de la variable, sobre el eje vertical se sitúan
las frecuencias (absolutas, relativaas, porcentajes o acumuladas). Partiendo del eje
horizontal, sobre cada valor de la variable se levanta una barra de latura correspondiente a la
frecuencia. Debemos tener en cuenta que la escala en el eje vertical debe comenzar con el
valor cero.

En ocasiones podemos ver representados los gráficos horizontalmente (la variable sobre
el eje de ordenadas y las frecuencias sobre el eje de abscisas)

El histograma permite dar una primera mirada al tipo de distribución de los datos:
1) Si las alturas de las barras son similares se dice que tiene distribución tipo “uniforme”

2) Si las alturas son mayores en la zona central se dice que tiene forma tipo “campana” y
puede ser simétrica o asimétrica, con sesgo hacia el lado positivo o al lado negativo

3) Si hay barras muy alejadas del grupo, se dice que son datos atípicos. Probablemente
estos datos se pueden atribuir a errores de medición y se los puede descartar pues no
pertenecen al grupo que se desea caracterizar
POLÍGONO DE FRECUENCIAS

Es una manera de representar el perfil de la distribución de los datos. Se obtiene uniendo mediante
segmentos de recta los puntos (marca de clase, frecuencia) Para cerrar el polígono se puede agregar
un punto a cada lado con frecuencia 0.

OJIVA:

Este gráfico se usa para representar la frecuencia acumulada, absoluta o relativa. Se lo obtiene
uniendo segmentos de recta que se extienden entre los extremos de las clases y usando los valores
de la frecuencia acumulada.

La ojiva permite responder preguntas tipo “cuantos datos son menores que” Ejemplo. ¿Cuantos
datos tienen un valor menor a 4.5? Respuesta: aproximadamente 27 datos
DIAGRAMA DE SECTORES

Utilizado habitualmente para variables cualitativas (cuantitativas discretas si presentas


pocos valores), el gráfico consiste en un círculo sobre el que se van trazando distintos sectores
circulares de amplitud proporcional a la frecuencia absoluta.

Para hallar la amplitud del sector circular multiplicamos 360º por la frecuencia relativa:
360º·fi=360º·ni/N.

También podemos encontrarnos este gráfico representado sobre media circunferencia, el


cálculo sería análogo al anterior pero cambiando la amplitud de 360º correspondiente al
círculo completo por 180º.

Calculo de la media, mediana y moda para datos agrupados:

Habitualmente siempre hablamos de la media cuando damos un valor central, aunque existen
otras dos medidas de centralización: la mediana y la moda.

Comenzaremos describiendo el cálculo de la Moda y la mediana.

MODA

Es el valor de la variable que presenta mayor frecuencia.


En variables cualitativas y cuantitativas discretas, basta observar la tabla de frecuencias
absolutas para obtener el valor de la moda.

En variables cuantitativas continuas hablaremos de intervalo modal para designar el


intervalo que presenta mayor frecuencia. Dentro del intervalo modal, la moda se calcula de
acuerdo al siguiente esquema:

Nota: Si la amplitud de los intervalos no es la misma para todos, en la expresión anterior trabajaríamos con las alturas
relativas (hi) en lugar de con las frecuencias absoluta (ni), al igual que ocurría en la representación de los histogramas.

MEDIANA
Es el valor de la variable que divide a la población en dos grupos con el mismo número de
individuos, o lo que es lo mismo, el valor de la variable que deja por debajo al 50% de la
población. Sólo es aplicable a variables cuantitativas discretas y continuas.
El cálculo de la mediana cuando se trata de datos simples es bien sencillo, ya que se
ordenan los datos de menor a mayor y la mediana será el valor central. Si los datos están
agrupados en intervalos, ya sea la variable discreta o continua, el cálculo de la mediana se
realiza, por medio de la tabla de frecuencias acumuladas, con la siguiente expresión:

donde
Li es el límite inferior de la clase mediana
ai es la amplitud de intervalo
N es el número total de datos de la distribución
Ni-1 es la frecuencia absoluta acumulada de la clase anterior a la mediana
ni el la frecuencia absoluta de la clase mediana

La expresión de la mediana proviene de la siguiente gráfica:

MEDIA ARITMÉTICA
Se llama media aritmética (habitualmente la denominamos media) a la suma de todos los
valores de la variable dividida por el número total de valores. Para su cálculo, se utiliza la
siguiente expresión:
∑𝑛𝐼=1 𝑚𝑖 ∗ 𝑛𝑖
𝑋̅ =
𝑁

Donde mi =marca de clase ni = frecuencia absoluta N= número total de datos


Ejercicio 1. Suponga que se desean analizar los siguientes datos correspondientes al gasto
en KWH de electricidad durante un mes, obtenidos una muestra de 100 casas de una colonia
rezagada de la ciudad de México:

Datos correspondientes al costo de electricidad en pesos mexicanos


96 171 202 178 147 102 153 129 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149
108 119 183 151 114 135 191 137 129 158
157 185 90 116 172 111 148 213 130 165
95 163 150 154 130 143 187 166 139 149
141 149 206 175 123 128 144 168 109 167
96 171 202 178 147 102 153 129 127 82
108 119 183 151 114 135 191 137 129 158
Realice lo siguiente:
1. Identifique tipo de Variable y Tabla de distribución de frecuencias
2. histograma de frecuencias absolutas
3. polígono de frecuencias relativas acumuladas
4. ojiva
calcule lo siguientes estadísticos
media, medina, moda, varianza y desviación estándar para datos agrupados
Calcule la media y varianza
Ejercicio 2: los datos de la muestra siguiente, correspondes al número de reactivos
vendidos por un almacén denominado Sumilab, en un periodo de 100 días.
37 48 48 57 32 37 48 57 32 48
63 55 34 48 36 63 55 48 36 34
32 47 50 46 28 32 47 46 28 50
19 29 33 53 68 19 29 53 68 33
49 26 20 63 20 49 26 63 20 20
41 35 38 35 25 41 35 35 25 38
23 38 43 43 45 23 38 43 45 43
54 58 53 49 32 54 58 49 32 53
36 45 43 12 21 36 45 12 21 43
55 50 27 24 42 55 50 24 42 27
Realice lo siguiente:
1. Tabla de distribución de frecuencias
2. Histograma de frecuencias absolutas
3. Construir el polígono de frecuencias relativas acumuladas.
4. Comprobar la normalidad de los datos.
5. Ojiva
Calcule lo siguientes estadísticos
media, medina, moda, varianza y desviación estándar para datos agrupados
Ejercicio 3. Un fabricante de neumáticos ha recabado, información sobre la cantidad de
miles de kilómetros recorridos por un cierto modelo de neumático hasta que se esta se haya
ponchado o reventado. Los concesionarios la han proporcionado los siguientes datos:

61.979 4.3068 41.539 62.215 51.269 82.919 34.182 37.654


51.179 74.582 58.708 48.035 67.124 41.830 61.030 58.267
74.239 60.727 56.155 86.070 90.565 53.751 76.580 68.629
48.240 57.884 55.257 84.656 48.662 10.504 60.951 38.420
79.426 67.662 53.324 49.011 29.480 41.128 30.252 33.412
47.012 71.360 78.635 41.715 72.635 41.463 48.996 48.172
55.643 55.912 46.681 66.519 59.168 66.313 35.884 28.625
84.588 40.709 50.238 61.390 85.720 45.313 46.724 61.752
63.692 70.003 65.996 55.989 49.677 46.502 67.467 64.398
44.411 41.886 34.754 59.888 59.449 67.632 89.116 69.483
48.698 65.854 75.850 36.949 75.548 69.010 61.477 65.585
52.452 50.432 37.748 51.831 73.808 61.065 35.807 57.277
80.502 35.342 44.719 37.402

Se pide:
a- Identificar tipo de variable
b- Construir la taba de frecuencias calculando las clases (K ) con la fórmula de Sturgess.
c- Dibujar el histograma de frecuencias relativas sin acumular y acumulado.
d- Dibujar el polígono de frecuencias acumuladas
e- Dibujar la Oiva de datos de frecuencias relativa acumulada
f- Calcular medidas de tendencia central media, mediana, moda
g- Obtener las medidas de dispersión varianza, desviación estándar y desviación típica
h- Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante.

Ejemplo 4: Valores de los pesos en miligramos de una muestra de 100 armellas,


producidos por una máquina.
7.33 7.39 7.38 7.32 7.29 7.34 7.33 7.29 7.26 7.38
7.31 7.33 7.32 7.33 7.36 7.33 7.32 7.32 7.27 7.32
7.26 7.38 7.33 7.28 7.3 7.31 7.3 7.28 7.34 7.33
7.26 7.33 7.32 7.33 7.27 7.34 7.34 7.27 7.34 7.32
7.37 7.37 7.4 7.34 7.3 7.32 7.34 7.3 7.38 7.4
7.27 7.35 7.33 7.33 7.32 7.32 7.35 7.33 7.2 7.33
7.3 7.34 7.32 7.35 7.33 7.33 7.39 7.33 7.29 7.32
7.33 7.32 7.34 7.34 7.34 7.31 7.31 7.26 7.27 7.34
7.32 7.29 7.33 7.31 7.35 7.32 7.35 7.38 7.26 7.33
7.35 7.35 7.31 7.32 7.32 7.35 7.31 7.33 7.34 7.31
Realice lo siguiente:
1. Tipo de Variables y Tabla de distribución de frecuencias
2. histograma de frecuencias absolutas
3. Construir el polígono de frecuencias relativas acumuladas.
4. Comprobar la normalidad de los datos.
5. Ojiva
calcule lo siguientes estadísticos: Media, medina, moda, varianza y desviación estándar
para datos agrupados

También podría gustarte