Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas Sumatorias Estadistica
Medidas Sumatorias Estadistica
El objetivo principal de las medidas de tendencia central es poder representar por medio de un
solo nmero al conjunto de datos, es decir, dan valores representativos de la distribucin de
frecuencias, situados en algn lugar intermedio, alrededor del cual, se encuentran los otros
valores. Nos indican dnde tienden a concentrarse los valores.
Existen tres medidas de tendencia central generales, que son, la Media aritmtica, la Mediana y
la Moda; as como otras que se utilizan en casos particulares como la Media ponderada, la
Media Armnica, la Media Geomtrica, la Media Cuadrtica.
Datos No Agrupados:
X= cualquier dato
n
X
i 1
i
X=
n Nmero total de datos
10 12 36 25 58 121
x 24.2
5 5
Datos Agrupados:
obtiene: x
15000*18 20000* 35 25000* 29 1695000 $20,670.70
82 82
Mediana x
~ : Es el valor central, el que delimita al 50% de los datos, es decir, es el valor que
se encuentra exactamente en la mitad de los datos.
Datos No agrupados: En los datos ordenados se aplica la siguiente relacin, para encontrar
la posicin de los datos.
n 1
posicin ; en donde n = nmero total de datos
2
Datos Agrupados:
Se localiza la clase o rengln que contiene a la mediana, con la siguiente condicin
n +1
fa , es decir debemos encontrar la primer frecuencia acumulada que sea mayor
2
o igual a la posicin, para posteriormente aplicar la siguiente formula:
~ = FI + posicin fa anterior * i
X donde:
f
FI Fa F i
Frontera o Frecuencia Frecuencia Tamao de
lmite acumulada del rengln de intervalo en el
verdadero anterior al la mediana rengln de la
inferior del rengln de la mediana
rengln de la mediana
mediana
Nota: Si la posicin, en los datos no agrupados, es decimal (.5), se toma el promedio del dato
anterior y el siguiente.
Fronteras($)
Salario No. De emp.
(X) (F)
12,500-17,500 $15,000 18
17,500-22,500 $20,000 35
22,500-27,500 $25,000 29
Primero se obtiene la posicin:
82 1
posicin 41.5
2
Datos No Agrupados: Despus de ordenar los datos buscamos el valor que ms se repite.
Ejemplo: Encontrar la moda de; 47, 48, 49, 49, 49, 51, 51, 52. Podemos observar que el
nmero que ms se repite es el 49. Si ningn valor se repite, no existe moda
Datos Agrupados:
donde : 1 f f anterior
2 f fposterior
Observamos las frecuencias (No. de empleados) y decimos que la clase modal es la segunda,
porque 35 es la frecuencia ms grande y aplicamos:
1 17
X = FI + * i 17500 * 5000 $21,195.65
1 2 17 6
donde : 1 f f anterior 35 18 17
2 f f posterior 35 29 6
Relacin entre Media Aritmtica, Mediana y Moda:
Relacin Simetra
X
X =X Simtrica
<X
X <X Sesgo positivo
X
X >X Sesgo negativo
Media Aritmtica Ponderada X p : Es el promedio de los datos en donde se le da un peso o
importancia especfica a cada observacin. Se calcula:
Wi*X i
i 1
X w= n
Suma de las ponderaciones
W
i 1
i
Ejemplo:
Aplicamos la formula:
n
W *X i i
(17.8 * 75) (35.9 * 56) (79.45 * 19) 4854.95
X w= i 1
$32.37
n
75 56 19 150
W
i 1
i
Media Geomtrica (G): Con cierto tipo de datos, la media aritmtica no da el valor promedio
correcto. La media geomtrica sirve para promediar los crecimientos geomtricos de una
variable.
Si suponemos que Y representa el factor de crecimiento geomtrico de la variable X, es decir:
Xi
Yi ,entonces el factor de crecimiento geomtrico promedio de la variable X ser:
X i 1
Datos No Agrupados:
G n Y1 * Y2 * * Yn
Ejemplo:
Si los precios de la accin Anhuac en los ltimos cuatro das fueron; 4.75, 5.23, 4.78 y 6.32
calcula el factor de crecimiento promedio y el crecimiento porcentual promedio.
ltimo 6.32
b) Otra forma es G 1.330526316 1.099869493
3 3
nmero de datos -1
primero 4.75
Datos Agrupados:
G n Y1f1 * Y2f2 * * Ykfk
Ejemplo:
Supngase que se cuenta con la informacin diaria de los incrementos porcentuales de una
accin y que se representan en la siguiente tabla:
Crecimiento Frecuencias
porcentual en das
(%)
10 14
20 15
30 48
crecimiento porcentual
y 1
100
Media Armnica (H): Cuando los datos a promediarse estn medidos en unidades expresadas
en forma de cocientes (km./hr., $/lt, etc.), lo ms adecuado es utilizar la media armnica, ya que
la media aritmtica nos llevar a un promedio equivocado.
Datos No Agrupados:
n
H n
1
X
i 1 i
Ejemplo:
Si un vehculo se mueve de la ciudad A a la B a 65 Km./hr y regresa de B a A a 98 Km./Hr a qu
promedio se desplaz.
n 2
H 78.1595
n
1 1 1
i 1 X i
65 98
Datos Agrupados:
n
H k
fi
X
i 1 i
Velocidad Nmero
promedio de
en km/hr vehculos
50 15
60 28
75 31
La respuesta es:
n 74
H 62.711864
k
fi 15 28 31
X
i 1
50 60 75
i
Datos no agrupados:
x 2
i
MC i 1
n
Ejemplo:
Supngase que se obtienen las ganancias y prdidas del precio de una accin durante una
semana; - 4.00, - 3.50, 2.35, 6.20, 3.25 Calcular el promedio:
x
i 1
2
i
(4.0) 2 (3.5) 2 2.352 6.2 2 3.25 2 50.775
MC 3.186691
n 5 5
Datos agrupados:
fx 2
i i
MC i 1
n
Ejemplo:
Ahora deseamos obtener el promedio de una tabla de distribucin de frecuencias pero con
datos positivos y negativos.
Ganancias y No. De
prdidas del das
precio de (f)
una accin
(x)
-7.25 25
2.75 14
12.75 2
fx 2
i i
25 * (7.25) 2 14 * 2.75 2 2 *12.75 2
MC i 1
6.5239
n 41
Ayudan a localizar el valor de la variable que acumula cierto porcentaje especfico de datos.
Deciles (D): Representan el 10%, 20%, ... , 90% de los datos acumulados respectivamente.
Percentiles (P): Representan el 1%, 2%, ... , 99% de los datos acumulados respectivamente.
Datos No Agrupados:
j * ( n 1)
Posicin
r
donde :
j Nmero de cuantil que se desea obtener
r puede ser 4, 10 o 100 depende del cuantil
que se desee obtener
n nmero de datos
Dados los nmeros 3, 5, 7, 36, 45; obtener el nmero que represente al 75% de los datos.
Solucin:
N=5
J = 75
R = 100
75 * (5 1)
4 .5
100
3. Aplicamos la frmula:
Datos Agrupados:
Primero calculamos la posicin como en los datos no agrupados, despus buscamos la primer
fa posicin , y aplicamos la siguiente formula:
Posicin de la mediana
Ejemplo
Fronteras Frecuencia Fa
100 - 200 389 389
200- 300 258 647
300 - 400 452 1099
j * n 1 3 * (1099 1)
fa anterior 647
r 4
C = FI + * i 300 * 100 339.3805
f 452
2.4 MEDIDAS DE DISPERSIN
Rango (o Intervalo):
Es la distancia que existe entre el menor y mayor valor de los datos.
Datos No Agrupados:
Datos Agrupados:
Q 3 Q1
Q
2
Datos No Agrupados:
X X
i 1
i
DM =
n
Datos Agrupados:
f
i 1
i Xi X
DM =
n
Varianza:
Poblacional ( 2 ): Es el promedio del cuadrado de la distancia de los datos a su media
Datos No Agrupados:
N
X
2
i
2 = i 1
N
N
Xi
2
2 i1 2
N
Datos Agrupados:
f X
2
i i
=
2 i1
N
k
fi *X i
2
2 i1 2
N
Muestral (S2 ): La suma de las distancias al cuadrado se divide entre en nmero de datos
menos uno:
Datos No Agrupados:
n
x x
2
i
i 1
S2 =
n -1
n
xi2
n x
2
S 2 i 1
n -1 n 1
Datos Agrupados:
k
f x x
2
i i
i 1
S2 =
n -1
k
f i x i2
n x
2
S 2 i 1
n -1 n -1
Desviacin Estndar:
Mide la variacin de los datos en trminos absolutos. Es la raz cuadrada positiva de la
varianza.
Poblacional: 2
Muestral: S = S2
- Al menos el 75% de los valores cae dentro de 2 desviaciones estndar alrededor de la media:
X 2S
- Al menos el 89% de los valores caen dentro de 3 desviaciones estndar alrededor de la
media: X 3S
S
CV = 100
X
Proporcionan un valor numrico para saber hacia qu lado de la distribucin hay mayor
acumulacin de frecuencias y si la concentracin central de frecuencias es mayor que en los
extremos o viceversa sin tener que graficar los datos.
Datos No Agrupados:
n
x x
r
i
mr i 1
n
Datos Agrupados:
n
f x x
r
i i
mr i 1
n
El primer momento respecto a la media (r=1) siempre es igual a cero.
El segundo momento respecto a la media (r=2) es la varianza poblacional.
Moda=Mediana=Media
Insesgada
Mediana
Media
Mediana
Media
Datos No Agrupados:
n
x x
3
i
m3
a3 i 1
S3 ns 3
Datos Agrupados:
f x x
3
i i
m3
a3 i 1
S3 ns 3
Coeficiente Sesgo
momento de
sesgo
a3 = 0 No hay sesgo. La
distribucin es
insesgada
a3 > 0 La distribucin tiene
sesgo positivo o a la
derecha.
a3 < 0 La distribucin tiene
sesgo negativo o a la
izquierda.
Leptocrtica
Mesocrtica
Platocrtica
x x
4
i
m4
a4 i 1
S4 ns 3
Datos Agrupados:
k
f x x
4
i i
m4
a4 i 1
S4 ns 4
Coeficiente Curtosis
momento
de curtosis
a4 = 3 La distribucin es
Mesocrtica.
a4 > 3 La distribucin es
Leptocrtica.
a4 < 3 La distribucin es
Platocrtica.
Indice de Gini:
k 1
p i qi
Ig i1
k 1
p
i1
i
donde:
k = nmero de clases o categoras
fi
p i = la proporcin acumulada de individuos = 100 = fra x 100
n
q i = la proporcin acumulada del total del producto de f i*xi
0 Ig 1
Si Ig=0, la variable est menos concentrada (mejor repartida).
Si Ig=1, la variable est ms concentrada (peor repartida).
Curva de Lorenz:
Se grafican los valores de la proporcin acumulada de individuos (p) y la proporcin
acumulada del total de la variable (q).
La funcin identidad representa la igualdad absoluta, es decir, a la variable cuando no est
concentrada (la recta a 45 grados). La desigualdad absoluta o mxima concentracin de la
variable indicara que un solo individuo tenga el total de la variable (el tringulo inferior).
El Indice de Gini calcula el rea entre la diagonal y la Curva de Lorenz, como un porcentaje del
rea del tringulo inferior de la grfica (mide la desigualdad relativa).
3.1- Medidas de Concentracin
Indice de Gini:
k 1
p i qi
Ig i 1
k 1
p
i 1
i
donde:
El Indice de Gini calcula el rea entre la diagonal y la Curva de Lorenz, como un porcentaje del
rea del tringulo inferior de la grfica (mide la desigualdad relativa).
Ejemplo:
que no hay mucha concentracin de los datos, es decir, los datos se encuentran bien
distribudos.
Notacin Suma
X i 1
i , esta expresin indica que estos n valores deben sumarse. Por consiguiente:
X
i 1
i X 1 X 2 X 3 ... X n
X : X 1 2, X 2 0, X 3 1, X 4 5 y X 5 7 .Por lo tanto:
X
i 1
i X 1 X 2 X 3 X 4 X 5 2 0 (1) 5 7 13
En estadstica nos vemos involucrados muy a menudo con la suma de los valores al cuadrado
de una variable. Por lo tanto.
n
X
i 1
i
2
X 12 X 22 X 32 ... X n2
X
i 1
i
2
X 12 X 22 X 32 X 42 X 52
2 2 0 2 ( 1) 2 5 2 7 2
4 0 1 25 49
79
n
Se debe observar, aqu que X
i 1
i
2
, la sumatoria de los cuadrados no es igual a
2 2
n n
n
XI , el cuadrado de la suma, esto es X i
2
Xi
i 1 i 1 i 1
En nuestro ejemplo, la sumatoria de los cuadrados es igual a 79. Esto no es igual al cuadrado
de la
Otra operacin que se utiliza con frecuencia implica la sumatoria del producto. Esto es,
suponiendo que tenemos dos variables, X y Y, cada una con n observaciones.
Entonces,
XY
i 1
i i X 1Y1 X 2Y2 X 3Y3 ... X nYn
Continuando con el ejemplo anterior, suponiendo que tambin se tiene una segunda variable Y
cuyos valores son
Y1 1, Y2 3, Y3 2, Y4 4 y Y5 3 Entonces,
X Y
i 1
i i X 1Y1 X 2Y2 X 3Y3 X 4Y4 X 5Y5
n
Al calcular X Y
i 1
i i debemos tomar en cuenta que el primer valor de X por el primer
valor de Y
n
n n
i 1
X Y
i i i Yi
X
i 1 i 1
5 5
En nuestro ejemplo, X i 13 y
i 1
Y
i 1
i 1 3 ( 2) 4 3 9 de modo que
5 5 n
X i Yi (13)(9) 117 . Esto no es lo mismo que X Y i i , que es igual
i 1 i 1 i 1
a 45.
Antes de estudiar las cuatro reglas bsicas para efectuar operaciones con notacin sigma, ser
de ayuda presentar los valores de cada una de las cinco observaciones de X y de Y en forma
de tabla:
Observacin Xi Yi
1 2 1
2 0 3
3 -1 -2
4 5 4
5 7 3
5 5
X i 13
i 1
Y
i 1
i 9
Regla 1: La sumatoria de los valores de dos variables es igual a la suma de los valores de cada
variable sumada.
n n n
X i Yi X i Yi
i 1 i 1 i 1
En nuestro ejemplo:
X
i 1
i Yi (2 1) (0 3) ( 1 ( 2)) (5 4) (7 3)
3 3 ( 3) 9 10 22
5 5
X Y
i 1
i
i 1
i 13 9 22
Regla 2: La sumatoria de una diferencia entre los valores de dos variables es igual a la
diferencia entre los valores sumados de las variables.
n n n
(X
i 1
i Yi ) X i Yi
i 1 i 1
X
i 1
i Yi (2 1) (0 3) ( 1 ( 2)) (5 4) (7 3)
1 (3) 1 1 4
5 5
4 X i Yi 13 9 4
i 1 i 1
Regla 3: La sumatoria de una constante por una variable es igual a la constante que multiplica
a la sumatoria de los valores de la variable.
n n
cX i c X i
i 1 i 1
4 0 ( 2) 10 14 26
5
2 X i (2)(13 ) 26
i 1
Regla 4: Una constante sumada n veces ser igual a n veces al valor de la constante.
c nc
i 1
c 2 2 2 2 2 10
i 1
(5)(2) 10
c 2 2 2 2 2 2 12
i 2
((7 2) 1) * ( 2) 12
Para ilustrar cmo se utilizan las reglas de la sumatoria, podemos mostrar una de las
propiedades matemticas pertenecientes al promedio o media aritmtica .
X X 0
i 1
i
Esta propiedad establece que la sumatoria de las diferencias entre cada observacin y la media
aritmtica es cero. Esto se puede probar matemticamente de la siguiente manera:
1.- De la ecuacin (4.1),
X i
x i 1
n
As pues, utilizando la regla 2 de la sumatoria, tenemos:
n n n
X
i 1
i X Xi X
i 1 i 1
2.- Puesto que, para cualquier conjunto fijo de datos, X Puede ser considerada como una
constante, de la regla 4 de la sumatoria tenemos:
n
X nX
i 1
Por consiguiente,
X X Xi n X
n n
i
i 1 i 1
X i
despus n X
n
Xi
X i 1
i 1
n
Por consiguiente,
n n n
X
i 1
i X Xi Xi
i 1 i 1
X
i 1
i X 0
PROBLEMA
Suponiendo que se tienen seis observaciones de las variables X y Y tales que
X 1 2, X 2 1, X 3 5, X 4 3, X 5 1, X 6 2 yY1 4, Y2 0, Y3 1, Y4 2, Y5 7, Y6 3
Calcule cada una de las siguientes sumatorias.
6 6
a) Xi
i 1
b) Y
i 1
i
6 6
c) X i2
i 1
d) Y
i 1
i
2
6 6
e) X Y
i 1
i i f) X
i 1
i Yi
6
g) X
i 1
i Yi h)
X
6
i 3Yi 2 X i2
i 1
6 6
i) cX i , c 1
i 1
j) X
i 1
i 3Yi c , c 3
INTRODUCCIN A LA ESTADSTICA
La Estadstica es una ciencia que nos proporciona un mtodo importante para la toma de
decisiones y resolver problemas en forma sistemtica y reproducible, a diferencia de otros
mtodos que difcilmente pueden ser explicados o reproducidos hasta por la misma persona
que lo ejecuta. Por lo anterior es importante analizar detenidamente cada uno de los conceptos
en los que se fundamenta sta para lograr acercarnos profundamente a su conocimiento.
Dado que la estadstica nace con la idea de resolver problemas comenzaremos diciendo que
un problema es la diferencia entre lo real y lo deseado, es decir, que nosotros normalmente al
tener injerencia en la toma de decisiones podamos escenificar perfectamente la realidad que
nos rodea y con ello empatar nuestras necesidades o deseos. De tal forma, que la estadstica,
entonces juegue el papel de agente caracterizador de una poblacin. Entendiendo a esta
(Poblacin) como una realidad concreta que comprende todos los elementos que permiten
bosquejar a un problema.
Por lo tanto una muestra ser aquel subconjunto propio obtenido de la poblacin, es decir,
cuenta con algunos elementos y no todos los de la poblacin.
Las medidas que se obtienen en una poblacin son llamadas parmetros y las obtenidas en
una muestra reciben el nombre de estadsticos. Es importante aclarar que las poblaciones y
las muestras estn determinadas por el problema ya que en diferentes situaciones una muestra
puede jugar el papel de poblacin dependiendo del problema y viceversa.
Por ejemplo una gota de sangre es una muestra si el problema es estudiar la salud de una
persona, pero es una poblacin si me interesa determinar el volumen de eritrocitos y leucocitos
que hay en ella. As en los negocios tambin es importante delimitar el problema ya que las
ventas de un da resultan ser una muestra cuando estemos interesados en analizar las ventas
promedio anuales, y por otro lado resulta ser la poblacin cuando analizamos las ventas por
empleado en ese da.
RAMAS DE LA ESTADSTICA
Sera muy recomendable que investigaras otras definiciones de la estadstica en cualquier libro
de Estadstica y comentaras con tus compaeros y tu profesor las diferencias que encuentres.
Adems sera muy bueno que analizaras cualquier problema que hayas tenido para revisar si
en realidad hubo un deseo y una realidad diferentes.
TIPOS DE VARIABLES
Para poder realizar una estadstica tambin es necesario identificar la naturaleza de los datos
que conforman a la poblacin, con el objeto de establecer las variables que se deben manejar,
pudiendo encontrarnos con datos cuantitativos y datos cualitativos. Los datos cuantitativos
son aquellos que resultan de una medida o de un conteo por lo que los podemos diferenciar en
continuos y en discretos respectivamente, es decir, que se pueden obtener datos cuantitativos
que debido a un instrumento podemos especificar valores enteros y decimales de tal forma que
sus diferencias sern establecidas dependiendo de la exactitud del instrumento al medir
distancias, volmenes, superficies, etc. y otros datos que solo se puedan contar, como es el
caso del nmero de automviles en circulacin en cierta ciudad, nmero de empleados en una
empresa, etc. Los datos cualitativos resultan de aquellas poblaciones en las que sus elementos
no pueden ser medidos debido a su naturaleza y que por lo tanto solo se les pueden observar
atributos y diferencias.
Aqu ser bueno recordar cuantas veces has requerido de este tipo de informacin, ya sea, al
preparar un pastel o una bebida, al describir a un amigo o al querer explicar las caractersticas
de una ciudad a la que visitaste.
ESCALAS DE MEDICIN
Nominal; la cul se utiliza principalmente en los datos cualitativos y nos permite manejar la
informacin por su nombre, como en los casos de marcas de diferentes productos,
enfermedades, preferencias, etc.
Ordinal; aquella que utilizamos cuando necesitamos establecer orden entre las diferencias
de la poblacin y sus datos son cualitativos, por ejemplo, escalas de calidad (mala, regular,
buena, muy buena), escalas de gusto (muy sabrosa, sabrosa, agradable, desagradable,
muy desagradable), etc.
Razn; Bsicamente utilizada en datos cuantitativos que pueden ser medidos con
instrumentos estandarizados o con un cero absoluto como por ejemplo una distancia
medida en kilmetros, un volumen medido en centmetros cbicos, ventas medidas en
pesos, etc.
Sistemtico; Este muestreo permite obtener los elementos de cada k - sima unidad de la
poblacin, y para ello se requiere conocer el tamao de la poblacin (N), el de la muestra (n) y
obtener el valor de k, de tal forma que al tener estos datos escojamos al primer dato por medio
de aleatorio simple y de ah de k en k. Por
N ejemplo; si tenemos la necesidad de extraer una
K
n muestra de 20 artculos de 1000 unidades
producidas entonces deberemos dividir 1000/20
obteniendo 50 por lo que el primer nmero lo seleccionamos de nuestra tabla de nmeros
aleatorios obteniendo el nmero 12, por lo que, los siguientes nmeros debern ser 12+k,
12+2k, etc., es decir, 12, 62,112, 162, 212, 262, 312, 362, 412, 462, 512, etc.
87 65 78 87 60 87 34 31 43 87
Estratificado; Este tipo de muestreo 78 90 65 68 62 70 80 61 62 72
requiere tener una poblacin bien clasificada 95 64 80 90 68 80 30 35 40 75
en varios grupos llamados estratos, que a su
interior se mantengan bastante homogneos,
59 68 65 92 70 78 95 33 72 65
para construir la muestra normalmente se 70 95 50 75 31 60 43 78 70 60
toma una cantidad de elementos del mismo 65 60 30 90 40 80 59 27 92 65
tamao de cada uno de los estratos, este debe ser mediante el muestreo aleatorio simple
(m.a.s.); aunque en algunos casos cuando las proporciones de los estratos son distintas se
toman en cuenta.
Por conglomerados; En este caso la muestra nos presenta gran dificultad para establecer
sus diferencias, por lo que iniciamos seleccionando en forma aleatoria una muestra de
conglomerados, ya que, cada uno de ellos podra representar una muestra, posteriormente se
deber elaborar un censo para poder establecer las proporciones de las diferentes categoras
que se encuentren presentes en nuestra muestra.
Podras escoger los nmeros del juego Melate mediante un muestreo probabilstico?, De
poderse cul utilizaras?, Qu nmeros seleccionaras?, Te atreveras a pagar por esos
nmeros?
Ahora bien, despus de determinar que tipo de variables utilizaremos, de que formas las vamos
a medir y si ser necesario obtener una muestra nuestra siguiente decisin a tomar dentro del
mtodo estadstico ser el de especificar si usaremos los datos en forma agrupada o no
agrupada.
Para el caso de querer agrupar los datos, entonces deberemos crear una tabla de
distribucin de frecuencias y para ello los pasos que debemos seguir son los siguientes:
Nos podemos percatar que en este caso las cifras significativas son las que representan a las
decenas por lo que el diagrama quedar compuesto de la siguiente forma:
Ntese que este diagrama nos sirve para
2 7
encontrar los valores mnimos y mximos de
3 0 0 1 1 3 4 5 forma ms rpida, tambin nos permiti ordenar a
4 0 0 3 3 los datos en forma ms sencilla y por ltimo nos
5 0 9 9 muestra al menos el comportamiento de la forma
6 0 0 0 0 1 2 2 4 5 5 5 5 5 5 8 8 8 en el conjunto de datos.
7 0 0 0 0 2 2 5 5 8 8 8
8 0 0 0 0 7 7 7 7 8
9 0 0 0 2 2 5 5 5
El siguiente paso es obtener el Rango mediante la siguiente relacin, en la que nos debemos
cuestionar su significado, ya que, no representa una diferencia simplemente sino que, ms bien
es nuestra primer medida estadstica que representa la mxima dispersin que vamos a
encontrar en nuestro conjunto de datos, as
Rango = dato mayor - dato menor
tendremos: 95-27 = 68
El siguiente paso ser determinar la frecuencia ( f ) o nmero de datos que caen dentro de los
intervalos que hemos generado por lo que debemos contestar a la pregunta de cuntos
datos se encuentran entre tal valor y tal otro?, es decir, en nuestro ejemplo vemos que LS
debemos preguntarnos cuntos datos hay entre los valores de 27 y 35?, pudiendo 35
observar en el diagrama de tallo y hojas que contamos con 8 datos, y as sucesivamente 44
hasta terminar de preguntarnos los dems intervalos teniendo: 53
f 62
8 De esta manera ahora ya contamos con una tabla de distribucin de frecuencias la 71
4 cual nos permitiera crear nuevas columnas que nos facilitarn la tarea de describir 80
1 una realidad y con ello resolver un problema mediante decisiones importantes. 89
9 98
14 Una de las columnas que podemos generar puede ser la que representa a la
i
11
5 frecuencia acumulada ( i fa f j ), es decir, la que nos responder a la pregunta de
8 j 1
cuntos datos se fueron presentando desde el primer intervalo hasta el ltimo?, D esta
forma tendremos:
fa
8 As, con esta columna podemos decir que 8 das tuvimos entre 25 y 37 comensales, 12
12 das entre 25 y 44, etc.
13
22 Despus debemos encontrar un nmero que representa a todo el intervalo, ya que, es
36 ms sencillo hablar de un solo dato a un intervalo.
47
52 Este nmero se llama marca de clase o punto medio el cual quedar representado por
60 una x y se calcula utilizando los lmites o los lmites reales o verdaderos, mediante la
siguiente relacin:
En donde li representa al lmite inferior ls al lmite superior
li + ls lri + lrs y lri, lrs a los lmites reales.
x = =
2 2
Ntese que la marca de clase puede obtenerse con los lmites que habamos obtenido o con
los lmites reales, los cuales resultan de las siguientes acciones.
Es importante lograr establecer un intervalo continuo para poder hacer anlisis estadstico de
todo el conjunto de datos y que a la vez no nos limite este mismo conjunto.
Para obtener un lmite real debemos tomar los valores de los lmites que presentan un hito de
informacin (como es el caso de 44 y 45 en nuestro ejemplo) y encontrar un punto que
represente ese intervalo con la frmula que hemos utilizado con las marcas de clase.
f
fr = x 100
N
Es el nmero total
de datos o en otras
palabras la suma
de f
Al tener la frecuencia relativa entonces tambin nos podemos preguntar cul es la proporcin
i
acumulada ( fra i fr
j1
j ) por rengln de la misma forma que lo hicimos para la frecuencia.
fr fra Como estas columnas representan la proporcin que le corresponde a cada
13 13 una de las frecuencias en cada rengln entonces tambin podramos crear
7 20 una columna que representara los grados dentro de una circunferencia con el
2 22 objetivo de crear una grfica de pastel o de pay tambin llamada grfica de
15 37 sectores.
23 60
18 78 Grfica de Pastel (Pie, Circular o de Sectores): Puede representar datos
8 87 cualitativos o cuantitativos. Un crculo se divide en sectores que representan,
13 100 proporcionalmente, cada clase. No es recomendable representar mas de 6
clases.
Se suelen ordenar los sectores para hacer ms evidente sus diferencias.
A partir de la frecuencia relativa, se obtienen los grados:
gradosi fri 360 gradosi % i 3.6
Ojiva: Equivalen a los polgonos de frecuencia acumulada. Relacionan las fronteras inferiores
con los valores acumulados de frecuencia. Su aplicacin se concreta a responder preguntas
como: qu proporcin acumulada le corresponde a este dato?, Qu dato corresponde a esta
proporcin acumulada?. Hay dos criterios para construir ojivas:
1) Ojiva "Menor que": "cuntas observaciones son menores que esta frontera?". Es una
curva creciente que empieza en frecuencia cero y termina en el total de observaciones.
2) Ojiva "O ms": "cuntas observaciones hay iguales o mayores a esta fronteras?". Es una
curva decreciente que empieza en el total de observaciones y termina en cero.
FUENTES DE DATOS.
Ahora nos interesa describir la forma en que la estadstica se hace llegar la informacin para
poder trabajarla. En principio podemos decir que hay dos tipos de estudios estadsticos;
aquellos que involucran la toma de decisiones respecto a una poblacin y/o sus caractersticas,
es decir, el estudio enumerativo y el segundo llamado estudio analtico que involucra realizar
actividad sobre un proceso para mejorar el desempeo en el futuro.
Despus de haber decidido que tipo de estudio se debe realizar entonces podremos encontrar
la informacin en tres tipos de fuentes:
1) La bibliogrfica
2) La experimentacin y
3) La entrevista.
Dentro de la informacin bibliogrfica podemos decir que esta representada por la informacin
impresa y quedan incluidas las nuevas fuentes tales como la informacin obtenida en Internet,
discos compactos, y cualquier otro medio digital que permita obtener informacin almacenada.
Las ventajas de este tipo de datos quedan manifiestas por la velocidad de obtencin de la
informacin, ya que, tal vez pueda estar clasificada y ordenada, adems de evitarnos la prdida
de tiempo para recopilar esta informacin. La desventaja es que muchas veces la informacin
no es actualizada o que la informacin no se apegue exactamente a nuestro problema.
En cuanto a la entrevista podemos decir que contamos al menos con tres tipos diferentes:
a) Por correo
b) Por telfono
c) Directa.
Cada una de ellas tiene sus ventajas y sus desventajas pero tambin son utilizadas en la
actualidad, as como, una serie de versiones que mezclan estos tres tipos, por ejemplo en los
noticieros televisivos hacen una pregunta y dan dos diferentes telfonos o tres para recibir las
respuestas.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 2 3 1 2 1 0 8 7 6 5 9 7 8 1 0 0 3 4 9 8 0 0 9 7 1
2 5 5 6 3 8 9 0 9 6 7 5 9 0 7 6 4 2 3 1 6 5 6 3 3 2
3 9 6 4 1 2 3 0 0 4 6 1 7 9 2 1 4 3 9 1 5 2 3 9 0 8
4 3 2 8 9 2 9 3 4 6 5 9 4 7 7 2 6 2 1 5 9 0 7 1 9 9
5 3 6 1 0 0 4 0 7 0 5 1 5 3 9 1 0 1 2 1 8 5 9 4 4 6
6 5 3 3 4 7 1 9 5 4 5 2 4 6 4 2 9 6 5 4 3 9 4 2 1 7
7 4 3 1 0 3 3 7 8 7 3 7 5 3 5 0 2 6 4 1 1 0 2 7 0 2
8 2 2 8 6 5 6 7 2 7 1 6 4 1 8 6 5 4 3 7 1 2 6 6 1 0
9 0 4 1 6 5 7 6 4 2 0 3 4 5 2 1 5 9 6 8 7 6 0 5 6 4
10 9 1 7 0 3 6 6 7 3 1 2 2 8 4 6 8 3 8 9 9 7 3 5 8 0
11 6 0 6 7 7 0 6 8 7 7 1 2 4 3 4 3 3 3 4 4 0 9 7 8 1
12 8 2 7 3 2 9 2 8 3 8 2 1 0 7 1 2 7 7 5 7 1 3 8 5 9
13 6 0 6 7 4 5 8 9 6 0 9 4 9 5 1 5 1 0 7 2 0 5 5 0 6
14 7 8 0 2 4 8 1 5 8 2 8 5 5 5 2 1 2 4 8 4 8 8 9 3 5