Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
1.1 La población y la muestra. Relación entre De esta definición pueden percibirse dos grandes
la probabilidad y la estadística. áreas de acción de la Estadística, la Descriptiva y
Clasificaciones de la estadística. la Inferencial.
Noviembre 2009 1
Es necesario determinar que todas las ciencias Las Poblaciones se clasifican en función a su
sin importar la disciplina tienen como cardinalidad.
denominador común al método científico, por
ende, la Estadística al ser una herramienta Población Finita. Es aquella que incluye un
necesaria ara el método científico, forma parte número limitado de medidas y observaciones.
también de todas las ciencias.
Población Infinita. Es aquella que por incluir un
Desde el punto de vista de la naturaleza de la gran número de medidas y observaciones no es
información manipulada, la Estadística puede posible determinar la cantidad de éstas.
clasificarse como Paramétrica y No Paramétrica.
En lo general, las características medibles de una
Estadística Paramétrica. Son todas aquellas población son denominadas Parámetros.
técnicas y herramientas estadísticas que utilizan
variables cuantitativas, es decir, medibles. Muestra. Conjunto de observaciones o medidas
tomadas a partir de una población dada, es decir,
Estadística No Paramétrica. Son todas aquellas es un subconjunto de la población. Desde luego,
técnicas y herramientas estadísticas que utilizan la cardinalidad de la muestra depende de la
variables cualitativas. cardinalidad de la población. Las muestras deben
ser representativas para evitar un sesgo u error.
Desde el punto de vista del número de variables
sobre las cuales se basa el análisis matemático Estadísticos Muestrales1. En lo general, son las
respectivo, siendo la estadística univariable la características medibles de una muestra
que utiliza una sola variable, mientras que la
estadística multivariable analiza dos o más El muestreo es la técnica seguida para obtener o
variables. extraer una muestra. Su ventaja radica en que
nos permite conocer, con un grado de
Población. Conjunto de todas las posibles aproximación aceptable, a partir de sus
observaciones. Sinónimo de Conjunto Universal características, las características propias de la
se le define como la totalidad de todas las población de la cual proviene. Esto resulta
posibles mediciones observables, bajo
consideración en una situación dada por
determinado problema, circunstancias diferentes 1 En la literatura suelen denominarse por
implican situaciones diferentes. igual estadísticos o estadísticas a las
características de las muestras.
Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.
Noviembre 2009 2
invaluable, tomando en cuenta que en la mayoría Muestreo Estratificado. Esta técnica implica
de los casos, las características de las muestras dividir a la población en clases o grupos
son desconocidas. denominados Estratos. Se supone que las
unidades que componen al estrato, son
El sesgo es la diferencia que existe entre los relativamente homogéneas, con respecto a las
datos obtenidos a través de una muestra y los características que vayan a estudiarse. A menudo
datos reales (normalmente desconocidos) se toma una razón de muestreo igual para todos
pertenecientes a la población. Puede interpretarse los estratos generalmente en proporción; a una
como un error absoluto entre un valor real y uno muestra seleccionada así, se le llama Muestra
aproximado. Cuando se denomina como sesgado Estratificada Proporcional. (Se estudia sólo el
a determinado resultado se pretende establecer estrato)
que su valor es diferente al real.
Cuando la proporción de rastreo está
Las técnicas de muestreo pueden clasificarse de directamente relacionada con la homogeneidad
la siguiente forma: es decir entre más homogéneo sea el estrato
menor será su proporción incluida en la muestra.
A una muestra obtenida de esta forma se le
denomina: Muestra estratificada
Desproporcionada. (De una población normal se
toma una muestra proporcional)
Noviembre 2009 3
1.2 Estadística descriptiva. general se coincide que no sean tan pocos
que no resulte apropiada la agrupación de
Representación de los datos de una datos ni tantos que la haga poco práctica. En
muestra. La Estadística Descriptiva se general, se recomienda que el número de
encarga de la obtención, organización, intervalos no sea ni menor de cinco ni mayor
representación y descripción de los datos. a quince.
La obtención de los datos se logra a través de Por otra parte, ciertos autores han establecido
las técnicas de muestreo, conforme al diseño algunas reglas matemáticas para determinar
del experimento seleccionado. el número de intervalos. Dos de ellas son:
Intervalos de clase. Se refiere a los 50.1 50.6 51.1 50.8 52.2 51.9 51.2 52.0
intervalos en los cuales serán agrupados los n 50.6 49.1 51.8 51.0 50.8 51.8 51.1 49.7
datos obtenidos en el muestreo. Una tabla de 50.7 51.4 51.9 50.4 51.7 51.0 49.5 52.0
frecuencias se compone de un número finito 51.1 51.8 50.3 51.5 51.7 50.3 49.9 49.7
de intervalos continuos, todos del mismo 52.0 51.3 51.1 50.8 49.4 50.3 51.1 51.2
ancho. El número de intervalos es variable y 50.8 51.5 51.1 51.2 50.3 51.3 51.7 51.8
su elección depende de la experiencia de 51.4 51.0 51.7 50.1 52.1 51.0 52.8 51.1
quién construye la tabla. No existe consenso 49.9 50.9 50.2 51.5 51.0 50.2 49.6 51.3
51.8 50.3 50.5 51.7 51.7 50.4 49.6 51.2
por parte de los autores para determinar el
51.3 51.2 51.6 51.9 51.9 51.6 53.1 51.8
número óptimo de intervalos, pero en lo
Noviembre 2009 4
El primer paso para construir los intervalos de menor. Para motivos de nuestro ejemplo,
clase consiste en ordenar los datos de menor a comenzaremos en el dato menor.
mayor, sin eliminar ninguno de ellos.
Intervalos de Clase
Límite Límite
49.1 50.1 50.5 51.0 51.1 51.4 51.7 51.9 Clase Inferior Superior
49.4 50.2 50.6 51.0 51.2 51.4 51.7 51.9 1 49.1 49.6
49.5 50.2 50.6 51.0 51.2 51.5 51.7 51.9 2 49.6 50.1
49.6 50.3 50.7 51.0 51.2 51.5 51.8 52.0 3 50.1 50.6
4 50.6 51.1
49.6 50.3 50.8 51.1 51.2 51.5 51.8 52.0 5 51.1 51.6
49.7 50.3 50.8 51.1 51.2 51.6 51.8 52.0 6 51.6 52.1
49.7 50.3 50.8 51.1 51.3 51.6 51.8 52.1 7 52.1 52.6
49.9 50.3 50.8 51.1 51.3 51.7 51.8 52.2 8 52.6 53.1
Número de intervalos. Es atribución del A este respecto, algunos autores en apego fiel a
diseñador del experimento definir el número de la definición de intervalos expresan a los
intervalos con la recomendación de que no sean intervalos de clase en forma de intervalos
ni menos de cinco ni más de quince. No obstante, abiertos por un extremo y cerrados por el otro (el
es posible utilizar como guía las siguientes extremo cerrado o abierto es decisión del
expresiones: diseñador)2. Sin embargo, por usos y costumbres
y pensando en las representaciones gráficas de
# intervalos = 1 + 3.322 Log (80) = 7.32 los datos, se utilizan algunos recursos para evitar
esta eventualidad.
# intervalos = n = 80 = 8.94
Uno de estos recursos consiste en aprovechar la
Se conviene en establecer ocho intervalos uniformidad de los datos producto del diseño del
experimento. En nuestro caso, el muestreo arrojó
datos uniformes en el sentido de que todos ellos
Ancho del intervalo. Se define como: son compuestos por dos cifras enteras y una cifra
decimal. Se puede proceder de dos formas:
W : Ancho del Intervalo
Rango
W= 1. Iniciar los intervalos un poco antes que
# intervalos
el dato menor, por ejemplo en 49.05. Al
Para nuestro ejemplo: establecer un límite de intervalos con
una cifra decimal más, se minimiza la
4.0
W = = 0.5 probabilidad de que algún dato coincida
8 con alguna frontera. Sin embargo, el dato
mayor quedará excluido del último
Todos los intervalos medirán 0.5 cm de ancho. intervalo, por lo que se deberá aumentar
Ahora bien, el primer intervalo puede comenzar el ancho del intervalo.
justo en el dato más pequeño, aunque esto no es
regla general; si al diseñador le conviene, puede
empezar con un límite inferior menor al dato
2 Se les denomina Límites Reales de Clase.
Noviembre 2009 5
2. Aumentar el ancho de intervalo en una 49.1 50.1 50.5 51.0 51.1 51.4 51.7 51.9
cifra decimal más que la que contienen 49.4 50.2 50.6 51.0 51.2 51.4 51.7 51.9
los datos, por ejemplo, 0.55. Debe 49.5 50.2 50.6 51.0 51.2 51.5 51.7 51.9
tomarse en cuenta que en determinado 49.6 50.3 50.7 51.0 51.2 51.5 51.8 52.0
momento, la suma de los anchos de
49.6 50.3 50.8 51.1 51.2 51.5 51.8 52.0
intervalo pueden hacer coincidir un dato.
Resulta más conveniente utilizar 0.51 49.7 50.3 50.8 51.1 51.2 51.6 51.8 52.0
49.7 50.3 50.8 51.1 51.3 51.6 51.8 52.1
Intervalos de Clase 49.9 50.3 50.8 51.1 51.3 51.7 51.8 52.2
Límite Límite
Inferior Superior
49.9 50.4 50.9 51.1 51.3 51.7 51.8 52.8
Clase
1 49.10 49.61
50.1 50.4 51.0 51.1 51.3 51.7 51.9 53.1
2 49.61 50.12
3 50.12 50.63
4 50.63 51.14 Naturalmente, la suma de todas las frecuencias
5 51.14 51.65 debe coincidir con el número total de datos (n).
6 51.65 52.16
7 52.16 52.67
8 52.67 53.18 Frecuencia Relativa. Se refiere a la frecuencia
de cada una de las clases dividida entre el
Este último arreglo garantiza el cumplimiento de número total de datos (n). De aquí se deriva la
las tres características de los intervalos de clase. interpretación frecuentista de la probabilidad.
Marcas de clase. Son los puntos intermedios de F 'i : Frecuencia relativa de la i-ésima clase
cada intervalo de clase. F
F 'i = i
n
Lsup − Linf
Ti : Marca de Clase Ti =
2 Comprobando el axioma de la probabilidad para
Intervalos de Clase
variables aleatorias discretas: ∑
P( x) = 1 , la
∀X
Marcas de
Límite Límite
Clase Clase suma de todas las frecuencias relativas debe ser
Inferior Superior
1 49.10 49.61 49.36
la unidad.
2 49.61 50.12 49.87
3 50.12 50.63 50.38
4 50.63 51.14 50.89 Frecuencia Acumulada. Son los datos
5 51.14 51.65 51.40 acumulados desde el primer dato hasta la i-ésima
6 51.65 52.16 51.91
clase.
7 52.16 52.67 52.42
8 52.67 53.18 52.93
Faci : Frecuencia Acumulada de la i-ésima
clase.
Frecuencia. Es el número de datos que pertenece
a cada intervalo de clase. Este concepto coincide con el particular de
Función de Distribución o Función de
Fi : Frecuencia de la i-ésima clase Probabilidad Acumulada. Debe destacarse que la
Frecuencia Acumulada de la última clase debe
coincidir con el número total de datos (n).
Noviembre 2009 6
Frecuencia Acumulada Relativa. En la El Histograma en una gráfica de barras o
frecuencia acumulada de la clase i-ésima entre el columnas que se construye en un sistema
numero total de datos (n). coordenado en cuyo eje horizontal o de abscisas
se detallan los intervalos de clase y en el eje
F ' aci : Frecuencia Acumulada Relativa vertical o de ordenadas se ubican las frecuencias
o las frecuencias relativas.
Faci
F ' aci =
n El polígono de frecuencias es una línea
quebrada que une los puntos de intersección de la
De la misma forma, se comprueba que abscisa que corresponde a la marca de clase con
∑
∀X
P( x) = 1 ya que la frecuencia relativa de la la ordenada que puede ser la frecuencia o la
frecuencia relativa. El polígono se cierra con el
última clase, debe ser la unidad. eje horizontal al iniciarlo en el límite inferior del
primer intervalo de clase y concluirlo en el límite
La tabla completa queda de la siguiente forma: superior del última intervalo de clase.
Histograma
Polígono de
Representaciones frecuencias
Gráficas
Ojiva de frecuencias
Noviembre 2009 7
20
18
20 16
12
15
10 6
5
2
5 1
0
49 . 1 0 49. 61 50. 12 50. 63 5 1. 14 5 1. 65 52. 16 52. 67 5 3. 18
Histograma
20 20
18
16
15
12
10
6
5 5
2
1
0
49.36 49.87 50.38 50.89 51.40 51.91 52.42 52.93
Polígono de frecuencias
100
80 79 80
77
60 57
40 41
23
20
11
5
0
49.36 49.87 50.38 50.89 51.40 51.91 52.42 52.93
Ojiva de frecuencias
Noviembre 2009 8
representar de la mejor forma a los datos de los
cuales proviene. Esta representación puede
Medidas descriptivas. Estos índices permiten lograrse de varias formas.
caracterizar a las distribuciones de frecuencias
para poder hacer una interpretación acertada de
la misma.
Media Aritmética
n
En lo general, todas estas medidas pueden ser
calculadas para datos no agrupados y para datos ∑X i
n
Cuando se datos agrupados se trata, se utiliza la
donde n es el número total de datos.
información contenida en la distribución de
Para datos agrupados:
frecuencias lo que realmente implica una
simplificación, ya que se considera que todos los
datos que se ubican en un mismo intervalo de k
clase (frecuencia) son iguales y se ubican sobre
∑F T i i k
= ∑ F 'i Ti
la marca de clase respectiva. Naturalmente, esta
simplificación origina un error en los cálculos,
X= i =1
n i =1
mismo que no se considera significativo y que
puede reducirse utilizando intervalos de
confianza angostos.
Donde:
Medidas de Tendencia Central. Son aquellas Fi es la frecuencia de la i-ésima clase
medidas que nos proporcionan un dato que, con Ti es la marca de clase de la i-ésima clase
ciertos matices, puede considerarse representante
F 'i es la frecuencia relativa de la i-ésima
de los n datos obtenidos del muestreo.
clase
Media. Tradicionalmente se considera a la media k representa el total de clases de la
como un promedio aritmético de n datos. En distribución
realidad es más que esto. La media pretende
Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.
Noviembre 2009 9
En la práctica suele obtenerse a través de
Como dato representante de una muestra, la logaritmos.
media aritmética presenta el problema de los
datos ubicados en los extremos de la muestra, los
más pequeños y los más grandes, que en la
generalidad suelen ser pocos, sesgan o inducen Log (G ) =
1
[Log ( X 1 ) + Log ( X 2 ) + Log ( X 3 ) + ... + Log ( X n )]
un error en el resultado. La media aritmética n
nunca debe utilizarse por sí sola para hacer
alguna conclusión sobre la muestra, resulta Media armónica. La media armónica de una
conveniente acompañarla de alguna medida de serie de números es el recíproco de la media
dispersión como se verá más adelante. aritmética de los recíprocos de los números.
X n
Para calcular la media ponderada de n datos
(datos no agrupados) es necesario contar todos
ellos para establecer cuantos de ellos se repiten. Mediana. Es el dato que divide exactamente a la
En la práctica, esto implica ordenarlos, motivo mitad a la muestra.
por el cual no se acostumbra su cálculo en esta
modalidad. Por otra parte, como puede
observarse, la media ponderada para datos
agrupados coincide con la media aritmética para
datos agrupados, si consideramos un punto de
vista frecuentista de la probabilidad, ya que la n impar n par
frecuencia de la clase i-ésima dividida entre el
número total de datos es la probabilidad de que
un dato pertenezca a la clase respectiva, mientras
que la marca de clase representa el valor Se muestran los dos posibles casos de la mediana
específico del dato. con datos no agrupados, en el primer caso la
muestra está compuesta por un número non de
observaciones. La mediana es el dato que se
k
∑F T i i k
encuentra exactamente a la mitad de la muestra
ordenada. (de menor a mayor por ejemplo); esto
X= i =1
= ∑ F 'i Ti se puede entender considerando una balanza que
n i =1
contiene los datos; para que esté equilibrada debe
existir el mismo número de datos de cada lado,
por lo que la mediana será la que quede situada
Media geométrica. en el centro de la balanza.
X = n X 1 ⋅ X 2 ⋅ X 3 ⋅ ... ⋅ X n
Noviembre 2009 10
El segundo caso cuando la muestra está Para nuestro caso, n es par e igual a 80. De tal
compuesta por un número par de observaciones. forma:
En este caso, la mediana es el promedio de los
dos valores centrales.
X 80 + X 80
+1 X 40 + X 41 51.1 + 51.1
Para su cálculo como dato no agrupado es med = 2 2
= = = 51.1
necesario ordenar los datos en forma descendente 2 2 2
o ascendente y atender la siguiente regla, de
acuerdo a la naturaleza del número total de datos
n: Para su cálculo como dato agrupado, la mediana
se obtiene determinando cual es la clase que
Si n es impar: med = X n +1 incluye a la mediana, la cual se distingue porque
tiene una frecuencia acumulada relativa mayor o
2
igual a 0.5 (50% de los datos).
Fac
n Fk
2
F’ack-1
Med
Linfk Lsupk
Noviembre 2009 11
para nuestro ejemplo, la clase mediana (o la que
A partir de una interpolación lineal, se utiliza la incluye a la mediana) es la clase 4, ya que su
ecuación de la recta: frecuencia acumulada relativa es de 0.51. De tal
forma:
y = y0 + m( x − x0 )
⎛ 80 ⎞
⎜ − 23 ⎟
de acuerdo con la anterior figura:
med = 50.63 + ⎜ 2 ⎟(0.51) = 51.11
⎜ 18 ⎟
f 'k ⎜ ⎟
y = 0.5 y = F ' ack −1 m= ⎝ ⎠
w
x = med x 0 = Liminf Moda. Es el elemento de la muestra que más se
repite. Una muestra puede tener una o más
donde: modas. Cuando todos los elementos de la
muestra son diferentes, no tiene sentido hablar de
k : Clase donde se ubica a la mediana ella.
F ' ack : Frecuencia acumulada relativa de
Para datos no agrupados, la moda se determina
la clase anterior a la en que se encuentra la por inspección, mientras que para datos
mediana agrupados se puede aproximar con la marca de
f 'k : frecuencia de la clase donde se ubica clase del intervalo de la clase modal, que es la
la median que tenga la mayor frecuencia.
w : ancho del intervalo
Liminf : Límite inferior de la clase donde se En algunos casos se puede mejorar la
aproximación considerando que la moda es la
ubica la mediana.
abscisa del máximo de una curva hipotética que
pasa por las marcas de clase, como se observa:
Sustituyendo los valores:
f 'k R S
0.5 = F ' ac k −1 + (me − Lminf )
w P
D1 E F D2
despejando: T
med = Liminf +
w
(0.5 − F ' ac k −1 ) Q
f 'k
Noviembre 2009 12
De acuerdo con lo anterior, se puede considerar Medidas de dispersión. Estas medidas reflejan
que la moda debe pertenecer al intervalo de clase la separación o alejamiento de los elementos de
con máxima frecuencia, pero proporcionalmente una muestra. Estas medidas deben acompañar a
más cercano al intervalo adyacente que le siga en las medidas de tendencia central, particularmente
frecuencia, de esta manera se puede plantear la a la media, para evitar los efectos que los datos
proporción (triángulos semejantes): extremos tienen sobre ellas.
(Mod − Linf )D2 = (Lsup − Mod )D1 Varianza. Tal y como la define la probabilidad,
la varianza de una variable aleatoria es el
Mod (D1 − D2 ) = Linf D2 + Lsup D1 segundo momento de la misma con respecto a la
media. Asimismo, se interpreta de la misma
Si: w = Lsup − Linf ⎯
⎯→ Lsup = Linf + w forma, como un promedio de las distancias de
cada dato hacia la media.
sustituyendo
Momentos para datos no agrupados:
Mod (D1 − D2 ) = Linf D2 + (Linf + w)D1 k
∑ (X i − X )
n
1
mk =
L (D + D2 ) + wD1 n i =1
Mod = inf 1
D1 + D2 Momentos para datos agrupados:
Fi (Ti − X )
r
1
mk = ∑
k 3
⎛ D1 ⎞
Mod = Linf + ⎜⎜ ⎟⎟ w n i =1
⎝ D1 + D2 ⎠
Para datos no agrupados la varianza se define
como:
donde: 2
∑ (X −X)
n
Linf : Límite inferior de la clase modal i
w : ancho del intervalo σ = 2 i =1
∑ (X −X)
n n
− 2X i X + X
número 6. Dado lo anterior: 2 2
i i
σ =
2 i =1
= i =1
n n
⎛ 4 ⎞
mod = 51.65 + ⎜ ⎟(0.51) = 51.7 n n n
⎝ 4 + 18 ⎠ ∑ X i2 − 2 X ∑ X i + n X ∑X
2
i
1 n
σ = i =1 i =1
= ∑ X i2 − 2 X i =1
+X
2 2
Noviembre 2009 13
n Desviación media. Ciertos autores opinan que
∑X
i =1
i para obtener el promedio de las distancias de
ya que X = sustituyendo cada dato con respecto a la media debe obtenerse
n el valor absoluto de la distancia entre ambos
puntos y después obtenerse su promedio. De tal
1 forma, la desviación media (para datos no
σ2 = ∑ X i2 − 2 X − X
2 2
agrupados) se define como:
n
n
∑X i −X
1 n
Desviación Media = i =1
σ2 = ∑ X i2 − X
2
n
n i =1
Asimismo, algunos autores utilizan como
referencia a la mediana en lugar de la media.
Para datos agrupados:
n
∑X i − med
σ 2 = ∑ Fi (Ti − X ) = ∑ F ' i (Ti − X ) Desviación Media =
1 r 2
r
2 i =1
n i =1 n
i =1
Noviembre 2009 14
Esto implica que debe cumplirse la Datos no agrupados: α 3 = − 0.28
siguiente relación:
X = med = mod
Datos agrupados: α 3 = − 0.2382
α3 > 0 α4 =
m4
=
m4
(m2 ) 2
(σ )
2 2
m4 m4
α4 = −3= −3
(m2 ) 2
(σ )
2 2
4 Kurtosis en Inglés
Noviembre 2009 15
El lector deberá estar atento a esta situación, ya Fractiles. Si una serie de datos que se colocan en
que la gran mayoría de los programas de orden de magnitud, el valor medio (o la media
computadoras realizan su comparación contra el aritmética de los dos valores medios) que divide
cero. al conjunto de datos en dos partes iguales es la
mediana. Por extensión, de esta idea se puede
La interpretación es la siguiente: pensar en aquellos valores que dividen a los
datos en cuatro partes iguales. Estos valores se
llaman primero, segundo y tercer cuartíl,
Si α 4 = 0 (o tres), se trata de una respectivamente; el segundo cuartíl corresponde
distribución mesocúrtica. a la mediana de la distribución.
Si α 4 > 0 (o tres), se trata de una Análogamente, los valores que dividen a la
distribución Leptocúrtica (o puntiaguda). distribución en diez partes iguales se denominan
Si α 4 < 0 (o tres), se trata de una deciles, mientras que aquellos que lo hacen en
distribución Platicúrtica (o aplastada). cien partes iguales se llaman percentiles.
corresponden a la mediana.
Para nuestro ejemplo:
El cálculo de los fractiles es bajo el mismo
Para datos no agrupados: α = − 0.1121
4
procedimiento utilizado para la mediana.
Para datos agrupados: α = − 0.4986
4
⎛ n ⋅ fracción − Fac k −1 ⎞
Fractil = Liminf + ⎜⎜ ⎟⎟ w
⎝ Fk ⎠
donde:
Noviembre 2009 16
Asimismo, si se restan el tercer y primer cuartíl
Liminf : Límite inferior de la clase en que estaremos acotando el 50% de la distribución,
se ubica el fractil buscado. pero centrada en torno a la mediana. A esta
n: Total de datos de la distribución. distancia se le conoce como distancia
intercuartílica.
fracción : Porcentaje de la muestra
buscado. Análogamente, a la diferencia entre el noveno y
Fack −1 : Frecuencia acumulada de la clase el primer decíl se le conoce como distancia
anterior a aquella en que se ubica interdecílica y acta al 80% de la población
el fractil buscado. centrada en torno a la mediana.
Fk : Frecuencia de la clase en la cual
Para el ejemplo desarrollado, los cálculos son los
se ubica el fractil buscado.
siguientes:
w: Ancho del intervalo.
Primer cuartíl (ubicado en la tercera clase)
El procedimiento es análogo al utilizado para
⎡ (80 )(.25) − 11⎤
calcular la mediana. Con auxilio de la frecuencia
Q1 = 50.12 + ⎢ ⎥⎦ (0.51) = 50.5025
acumulada relativa debe ubicarse la clase en la
cual se ubica el fractil buscado. ⎣ 12
Noviembre 2009 17
Como conclusión de este capítulo, se muestra
una tabla resumen con las medidas descriptivas
del ejemplo que se ha desarrollado a lo largo del
mismo.
Datos Datos
no agrupados Agrupados
n 80
Rango 4.0
Sturges 7.32
n 8.94
media= 51.0625 media= 51.0571
mediana= mediana= 51.1117
moda= moda= 51.7427
Varianza= 0.6308 Varianza= 0.6564
Desv. Est.= 0.7943 Desv. Est.= 0.8102
Asimetría= -0.2800 Asimetría= -0.2382
Apuntamiento= -0.1121 Apuntamiento= -0.4986
Primer cuartil= 50.4750 Primer cuartil= 50.5025
Tercer cuartil= 51.7000 Tercer cuartil= 51.7265
Primer decil= 49.9000 Primer decil= 49.8650
Noveno decil= 51.9 Noveno decil= 52.0325
Bibliografía
Captura y Edición:
M.A. María Torres Hernández.
Noviembre 2009 18