Está en la página 1de 18

Análisis estadístico de datos muestrales

M. en A. Víctor D. Pinilla Morán


Facultad de Ingeniería, UNAM

Resumen

Representación de los datos de una muestra: tablas de frecuencias,


frecuencias relativas y frecuencias relativas acumuladas.

Representación gráfica de dichas tablas: Histogramas y polígonos de


frecuencias. Analogías de estos polígonos con las funciones de
probabilidad según el concepto frecuentista de la probabilidad:
distribuciones empíricas de probabilidad.

Medidas de tendencia central, de dispersión de la muestra, de sesgo y


aplanamiento de la muestra, cuando los datos de ella están o no
agrupados. Analogía de estas medidas con las correspondientes a la
función de probabilidad de la variable aleatoria discreta.

1.1 La población y la muestra. Relación entre De esta definición pueden percibirse dos grandes
la probabilidad y la estadística. áreas de acción de la Estadística, la Descriptiva y
Clasificaciones de la estadística. la Inferencial.

Estadística: En el lenguaje común es conocida Estadística Descriptiva. Se refiere a aquella


como un conjunto de datos. Se refiere a un parte del estudio que incluye la obtención,
conjunto de métodos para manejar la obtención, organización, presentación y descripción de la
presentación y el análisis de observaciones información numérica.
numéricas. Sus fines son: Describir al conjunto
de datos obtenidos y tomar decisiones, o bien, Estadística Inferencial. Es una técnica de la
realizar generalizaciones acerca de las cual se obtienen generalizaciones o se toman
características de todas las posibles decisiones con base a información parcial o
observaciones bajo consideración. incompleta obtenida mediante técnicas
descriptivas.

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 1
Es necesario determinar que todas las ciencias Las Poblaciones se clasifican en función a su
sin importar la disciplina tienen como cardinalidad.
denominador común al método científico, por
ende, la Estadística al ser una herramienta Población Finita. Es aquella que incluye un
necesaria ara el método científico, forma parte número limitado de medidas y observaciones.
también de todas las ciencias.
Población Infinita. Es aquella que por incluir un
Desde el punto de vista de la naturaleza de la gran número de medidas y observaciones no es
información manipulada, la Estadística puede posible determinar la cantidad de éstas.
clasificarse como Paramétrica y No Paramétrica.
En lo general, las características medibles de una
Estadística Paramétrica. Son todas aquellas población son denominadas Parámetros.
técnicas y herramientas estadísticas que utilizan
variables cuantitativas, es decir, medibles. Muestra. Conjunto de observaciones o medidas
tomadas a partir de una población dada, es decir,
Estadística No Paramétrica. Son todas aquellas es un subconjunto de la población. Desde luego,
técnicas y herramientas estadísticas que utilizan la cardinalidad de la muestra depende de la
variables cualitativas. cardinalidad de la población. Las muestras deben
ser representativas para evitar un sesgo u error.
Desde el punto de vista del número de variables
sobre las cuales se basa el análisis matemático Estadísticos Muestrales1. En lo general, son las
respectivo, siendo la estadística univariable la características medibles de una muestra
que utiliza una sola variable, mientras que la
estadística multivariable analiza dos o más El muestreo es la técnica seguida para obtener o
variables. extraer una muestra. Su ventaja radica en que
nos permite conocer, con un grado de
Población. Conjunto de todas las posibles aproximación aceptable, a partir de sus
observaciones. Sinónimo de Conjunto Universal características, las características propias de la
se le define como la totalidad de todas las población de la cual proviene. Esto resulta
posibles mediciones observables, bajo
consideración en una situación dada por
determinado problema, circunstancias diferentes 1 En la literatura suelen denominarse por
implican situaciones diferentes. igual estadísticos o estadísticas a las
características de las muestras.
Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 2
invaluable, tomando en cuenta que en la mayoría Muestreo Estratificado. Esta técnica implica
de los casos, las características de las muestras dividir a la población en clases o grupos
son desconocidas. denominados Estratos. Se supone que las
unidades que componen al estrato, son
El sesgo es la diferencia que existe entre los relativamente homogéneas, con respecto a las
datos obtenidos a través de una muestra y los características que vayan a estudiarse. A menudo
datos reales (normalmente desconocidos) se toma una razón de muestreo igual para todos
pertenecientes a la población. Puede interpretarse los estratos generalmente en proporción; a una
como un error absoluto entre un valor real y uno muestra seleccionada así, se le llama Muestra
aproximado. Cuando se denomina como sesgado Estratificada Proporcional. (Se estudia sólo el
a determinado resultado se pretende establecer estrato)
que su valor es diferente al real.
Cuando la proporción de rastreo está
Las técnicas de muestreo pueden clasificarse de directamente relacionada con la homogeneidad
la siguiente forma: es decir entre más homogéneo sea el estrato
menor será su proporción incluida en la muestra.
A una muestra obtenida de esta forma se le
denomina: Muestra estratificada
Desproporcionada. (De una población normal se
toma una muestra proporcional)

Muestreo por Conglomerados. Este


procedimiento implica la selección de grupos
(conglomerados) a partir de la población, las
diferencias entre conglomerados son
generalmente pequeñas, aunque internamente sus
unidades son heterogéneas. Cada conglomerado
es una miniatura de la población.

Muestreo Probabilístico. Es aquel en donde en Muestreo sistemático. Se selecciona una


la elección de una muestra interviene el azar. muestra tomada cada k-ésima unidad de la
población a la vez, una vez que las unidades de
Muestreo No Probabilístico. Es aquel en donde la población están arregladas de alguna forma. k,
en la selección de una muestra no interviene el es la razón del muestreo. (En el metro, preguntar
azar. a cada 5 personas que pasan.)

Muestreo Aleatorio Simple. Cada uno de los


componentes de la muestra tienen la misma
probabilidad de ser elegido. Puede ser:

Con Reemplazo logra un número infinito


de las muestras, lo que asegura la
independencia estadística entre ellas.

Sin Reemplazo logra un número finito de


las muestras las cuales son
estadísticamente dependientes.

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 3
1.2 Estadística descriptiva. general se coincide que no sean tan pocos
que no resulte apropiada la agrupación de
Representación de los datos de una datos ni tantos que la haga poco práctica. En
muestra. La Estadística Descriptiva se general, se recomienda que el número de
encarga de la obtención, organización, intervalos no sea ni menor de cinco ni mayor
representación y descripción de los datos. a quince.

La obtención de los datos se logra a través de Por otra parte, ciertos autores han establecido
las técnicas de muestreo, conforme al diseño algunas reglas matemáticas para determinar
del experimento seleccionado. el número de intervalos. Dos de ellas son:

Como se podrá observar más adelante, Ley de Sturges: # intervalos = 1 +


existen expresiones que permiten trabajar 3.322 Log (n)
con la totalidad de los datos de la muestra; al # intervalos = n
arreglo que utiliza la totalidad de los datos se
le conoce como datos no agrupados. En ambos casos, n es el número total de
datos.
Antes de la evolución tecnológica o bien,
cuando los recursos de cómputo son Lo que resulta importante, más que
limitados, trabajar con un número alto de determinar el número de intervalos, es que
datos resulta complicado. Por tal motivo, se estos cumplan con una serie de
conformó un arreglo de datos basado en características:
intervalos conocido como tabla de
frecuencias. Cuando se utiliza la tabla de 1. Todos los intervalos deben tener el
frecuencias se dice que se trabaja con datos mismo ancho.
agrupados. 2. Un dato sólo puede pertenecer a un
solo intervalo.
Ahora bien, con el avance en los recursos de 3. No debe haber intervalos vacíos.
cómputo resulta ahora de lo más sencillo
trabajar con datos no agrupados, lo que evita Ilustremos lo anterior con un ejemplo.
errores numéricos y los propios ocasionados
por el agrupamiento de los datos en las tablas Ejemplo. Los siguientes datos corresponden
de frecuencia. No obstante, las tablas de a 80 mediciones de la longitud de un
frecuencias son necesarias para construir las travesaño parte de un chasis. Sus
representaciones gráficas de las muestras. dimensiones son en centímetros.

Intervalos de clase. Se refiere a los 50.1 50.6 51.1 50.8 52.2 51.9 51.2 52.0
intervalos en los cuales serán agrupados los n 50.6 49.1 51.8 51.0 50.8 51.8 51.1 49.7
datos obtenidos en el muestreo. Una tabla de 50.7 51.4 51.9 50.4 51.7 51.0 49.5 52.0
frecuencias se compone de un número finito 51.1 51.8 50.3 51.5 51.7 50.3 49.9 49.7
de intervalos continuos, todos del mismo 52.0 51.3 51.1 50.8 49.4 50.3 51.1 51.2
ancho. El número de intervalos es variable y 50.8 51.5 51.1 51.2 50.3 51.3 51.7 51.8
su elección depende de la experiencia de 51.4 51.0 51.7 50.1 52.1 51.0 52.8 51.1
quién construye la tabla. No existe consenso 49.9 50.9 50.2 51.5 51.0 50.2 49.6 51.3
51.8 50.3 50.5 51.7 51.7 50.4 49.6 51.2
por parte de los autores para determinar el
51.3 51.2 51.6 51.9 51.9 51.6 53.1 51.8
número óptimo de intervalos, pero en lo

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 4
El primer paso para construir los intervalos de menor. Para motivos de nuestro ejemplo,
clase consiste en ordenar los datos de menor a comenzaremos en el dato menor.
mayor, sin eliminar ninguno de ellos.
Intervalos de Clase
Límite Límite
49.1 50.1 50.5 51.0 51.1 51.4 51.7 51.9 Clase Inferior Superior
49.4 50.2 50.6 51.0 51.2 51.4 51.7 51.9 1 49.1 49.6
49.5 50.2 50.6 51.0 51.2 51.5 51.7 51.9 2 49.6 50.1
49.6 50.3 50.7 51.0 51.2 51.5 51.8 52.0 3 50.1 50.6
4 50.6 51.1
49.6 50.3 50.8 51.1 51.2 51.5 51.8 52.0 5 51.1 51.6
49.7 50.3 50.8 51.1 51.2 51.6 51.8 52.0 6 51.6 52.1
49.7 50.3 50.8 51.1 51.3 51.6 51.8 52.1 7 52.1 52.6
49.9 50.3 50.8 51.1 51.3 51.7 51.8 52.2 8 52.6 53.1

49.9 50.4 50.9 51.1 51.3 51.7 51.8 52.8


50.1 50.4 51.0 51.1 51.3 51.7 51.9 53.1 Puede observarse que tanto el dato menor como
el mayor son incluidos en algún intervalo; sin
Rango. Es la diferencia entre el dato mayor y el embargo, se produce un conflicto ya que algunos
menor. datos coinciden con las fronteras compartidas de
los intervalos, lo cual no satisface la segunda
Rango = 53.1 – 49.1 = 4.0 característica de los intervalos de clase.

Número de intervalos. Es atribución del A este respecto, algunos autores en apego fiel a
diseñador del experimento definir el número de la definición de intervalos expresan a los
intervalos con la recomendación de que no sean intervalos de clase en forma de intervalos
ni menos de cinco ni más de quince. No obstante, abiertos por un extremo y cerrados por el otro (el
es posible utilizar como guía las siguientes extremo cerrado o abierto es decisión del
expresiones: diseñador)2. Sin embargo, por usos y costumbres
y pensando en las representaciones gráficas de
# intervalos = 1 + 3.322 Log (80) = 7.32 los datos, se utilizan algunos recursos para evitar
esta eventualidad.
# intervalos = n = 80 = 8.94
Uno de estos recursos consiste en aprovechar la
Se conviene en establecer ocho intervalos uniformidad de los datos producto del diseño del
experimento. En nuestro caso, el muestreo arrojó
datos uniformes en el sentido de que todos ellos
Ancho del intervalo. Se define como: son compuestos por dos cifras enteras y una cifra
decimal. Se puede proceder de dos formas:
W : Ancho del Intervalo
Rango
W= 1. Iniciar los intervalos un poco antes que
# intervalos
el dato menor, por ejemplo en 49.05. Al
Para nuestro ejemplo: establecer un límite de intervalos con
una cifra decimal más, se minimiza la
4.0
W = = 0.5 probabilidad de que algún dato coincida
8 con alguna frontera. Sin embargo, el dato
mayor quedará excluido del último
Todos los intervalos medirán 0.5 cm de ancho. intervalo, por lo que se deberá aumentar
Ahora bien, el primer intervalo puede comenzar el ancho del intervalo.
justo en el dato más pequeño, aunque esto no es
regla general; si al diseñador le conviene, puede
empezar con un límite inferior menor al dato
2 Se les denomina Límites Reales de Clase.

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 5
2. Aumentar el ancho de intervalo en una 49.1 50.1 50.5 51.0 51.1 51.4 51.7 51.9
cifra decimal más que la que contienen 49.4 50.2 50.6 51.0 51.2 51.4 51.7 51.9
los datos, por ejemplo, 0.55. Debe 49.5 50.2 50.6 51.0 51.2 51.5 51.7 51.9
tomarse en cuenta que en determinado 49.6 50.3 50.7 51.0 51.2 51.5 51.8 52.0
momento, la suma de los anchos de
49.6 50.3 50.8 51.1 51.2 51.5 51.8 52.0
intervalo pueden hacer coincidir un dato.
Resulta más conveniente utilizar 0.51 49.7 50.3 50.8 51.1 51.2 51.6 51.8 52.0
49.7 50.3 50.8 51.1 51.3 51.6 51.8 52.1
Intervalos de Clase 49.9 50.3 50.8 51.1 51.3 51.7 51.8 52.2
Límite Límite
Inferior Superior
49.9 50.4 50.9 51.1 51.3 51.7 51.8 52.8
Clase
1 49.10 49.61
50.1 50.4 51.0 51.1 51.3 51.7 51.9 53.1
2 49.61 50.12
3 50.12 50.63
4 50.63 51.14 Naturalmente, la suma de todas las frecuencias
5 51.14 51.65 debe coincidir con el número total de datos (n).
6 51.65 52.16
7 52.16 52.67
8 52.67 53.18 Frecuencia Relativa. Se refiere a la frecuencia
de cada una de las clases dividida entre el
Este último arreglo garantiza el cumplimiento de número total de datos (n). De aquí se deriva la
las tres características de los intervalos de clase. interpretación frecuentista de la probabilidad.

Marcas de clase. Son los puntos intermedios de F 'i : Frecuencia relativa de la i-ésima clase
cada intervalo de clase. F
F 'i = i
n
Lsup − Linf
Ti : Marca de Clase Ti =
2 Comprobando el axioma de la probabilidad para

Intervalos de Clase
variables aleatorias discretas: ∑
P( x) = 1 , la
∀X
Marcas de
Límite Límite
Clase Clase suma de todas las frecuencias relativas debe ser
Inferior Superior
1 49.10 49.61 49.36
la unidad.
2 49.61 50.12 49.87
3 50.12 50.63 50.38
4 50.63 51.14 50.89 Frecuencia Acumulada. Son los datos
5 51.14 51.65 51.40 acumulados desde el primer dato hasta la i-ésima
6 51.65 52.16 51.91
clase.
7 52.16 52.67 52.42
8 52.67 53.18 52.93
Faci : Frecuencia Acumulada de la i-ésima
clase.
Frecuencia. Es el número de datos que pertenece
a cada intervalo de clase. Este concepto coincide con el particular de
Función de Distribución o Función de
Fi : Frecuencia de la i-ésima clase Probabilidad Acumulada. Debe destacarse que la
Frecuencia Acumulada de la última clase debe
coincidir con el número total de datos (n).

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 6
Frecuencia Acumulada Relativa. En la El Histograma en una gráfica de barras o
frecuencia acumulada de la clase i-ésima entre el columnas que se construye en un sistema
numero total de datos (n). coordenado en cuyo eje horizontal o de abscisas
se detallan los intervalos de clase y en el eje
F ' aci : Frecuencia Acumulada Relativa vertical o de ordenadas se ubican las frecuencias
o las frecuencias relativas.
Faci
F ' aci =
n El polígono de frecuencias es una línea
quebrada que une los puntos de intersección de la
De la misma forma, se comprueba que abscisa que corresponde a la marca de clase con

∀X
P( x) = 1 ya que la frecuencia relativa de la la ordenada que puede ser la frecuencia o la
frecuencia relativa. El polígono se cierra con el
última clase, debe ser la unidad. eje horizontal al iniciarlo en el límite inferior del
primer intervalo de clase y concluirlo en el límite
La tabla completa queda de la siguiente forma: superior del última intervalo de clase.

Intervalos de Clase Frecuencia


Marcas de Frecuencia Frecuencia
Clase Límite Límite Frecuencia Acumulada
Clase Relativa Acumulada
Inferior Superior Relativa
1 49.10 49.61 49.36 5 0.06 5 0.06
2 49.61 50.12 49.87 6 0.08 11 0.14
3 50.12 50.63 50.38 12 0.15 23 0.29
4 50.63 51.14 50.89 18 0.23 41 0.51
5 51.14 51.65 51.40 16 0.20 57 0.71
6 51.65 52.16 51.91 20 0.25 77 0.96
7 52.16 52.67 52.42 2 0.03 79 0.99
8 52.67 53.18 52.93 1 0.01 80 1.00
Σ 80 1.00

Cuando un polígono se dibuja sobre un


Esta tabla se conoce como Distribución de histograma de la misma distribución, la línea
Frecuencias. quebrada une los centros de las bases superiores
de los rectángulos del histograma.
Representación gráfica de la distribución de
frecuencias. Una forma muy rápida y efectiva de Las ojivas de frecuencias son líneas quebradas
interpretar la información contenida en una que se trazan por los puntos de intersección de
distribución de frecuencias consiste en graficar las coordenadas que corresponden a las marcas
sus elementos. de clase y sus respectivas frecuencias
acumuladas o frecuencias acumuladas relativas.
Básicamente existen tres tipos de
representaciones:

Histograma

Polígono de
Representaciones frecuencias
Gráficas
Ojiva de frecuencias

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 7
20
18
20 16

12
15

10 6
5

2
5 1

0
49 . 1 0 49. 61 50. 12 50. 63 5 1. 14 5 1. 65 52. 16 52. 67 5 3. 18

Histograma

20 20
18
16
15

12
10

6
5 5

2
1
0
49.36 49.87 50.38 50.89 51.40 51.91 52.42 52.93

Polígono de frecuencias

100

80 79 80
77

60 57

40 41

23
20
11
5
0
49.36 49.87 50.38 50.89 51.40 51.91 52.42 52.93

Ojiva de frecuencias

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 8
representar de la mejor forma a los datos de los
cuales proviene. Esta representación puede
Medidas descriptivas. Estos índices permiten lograrse de varias formas.
caracterizar a las distribuciones de frecuencias
para poder hacer una interpretación acertada de
la misma.

Media Aritmética
n
En lo general, todas estas medidas pueden ser
calculadas para datos no agrupados y para datos ∑X i

agrupados. Para datos no agrupados: X = i =1

n
Cuando se datos agrupados se trata, se utiliza la
donde n es el número total de datos.
información contenida en la distribución de
Para datos agrupados:
frecuencias lo que realmente implica una
simplificación, ya que se considera que todos los
datos que se ubican en un mismo intervalo de k
clase (frecuencia) son iguales y se ubican sobre
∑F T i i k
= ∑ F 'i Ti
la marca de clase respectiva. Naturalmente, esta
simplificación origina un error en los cálculos,
X= i =1

n i =1
mismo que no se considera significativo y que
puede reducirse utilizando intervalos de
confianza angostos.
Donde:
Medidas de Tendencia Central. Son aquellas Fi es la frecuencia de la i-ésima clase
medidas que nos proporcionan un dato que, con Ti es la marca de clase de la i-ésima clase
ciertos matices, puede considerarse representante
F 'i es la frecuencia relativa de la i-ésima
de los n datos obtenidos del muestreo.
clase
Media. Tradicionalmente se considera a la media k representa el total de clases de la
como un promedio aritmético de n datos. En distribución
realidad es más que esto. La media pretende
Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 9
En la práctica suele obtenerse a través de
Como dato representante de una muestra, la logaritmos.
media aritmética presenta el problema de los
datos ubicados en los extremos de la muestra, los
más pequeños y los más grandes, que en la
generalidad suelen ser pocos, sesgan o inducen Log (G ) =
1
[Log ( X 1 ) + Log ( X 2 ) + Log ( X 3 ) + ... + Log ( X n )]
un error en el resultado. La media aritmética n
nunca debe utilizarse por sí sola para hacer
alguna conclusión sobre la muestra, resulta Media armónica. La media armónica de una
conveniente acompañarla de alguna medida de serie de números es el recíproco de la media
dispersión como se verá más adelante. aritmética de los recíprocos de los números.

Media Ponderada. A diferencia del promedio 1 n


aritmético, el promedio ponderado toma en X= n
= n
1 1 1
cuenta la existencia de los elementos además de ∑
n i =1 X i
∑n
i =1
su valor a promediar. Es decir, al tomar en
cuenta el número de elementos repetidos
minimiza la posibilidad de uno o dos datos en la práctica se utiliza:
extremos modifiquen dramáticamente el
resultado. La media ponderada corresponde n
1
directamente al valor esperado o esperanza
1
∑X
i =1
matemática estudiado en Probabilidad. = i

X n
Para calcular la media ponderada de n datos
(datos no agrupados) es necesario contar todos
ellos para establecer cuantos de ellos se repiten. Mediana. Es el dato que divide exactamente a la
En la práctica, esto implica ordenarlos, motivo mitad a la muestra.
por el cual no se acostumbra su cálculo en esta
modalidad. Por otra parte, como puede
observarse, la media ponderada para datos
agrupados coincide con la media aritmética para
datos agrupados, si consideramos un punto de
vista frecuentista de la probabilidad, ya que la n impar n par
frecuencia de la clase i-ésima dividida entre el
número total de datos es la probabilidad de que
un dato pertenezca a la clase respectiva, mientras
que la marca de clase representa el valor Se muestran los dos posibles casos de la mediana
específico del dato. con datos no agrupados, en el primer caso la
muestra está compuesta por un número non de
observaciones. La mediana es el dato que se
k

∑F T i i k
encuentra exactamente a la mitad de la muestra
ordenada. (de menor a mayor por ejemplo); esto
X= i =1
= ∑ F 'i Ti se puede entender considerando una balanza que
n i =1
contiene los datos; para que esté equilibrada debe
existir el mismo número de datos de cada lado,
por lo que la mediana será la que quede situada
Media geométrica. en el centro de la balanza.

X = n X 1 ⋅ X 2 ⋅ X 3 ⋅ ... ⋅ X n

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 10
El segundo caso cuando la muestra está Para nuestro caso, n es par e igual a 80. De tal
compuesta por un número par de observaciones. forma:
En este caso, la mediana es el promedio de los
dos valores centrales.
X 80 + X 80
+1 X 40 + X 41 51.1 + 51.1
Para su cálculo como dato no agrupado es med = 2 2
= = = 51.1
necesario ordenar los datos en forma descendente 2 2 2
o ascendente y atender la siguiente regla, de
acuerdo a la naturaleza del número total de datos
n: Para su cálculo como dato agrupado, la mediana
se obtiene determinando cual es la clase que
Si n es impar: med = X n +1 incluye a la mediana, la cual se distingue porque
tiene una frecuencia acumulada relativa mayor o
2
igual a 0.5 (50% de los datos).

Xn +Xn Para obtener una expresión que permita su


+1
cálculo, a partir de la ojiva de frecuencias
Si n es par: med =
2 2

2 acumuladas relativas se puede aproximar su


mediana trazando una línea horizontal a partir de
Como puede observarse, cuando el número de la ordenada 0.5 (o 50%) hasta cortar la gráfica y
elementos es par no hay un valor que se en dicho punto localizar el correspondiente en el
encuentre exactamente a la mitad de la muestra; eje de las abscisas.
en este caso se pueden promediar los dos valores
más cercanos a la mitad.

Fac

n Fk
2

F’ack-1

Med
Linfk Lsupk

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 11
para nuestro ejemplo, la clase mediana (o la que
A partir de una interpolación lineal, se utiliza la incluye a la mediana) es la clase 4, ya que su
ecuación de la recta: frecuencia acumulada relativa es de 0.51. De tal
forma:
y = y0 + m( x − x0 )
⎛ 80 ⎞
⎜ − 23 ⎟
de acuerdo con la anterior figura:
med = 50.63 + ⎜ 2 ⎟(0.51) = 51.11
⎜ 18 ⎟
f 'k ⎜ ⎟
y = 0.5 y = F ' ack −1 m= ⎝ ⎠
w
x = med x 0 = Liminf Moda. Es el elemento de la muestra que más se
repite. Una muestra puede tener una o más
donde: modas. Cuando todos los elementos de la
muestra son diferentes, no tiene sentido hablar de
k : Clase donde se ubica a la mediana ella.
F ' ack : Frecuencia acumulada relativa de
Para datos no agrupados, la moda se determina
la clase anterior a la en que se encuentra la por inspección, mientras que para datos
mediana agrupados se puede aproximar con la marca de
f 'k : frecuencia de la clase donde se ubica clase del intervalo de la clase modal, que es la
la median que tenga la mayor frecuencia.
w : ancho del intervalo
Liminf : Límite inferior de la clase donde se En algunos casos se puede mejorar la
aproximación considerando que la moda es la
ubica la mediana.
abscisa del máximo de una curva hipotética que
pasa por las marcas de clase, como se observa:
Sustituyendo los valores:

f 'k R S
0.5 = F ' ac k −1 + (me − Lminf )
w P
D1 E F D2

despejando: T
med = Liminf +
w
(0.5 − F ' ac k −1 ) Q
f 'k

No obstante, por motivos generalistas, resulta


mejor expresar a la mediana en función de
frecuencias absolutas en lugar de relativas:
X
mod
Linf Lsup
⎛n ⎞
⎜ − Fac k −1 ⎟
med = Liminf +⎜ 2 ⎟w
⎜ Fk ⎟
⎜ ⎟
⎝ ⎠

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 12
De acuerdo con lo anterior, se puede considerar Medidas de dispersión. Estas medidas reflejan
que la moda debe pertenecer al intervalo de clase la separación o alejamiento de los elementos de
con máxima frecuencia, pero proporcionalmente una muestra. Estas medidas deben acompañar a
más cercano al intervalo adyacente que le siga en las medidas de tendencia central, particularmente
frecuencia, de esta manera se puede plantear la a la media, para evitar los efectos que los datos
proporción (triángulos semejantes): extremos tienen sobre ellas.

La medida de dispersión más sencilla es el


EP PF Mod − Linf Lsup − Mod Rango, amplitud o recorrido, que como ya se
= ⎯
⎯→ = mencionó es la diferencia entre el dato mayor y
RQ ST D1 D2 del menor.

(Mod − Linf )D2 = (Lsup − Mod )D1 Varianza. Tal y como la define la probabilidad,
la varianza de una variable aleatoria es el
Mod (D1 − D2 ) = Linf D2 + Lsup D1 segundo momento de la misma con respecto a la
media. Asimismo, se interpreta de la misma
Si: w = Lsup − Linf ⎯
⎯→ Lsup = Linf + w forma, como un promedio de las distancias de
cada dato hacia la media.
sustituyendo
Momentos para datos no agrupados:
Mod (D1 − D2 ) = Linf D2 + (Linf + w)D1 k

∑ (X i − X )
n
1
mk =
L (D + D2 ) + wD1 n i =1
Mod = inf 1
D1 + D2 Momentos para datos agrupados:

Fi (Ti − X )
r
1
mk = ∑
k 3
⎛ D1 ⎞
Mod = Linf + ⎜⎜ ⎟⎟ w n i =1
⎝ D1 + D2 ⎠
Para datos no agrupados la varianza se define
como:
donde: 2

∑ (X −X)
n
Linf : Límite inferior de la clase modal i
w : ancho del intervalo σ = 2 i =1

D1 :diferencia de las frecuencias de la n


clase modal y la premodal
Esta fórmula puede expresarse de una forma más
D2 : diferencia de las frecuencias de la clase
sencilla a partir del desarrollo del binomio al
modal y la postmodal cuadrado:
para nuestro ejemplo, la clase modal es la
∑ (X )
2

∑ (X −X)
n n
− 2X i X + X
número 6. Dado lo anterior: 2 2
i i
σ =
2 i =1
= i =1

n n
⎛ 4 ⎞
mod = 51.65 + ⎜ ⎟(0.51) = 51.7 n n n
⎝ 4 + 18 ⎠ ∑ X i2 − 2 X ∑ X i + n X ∑X
2
i
1 n
σ = i =1 i =1
= ∑ X i2 − 2 X i =1
+X
2 2

A partir de la inspección de la muestra, el dato n n i =1 n


que más se repite es 51.1 con siete repeticiones.
3 En este caso r representa el total de clases, haciendo

una distinción con k, que es el orden del momento.

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 13
n Desviación media. Ciertos autores opinan que
∑X
i =1
i para obtener el promedio de las distancias de
ya que X = sustituyendo cada dato con respecto a la media debe obtenerse
n el valor absoluto de la distancia entre ambos
puntos y después obtenerse su promedio. De tal
1 forma, la desviación media (para datos no
σ2 = ∑ X i2 − 2 X − X
2 2
agrupados) se define como:
n
n

∑X i −X
1 n
Desviación Media = i =1
σ2 = ∑ X i2 − X
2
n
n i =1
Asimismo, algunos autores utilizan como
referencia a la mediana en lugar de la media.
Para datos agrupados:
n

∑X i − med
σ 2 = ∑ Fi (Ti − X ) = ∑ F ' i (Ti − X ) Desviación Media =
1 r 2
r
2 i =1

n i =1 n
i =1

Es necesario comentar que debido a las


complejidades que implica el manejo del valor
Utilizando esta última expresión, para nuestro absoluto, estos conceptos no son muy socorridos.
ejemplo la varianza es de:

σ 2 = 0.6564 Asimetría. Esta medida, también llamada sesgo,


tiene como finalidad mostrar hacia qué lado de le
media se ubican más datos. Corresponde al tercer
Por otra parte, utilizando la fórmula para datos momento con respecto a la media determinar esta
no agrupados: situación. No obstante, en situación similar a lo
que ocurre con la varianza, el tercer momento
σ 2 = 0.6308 posee las unidades de la variable muestreada
elevada al cubo.
Desviación estándar. Es fácil de percibir, a
partir de un análisis dimensional, que la varianza Con el fin de volver adimensional al tercer
posee las unidades de la variable muestreada momento, se define al coeficiente de asimetría
elevada al cuadrado. Esta situación no permite de la siguiente forma:
una rápida visualización o interpretación de la
m3 m3
dispersión de los datos. α3 = =
En virtud de lo anterior, la desviación estándar es
( m2 ) (σ )
3 3
2 2

la raíz cuadrada de la varianza:


Este coeficiente tiene como referencia al valor
cero.
σ = σ2
Si: α 3 = 0 La distribución es simétrica,
La desviación estándar también es conocida
como desviación típica o error estándar. es decir, existe la misma cantidad de
datos a ambos lados de la media.

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 14
Esto implica que debe cumplirse la Datos no agrupados: α 3 = − 0.28
siguiente relación:

X = med = mod
Datos agrupados: α 3 = − 0.2382

Implica que se trata de una curva asimétrica


Si: α 3 < 0 La distribución es asimétrica negativa. Comprobando lo anterior:
negativa, es decir, existen más datos a
derecha de la media. X = 51.0571 med = 51.1117
mod = 51.7423
Esto implica que debe cumplirse la
siguiente relación:
mod = med = X
mod < med < X
Apuntamiento. Corresponde al cuarto momento
Si: α 3 > 0 La distribución es asimétrica con respecto a la media identificar a una medida
positiva, es decir, existen más datos a que auxiliar directamente a las medidas de
izquierda de la media. dispersión. El apuntamiento o curtosis4 detalla lo
puntiagudo o aplastado de una distribución.
Esto implica que debe cumplirse la
siguiente relación: Una distribución puntiaguda implica que los
datos están más cercanos a la media lo que a su
X > med > mod vez arroja una varianza pequeña. En caso
contrario, una distribución aplastada implica que
los datos se alejan de la media, lo que implica
una varianza grande.

α3 = 0 El cuarto momento con respecto a la media posee


las unidades de la variable muestreada elevadas a
la cuarta potencia. Para mejorar una posible
interpretación, se define al coeficiente de
apuntamiento o coeficiente de curtosis:

α3 > 0 α4 =
m4
=
m4
(m2 ) 2
(σ )
2 2

El valor de referencia de este coeficiente es tres.


Algunos autores, para homologar el uso de este
coeficiente con el de simetría, disminuyen en tres
unidades el valor obtenido y así logran que el
α3 < 0 valor de referencia sea cero.

m4 m4
α4 = −3= −3
(m2 ) 2
(σ )
2 2

Para nuestro ejemplo:

4 Kurtosis en Inglés

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 15
El lector deberá estar atento a esta situación, ya Fractiles. Si una serie de datos que se colocan en
que la gran mayoría de los programas de orden de magnitud, el valor medio (o la media
computadoras realizan su comparación contra el aritmética de los dos valores medios) que divide
cero. al conjunto de datos en dos partes iguales es la
mediana. Por extensión, de esta idea se puede
La interpretación es la siguiente: pensar en aquellos valores que dividen a los
datos en cuatro partes iguales. Estos valores se
llaman primero, segundo y tercer cuartíl,
Si α 4 = 0 (o tres), se trata de una respectivamente; el segundo cuartíl corresponde
distribución mesocúrtica. a la mediana de la distribución.
Si α 4 > 0 (o tres), se trata de una Análogamente, los valores que dividen a la
distribución Leptocúrtica (o puntiaguda). distribución en diez partes iguales se denominan
Si α 4 < 0 (o tres), se trata de una deciles, mientras que aquellos que lo hacen en
distribución Platicúrtica (o aplastada). cien partes iguales se llaman percentiles.

El quinto decíl y el quincuagésimo percentil

corresponden a la mediana.
Para nuestro ejemplo:
El cálculo de los fractiles es bajo el mismo
Para datos no agrupados: α = − 0.1121
4
procedimiento utilizado para la mediana.
Para datos agrupados: α = − 0.4986
4

⎛ n ⋅ fracción − Fac k −1 ⎞
Fractil = Liminf + ⎜⎜ ⎟⎟ w
⎝ Fk ⎠

donde:

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 16
Asimismo, si se restan el tercer y primer cuartíl
Liminf : Límite inferior de la clase en que estaremos acotando el 50% de la distribución,
se ubica el fractil buscado. pero centrada en torno a la mediana. A esta
n: Total de datos de la distribución. distancia se le conoce como distancia
intercuartílica.
fracción : Porcentaje de la muestra
buscado. Análogamente, a la diferencia entre el noveno y
Fack −1 : Frecuencia acumulada de la clase el primer decíl se le conoce como distancia
anterior a aquella en que se ubica interdecílica y acta al 80% de la población
el fractil buscado. centrada en torno a la mediana.
Fk : Frecuencia de la clase en la cual
Para el ejemplo desarrollado, los cálculos son los
se ubica el fractil buscado.
siguientes:
w: Ancho del intervalo.
Primer cuartíl (ubicado en la tercera clase)
El procedimiento es análogo al utilizado para
⎡ (80 )(.25) − 11⎤
calcular la mediana. Con auxilio de la frecuencia
Q1 = 50.12 + ⎢ ⎥⎦ (0.51) = 50.5025
acumulada relativa debe ubicarse la clase en la
cual se ubica el fractil buscado. ⎣ 12

Por ejemplo, si de desea calcular el primer cuartíl


debe ubicarse la clase que incluye a la frecuencia Tercer cuartíl (ubicado en la sexta clase)
acumulada relativa al 0.25 o 25%; para el tercer
cuartíl corresponde al 0.75 o 75% de la
distribución; para noveno decíl ocurre a .90 o ⎡ (80)(.75) − 57 ⎤
90%. Q3 = 51.65 + ⎢
⎣ 20 ⎥⎦ (0.51) = 51.7265
La fracción corresponde a la parte de la
distribución en la que se desea dividir, por
ejemplo, para la mediana o mitad de la Distancia intercuartílica: 51.7265 – 50.5025 =
1 1.224
distribución la fracción fue o 0.5, para el
2 Primer decíl (ubicado en la segunda clase)
1
primer cuartíl será o 0.25 y así
4
consecutivamente. ⎡ (80(0.1) − 5) ⎤
D1 = 49.61 + ⎢
⎣ 6 ⎥⎦ (0.51) = 49.8650
Una forma de interpretar la información que nos
entregan los fractiles consiste en ubicar los
límites que comprenden las fronteras mismas que
son los fractiles. Noveno decíl (ubicado en la sexta clase)

Por ejemplo, la mediana nos ubica a la frontera


⎡ (80 )(0.9 ) − 57 ⎤
⎥⎦ (0.51) = 52.0325
que divide en dos partes iguales a la muestra. D9 = 51.56 + ⎢
Pero además implica que la primer parte de la ⎣ 20
muestra inicia en el límite inferior de la primera
clase y concluye en la mediana, así como que la
segunda parte inicia en la mediana y concluye en
el límite superior del último intervalo de clase. Distancia interdecílica: 52.0325 – 49.8650 =
2.1675

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 17
Como conclusión de este capítulo, se muestra
una tabla resumen con las medidas descriptivas
del ejemplo que se ha desarrollado a lo largo del
mismo.

Datos Datos
no agrupados Agrupados
n 80
Rango 4.0
Sturges 7.32
n 8.94
media= 51.0625 media= 51.0571
mediana= mediana= 51.1117
moda= moda= 51.7427
Varianza= 0.6308 Varianza= 0.6564
Desv. Est.= 0.7943 Desv. Est.= 0.8102
Asimetría= -0.2800 Asimetría= -0.2382
Apuntamiento= -0.1121 Apuntamiento= -0.4986
Primer cuartil= 50.4750 Primer cuartil= 50.5025
Tercer cuartil= 51.7000 Tercer cuartil= 51.7265
Primer decil= 49.9000 Primer decil= 49.8650
Noveno decil= 51.9 Noveno decil= 52.0325

Bibliografía

Taro Yamane, Estadística, Editorial Harla,


México 1999.

Spiegel, Estadística Serie Schaum, Edit. Mc.


Graw Hill, México 1999.

Frontana et al, Apuntes de Probabilidad y


Estadística, Facultad de Ingeniería, México
1985

Berk & Carey, Análisis de datos con


Microsoft Excel, Edit. Thompson Learning,
México 2001

Canavos, Probabilidad y Estadística, Mc.


Graw Hill, México 1994.

Captura y Edición:
M.A. María Torres Hernández.

Probabilidad y Estadística M.A. Víctor Damián Pinilla Morán.

Noviembre 2009 18

También podría gustarte