Está en la página 1de 6

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

FACULTAD DE QUÍMICA • ESTADÍSTICA


Estadı́stica Descriptiva • GRUPO 2 • 2023-1

Ejemplo.

Ejemplo: Parte de un estudio de control de calidad tuvo como objetivo mejorar una lı́nea de producción, se
midieron los pesos (en onzas) de 50 barras de jabón. Los resultados son los siguientes:

Pesos en onzas.
16.2 15.8 12.8 14.3 15.7 14.8 18.8 13.6 18.5 16.5
17.1 17.4 17.6 14.6 15.2 17.3 17.7 16.5 17.4 13.8
16.2 13.1 18.5 18.3 11.6 18.3 15.6 15.9 16.1 17
17.3 13.7 16.6 16.4 12.7 18.3 20.3 15.9 15.8 16.5
19.2 16.3 12.6 18.1 17.4 14.1 13.3 14.3 15.1 15.6

A) Construya un histograma de frecuencias relativas, grafique el polı́gono de frecuencias e indique las carac-
terı́sticas de la distribución.

B) Calcular las medidas de centro, las medidas de dispersión y los cuartiles.

Solución: Inciso A):

Para construir la tabla de frecuencias ordenamos la información,

Pesos en onzas.
11.6 12.6 12.7 12.8 13.1 13.3 13.6 13.7 13.8 14.1
14.3 14.3 14.6 14.8 15.1 15.2 15.6 15.6 15.7 15.8
15.8 15.9 15.9 16.1 16.2 16.2 16.3 16.4 16.5 16.5
16.5 16.6 17 17.1 17.3 17.3 17.4 17.4 17.4 17.6
17.7 18.1 18.3 18.3 18.3 18.5 18.5 18.8 19.2 20.3

elegimos el número de clases, el ancho de clase y calculamos la tabla de frecuencias correspondiente.

Elementos.
Total (n) 50
Valor Mı́n. 11.6
Valor Máx. 20.3
Rango 8.7
Criterio para elegir k Menos de 50 5a7
De 20 a 50 7
Raı́z(n) 7.07106
1 + 3.322*log(n) 6.64397

Elección de núm de clases 7


Ancho de clase 1.2429 1,20
Aumento para calcular los lı́mites de clase 0.1
Aumento para calcular los lı́mites reales 0.05

1
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE QUÍMICA • ESTADÍSTICA
Estadı́stica Descriptiva • GRUPO 2 • 2023-1

Considerando los elementos de la tabla anterior la tabla de frecuencias queda como:

Tabla de Frecuencias.
Clases fi fi ac. Fi Fi ac. Mi
( 11.55 , 12.85 ) 4 4 0,08 0,08 12,2
( 12.85 , 14.15 ) 6 10 0,12 0,2 13,5
( 14.15 , 15.45 ) 6 16 0,12 0,32 14,8
( 15.45 , 16.75 ) 16 32 0,32 0,64 16,1
( 16.75 , 18.05 ) 9 41 0,18 0,82 17,4
( 18.05 , 19.35 ) 8 49 0,16 0,98 18,7
( 19.35 , 20.65 ) 1 50 0,02 1 20

Con la información de la tabla anterior, construimos el histograma:

Utilizando la representación anterior, ¿en qué clase se concentra la información?¿cuáles son las clases donde se
acumula la mayorı́a de la información?
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE QUÍMICA • ESTADÍSTICA
Estadı́stica Descriptiva • GRUPO 2 • 2023-1

Para el polı́gono de frecuencias consideramos un histograma como sigue:

y borramos las barras para obtener:

¿Cuál es el perfil de la distribución de la información?


UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE QUÍMICA • ESTADÍSTICA
Estadı́stica Desriptiva • GRUPO 2 • 2023-1

Adicionalmente, para la ojiva consieramos las siguientes representaciones:

señalando con puntos los lı́mites superiores de cada clase y uniendo los puntos con segmentos de recta:

¿Qué proporción de los pesos en onzas es a lo sumo de 17.6 onzas? ¿Qué proporción tiene menos de 17.6? ¿Qué
proporción de los pesos en onzas tiene más de 17.6 onzas? ¿Qué proporción de los pesos en onzas tiene por lo menos
17.6 onzas?
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE QUÍMICA • ESTADÍSTICA
Estadı́tica Descriptiva • GRUPO 2 • 2023-1

MEDIDAS DE TENDENCIA CENTRAL

Media Muestral.
Para un conjunto dado de números x1 , x2 , ..., xn , la medida más conocida y útil del centro es la media, media
muestral o promedio aritmético del conjunto. Como casi siempre se pensará que los números xi constituyen una
muestra, a menudo se hará referencia al promedio aritmético como la media muestral y se le denotará por x.

Definición: La media muestral x de las observaciones x1 , x2 , ..., xn está dada por


x1 + x2 + ... + xn Pn xi
x= = i=1
n n
P
El numerador de x se escribe más informalmente como xi , donde la suma incluye todas las observaciones
muestrales.

Moda.
La moda es la categorı́a que se presenta con más frecuencia o el valor de las observaciones xi que se presenta con
más frecuencia. Cuando las mediciones en una variable continua se han agrupado como histograma de frecuencia o
de frecuencia relativa, la clase con el pico más alto se llama clase modal, y el punto medio de esa clase se toma como
la moda.

Mediana.
La palabra mediana es sinónimo de medio y la mediana muestral es en realidad el valor medio una vez que
se ordenan las observaciones de la más pequeña a la más grande. Cuando las observaciones están denotadas por
x1 , ..., xn , se utilizaremos el sı́mbolo x̃ para representar la mediana muestral. El propósito de la mediana de la mues-
tra es reflejar la tendencia central de la muestra de manera que no sea influida por los valores extremos (a diferencia
de la media muestral que es sensible a valores extremos).

Definición: Dado que las observaciones en una muestra son x1 , x2 , ..., xn , acomodadas en orden de magnitud
creciente, la mediana de la muestra se calcula considerando:
(
x n2 +1 si n impar
x̃ = 1 
x n + x n2 +1 si n par
2 2

MEDIDAS DE DISPERSIÓN.
Rango.
El rango, R, de un conjunto de n mediciones se define como la diferencia entre la medicion más grande y la mas
pequeña, es decir, R = Rango = Xmax − Xmı́n .

Varianza muestral.
La varianza de una muestra de n observaciones es la suma de las desviaciones cuadradas de las observaciones
alrededor la media x dividida entre (n − 1). La varianza muestral se denota con s2 y la calculamos con la expresión:
Pn (xi − x)2
s2 = i=1
n−1
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE QUÍMICA • ESTADÍSTICA
Estadı́stica Descriptiva • GRUPO 2 • 2023-1

Desviación estándar muestral.


Mientras que la varianza muestral es una cantidad importante, tiene una seria desventaja como una medida de
la dispersión. Sus unidades no son las mismas que las unidades de los valores de la muestra; estas tienen unidades
al cuadrado. Para obtener una medida de la dispersión cuyas unidades sean las mismas que las de los valores de
la muestra, simplemente se toma la raı́z cuadrada de la varianza. Esta cantidad se denomina
√ desviación estándar
muestral. Se acostumbra denotar a la desviación estándar muestral por la letra s = s2 .

Definición: La desviación estándar es una cantidad que mide el grado de dispersión en una muestra. La desvia-

cion estándar de un conjunto de mediciones es igual a la raı́z cuadrada positiva de la varianza, es decir, s = s2 .

Nota: Los conjuntos de datos pueden tener el mismo centro pero con aspecto diferente por la forma en que
los números se dispersan desde el centro.

MEDIDAS DE POSICIÓN.
Las medidas de posición se utilizan para describir la posición que un dato especı́fico posee en relación con el
resto de los datos cuando estan en orden por categorı́as. Cuartiles y percentiles son dos de las medidas de posición
más populares.

Cuartiles.
Son valores de la variable que dividen los datos ordenados en cuartos; cada conjunto de datos tiene tres cuartiles.
El primer cuartil, Q1 , es un número tal que a lo sumo 25 % de datos son menores en valor que Q1 y a lo sumo 75 %
son mayores (represente la idea en un diagrama). El segundo cuartil es la mediana Q2 = M e = x̃ . El tercer cuartil,
Q3 , es un número tal que a lo sumo 75 % de los datos son menores en valor que Q3 y a lo sumo 25 % son mayores
(represente la idea en un diagrama).

Percentiles.
Son los valores de la variable que dividen un conjunto de datos clasificados en 100 subconjuntos iguales; cada
conjunto de datos tiene 99 percentiles. El k − ésimo percentil, Pk , es un valor tal que a lo sumo k % de los datos son
menores en valor que Pk y a lo sumo (100 − k) % de los datos son mayores.

Notas:

1. El primer cuartil (Q1 ) y el 25avo percentil coinciden; es decir, Q1 = P25 . También, Q3 = P75 .

2. La mediana (x̃), el segundo cuartil (Q2 ), y el 50avo percentil son todos lo mismo: x̃ = Q2 = P50 . Por tanto,
cuando se requiera calcular P50 o Q2 , usamos el procedimiento para hallar la mediana.

También podría gustarte