Está en la página 1de 17

Matemática Aplicada

1.- ESTADÍSTICA DESCRIPTIVA

Departamento de Matemática Aplicada


Escuela Técnica Superior de Ingenierı́a Industrial
Universidad de Salamanca

(Araceli Queiruga Dios - queirugadios@usal.es)

Matemáticas III - Estadı́stica


Matemática Aplicada

Conceptos básicos
La estadı́stica descriptiva es una ciencia que analiza series de
datos (por ejemplo, edad de una población, temperatura en
ciertos meses, altura de los estudiantes de una escuela, etc) y
trata de extraer conclusiones sobre el comportamiento de estas
variables.
Las variables pueden ser de dos tipos:
- Variables cualitativas o atributos: no se pueden medir
numéricamente (por ejemplo: nacionalidad, color de la piel).
- Variables cuantitativas: tienen valor numérico (edad, precio de
un producto, ingresos anuales). Estas variables cuantitativas se
pueden clasificar en:
- Discretas: solo pueden tomar valores enteros. Por ejemplo:
número de hermanos (nunca podrá ser, por ejemplo, 3, 45).
- Continuas: pueden tomar cualquier valor real dentro de un
intervalo. Por ejemplo, la velocidad de un vehı́culo puede ser
80, 3 km/h, 94, 57 km/h, etc.
Matemáticas III - Estadı́stica
Matemática Aplicada

1. Las lesiones observadas en edificios construidos con cemento


aluminoso, en los años cincuenta en determinada zona
geográfica, han sido clasificadas como leves, graves y muy
graves. Los siguientes datos reflejan el resultado de la
observación de 50 edificios afectados.
lesiones leves 24 edificios
lesiones graves 15 edificios
lesiones muy graves 11 edificios

Tenemos ası́ la variable cualitativa tipo de lesión, que puede


representar tres valores (atributos) diferentes.
Veremos a lo largo de los ejemplos la utilización de variables
cuantitativas.

Matemáticas III - Estadı́stica


Matemática Aplicada

Conceptos básicos II
Frecuencia absoluta, ni , de una valor xi , dentro de un
conjunto de datos, es el número de veces que dicho valor se
repite en el mismo.
Frecuencia relativa, fi , de un valor es el valor de su
frecuencia absoluta dividido por el número total de datos,
ası́, la frecuencia relativa de xi es fi = nni , donde n
representa el nº de datos total de la muestra.
La frecuencia relativa es un tanto por uno; sin embargo, es
bastante frecuente hablar siempre en términos de tantos
por ciento o porcentajes, que resultan de multiplicar la
frecuencia relativa por 100.
Llamamos frecuencia absoluta acumulada en el valor xi a la
suma de las frecuencias absolutas de los valores inferiores o
iguales a él. (Y de la misma forma se obtiene la frecuencia
relativa acumulada).
Matemáticas III - Estadı́stica
Matemática Aplicada

2. Medimos la altura de los niños de una clase y obtenemos los


siguientes resultados (cm):

Alumno Estatura Alumno Estatura Alumno Estatura


Alumno 1 1, 25 Alumno 11 1, 23 Alumno 21 1, 21
Alumno 2 1, 28 Alumno 12 1, 26 Alumno 22 1, 29
Alumno 3 1, 27 Alumno 13 1, 30 Alumno 23 1, 26
Alumno 4 1, 21 Alumno 14 1, 21 Alumno 24 1, 22
Alumno 5 1, 22 Alumno 15 1, 28 Alumno 25 1, 28
Alumno 6 1, 29 Alumno 16 1, 30 Alumno 26 1, 27
Alumno 7 1, 30 Alumno 17 1, 22 Alumno 27 1, 26
Alumno 8 1, 24 Alumno 18 1, 25 Alumno 28 1, 23
Alumno 9 1, 27 Alumno 19 1, 20 Alumno 29 1, 22
Alumno 10 1, 29 Alumno 20 1, 28 Alumno 30 1, 21

Obtener las frecuencias absolutas y frecuencias relativas.

Matemáticas III - Estadı́stica


Matemática Aplicada

3. Supongamos que medimos la estatura de los habitantes de


una vivienda y obtenemos los siguientes resultados (cm):

Habitante Estatura Habitante Estatura Habitante Estatura


Habitante 1 1, 15 Habitante 11 1, 53 Habitante 21 1, 21
Habitante 2 1, 47 Habitante 12 1, 16 Habitante 22 1, 59
Habitante 3 1, 57 Habitante 13 1, 60 Habitante 23 1, 86
Habitante 4 1, 71 Habitante 14 1, 81 Habitante 24 1, 52
Habitante 5 1, 92 Habitante 15 1, 98 Habitante 25 1, 48
Habitante 6 1, 39 Habitante 16 1, 20 Habitante 26 1, 37
Habitante 7 1, 40 Habitante 17 1, 42 Habitante 27 1, 16
Habitante 8 1, 64 Habitante 18 1, 45 Habitante 28 1, 73
Habitante 9 1, 77 Habitante 19 1, 22 Habitante 29 1, 62
Habitante 10 1, 49 Habitante 20 1, 98 Habitante 30 1, 00

Agrupar los datos en 10 intervalos.

Matemáticas III - Estadı́stica


Matemática Aplicada

Conceptos básicos III: Medidas de tendencia central


Media aritmética, x, de un conjunto de datos x1 , x2 , . . . , xn
es la suma de todos ellos dividido por el número total de
datos de la muestra,
n
X
xi
x1 + x2 + . . . + xn i=1
x= =
n n

Llamamos mediana, M , de un conjunto de datos


x1 , x2 , . . . , xn , al valor que ocupa el lugar central de los
mismos ordenados en orden creciente. En el caso en que el
número de datos sea par, se elegirá como mediana el punto
medio de los dos valores centrales.
La moda de un conjunto de datos es el valor, o valores de
mayor frecuencia absoluta, por lo tanto coincide con alguno
de ellos.
Matemáticas III - Estadı́stica
Matemática Aplicada

4. Vamos a utilizar la tabla de distribución de frecuencias con


los datos de la estatura de los alumnos que vimos en el ejemplo
2. para obtener la media, mediana y la moda.

Matemáticas III - Estadı́stica


Matemática Aplicada

Conceptos básicos IV: Medidas de dispersión


Rango, amplitud o recorrido de una muestra es la diferencia
entre el máximo y el mı́nimo de los valores muestrales.
Se llama varianza, s2 , de los datos x1 , x2 , . . . , xn al valor
n
X
(xi − x)2
(x1 − x)2 + (x2 − x)2
+ . . . + (xn − x)2
s2 = = i=1
n n
(mide el promedio de los cuadrados de las desviaciones de
los datos respecto de la media).
Se denomina s, a la desviación tı́pica, y sb a la cuasi
desviación tı́pica o desviación estándar:
v v
u n u n
uX uX
2
u
u (xi − x) u
u (xi − x)2
t i=1 t i=1
s= , sb =
n n−1
Matemáticas III - Estadı́stica
Matemática Aplicada

5. La siguiente tabla contiene el número de personas que


habitan en cada vivienda, en una muestra de 30 pisos, tomada
en un barrio de Madrid. Obtener para este ejemplo, la media,
mediana y varianza.

1 5 2 2 3 6 2 2 4 3
4 4 3 2 2 4 1 2 5 4
1 6 2 2 6 3 3 4 2 1

Matemáticas III - Estadı́stica


Matemática Aplicada

6. Los siguientes datos corresponden al ı́ndice de


α−fetoproteina en el suero sanguı́neo de 30 individuos adultos
con unas condiciones de vida similares:

2, 29 2, 67 2, 84 2, 65 2, 52 1, 75 2, 12 1, 54 1, 95 1, 82
1, 95 1, 75 1, 92 1, 92 1, 46 1, 15 1, 70 1, 86 1, 04 1, 06
1, 52 1, 67 1, 40 2, 13 1, 23 1, 83 1, 91 1, 78 2, 10 1, 52

Obtener la media, mediana, varianza y desviación tı́pica.

Matemáticas III - Estadı́stica


Matemática Aplicada

Conceptos básicos V: Otros parámetros de interés


Los percentiles permiten analizar la posición respecto a las
frecuencias acumuladas de los datos de la muestra. Ası́, el
percentil α, Pα , de x1 , x2 , . . . , xn (conjunto ordenado de
datos) es el valor que es mayor o igual que el α % de los
valores muestrales.
En particular, la media es el percentil 50, y los percentiles
25 y 75 se llaman respectivamente primer y tercer cuartil,
representados por Q1 y Q3 .
Una medida de dispersión asociada a los cuartiles es el
rango o recorrido intercuartı́lico, que se define como la
diferencia Q3 − Q1
Se llama coeficiente de variación al cociente entre la
desviación tı́pica y la media aritmética:
s
CV =
x
Matemáticas III - Estadı́stica
Matemática Aplicada

7. En la siguiente tabla se representan 17 notas obtenidas por


el mismo número de alumnos, sin ordenar. Calcular la mediana
y los cuartiles de esta serie.
4 3 5 8 7 3 7 4,5 3,5 5 3,5 6 6 4 4 7 5

Matemáticas III - Estadı́stica


Matemática Aplicada

8. Los siguientes datos corresponden a 49 mediciones de


colesterol-HDL medidos en otras tantas personas de edades y
hábitos similares.

69, 4 68, 3 60, 04 70, 01 93, 2 71, 1 58, 2


73, 6 70, 9 71, 5 57, 1 58, 7 56, 9 74, 8
55, 6 66, 6 63, 7 74, 5 77, 3 88 70, 3
75, 9 67, 5 70 67, 3 67, 6 77, 8 70, 6
64, 9 68 85, 1 72, 8 61, 6 69, 2 69, 6
68, 1 50 60, 2 52 76, 4 77, 2 82, 4
74, 6 71, 9 73, 8 82, 2 71, 9 73, 6 69, 1

Agrupar los datos en clases y calcular los parámetros de


centralización y dispersión.

Matemáticas III - Estadı́stica


Matemática Aplicada

9. La media aritmética de 20 datos numéricos x1 , x2 , . . . , x20


(ordendados en orden creciente) es x = 81, 4 y su desviación
tı́pica s = 7, 32. Si eliminamos el dato menor x1 = 68 y el
mayor, x20 = 102, 6, calcular la media aritmética y desviación
tı́pica de los 18 restantes y comprobar que la desviación tı́pica
ha disminuido.

La suma de los 20 datos es


20
X
xi = 20 · 81, 4 = 1628
i=1

y la suma de sus cuadrados


20
X
x2i = 20(s2 + x2 ) = 20(7, 322 + 81, 42 ) = 133590, 848
i=1

Matemáticas III - Estadı́stica


Matemática Aplicada

Agrupación de datos

Los datos se agrupan en clases en el mismo momento de su


recopilación, de modo que se pierde algo de información y el
conjunto de datos aparece condensado en una tabla donde
se muestran intervalos de valores, que se suelen tomar con
la misma longitud, y frecuencias correspondientes.
Las fórmulas de media y varianza son ahora:
r
X r
X r
X
xi ni (xi − x)2 ni x2i ni
i=1 i=1 i=1
x= ; s2 = = − x2
n n n
El punto medio de cada intervalo se llama marca de clase y
se considera representativo de toda ella.

Matemáticas III - Estadı́stica


Matemática Aplicada

10. Dada la siguiente tabla, correspondiente a 178 datos


agrupados en clases:

Clases Frecuencia absoluta


50 − 65 9
65 − 80 23
80 − 95 22
95 − 110 31
110 − 125 35
125 − 140 26
140 − 155 22
155 − 170 10

Calcular la media y la desviación tı́pica.

Matemáticas III - Estadı́stica

También podría gustarte