Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Departamento de Matemáticas
Universidad de Murcia
UPTC
Capı́tulo 4: Estadı́stica descriptiva
Contenidos
Introducción a la estadı́stica
Curvas de regresión
La recta de regresión
La regresión exponencial
La regresión potencial
La regresión logarı́tmica
El coeficiente de correlación lineal
Capı́tulo 4: Estadı́stica descriptiva
Introducción a la estadı́stica
Definición de Estadı́stica
¿Qué es la Estadı́stica?
Es la ciencia que se ocupa de recoger, clasificar, representar y resumir los
datos de muestras extraı́das de poblaciones y que, a partir de esas
muestras, valiéndose del cálculo de probabilidades, se encarga de hacer
inferencias acerca de las poblaciones.
Conceptos generales
Población: conjunto de individuos sobre los que se realiza la
investigación estadı́stica.
Muestra: subconjunto de individuos de la población.
Tamaño muestral: número de individuos de la muestra.
Variable: propiedad o cualidad que puede manifestarse bajo dos o
más formas distintas en un individuo de una población.
1 Cuantitativas: se expresan numéricamente. Pueden ser discretas
(toman valores numéricos aislados: edad, no de hijos...) y continuas
(toman cualquier valor dentro de unos lı́mites: altura, peso...).
2 Cualitativas: no se expresan numéricamente. Pueden ser dicotómicas
(sólo aceptan dos posibles resultados: sexo...), ordinales (admiten
una ordenación ascendente: escala militar...) y nominales (ninguno
de los dos tipos anteriores: color...).
Dato o valor: resultado de una variable obtenido en un individuo de
una muestra.
Clases: distintas formas en que se manifiesta una variable.
Capı́tulo 4: Estadı́stica descriptiva
Tabulación de datos y representaciones gráficas
Tabulación de datos
f1 + f2 + · · · + fk = n,
h1 + h2 + · · · + hk = 1,
%1 + %2 + · · · + %k = 100,
Capı́tulo 4: Estadı́stica descriptiva
Tabulación de datos y representaciones gráficas
La media aritmética
Si x1 , . . . , xn son n valores de una muestra, su media aritmética es:
x1 + x2 + · · · + xn
x= .
n
Notación: Pn
i=1 xi
x=
n
La mediana Me
La mediana es el valor que deja por debajo el 50 % de los datos y por
arriba el 50 % restante, siempre que éstos se hayan ordenado de menor a
mayor.
Ejemplo:
898 224
x= = 99.7, y= = 24.8,
9 9
23784 898 224
sxy = − = 159,3086419...
9 9 9
Capı́tulo 4: Estadı́stica descriptiva
Curvas de regresión
35
30
25
20
15
10
0 X
60 70 80 90 100 110 120 130
Curvas de regresión
Curva de regresión: curva ideal hacia la que tienden los puntos del
diagrama de dispersión.
Las curvas de regresión se pueden considerar:
1 de Y sobre X , o de X sobre Y (nos centraremos en las de Y sobre
X ; las otras son análogas).
2 de un tipo especial: lineal, parabólica, potencial, exponencial,
logarı́tmica, etc.
Regresión lineal
La ecuación de la recta de regresión de Y sobre X que mejor se ajusta
viene dada por
sxy sxy
y = a + bx, donde b= , a=y− x.
sx2 sx2
Capı́tulo 4: Estadı́stica descriptiva
Curvas de regresión
La regresión exponencial
Regresión exponencial
La regresión exponencial es el ajuste (por el método de mı́nimos
cuadrados) a una curva
y = ae bx .
Regresión exponencial
Haciendo el cambio y 0 = ln y , A = ln a, queda
y 0 = A + bx,
con lo que se reduce a un ajuste lineal entre las variables Y 0 y X .
ln y = ln a + x ln b,
Regresión potencial
Regresión potencial
Haciendo el cambio y 0 = ln y , A = ln a, x 0 = ln x, queda
y 0 = A + bx 0 ,
Regresión logarı́tmica
Regresión logarı́tmica
Haciendo el cambio x 0 = ln x, queda
y = a + bx 0 ,
Curvas de regresión
Regresión lineal
Regresión exponencial
¿Regresión logarı́tmica?
Capı́tulo 4: Estadı́stica descriptiva
Curvas de regresión
El coeficiente de correlación lineal
Ejemplo
La ley de Hook establece que el alargamiento de un muelle es proporcional a la
fuerza aplicada: L = L0 + αF (L0 = longitud inicial, α = constante del muelle).
Se han obtenido los siguientes datos experimentalmente:
Fuerza xi Longitud yi xi2 yi2 xi yi
2 3 4 9 6 ¿Cuál es la constante
4 6 16 36 24 del resorte? ¿Y la
6 8 36 64 48 longitud inicial?
8 9 64 81 72 y = L0 + αx, ¿L0 , α?
Suma: 20 26 120 190 150
P 2
20 26 13 xi 120
x= = 5, y = = , sx2 = − x2 = − 25 = 5.
4P 4 2 n 4
xi yi 150 65
sxy = − xy = − = 5.
n 4 2
sxy 5 13 3
α = 2 = = 1; L0 = y − αx = −5= .
sx 5 2 2
sxy 5
¿Fiabilidad? r = = √ ≈ 0,975 −→ muy bueno.
sx sy 5 · 5,25