Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contenido
1.- Introducción. 3
1.4.2.1.Parámetros de centralización. 7
1.4.2.2.Parámetros de Posición. 9
1.4.2.3. Parámetros de dispersión. 10
1.4.2.4. Parámetros de forma. 11
Introducción. 12
3.1. Conceptos. 19
1
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
5.1.1.Distribución binomial. 27
5.2.4.2Distribución tn de Student. 32
5.2.4.3Distribución Fm;n (de Fisher-Snedecor ). 33
6.2.Estimación puntual. 36
6.4.1.2.Prueba de independencia. 47
6.4.1.3.Prueba de homogeneidad. 48
6.4.1.4.Sobre otras pruebas no paramétricas. 48
2
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
3
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
1.- Introducción.
Es ésta la más delicada de las fases de todo estudio estadístico puesto que los resultados finales
de un análisis están en gran parte condicionados por la información que se recoge para ser
analizada. En el momento de abordar un estudio conviene definir unos objetivos y tener bien
claro quiénes son y qué secuencias habrá que seguir para lograrlos. Los datos a recoger en esta
fase los clasificaremos en dos tipos:
Datos directos o publicados, que son datos que se obtienen de censos, anuarios, informes,…, son
datos que están a disposición del investigador.
Los datos indirectos (o de recopilación propia) son datos que se obtienen directamente de la
observación de fenómenos. Diremos datos experimentales a aquellos que el investigador recoge
observando resultados de investigaciones.
4
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Conscientes de que en todo estudio es posible cometer algún error, en estadística nos hemos de
centrar siempre en controlarlos en la mayor medida posible.
Diremos errores de muestreo a aquellos errores que se cometen al tratar una muestra como
perfectamente representativa de la población de la que procede cuando esto en realidad esto
nunca ocurre salvo que la muestra coincida exactamente con toda la población objeto de estudio.
5
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Diremos así a los grupos disjuntos en los que se encerrarán los valores de la
variable. Están caracterizadas estas categorías porque las individualidades
encerradas en una determinada clase presentan semejanza y por el contrario
elementos de clases distintas son claramente distintos en comportamiento.
Entendemos por clases de valor único a aquellos conjuntos en los
que todos los valores de la variable allí encerrados son idénticos. Estas
clases son adecuadas para encerrar valores bien de variables
cualitativas o bien de variables cuantitativas discretas.
Las clases de intervalo son definidas por intervalos entre cuyos
extremos se encierran valores de las variables que están comprendidos
entre dichos extremos. Estas clases resultan adecuadas para encerrar
valores de variables cuantitativas continuas e incluso para encerrar
valores de variables cuantitativas discretas en los casos en que el
número de valores de la variable sea extremadamente elevado.
Si bien la determinación del número de clases para encerrar los valores de una
variable no obedece a criterios fijos sí es conveniente recordar que el número de
clases a construir no debe ser demasiado grande puesto que si así es ello no
supone ahorro alguno en el tratamiento de la información , tampoco debe ser
muy pequeño porque en este caso se cometerá con frecuencia el error de que
valores bien diferentes son interpretados del mismo modo.
Señalaremos, a su vez, que hay casos en los que por diferentes razones una
variable cuantitativa continua conviene tratarla como discreta y al contrario,
casos en los que una variable cuantitativa discreta conviene tratarla como
6
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Se dice distribución de frecuencias para una variable estadística a todo par que
en su primera componente hace referencia a las clases en las que se encierra la
variable, y la segunda se refiere a las frecuencias absolutas con que la variable
se manifiesta en las diferentes clases.
Tipo II: que notaremos como ( xi , f i ) , son adecuadas para presentar variables
cualitativas o cuantitativas discretas.
7
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
1.4.2.1.Parámetros de centralización.
8
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Para las distribuciones tipos I, II, o III se determina mediante las expresiones
siguientes:
I ∑x i
x= i =1
N
n
II ∑x i fi
x= i =1
N
n
III ∑ x′ f i i
x= i =1
N
(xi denota los valores de la variable; fi denota la frecuencia absoluta correspondiente al valor xi , N denota al
total de valores de la variable a lo largo de la distribución)
Mediana Me. Se dice así aquel valor de la variable tal que ordenada ésta en
sentido creciente a lo largo de la distribución este valor de la mediana supera al
50% de los valores de la variable y es superada por el 50% de valores restantes.
N / 2 − Fi −1
Me = Li −1 + C i
fi
Siendo Li −1 el extremo inferior de la clase mediana; Fi −1 la frecuencia acumulada hasta la
categoría inmediatamente anterior a la categoría mediana; f i la frecuencia absoluta de dicha
categoría mediana y C i la amplitud de tal categoría .
Moda, Mo
9
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
moda será aquél valor de la variable que lleve asociada la más alta de las frecuencias
absolutas.
1.4.2.2.Parámetros de Posición.
10
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
∑x i − x fi
DME = i =1
N
y se expresa en las mismas unidades que la variable a quien se refiere.
∑ (xi − Ot ) f i
M r ,Ot = i =1
N
De entre ellos son momentos especialmente interesantes aquellos centrados en
ar =
∑ xir f i
N
el cero y en la media de la variable, respectivamente
∑ (xi − x )r f i
mr =
N
11
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
σ
Cv = ,; obsérvese que la dispersión se expresa en como la relación entre la
x
desviación típica y la media de la variable, y de su interpretación cabe señalar:
m N
b2 = 44 =
σ 4
σ
Se interpreta señalando que
12
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Introducción.
Y
X x1 x2 . xi . xn
y1
y2
.
yj fij
.
ym
13
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Tres problemas nos ocupan en este segundo tema, a saber, el problema del ajuste
de una distribución bidimensional, el caso particular de la regresión lineal y el
problema de la determinación de un indicador del grado de dependencia entre las
componentes de una tal variable.
Estas tres cuestiones que teóricamente abordamos en el orden señalado en las
aplicaciones prácticas se emplearán en sentido contrario. Más adelante
comprobaremos porqué.
14
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
∑ ( y − f (x ))
2
i i
g4 =1− i
∑ y − ny 2
i
2
∑ (y
i
i − f ( xi ))
2
Es por ello que para que una función se entienda sensata como función
de ajuste habrá de presentar un índice de bondad al menos mayor que
cero. Ahora bien:
15
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
∑(y i − f ( xi ))
2
S y2 = i
n
∑ (x − O1 ) ( y1 − O2 ) f ij
r s
i
M r , s ,O1,O 2 = ij
Por otro lado también resultan de especial interés los momentos para los que el
origen (O1, O2) se considera el punto determinado por las medias marginales.
Denotaremos los momentos centrados en las medias marginales como
∑ (x − x ) ( y1 − y ) f ij
r s
i
mr ,s = ij
∑ (x i − x )( y1 − y ) f ij
m11 = ij
Para determinar la covarianza de forma más cómoda se suele utilizar la siguiente relación entre
momentos: m11= a11 – a10 a01
16
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
y = f ( x) = a + b21 x
Al minimizar en este caso la expresión Q = Ʃ(yi- f (xi))2 que mide las desviaciones
cuadráticas entre realidades (yi ) y pronósticos establecidos por la función de
ajuste (f (xi))se observa que la anterior recta de ajuste pasa por el punto
determinado por las medias marginales ( x, y ) y presenta una pendiente que se
corresponde con b21 = m11 / m20. Ello permite expresarla mediante la ecuación
(y – a01) = m11 / m20 (x – a10). Se le dice recta de regresión de y sobre x y explica el
comportamiento de la segunda componente mediante el conocimiento de la
primera.
Nótese que las pendientes de las rectas tienen el mismo signo, que viene marcado por el de la
covarianza de la distribución, con lo cual si m11 > 0 se entenderá que conforme una componente
crece la otra lo hace. Contrariamente, si m11 < 0 estaremos en condiciones de decir que cuando
una componente crece, la otra decrece.
17
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
18
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
19
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
3.1. Conceptos.
20
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
21
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
22
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Teoremas fundamentales.
23
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Función de probabilidad
σ 2 ( x) = ∑ [( xi − µ ) 2 ] pi
i
Función de distribución.
24
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
∑e
itxi
ϕ(t) = E[eitx] = pi .
i
Destacamos que lo interesante de esta función es que nos ofrece la comodidad en
la determinación de los momentos de orden k centrados en el origen mediante la
Φ k ) ( 0)
expresión a k = .
ik
Al ser estas variables para las que entre dos valores cualesquiera de ellas
existen infinitas posibilidades de ubicación de otros de sus propios valores surge
ahora la necesidad de reconsiderar que lo que en el caso de variables discretas
son sumatorios.
Al tratar variables contínuas nos vemos en la necesidad de sustituir sumatorios
por integrales, es toda la novedad respecto a lo comentado para el análisis de
variables discretas.
25
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Función de densidad.
Función de distribución.
Para una variable aleatoria contínua X definida sobre un intervalo real [a,
b] se define la función de distribución mediante la expresión
x
F (x) = P[x ≤ x] = ∫ a
f (x) dx
La siguiente relación entre las funciones de densidad y distribución de una variable contínua es
de suma importancia; conocida cualquiera de ellas la determinación de la otra es inmediata como
muestra las relaciones
x
• F (x)= ∫ a
f (x) ; f (x) = F’ (x)
Función característica.
x
ϕ (t) = E[eitx] = ∫ eitx f(x) dx.
a
b
La media aritmética se expresará en este caso µ = E[x] = ∫ x f(x) dx .
a
26
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
b
σ 2 [ x] = ∫ ( x − µ ) 2 f ( x)dx = a2 − µ 2
a
φ k ( 0)
ak = .
ik
27
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
5.1.1.Distribución binomial.
Sea un experimento aleatorio del que de cada experimentación sólo caben dos
posibles resultados. Uno al que llamaremos éxito que acontece con probabilidad
p, y el otro al que decimos fracaso que ocurrirá con probabilidad q = 1-p. Sea n el
número de experimentaciones independientes practicadas en el contexto de un
tal experimento, y sea una variable discreta X que señala el número k de éxitos
acontecidos en el total de las n experimentaciones.
Diremos que una tal variable aleatoria discreta X sigue una distribución
binomial de parámetros n y p, y denotaremos B(n,p). Para esta variable
señalaremos como
n
Función de probabilidad P[ X = k ] = p k q n −k
k
x
n
Función de distribución F(x)= P[ X ≤ x] = ∑ p k q n − k
k =0 k
φ (t ) = E[e itx ] = ( pe it + q) n
28
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
k =0 k!
k
λ i
Función característica φ (t ) = ∑e
i =0
itk
e −λ
i!
La media de la variable es µ = E[x] = λ
La variable presenta por varianza σ 2 ( x) = λ
Esta distribución posee una propiedad importante de cara a la práctica, es la propiedad de reproductividad que
señala lo siguiente: si una variable discreta X sigue un proceso de Poisson de parámetro λ y otra
1
variable Y sigue un proceso de Poisson de parámetro λ entonces la variable aX+bY combinación
2
lineal de las anteriores siguen un proceso de Poisson P(aλ1+bλ2).
x
La función de distribución es F(x)= P[ X ≤ x] = ∑ pq k −1
k =1
it
pe
φ (t ) = es la función característica de la variable
1 − qe it
1 q
Presenta por media µ = y la varianza de la variable es σ 2 ( x) =
p p2
29
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
x−a
• F ( x) = como función de distribución
b−a
e itb − e ita
• φ (t ) = es la función característica de la variable
it (b − a)
b+a
• Presenta por media µ = E[ x] =
2
12
Se dice que una variable aleatoria contínua X sigue una distribución exponencial
negativa de parámetro λ >0 si estando definida en [0, ∞ ] su función de densidad
es f ( x) = λe − λx
1
• E[ x] = como media
λ
• La función de distribución para ella es F ( x) = 1 − e − λx
1
• σ 2 ( x) = 2 es la varianza de tal variable exponencial negativa
λ
30
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Diremos que una variable aleatoria contínua X sigue una distribución normal de
media µ y desviación típica σ , y denotamos N (µ , σ ) si estando definida sobre
( x−µ ) 2
1 −
todo R su densidad es f ( x) = e 2σ 2
σ 2π
Por otro lado, con anterioridad hemos estudiado la variable discreta para un
esquema binomial B(n,p), y comentamos que cuando n se hace grande es
complejo tratar la función de probabilidad de una tal variable. El problema se
31
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
De estas variables citaremos únicamente las densidades a las que en cada caso
obedecen y los parámetros media y varianza respectivos. Es, en cada caso,
interesante la evaluación de las diferentes funciones de distribución en un punto
dado, pero hemos de señalar que la dificultad de la expresión de tales funciones
de distribución aconsejan utilizar las correspondientes tablas que muestran
estas evaluaciones.
32
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
x
Una propiedad interesante de esta variable:
Para n>30 grados de libertad se puede utilizar la siguiente propiedad de
aproximación: 2 x n2 → N ( )
2n − 1,1
Una variable aleatoria contínua sigue una distribución t de Student con n grados
N (0,1)
de libertad si estando definida sobre todos los reales como el cociente su
2
Xn
n
densidad es
n + 1
1 Γ 2
− n +1
1 + x 2
2
f ( x)
n
πn Γ n
2
33
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
x m2
Fm, n = m
x n2
n
m
m + n m 2
Γ n
−1
Su densidad es f ( x) =
2 n x 2
∀x ≥ 0 , y dependiendo de los
m+n
m n −
Γ Γ m 2
2 2 1 +
n
grados de libertad m y n admite representaciones gráficas de la forma
n 2 n 2 ( m + n − 2)
E[ Fm, n ] = y σ 2 [ Fm,n ] = .
n−2 m ( n − 2) 2 ( n − 4)
34
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Hemos de tener en cuenta que en los trabajos que se abordan utilizando técnicas
de inferencia el primer problema que surge es el de la determinación de
muestras representativas de la población a analizar; las técnicas de
determinación de muestras soporte adecuadas en estos procesos se dicen
métodos de muestreo.
35
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Son múltiples las formas con las que se puede determinar una muestra
representativa de una población pero en cualquier caso serán la propia población
a analizar y la variable que la describe , las características en ella a estudiar, los
métodos de inferencia necesarios en el análisis y los objetivos marcados en tal
estudio los mejores indicadores para elegir el tipo de muestreo más conveniente
para la determinación de una muestra soporte.
No olvidemos que los errores de muestreo quedaban definidos como los errores
cometidos al considerar como valor real para un parámetro poblacional el valor
real del correspondiente parámetro muestral que naturalmente se obtiene del
análisis de no toda la población sino de una muestra representativa de tal
población.
36
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Es obvio que de entre todos los estimadores centrados el mejor estimador será
aquel que presente mínima varianza para las estimaciones que se puede
construir.
σ 2 (θ ) =
[1 + b' (θ )]
∂
nE[ log L] 2
∂ϑ
37
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
n
L( x1 , x 2 ,...., x n ;θ ) = ∏ f ( xi ;θ )
i =1
Nótese que inicialmente L es función de la muestra soporte y del parámetro a estimar , pero ante
una muestra particular L tan sólo dependerá del parámetro objeto de estimación.
[ ]
∀ε > 0 → P θˆ − θ ≥ ε → 0 cuando n → ∞
En la práctica para contrastar si un estimador es consistente nos
limitaremos a comprobar si se cumplen las condiciones siguientes:
E [θˆ] = θ
n →∞
lim
n →∞
[]
σ 2 θˆ → 0
θˆ invariante g —> g ( θˆ ) = g ( θ )
38
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Observaciones:
Los estimadores máximo verosímiles no necesariamente son centrados. Este método construye
estimadores bastante precisos con muestras grandes. Cuando las muestras son pequeñas las
estimaciones están muy condicionadas por el tamaño de la muestra.
39
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
40
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Dado que el error de muestreo en una estimación está relacionado con el tamaño
muestral y nivel de confianza 1−α con la que se requiere construir la estimación
será el propio investigador quien en función de estas relaciones y el problema a
estudiar decida si es más importante ganar en precisión o en fiabilidad cuando la
muestra dada es de un tamaño fijado; o si lo que se impone es ganar a la vez
tanto en precisión como en confianza para lo cual necesariamente el tamaño
muestral ha de ser incrementado, y ello sabemos bien lo que supone.
41
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
42
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Una hipótesis estadística no es más que una afirmación que establecemos sobre
una o más características de una población.
Al error cometido cuando se acepta Ho siendo falsa, se dice error tipo II.
43
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
44
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
PRUEBAS DE HIPOTESIS
Esquema Resumen
Muestras
pequeñas
P = 2 P[ X ≥ x / p = p 0 ]six > np 0
P = 2 P[ X ≤ x / p = p 0 ]six < np 0
Muestras
grandes
Muestras
grandes
45
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
desviaciones poblacionales
conocidas
desviaciones poblacionales
iguales desconocidas
desviaciones poblacionales
distintas y desconocidas
3-.Observaciones pareadas
4-.Referente a la varianza
46
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
H0: X → l
H1: X →≠ l
k
(oi − ei )2
Siendo así, el estimador de la prueba es X =∑
2
, y como se
ei
i =1
47
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Dada una tabla de contingencia que refleja una muestra de valores de una
variable bidimensional (X,Y)
H0 : X, Y son independientes
H1 : X, Y no son independientes
i =1 eij
y su distribución en el muestreo obedece a una χ ( r −1)( c −1);α
48
Matemáticas III. Grados I Mecánico - I. de Materiales. Estadística Curso 2016/2017
Dentro de este conjunto de pruebas se encuentran como pruebas más frecuentemente utilizadas
la prueba de los Signos, la prueba del Rango con signo de Wicolxon, la prueba de Suma de
Rangos y la prueba de Kruskal-Wallis.
49