Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
2
DEFINICIONES GENERALES
Muestreo
Censo
Población
3
de elementos que constituyen la población, según el número de elementos la
población puede ser finita o infinita. Cuando el número de elementos que
integra la población es muy grande, se puede considerar a esta como una
población infinita, por ejemplo; el conjunto de todos los números positivos. Una
población finita es aquella que está formada por un limitado número de
elementos.
Muestra
4
Parámetros de centralización
Media aritmética
Es la suma de todos los datos dividida por el número de datos. Se representa
por.
Para calcular la media aritmética hacemos:
Estadístico muestral
5
Muestra aleatoria simple: Es una muestra sacada de una población de
unidades, de manera que todo elemento de la población tenga la misma
probabilidad de selección y que las unidades diferentes se seleccionen
independientemente.
6
variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso
de otras medidas de dispersión más robustas.
Distribución normal
7
Distribución muestral de medias
8
podremos construir intervalos
de la forma
9
que sería el intervalo de confianza al 95% para m
De todas las posibles distribuciones básicas es, sin duda, la distribución normal
la más importante por el gran número de poblaciones que se distribuyen así,
real o asintóticamente, (en virtud de los Teoremas Límite).
10
en efecto si y dado que siendo
independientes pues realizamos m.a.s. y en aplicación del teorema
11
De ahí la importancia de establecer una distribución para la media muestral que
la relacione únicamente con la poblacional, lo que hará que conocida la
muestral concreta podamos aventurar el comportamiento de la poblacional.
Así tendríamos:
lo que da lugar a :
simplificando tendríamos
El teorema del límite central o teorema central del límite indica que, en
condiciones muy generales, si Sn es la suma de n variables aleatorias
independientes, entonces la función de distribución de Sn se aproxima bien a
una distribución normal (también llamada distribución gaussiana, curva de
Gauss o campana de Gauss). Así pues, el teorema asegura que esto ocurre
12
cuando la suma de estas variables aleatorias e independientes es lo
suficientemente grande.
con una media µ y una varianza σ2. El caso en el que su función de densidad
13
Para dos muestras independientes.
14
no se exigirá que coincida el número de observaciones en cada uno de los
grupos que se comparan, de modo que en el ejemplo n=40 y m=35.
(1)
Con lo cual, en este caso particular, el valor utilizado para el contraste será:
15
paquetes estadísticos no es más que la probabilidad de obtener, según esa
distribución, un dato más extremo que el que proporciona el test. Como ya se
dijo, refleja también la probabilidad de obtener los datos observados si fuese
cierta la hipótesis inicial. Si el valor-p es muy pequeño (usualmente se
considera p<0.05) es poco probable que se cumpla la hipótesis de partida y se
debería de rechazar. La región de aceptación corresponde por lo tanto a los
valores centrales de la distribución para los que p>0.05. En el ejemplo
planteado el valor-p correspondiente es de 0.425, de modo que no existe
evidencia estadística de que el peso medio en ambos grupos sea diferente. En
la Tabla 2, se determina los grados de libertad (en la primera columna) y el
valor de α (en la primera fila). El número que determina su intersección es el
valor crítico correspondiente. De este modo, si el estadístico que se obtiene
toma un valor mayor se dirá que la diferencia es significativa.
16
que expresa en definitiva un rango de valores entre los que se puede encontrar
el valor real de la diferencia entre los pesos de ambos grupos. Proporciona
además la misma información que obteníamos del contraste estadístico. El
hecho de que el valor cero pertenezca al intervalo indica que no se dispone de
evidencia para concluir que el peso sea distinto en ambos grupos.
17
siga una distribución F de Snedecor con parámetros (n-1) y (m-1).
que, bajo la hipótesis nula seguirá una distribución t de Student con un número
f de grados de libertad que dependerá de las varianzas muestrales según la
expresión:
18
La técnica para realizar el contraste es análoga a la vista anteriormente cuando
las varianzas son desconocidas e iguales. Por ejemplo, en el caso planteado, la
pérdida media de peso para los individuos en cada una de las dietas fue de
19
diferencia de ambas observaciones (en el ejemplo será la pérdida de peso), de
modo que se quiere contrastar la hipótesis:
frente a la alternativa
20
donde denota la media de la pérdida de peso estimada a partir de la
muestra:
21
Figura 1. Comparación de dos poblaciones normales
22
Tabla 1. Datos de 75 pacientes con sobrepeso sometidos a dos dietas alimenticias.
Dieta Peso inicial Peso final Dieta Peso inicial Peso final
A 94,07 86,59 B 88,02 84,12
A 96,79 93,08 B 88,22 86,13
A 92,15 87,85 B 103,45 101,21
A 92,30 86,83 B 82,94 79,08
A 96,50 92,70 B 89,71 86,19
A 83,11 76,80 B 94,83 91,93
A 91,16 83,40 B 81,93 78,97
A 90,81 86,74 B 83,41 78,89
A 81,37 77,67 B 73,59 69,76
A 89,81 85,70 B 108,47 104,20
A 84,92 79,96 B 72,67 70,01
A 84,43 79,80 B 96,84 93,66
A 86,33 81,15 B 88,48 87,00
A 87,60 81,92 B 89,57 87,24
A 81,08 76,32 B 85,22 82,09
A 92,07 90,20 B 103,76 102,24
A 81,14 73,34 B 87,84 84,66
A 96,87 93,58 B 91,50 88,95
A 99,59 92,36 B 93,04 88,73
A 83,90 77,23 B 92,14 88,07
A 89,41 85,45 B 85,26 81,36
A 85,31 84,59 B 89,42 86,64
A 89,25 84,89 B 92,42 88,99
A 93,20 93,10 B 93,13 89,73
A 89,17 86,87 B 80,86 77,81
A 93,51 86,36 B 88,75 85,93
A 88,85 83,24 B 95,02 91,90
A 88,40 81,20 B 92,29 91,28
A 82,45 77,18 B 89,43 87,22
A 96,47 88,61 B 93,32 89,77
A 99,48 94,67 B 92,88 89,38
A 99,95 93,87 B 89,88 88,00
A 100,05 94,15 B 82,25 80,81
A 87,33 82,17 B 88,99 86,87
A 87,61 86,01 B 82,07 79,74
A 89,28 83,78
A 89,72 83,56
A 95,57 89,58
A 97,71 91,35
A 98,73 97,82
23
CONCLUSION
24
Bibliografía
25