Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hipotesis Estadistica
Hipotesis Estadistica
Conceptos, Estadística
Descriptiva, Pruebas de Hipótesis
CIENCIA
INVESTIGACION
REALIDAD
METODO CIENTIFICO
PRINCIPIO DE LA INVESTIGACIÓN
VER EN LA
REALIDAD
LO QUE OTROS
NO HAN VISTO
EL PROCESO DE INVESTIGACIÓN (Erika Himmel)
CUERPO DE CONOCIMIENTOS
REALIDAD
FASE I FASE III FASE IV FASE V
CUERPO DE CONOCIMIENTOS
TEORÍAS
MODELOS
ANÁLISIS
DISEÑO
DE DATOS
REALIDAD
HECHOS FENÓMENOS DATOS
EXPERIENCIA
FASE II
Método científico y estadística
Plantear Diseñar
hipótesis experimento
M
y se calcula mediante las expresiones, según el caso:
Para TDNA TF TI
n n n
xi xi ni ci ni
M
i 1 n i 1 n i 1 n
xi representa el valor de la variable; ci representa la marca de clase.
La mediana
[=mediana(rango)]
La mediana de un conjunto de números ordenados en magnitud es o el valor
central o la media de los dos valores centrales.
La moda
[=moda(rango)]
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más
se repite, es la única medida de centralización que tiene sentido estudiar en una
variable cualitativa, pues no precisa la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más valores
de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso
tendremos una distribución bimodal o polimodal según el caso.
La moda
Estadígrafos de Posición
• Se define el cuantil de orden a como un valor de la variable por debajo del cual
se encuentra una frecuencia acumulada a.
• Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.
• Amplitud o Rango
[=max(rango)-min(rango)]
• La diferencia entre las observaciones extremas.
– 2,1,4,3,8,4. El rango es 8-1=7
– Es muy sensible a los valores extremos.
• Rango intercuartílico
• [=CUARTIL(rango;3)-CUARTIL(rango;1)]
– Es la distancia entre el primer y tercer cuartil.
• Rango intercuartílico = Q3 – Q1 = P75 - P25 = C0.75 – C0,25
– Parecida al rango, pero eliminando las observaciones más extremas
inferiores y superiores.
3
Media
-3.6 muestral
Frecuencia
2
4.4
1 -3.6
3.4
-.6
0
1 2 3 4 5 6 7 8 9 More
Edades observadas
Otra medida: Varianza
3
3.6x3.6
Media
Muestral
2
F re c ue n c ia
4.4x4.4
.6x.6
1
0
3.4x3.4
3.6x3.6
1 2 3 4 5 6 7 8 9 Mo re
Are a o bs e rv a da
Varianza
[=var(rango)]
( xi x )
n 2
s
2
i 1 n 1
Grados de libertad
• ¿Por qué calculamos la varianza dividiendo por n - 1,
en lugar de dividir por n?
• Como la suma de las desviaciones es 0, la última
desviación es una combinación lineal de las n - 1
desviaciones restantes.
• Por lo tanto, no estamos calculando el promedio de n
números independientes (los desvíos). Solo n -1 de
las desviaciones al cuadrado pueden variar
libremente y por ello, promediamos la suma de los
desvíos al cuadrado dividiendo por n -1.
• Al numero n -1 se lo denomina grados de libertad
de la varianza o de la desviación típica.
Desviación estándar
[=desvest(rango)]
s s 2
Así s = 3.78
Desviación estándar
S2=14.3 años2
S
S=3.78 años
Tema 3:
Introducción a Pruebas de
Hipótesis
Contrastes Paramétricos
• Las pruebas de hipótesis hacen inferencias respecto a
los parámetros de la población, como la media.
• Las pruebas paramétricas utilizan la estadística
paramétrica de muestras que provinieron de la
población que se está probando.
• Para formular estas pruebas, se hacen suposiciones
restrictivas sobre las poblaciones de las que se extraen
las muestras, por ejemplo, que las muestras son grandes
o que provienen de poblaciones normalmente
distribuidas. Pero las poblaciones no siempre son
normales.
Contrastes No Paramétricos
• Pero las poblaciones no siempre son normales.
• Se han desarrollado técnicas útiles que no hacen
suposiciones restrictivas respecto a la forma de las
distribuciones de las poblaciones. Éstas se conocen
como pruebas sin distribución, o pruebas no
paramétricas.
Elementos que conforman un Contraste
Hipótesis
• DESDE LA HIPÓTESIS DE TRABAJO
1. RELACIÓN MATEMÁTICA
2. SE RELACIONA CON HIPÓTESIS ESTADÍSTICA _______________
3. SE ESPERA ENTONCES _____________ LA HIPÓTESIS NULA
4. LA REGIÓN DE RECHAZO ES______________ (VER HIPÓTESIS
ALTERNA)
5. LA PROBABILIDAD ESPERADA ES ENTONCES (VER 3)
6. DECISIÓN SOBRE LA HIPÓTESIS NULA A PARTIR DE EVIDENCIA
(SE ACEPTA O RECHAZA)
7. DECISIÓN SOBRE HIPÓTESIS DE TRABAJO (SI 3=6 SE SUSTENTA…..
O NO SE SUSTENTA)
Se definen:
HIPÓTESIS DE HIPÓTESIS medida de
TRABAJO ESTADÍSTICAS discrepancia con una
distribución de
datos de la muestra probabilidad conocida
Regla de
decisión(nivel de
Se calcula una medida
de discrepancia significación a)
Valor calculado
Valor crítico o
tabulado
Se comparan los valores
calculado con tabulado
¿se rechaza
Ho?
H1 SI
NO
Se extraen conclusiones
DIAGRAMA DE LAS ETAPAS EN LA CONTRASTACION
DE LA HIPOTESIS ESTADISTICA Y SU RELACION CON
LAS HIPOTESIS DE TRABAJO. (Erika Himmel)
1 2
Hipótesis de se Hipótesis se estima El o los
trabajo formulan estadísticas parámetros
se
infiere
8 3 se selecciona
Un modelo
7 matemático
estadístico
se decide
4 se determina
6 5
se Reglas se La magnitud
Prueba de
significación calcula decisionales formulan de los errores
Identificación de hipótesis
• Hipótesis nula Ho • Hipótesis Alternativa H1
– La que contrastamos – Niega a H0
, , , ,
Región crítica y nivel de significación
Región crítica Nivel de significación: a
• Valores ‘improbables’ si... • Número pequeño: 1% , 5%
• Es conocida antes de realizar el • Fijado de antemano por el
experimento: resultados experimentales investigador
que refutarían H0 • Es la probabilidad de rechazar H0
cuando es cierta
a=5%
No rechazo
H0
a/2=2.5% a/2=2.5%
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis
alternativa
Bilateral
Unilateral Unilateral
Contrastes: unilateral y bilateral
Un ejemplo para la prueba t para una a:0.05 y gl:20
Bilateral
Unilateral Unilateral
Psicología
Biología
Educación
Astronomía
Economía
Ciencias sociales y
administrativas
PUNTUACIONES ESTÁNDAR
m=0 y s = 1.
xm
Se define una variable
Zx
s
PUNTUACIONES ESTÁNDAR: PUNTAJE Z
MATEMATICA : 5.8
LENGUAJE : 6.1
CIENCIAS : 5.6
En términos absolutos, Paula obtiene mejor nota en
Lenguaje, luego en Matemática y finalmente en Ciencias.
Ciencias Matemática Lenguaje
5.6 5.8 6.1
EJEMPLO DE COMPARACIÓN PUNTAJE Z
MATEMATICA : 0.20
LENGUAJE : -0.14
CIENCIAS : 0.54
T= 50+10z
EJEMPLO DE COMPARACIÓN PUNTAJE T
Tres estudiantes obtienen los siguientes puntajes en una
prueba de habilidad matemática, de un total de 100
puntos:
Mónica : 82
Carmen : 53
Cristina : 65
En términos absolutos, Mónica tiene el puntaje más alto y
las tres se encuentran sobre los 50 puntos.
0 10 20 30 40 50 60 70 80 90 100
xm
T x 50 10 s
EJEMPLO DE COMPARACIÓN PUNTAJE T
Mónica : x= 82 ; media= 60 y ds= 12
82 60
T 82 50 10 12 68.33
Carmen : x= 53 ; media= 60 y ds= 12
53 60
T 53 50 10 12 44.16
Cristina : x= 65 ; media= 60 y ds= 12
65 60
T 65 50 10 12 54.16
EJEMPLO DE COMPARACIÓN PUNTAJE Z
Mónica : 68.33
Carmen : 44.16
Cristina : 54.16
Carmen Cristina Mónica
44.16 54.16 68.33
Curva normal, Percentiles y Valores Estándar
¿Cómo calcular probabilidades asociadas a
una curva normal específica?
Dado que tanto m como s pueden asumir infinitos
valores, lo que hace impracticable tabular las probabilidades
para todas las posibles distribuciones normales, se utiliza la
distribución normal reducida o tipificada
1s 68 %
2s 95 %
3s 99 %
68%
95%
99% z
-3 -2 -1 0 1 2 3
Ahora podemos calcular eI valor z dada:
y una x seleccionada.