Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El objetivo del análisis de datos es el de extraer conclusiones de tipo general partiendo de pocos datos particulares
(de las propiedades de la población x la info contenida en una muestra).
INFERENCIA ESTADISTICA: El santo de lo concreto (muestra) a lo general (población).
CONTRASTE DE HIPÓTESIS (prueba de significación o prueba estadística): procesos mediante el cual se
trata de comprobar si lo que se afirma sobre una propiedad de la población puede sostenerse con la información
de la muestra disponible. Método de toma de decisiones, mantener o rechazar lo que se cree de esa población
dentro del método científico.
El contrastar las opciones dentro de un problema de conocimiento (que surgen de conocimiento ya existente), la
solución previsional de este problema de conocimiento toma forma de afirmación directamente verificable (no se
especulativos al poder hacer una contrastación empírica) estableciendo una forma operativa del comportamiento
de la/s variable/s.
HIPÓTESIS CIENTIFICA: es la afirmación verificable del conocimiento del problema (sobre la variable).
Contraste de Hipótesis: proceso de verificación de la hipótesis utilizado por la ciencia empírica.
3.1 lógica del contraste de hipótesis
1° paso: formular estadísticamente la hipótesis científica que se va a contrastar. Es decir, transformar un hipo
científica en una Hipo Estadística
2°paso: buscar evidencia empírica relevante para poder informar si la hipótesis que se estableció es o no
sostenible. Si extraigo de una muestra de la población un resultado similar al de la distribución poblacional que
la hipótesis propone puede decirse que es compatible con los datos empíricos. Si yo propongo que no hay ≠ entre
inteligencia de hombres y mujeres, al comparar las medias de dos muestras de individuos debería haber similitud
en las mismas.
3°paso: regla de decisión que debe establecerse en términos de probabilidad. La necesidad de trabajar con muestra
y no poblaciones (ya que no se puede la totalidad de individuos) nos obliga a establecer reglas para decidir en
términos de probabilidad. SI EL RESULTADO DE LA MUESTRA OBSERVADA ES MUY POCO PROBABLE, SUPONIENDO QUE LA
HIPOTESIS ES CORRECTA, SE LA CONSIDERA INCOMPATIBLE CON LOS DATOS. SI EL RESULTADO MUESTRAL ES
PROBABLE, SUPONIENDO QUE NUESTA HIPO ES CORRECTA, CONSIDERAMOS A LA MISMA COMO COMPATIBLE CON LOS
DATOS,
UN CONTRASTE DE HIPÓTESIS es un proceso de decisión en el que una hipótesis formulada en términos
estadísticos es puesta en relación con los datos empíricos para determinar si es o no compatible con ellos
Hipótesis estadística; afirmación sobre una o mas distribuciones de probabilidad, afirmación sobre la forma de
las distribuciones de probabilidad, o sobre el valor de parámetros de las distribuciones. HIPOTESIS
ESTADISTICAS suelen estar REPRESENTADAS por la letra H seguida de la afirmación que da contenido a la
hipótesis.
HIPOTESIS ESTADISTICA HIPOTESIS CIENTIFICA
Una hipótesis estadística surge partiendo de una La científica proporciona la base para formular la
científica sin que exista una correspondencia exacta estadística, pero no son la misma cosa
Se refiere a un aspecto de una distribución de Se refiere a un aspecto de la realidad
probabilidad
Existen muchas formas ≠ de expresar estadísticamente una hipótesis científica correcta
El primer paso para verificar una hipótesis es formular en términos estadísticos la afirmación que contiene la
hipótesis científica que se va a verificar.
El contraste de hipótesis se basa en
Ho hipótesis nula H1hipotesis alternativa
*Hipótesis que se somete a contraste *Hipótesis que niega a la nula
*Suele ser una afirmación concreta sobre la distribución de *Incluye todo lo que excluye la nula
probabilidad o sobre el valor de algún parámetro de la
distribución.
*Suele ser exacta, algo igual a algo *Suele ser inexacta, algo es ≠ < o > a algo
EL SIGNO IGUAL solo = (exacta) o acompañado ≥ ≤
(inexacta) SIEMPRE VA EN LA NULA
Ambas son exhaustivas y mutuamente exclusivas, si una es verdadera la otra es necesariamente falsa
≠ CONTRASTE BILATERAL o bidireccional
< o > CONTRASTE UNILATERAL o unidireccional (derecho o izquierdo si es mayor o menor)
3.1.2 Los supuestos
Para que la hipo estadística pueda predecir el resultado de la muestra con cierta exactitud se debe establecer
completamente la distribución de la población a trabajar, por ejemplo, una distribución normal con parámetros
establecidos, o una binomial que establece el tamaño de la muestra SON HIPOTESIS SIMPLES si no
especifican completamente son COMPUESTAS
Al no quedar establecido algo (n mu media o desvío) se debe estableces un CONJUNTO DE SUPUESTOS que
sumados a la hipótesis nos permiten especifica por completo la distribución poblacional de referencia.
Para contrastar una hipótesis donde se quiere saber si mu=30 o mu≠30, teniendo en cuenta que tan cercano a 30
debe ser el numero para saber si es =se tomara una regla de decisiones asociadas a una probabilidad, como en
este caso desconocemos sigma seguimos con el modelo de transformación T de Student con n= -1 grados de
libertad (por ejemplo)
LOS SUPUETOS de un contraste de hipótesis son un conjunto de afirmaciones que necesitamos establecer
(sobre la población de partida y sobre la muestra utilizada) para conseguir determinar la distribución de
probabilidad en la que se basara nuestra decisión sobre Ho
Algunos supuestos son mas restrictivos/exigentes que otros. EL INCUMPLIMIENTO de uno o varios
SUPUESTOS puede invalidar el contraste o llevar a una decisión errónea.
3.1.3 El estadístico de contraste
Se rechaza la hipótesis: cuando el valer del estadístico de contraste cae en la zona critica, se rechaza xq significa
que el valor tomado por el estadístico de contraste se aleja demasiado de la predicción que establece esa
hipótesis, ES DECIR que, si la hipótesis planteada fuera verdadera, el estadístico de contraste no debería haber
tomado ese valor, y como el estadístico si toma ese valor, la conclusión más razonable será que la hipótesis
planteada no es verdadera.
El TAMAÑO DE LAS ZONAS de rechazo y aceptación se determinan fijando el valor de α, es decir fijando el
nivel de significación con el que se desea trabajar (α es la probabilidad que se considera como bastante chica
para que los valores con esta probabilidad o menos no ocurran en Ho verdadera. α es establecida de
forma arbitraria, pero suele ser 0.01 y 0.05 (ósea me da el 99% o 95% de “eficacia”)
la forma en la que se va a dividir la distribución muestra en
zona de rechazo y zona de aceptación depende si el contraste
es BILATERA o UNILATERAL.
La zona critica estará situada donde puedan aparecer valores
muestrales incompatibles con Ho (es decir apuntan en contra
de Hi. La zona critica debe recoger los valores muestrales que
vayan en la dirección y tambien los que vayan en la direccion
La decisión se toma siempre con respecto a Ho, rechazándola o manteniéndola en base al valor tomado por el
estadístico de contraste y las condiciones de la regla de decisión: SE RECHAZA Ho si el estadístico de contraste
cae en zona critica, SE MANTIENE Ho si el estadístico de contraste cae en zona de aceptación.
Una decisión en el contraste de hipótesis consiste en rechazar o mantener Ho:
-si la rechazamos, afirmamos que esta hipo es falsa, afirmando que la probabilidad α de equivocarnos que
conseguimos probar en esta hipótesis es falsa.
-si la mantenemos, no afirmamos que se prueba la veracidad de la hipótesis, sino que afirmamos que no tenemos
evidencia empírica suficiente para rechazarla y puede ser considerada como compatible.
MANTENER una hipótesis nula, significa RECHAZAR una hipótesis nula, significa
con ello, que la hipótesis es compatible con con ello, que consideramos probado que
los datos esta hipótesis es falsa
Ya que Hi es de naturaleza tan inespecífica, es raro poder afirmar que la misma no es verdadera, y todo lo que se
desvíe un poco de Ho es parte de Hi, por lo que al mantener Ho se puede estar manteniendo algunos valores de
Hi, por lo que se MANTIENE O RECHAZA Ho, pero NUNCA que SE ACEPTA COMO VERDADERA.
La posibilidad de caer en falacias de afirmación del consecuente nos advierte la importancia de decidir como
plantear la hipótesis nula y alternativa en un contraste concreto
█para determinar que una afirmación sobre x cosa es FALSA, esta afirmación debe se planteada como Hipo Nula
(al rechazarla podemos concluir que es falsa)
█para determinar que una afirmación es VERDADERA, a esta se la plantea como Hipo Alternativa, así, al
rechazar la hipótesis nula es a favor de la alternativa (ya que la alternativa es la negación de la nula).
Bilaterales: el investigador o bien no sabe previamente sobre la dirección que pueden producir resultados
incompatibles con Ho, o, considera importante que los resultados sean incompatibles con Ho para cualquiera de
los dos lados (+o-)
Las hipótesis formuladas no contienen ninguna predicción sobre la dirección en la que se puede producir un
resultado muestral incompatible con la afirmación establecida en Ho, lo que se refleja en Hi con el signo de ≠
Unilaterales: Cuando el investigador desea comprobar si el valor del parámetro aumento/disminuyo, si un
grupo supera o no a otro en alguna variable, o si dos variables están relacionadas, etc.
El investigador tiene una idea previa sobre la dirección en la que se producen los resultados muestrales
incompatibles con Ho, o lo relevante solo es que se muestre incompatibles los resultados en alguna de las dos
direcciones
Hipótesis con predicción concreta sobre la dirección en la que se puede producir un resultado muestral
incompatible con la afirmación establecida, Hi esta reflejada con signos < y >
PARDO CAPITULO 04 – CONTRASTE DE HIPÓTESIS sobre medias
Pero puede ser que incluso μ y sean desconocidas y se deba hacer la transformación T
4.1.2 Suponiendo varianzas iguales
Raramente la investigación nos da medias poblacionales desconocidas con varianzas conocidas, por lo general
las varianzas suelen ser desconocidas por lo que la distribución muestral de Ypalito i – Y palito ii también va a
ser desconocido, por lo que se hará un supuesto de igualdad de varianzas o HOMOCEDASTIVIDAD
Si todas las varianzas son iguales solo necesitamos calcular una (varianza es desvió al cuadrado = ²)
Todos unos cuadros con ecuaciones y bla bla bla…… el procedimiento que se describe es la PRUEBA T
SOBRE LA ≠ DE MEDIAS es presentado para comparar las medias de dos grupos independientes. Pero para
que T se distribuya según el método t de Student, es necesario que sean las poblaciones normales, con n
razonablemente grandes e iguales o similares para que la varianza que se estima igual no sea incorrecta
ACA ESTA EL PUNTO 4.2 QUE NO FIGURA EN EL PROGRAMA
El índice de la relación lineal se llama COVARIANZA (puede definirse también como el promedio de
productos cruzados de las puntuaciones directas menos el producto de las medias) la covarianza carece de
valores máximos y mínimos, estables y comunes en todos los casos (todo es muy relativo como para saber si es
mucho poco o que tan cerca del cero esta un numero)
COEFICIENTE DE CORRELACIÓN DE PEARSON: Al usar las puntuaciones típicas las varianzas no
cambian al modificar por ejemplo las unidades de medida (km a yardas, litro a decímetro cubico etc.) la
puntuación típica tiene de varianza siempre 1.
Representado por la letra r, es un promedio de productos cruzados per de puntuaciones típicas (no las
diferenciales como la cuasivarianza)
En la fórmula 8.5
- la correlación entre dos variables siempre tendrá el mismo signo que la covarianza (xq el denominador es la
desviación típica que siempre es positiva)
-si la desviación típica de alguna de las variables es cero, la correlación es inmediata, ya que se dividiría por
cero (puntos en perfecta línea recta)
FIABILIDAD DEL TEST se suele administrar la prueba dos veces en el lapso corto (1sem x ej.) y se halla la
correlación entre las puntuaciones obtenidas ambas veces. Se debe desconfiar de test con índices de fiabilidad
menores a los que se establezcan para cada caso/área de estudio
La CORRELACION NO ES CAUSALIDAD no malinterpretar, una no causa la otra, se dan si ser causales
Estudios que miden conjuntos de variables, cuantifican las relaciones lineales y los relacionan pueden incluir los
valores de la investigación en una MATRIZ DE CORRELACIONES: tabla con tantas filas y columnas como
variables, donde se aprecia la correlación entre variables donde se cruzan sus respectivas filas/columna
Matriz triangular superior si presentan valores en las posiciones superiores a la diagonal principal
Matriz triangular inferior si presentan valores en las posiciones inferiores a la diagonal principal