16) Prueba Estadistica Inferencial

SEMINARIO
DE GRADO EN
FONOAUDIOLOGÍA
APUNTE 16
PRUEBAS ESTADÍSTICA INFERENCIAL
LICENCIATURA EN FONOAUDIOLOGÍA
AUTOR: MARCELO ACUÑA
UNIVERSIDAD GABRIELA MISTRAL

SEMINARIO DE GRADO – UGM V IRT UAL
1. Introducción
El siguiente documento tiene por fin ser una guía acotada para el manejo básico de pruebas estadísticas
inferenciales. Se presenta de forma acotada sin revisar de manera acabada toda la teoría a la base
de cada una de ellas, dejando además un modelo de presentación para guiar la interpretación final.
Este último funciona como un compilado de fuentes de información al respecto.
Para facilitar su utilización se aconseja acompañarlo con la exploración de algún paquete de análisis
estadístico, idealmente SPSS o R*.
El campo de la estadística es un conjunto de procedimientos para reunir, medir, clasificar, codificar,

computar, analizar y resumir información numérica, adquirida sistemáticamente” (Ritchey, 2008, p. 1)
Apunte de cátedra (16)

2
2. Variable
Una variable es todo atributo que cambia (varía). En todo análisis, siempre se consideran variables,
que dentro de un diseño investigativo se conforman como internas o externas. Se consideran variables
internas aquellas que son propias del estudio en cuestión, en tanto se consideran externas todas
aquellas que actúan como contexto ajeno al asunto analizado.
Dentro de las variables internas al diseño, se establece la posibilidad de medición o manejo de las
mismas. El manejo estipulado permitirá, o no, el control de cada variable por parte del investigador.
En cada análisis será posible determinar variables de carácter dependiente o independiente, cuestión
que delimitará las pruebas estadísticas que podremos o no realizar.
Una variable dependiente es toda aquella característica que queremos observar su cambio a raíz del
cambio controlado de otra variable, la variable independiente. Esto considera que todo aquel atributo
o característica que sea posible de medir y ser controlado, ya se por selección o de manera directa,
es posible de ser considerada como variable independiente.
La distinción de las variables entre dependientes e independientes se relaciona, pero no determina,

el nivel de medición de cada una.
3. Niveles de medición

Según los atributos que la variable presente, estos podrán ser medidos de una u otra forma.

Las variables cualitativas tienen mayor profundidad de análisis, pues les subyace espacios de contenido
y discurso que trasciende los espacios de medición, por los espacios de comprensión. Para aquellas
que tienen participación en estudios de enfoque cuantitativo, se les ordena y considera asociadas a
su frecuencia. Estas variables cualitativas pueden tener los siguientes niveles de medición:
1. NIVEL NOMINAL: Son variables cuyos atributos medibles son directamente nombres propios. No
existe una jerarquía propia, y el ordenamiento determinado para el análisis, es del todo arbitrario,
es decir, se ordenan acorde a la frecuencia de aparición.
3
Algunos ejemplos:
Sexo Hombre; Mujer; Otro
Nacionalidad Chilena ; Peruana ; Boliviana …
Diagnóstico HTA ; Diabetes …
Estado civil Soltero; casado; viudo; conviviente civil.
Las variables cuyo nivel de medición es Nominal tiene poca participación dentro de los cálculos
propiamente tal, sin embargo, dan orden y permiten la identificación de distintos grupos de datos.
2. NIVEL ORDINAL: Son variables cuyos atributos medibles pueden, o no, ser nombres propios, sin
embargo, a diferencia de las de nivel Nominal, en este caso si existe una jerarquía propia, siendo
en este caso el ordenamiento determinado para el análisis provisto por los mismos atributos de
la variable en cuestión. Las categorías implican en sí mismas una jerarquía u orden.
Algunos ejemplos:
Variable Atributo
Satisfacción Muy satisfecho
Satisfecho

Insatisfecho
Intensidad del dolor Alta
Media
Baja
Nivel Socio-Económico ABC1

C2
C3 …
4
Dependiente de la prueba estadística a querer utilizar, las variables de carácter ordinal permiten
cierto manejo a nivel estadístico, permitiendo además entender el orden jerárquico como parte de
los caculos posibles de realizar.
Por su parte, las variables cuyos atributos son cuantificables, entregan mayor versatilidad al investigador,
quien podrá extraer conclusiones estadísticas que le permitan conocer, respaldado en la estadística,
el comportamiento de fenómenos observados y reportados.
3. NIVEL DE INTERVALO
Intervalo Discreto: Números enteros, que permiten todas las operaciones matemáticas que un
número entero pueda proveer. Tienen sin embargo la salvedad que, si bien se podría obtener un
indicador, este puede ser comprensible sólo desde la noción matemática y no necesariamente desde
la realidad. Tomemos para este ejemplo la variable de intervalo discreto “Número de hijos”, en ella
es posible entender que los atributos podrán ser medidos sólo en números enteros, a razón de que
sólo se puede tener 1, 2 o 3 hijos (o más), pero no se puede tener 1,5 hijos. Sin embargo, al obtener
un promedio de hijos en una comunidad determinada, nos encontramos con la afirmación de que
“existen 2,73 hijos por mujer nacida”, esto último es una noción estadística, esto significa, que puede
darnos una idea que es comprensible, pero no necesariamente tangible.
Otros ejemplos de la misma: edad en años, número de intentos de suicidio.
Intervalo Continuo: Similar al nivel de medición de intervalo discreto, los intervalos continuos entregan
la continuidad de la medición, por ello pueden referirse a la infinidad que puede existir entre un valor

entero y otro. Para este caso, los valores son números que pueden definir decimales, y que, por tanto,
no tienen limitaciones operacionales al momento de realizar cálculos.
Algunos ejemplos:
Coeficiente intelectual (C.I), velocidad de respuesta (en segundos), tiempo de reacción (en segundos).
El amplio espectro de cálculos que permite esta variable, permite su desarrollo en casi todas las
pruebas estadísticas revisadas en este apunte.
5
4. Antes de continuar
Es necesario entonces, en este punto, recordar que la estadística funciona como una herramienta,
y que, como tal, será tan exacta y correcta, cómo quien la utiliza y el uso que le dé. En el desarrollo
de una investigación, existe un momento de determinación de las variables, así como sus niveles de
medición, este punto es crucial, pues sienta las bases de aquello que podremos, o no, hacer en última
instancia con los datos levantados, permitiendo el uso de pruebas estadísticas cuándo la planificación
lo haya contemplado.
Se hace necesario entonces, antes de continuar, aplicar y considerar las variables del estudio en curso.
Se presenta un esquema orientador para la exploración:

6
5. DISTRIBUCIÓN PARAMÉTRICA Y NO PARAMÉTRICA.
Tradicionalmente se considera que los fenómenos en la naturaleza se manifiestan en una distribución
normal, esto es, que los extremos de manifestación son menos frecuentes, teniendo una concentración de
frecuencias en el centro, alejado de los extremos. El concepto de media proviene de esta consideración,
en la que el valor más frecuente se encuentra al medio, coincidencia con varios de los indicadores de
tendencia central, explicado más abajo en este apunte.

Ilustración 1Curva normal o Campana de Gauss
En la figura podemos ver un ejemplo de curva normal, en ella vemos la distribución del Coeficiente
intelectual, en el que ambos extremos se encuentran poco poblados, es decir, existen pocos coeficientes
muy bajos y pocos coeficientes muy altos, sin embargo, es evidente que existe una mayor concentración
al centro, dejando en claro que existe mayor frecuencia en torno al puntaje 100 de coeficiente. 7
Toda distribución de frecuencias que no se comporte de esta manera es, por antonomasia, considerada
como no-paramétrica, esto conlleva varias implicancias, entre ellas que las pruebas estadísticas
aplicadas deben considerar esta forma de distribución.
6. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central son todos aquellos indicadores que pretenden resumir dentro de si
un número mayor de datos, esto significa que son representantes generales. Pretenden ser indicadores
relevantes, que entreguen información descriptiva al lector. Algunos de ellos son:
MEDIA (≈PROMEDIO): El valor que pretende entregar la mayor información de los datos. En general
se considera que media y promedio como sinónimos, sin embargo, esto no necesariamente es así, y la
diferencia radica en las variables paramétricas o no paramétricas. Para aquellas variables paramétricas,
en las que el promedio se encuentra justo al medio de la distribución, media y promedio, serán
entonces sinónimos. Se hace obvio entonces que, por oposición, esto no será así para las variables
no-paramétricas, pues en ellas el valor más frecuente no necesariamente se encuentra al medio de la
distribución ordenada. Para efectos de esto documento, y por la naturaleza de las pruebas estadísticas
a mostrar, se considerará como sinónimo media y promedio.
El mayor defecto de la media es que puede ser engañosa por sí sola, famosa es la frase de Nicanor
Parra “yo me como dos panes, usted ninguno; consumo promedio: un pan por persona”, por ello suele
ser acompañado de otros indicadores revisados más adelante.
Por ejemplo: (18+19+20+21) / 4 =promedio de edad del grupo.
MODO (MODA): Similar a su uso común, la moda es el valor de la distribución que más se repite. Se
pueden repetir bimodal, polimodal.

Por ejemplo: El nombre María se repite 200 veces en un grupo de 300 personas (frecuencia) por ello
es considerado Moda.
MEDIANA: Valor de la distribución que la divide en dos mitades. Es por definición el valor que, al
ordenar los datos, se encuentra al medio.
En una distribución paramétrica, Media y Mediana deberían coincidir.
8
7. MEDIDAS DE VARIABILIDAD:
Para indicar como cambia la variable y como se distribuyen los datos, se usan indicadores generales
que hablan directamente del comportamiento de los datos. Entre ellos tenemos:
7.1. CAMPO DE VARIACIÓN

Uno de los indicadores más simples y claros, es la diferencia entre el valor máximo menos el valor
mínimo. Y nos permite saber, del espectro posible de valores que puede tomar el atributo, que valores
tomó.
7.2. DESVIACIÓN ESTÁNDAR

La más empleada de las medidas de variabilidad y el mejor compañero de una media. Está representada
por la letra “S”. Corresponde a la raíz cuadrada del promedio de las desviaciones al cuadrado con
respecto al promedio. Y en palabras simples intenta de aclararnos cuánto varió los datos con respecto
al promedio; incluso es entendible como el promedio de las diferencias, y siempre se entrega en
valores absolutos, es decir que puede ser sobre o bajo el promedio indicado.
Por ejemplo: Si el promedio de Coeficiente intelectual es 100 y en un grupo se movieron en general

entre los 90 puntos y los 110, la Desviación Estándar sería de ±10 puntos, es decir 10 puntos sobre
o bajo el promedio.
Mientras más alta es la variabilidad o desviación estándar, existe menor homogeneidad con respecto
al promedio. Por ejemplo, en un curso, lo homogéneo= notas de un curso similares y lo heterogéneo=
mucha diferencia de notas dentro de un curso.

9
Ilustración 2 Formula de desviación estandár

8. MEDIDAS DE POSICIÓN
Considerando el gráfico de la curva normal como plano de ubicación, las medidas de posición orientan
con respecto a qué punto dentro de ese plano ocupa un dato particular.
La utilidad radica en toda la información que puede proveer sólo saber dónde se ubica.

A continuación, algunos de los datos necesarios para comprender estos conceptos.
NORMAS: Es el conjunto poblacional de la puntuación directa de la mayor parte del individuo, y que
sirve de parámetro para ubicar y comparar los datos de un individuo. Para poder determinar la ubicación
exacta de un sujeto con respecto a su grupo de referencia, el puntaje bruto debe transformarse en
alguna medida relativa de posición.
Estas serán: percentiles, puntajes Z y puntajes T.
8.1 PERCENTILES 10
Al poder determinar lo cantidad porcentual de datos que presentan una característica es también
posible determinar cuántos cumplen con ese valor o menos. Los percentiles son indicadores relevantes
de los porcentajes acumulados de los datos, que nos permiten tener nociones del área en que se
encuentra un dato particular.
Frecuencia acumulada (Fac%) con respecto a su valor total. Esto nos permitiría entender cuántos de
los datos están considerados en que porcentaje de los datos.
8.2 PUNTAJES Z Y T:
Puntaje Z es una medida relativa a la Desviación Estándar, esto quiere decir que cuándo puedo saber
cómo se comporta una curva normal, puedo saber más datos de ubicación.
Por ejemplo, en una curva donde el promedio se encuentra al centro de la curva, tomando por
ejemplo el Coeficiente intelectual de media = 100, con desviación estándar (S) =±10, sabemos que 1
desviación estándar (1S) significaría estar desplazado hacia la derecha de la curva, y 2S, sería estar aún
más desplazado, y así 3S sería estar 30 puntos sobre el promedio, o 3 desviaciones estándar sobre el
promedio. Entonces, al considerar Desviación estándar como una forma de ubicar un dato, sabremos
que, si es 1,34 S, está sobre el promedio, 1,34 desviaciones estándar; Puntaje Z es ese puntaje, la
cantidad de desviaciones estándar que separan al dato del promedio y puede ser positivo o negativo.
Entonces, con un puntaje Z=-2,324, sabemos que ese dato se encuentra 2,324 desviaciones estándar
bajo el promedio.

Entonces, ¿Cómo se calcula el puntaje Z? Se utiliza la siguiente formula: Z=x-µ/S (dato x menos el
promedio, dividido la desviación estándar).
Por ello, cuándo Z es cero, el valor es igual al promedio; por ejemplo, en el caso de la estatura de una
persona, cuando el valor de Z dé cero, la persona tendría una estatura igual a la del promedio de la 11
muestra. Cuando el valor de Z nos da negativo, quiere decir que está bajo el promedio (la persona
tendría una estatura por debajo del promedio), y cuando el valor de Z es positivo, estaría por sobre
el promedio en unidades de desviación estándar.
El puntaje T es una forma de transformar el puntaje Z en un valor absoluto y más comprensible. Sólo
pretende aumentar su valor: T= Z*10+50 (valor Z por 10, más 50).
Y en este caso, T=50 es el promedio, y por ello, bajo 50 es bajo el promedio y sobre 50, sobre el
promedio.
9. PRUEBA DE HIPÓTESIS

Al momento de querer decir algo, científicamente posible de comprobar y aseverar, es necesario
seguir el método científico, para ello se elaboran una Prueba de hipótesis, esta prueba considera que
existen necesariamente 2 alternativas: lo que propongo es verdadero o lo que propongo es falso.
Para poder dar una forma única y consensuada de acercamiento, se elaboran 2 hipótesis antónimas:
Hipótesis nula o hipótesis cero: niega el evento o afirma que éste se debe al azar.
Hipótesis alternativa o hipótesis investigativa o hipótesis 1: Afirma el evento “significativo”.
Por ejemplo,

En este caso, para una hipótesis se propone existen diferencias entre dos variables, en este caso P1
y P2. Se observa la proporción entre, por ejemplo, altura en hombres y mujeres. La diferencia puede
ser (se debe) al azar o, puede que no se deba al azar, para ello se estipula la prueba de hipótesis y
se somete a una prueba estadística, que tendrá que determinar científicamente si esto es así o no.
Para determinar si algo es así, científicamente, se utiliza una noción de error posible. Para considerarlo
válido se necesita un error del 5% o menos; esto quiere decir que, sí es que existen diferencias, pero
no puedo asegurar que ocurra el 95% de las veces, como mínimo. Para ello entonces utilizaremos el
concepto de significación o sig.
12
A partir de la observación de la significación de la prueba estadística, podremos aseverar si es que
la CONTINÚA?
Límite (mayor o menor a) 0,005: Zona de rechazo de la hipótesis nula. Se acepta la hipótesis alternativa.
Límite 0,95: Zona de aceptación de la hipótesis nula. Se rechaza la hipótesis alternativa.

9.1. ¿CÓMO SE PLANTEA UNA HIPÓTESIS ESTADÍSTICA?
Si bien, no existe una estructura tipo para la elaboración de una respuesta a todas las purbas estadísticas,
existen ciertos puntos comunes que pueden ser referidos con el modelo explicitado a continuación.
1. Hipótesis estadísticas: H0: H1:
2. Nombre de la prueba estadística:
3. Montos: el valor estadístico relevante de la prueba aplicada.
4. Conclusión: Monto de Sig=
se acepta o rechaza la hipótesis nula, acorde al valor de la significación, mayor o menor a 0,05, etc.
5. Interpretación: se ofrece una interpretación coherente de los datos, más allá de la conclusión
estadística entregada en el punto anterior, se integran los valores de los montos, se responde la
pregunta de origen y se elabora la respuesta en base a la hipótesis aceptada.
10. CORRELACIÓN LINEAL SIMPLE

Una prueba de correlación establece la co-ocurrencia de dos fenómenos, cuya causalidad no está en
cuestionamiento, es decir, al aseverar que ambos se encuentran correlacionados, en ningún caso se
está estableciendo que uno que uno ocurre a causa del otro.

Para referirnos a la correlación y la forma en que se manifiesta, utilizaremos la prueba estadística de
Correlación de Pearson, que permite determinar si existe correlación entre dos variables de intervalo
continuo, arrojando un estadístico llamado r (siempre en minúscula). Este coeficiente puede indicar
correlaciones con valores que van desde el -1 hasta el +1, dónde 0 indica que no existe correlación
o correlación nula.
Al considerar las correlaciones estamos permanentemente haciendo referencia a un diagrama XY, en

dónde X es una variable e Y otra variable, de tal forma que, en general, se pueden dan tres posibles
escenarios: 13
10.1. CORRELACIÓN DIRECTA

Una correlación directa, positiva o directamente proporcional, indica que el comportamiento o las
ocurrencias de las variables en cuestión tienden a aumentar en conjunto, es decir, mientras la variable
X aumenta, la variable Y también lo hará, dibujando una línea recta ascendente. Por ello, al considerar
sus valores en la prueba de correlación, su coeficiente será mostrado como positivo o sobre cero,
indicando una recta inclinada como en la figura a continuación.
Ilustración 3 Correlación positiva
10.2. CORRELACIÓN INVERSA

Una correlación inversa, indirecta, o negativa, indica que en tanto una de las variables aumentaba la
otra disminuía, mostrando indicadores negativos en la prueba de correlación. Esta correlación deja
explicito que ambas variables son inversamente proporcionales, así mientras una aumente, es más
probable que la otra disminuya.
Al mapear las ocurrencias de ambas variables, se dibuja una recta inclinada hacia abajo, como se
muestra a continuación:

Ilustración 4 Correlación negativa
10.3. NO EXISTE CORRELACIÓN

Son varios los motivos por lo que una correlación puede no presentarse, esta puede ser azarosa, o
bien, puede ser una constante. Para efectos de la prueba de correlación lineal simple, toda ocurrencia 14
que no describa una pendiente lineal es considerable como no existe correlación.
10.4. EJEMPLO
Utilizando el paquete estadístico SPSS, se presenta un ejemplo con las variables: Trastornos alimenticios
y Puntaje prueba de ansiedad de Seus.
Ilustración 5 Ejemplo de correlación. Output SPSS.
En este caso la respuesta sería elaborada como sigue:
1. Hipótesis estadísticas:
a. H0: r=0 (No existe correlación entre las variables X e Y)

b. H1: r≠0 (Existe correlación entre las variables X e Y)
2. Nombre de la prueba estadística: Correlación de Pearson
3. Montos: r= 0,743
4. Conclusión: monto de Sig= 0,000 . Dado sig=0,000 (p ≤0,05) se rechaza hipótesis nula y se acepta
hipótesis alternativa por lo que existe correlación entre las variables X e Y.
5. Interpretación: Para interpretar los dados de correlación es necesario conocer los criterios de 15
evaluación de una correlación.
CRITERIOS DE EVALUACIÓN DE CORRELACIÓN:
Magnitud: Monto de la correlación, que puede ser clasificado en, bajo (0 – 0,25), Medio Bajo (0, 26
– 0,50), Medio alto (0,51 – 0,75), Alto (0,76- 1).
Dirección: Signo positivo o negativo de correlación. Si el signo es positivo las variables son directamente
proporcionales (ej: si el rendimiento sube, las notas de los alumnos suben). Si en cambio la dirección
es negativa, la proporción es inversamente proporcional, (una sube, la otra baja, ej: si el tratamiento
aumenta, la depresión disminuirá paulatinamente).
Coeficiente de determinación (R mayúscula): Es el monto de cambio de variación de variables. Está

representado por R=(r*r)* 100 (R es igual a r al cuadrado por 100), la varianza de “y” respecto de
“x”. Es decir, cuánto cambia “y “respecto de la variable “x”.
R=r por ciento. El valor resultante será explicado en porcentajes. Entonces, diríamos “y” está afectado
en un 23% por la variable “x”, por ejemplo.
Interpretación de R: (Ejemplo) La varianza de la variable asertividad (“y”) explica en un 42% la varianza

de la variable edad (“x”) y viceversa.
Para el ejemplo anterior entonces la respuesta completa sería como sigue:
1. Hipótesis estadísticas:

a. H0: r=0 (No existe correlación entre las variables X e Y)
b. H1: r≠0 (Existe correlación entre las variables X e Y)
2. Nombre de la prueba estadística: Correlación de Pearson
3. Montos: r= 0,743
4. Conclusión: monto de Sig= 0,000 . Dado sig=0,000 (p ≤0,05) se rechaza hipótesis nula y se acepta
hipótesis alternativa por lo que existe correlación entre las variables X e Y. 16
5. Interpretación: Existe correlación entre Trastorno alimenticio y Puntaje prueba de ansiedad de

Seus, ésta es directamente proporcional por lo que a mayor Trastorno alimenticio también mayor
puntaje en la prueba de ansiedad de Seus. Esta correlación es de magnitud alta y su coeficiente
de determinación es 55,2%, esto es que la varianza de la variable Trastorno alimenticio explica
en un 55,2% la varianza de la variable Puntaje en la prueba de ansiedad de Seus, y viceversa.
10.5. REGRESIÓN LINEAL SIMPLE

En vista de que exista una correlación entre dos variables, es posible entonces predecir el comportamiento
de una a través del comportamiento de la otra, para ello es necesario primero saber cuál es esa
correlación y aplicar una ecuación que nos permitirá pronosticar, con cierto nivel de certeza, cuál
será el comportamiento de la otra variable.
Para realizar una interpretación de las variables, podemos bajo criterios de: magnitud, dirección y
coeficiente de determinación, predecir variables de una variable dependiente (y) a partir de la variable
independiente (x), para luego establecer una regresión.

Para entender la regresión, es necesario utilizar la Ecuación de la recta, que nos permitirá conocer
el valor deseado utilizando la siguiente formula:
17
Ilustración 6 Regresión
En la formula en cuestión, Y es el valor que queremos saber a partir de los datos que tenemos de X; a
será el valor constante, simbolizado por la diferencia al inicio de la recta en la ilustración; por último,
b es el coeficiente angular de la recta.
11. PRUEBA T DE STUDENT

La prueba T de student permite la comparación de 2 promedios de variables de intervalo, arrojando
un estadístico T que, junto a una significación, nos permitirá conocer si existe o no una diferencia
estadísticamente significativa entre ambas.
T des student nos provee 2 formatos, que se diferencian por la muestra que involucra su testeo. Se
consideran 2 muestras, las relacionadas o pareadas y las muestras independientes.
MUESTRA RELACIONADA O PAREADA: son las muestras que consideran un solo grupo de referencia,
o una sola población común, de la que se obtienen 2 promedios o medias de 2 variables distintas que

se desean comparar, por ejemplo, los promedios de la asignatura A y los promedios de la asignatura
B para un mismo grupo curso.
MUESTRAS INDEPENDIENTES: Considera la partición arbitraria de un mismo grupo, en el que se
18
contraponen 2 promedios obtenidos para 1 misma variable. En este caso las 2 variables en cuestión
en la prueba ya no son solamente las que arrojarán sus promedios, sino que se necesita de una variable
de agrupación, que nos permita diferenciar las muestras contempladas, separando nuestro grupo
en 2. Por ejemplo, comparar los promedios de la asignatura A para un grupo curso según su sexo.
11.1. PRUEBA T DE STUDENT PARA MUESTRAS PAREADAS
Prueba para un mismo grupo de mediciones relacionadas, pertenecen al mismo grupo muestral de ahí
que sean “pareadas”. Esta prueba compara dos promedios de dos variables diferentes, en un mismo
grupo. Ambas variables deben ser de intervalo.
El output de SPSS se ve de la manera siguiente:
Ilustración 7 Output T para muestras relacionadas
1. Planteamiento de hipótesis:

a. Ho: X1=X2; los promedios x1 y x2 son iguales, es decir, no hay diferencia significativa entre los
promedios.
b. H1: X1≠x2, Existen diferencias significativas entre los promedios.
2. Prueba de hipótesis: T de student para muestras relacionadas.
3. Montos: valores de los promedios, X1 y X2
4. Conclusión: Valor de T= xxx y valor de Sig= xxx (si se acepta o rechaza la hipótesis nula) 19
5. Interpretación: Si es que los promedios son iguales, no hay diferencias significativas entre las
variables, una variable no es superior a la otra o inferior a la otra y si son distintos los promedios,
existe una diferencia significativa entre ellas, habiendo una variable superior a otra en cuanto al
promedio.
11.2. PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES:
Grupos de mediciones diferentes, constituidos por elementos que son diferentes. Las mediciones
independientes no pertenecen al mismo grupo muestral.
Ej: Comparar la nota de evaluación de satisfacción que tuvo la variable “Comer” según el sexo de los
entrevistados, considerando una nota de 1 a 7. En este caso la variable “Comer” es una variable de
intervalo, sin embargo, la variable “Sexo” actúa como variable de agrupación, por lo que su nivel de
medición es nominal, y podría ser ordinal.

La prueba de T para muestras independientes incorpora además una prueba acotada de manera
interna, la prueba de Levene, para determinar la homogeneidad de las varianzas, esto considera la
necesariedad de usar uno u otro valor de T y sig.
1. Planteamiento de hipótesis:
a. Ho: X1=X2; los promedios x1 y x2 son iguales, es decir, no hay diferencia significativa entre los
promedios X1 y X2 según la agrupación de la variable Y.
b. H1: X1≠x2, Existen diferencias significativas entre los promedios de X según la variable de 20
agrupación Y.
2. Prueba de hipótesis: T de student para muestras independientes.
3. Montos de los promedios X1 y X2, además las desviaciones típicas S1 y S2.

4. Prueba de homogeneidad de varianzas (Levene):
H0: S1=S2 H1: S1 ≠ S2. Sig=
Si las varianzas son iguales se acepta la hipótesis nula, si las varianzas son distintas se rechaza la
hipótesis nula.
5. Conclusión: Valor de T= xxx y valor de Sig= xxx (si se acepta o rechaza la hipótesis nula)
6. Interpretación: Si es que los promedios son iguales, no hay diferencias significativas entre las
variables según la variable de agrupación, una variable no es superior a la otra o inferior a la
otra, independiente de los montos de los promedios. Si son distintos los promedios, existe una
diferencia significativa entre ellas, habiendo una variable superior a otra en cuanto los montos
entregados, esta diferencia es significativa.
12. ANÁLISIS DE VARIANZA ANOVA:

Similar a una T de student para muestras independientes, la prueba de ANOVA es una comparación
múltiple de promedios, en la que los atributos de la variable de agrupación son más de 2, esto quiere
decir que se compararán tres promedios o más. La novedad que incorpora esta prueba de hipótesis
es la posibilidad de comparar X1 con X2, X1 con X3 y X2 con X3; y así con entre todas las posibles
agrupaciones determinadas. Del mismo modo que en T independiente, la variable de agrupación
será una variable nominal, que en este caso tendrá más de 2 categorías, y la variable dependiente

será de intervalo.
21
1. Planteamiento de hipótesis: Planteamiento de hipótesis:
a. Ho: X1=X2=X3; los promedios x1, x2 y x3 son iguales, es decir, no hay diferencia significativa
entre los promedios X1,X2 y X3 según la agrupación de la variable Y.
b. H1: X1≠X2≠X3, Existen diferencias significativas entre los promedios de X según la variable de
agrupación Y.
La salvedad en este punto es que, la consideración de una diferencia entre X1, X2 y X3 no determina
exactamente entre cuales de los promedios involucrados sea la diferencia detectada, de ahí que sea
necesario realizar pruebas post-hoc.
2. Prueba estadística: ANOVA
3. Monto de promedios (x1, x2 , x3) y desviación estándar( s1, s2, s3).
4. ANOVA: Valor estadístico F= xxx y Sig= xxx , se acepta o rechaza la hipótesis nula.
5. Prueba de homogeneidad de varianzas (Levene):
a. Si se acepta H0: las varianzas son iguales, y en las pruebas post-hoc se recomienda usar la
formulación de Tuckey para la comparación múltiple de promedios.
b. Si se acepta H1: las varianzas son distintas, y en las pruebas post-hoc se recomienda usar la

formulación de Tamhane para la comparación múltiple de promedios.
22
6. Comparación múltiple de promedios:
H0: x1 = x2, Sig1=
H0: x2 = x3, Sig2=
H0: x3 = x1, Sig3=
7. Interpretación: En vista de que existen o no diferencias significativas entre los promedios, se

interpreta a partir de los montos y la comparación múltiple de promedios, que nos permitirá
saber dónde se encuentran las diferencias especificas entre los promedios.

23
BIBLIOGRAFÍA
• Campbell y Stanley (1995) “Diseños Experimentales y Cuasi Experimentales en la Investigación Social” Amorrortu
Editores, Séptima reimpresión. Buenos Aires.
• Hernández R, y otros. (2014) “Metodología de la Investigación” Editorial Mc Graw Hill. México.

24
UGM | 2018

16) Prueba Estadistica Inferencial

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

16) Prueba Estadistica Inferencial

Cargado por

Copyright:

Formatos disponibles

SEMINARIO

AUTOR: MARCELO ACUÑA

UNIVERSIDAD GABRIELA MISTRAL

El campo de la estadística es un conjunto de procedimientos para reunir, medir, clasificar, codificar,

Apunte de cátedra (16)

La distinción de las variables entre dependientes e independientes se relaciona, pero no determina,

3. Niveles de medición

Apunte de cátedra (16)

Sexo Hombre; Mujer; Otro

Nacionalidad Chilena ; Peruana ; Boliviana …

Diagnóstico HTA ; Diabetes …

Estado civil Soltero; casado; viudo; conviviente civil.

Satisfacción Muy satisfecho

Apunte de cátedra (16)

Nivel Socio-Económico ABC1

Otros ejemplos de la misma: edad en años, número de intentos de suicidio.

Apunte de cátedra (16)

Se presenta un esquema orientador para la exploración:

Apunte de cátedra (16)

Apunte de cátedra (16)

Por ejemplo: (18+19+20+21) / 4 =promedio de edad del grupo.

Apunte de cátedra (16)

En una distribución paramétrica, Media y Mediana deberían coincidir.

7.1. CAMPO DE VARIACIÓN

7.2. DESVIACIÓN ESTÁNDAR

Por ejemplo: Si el promedio de Coeficiente intelectual es 100 y en un grupo se movieron en general

Apunte de cátedra (16)

Ilustración 2 Formula de desviación estandár

Apunte de cátedra (16)

Estas serán: percentiles, puntajes Z y puntajes T.

Apunte de cátedra (16)

9. PRUEBA DE HIPÓTESIS

Hipótesis alternativa o hipótesis investigativa o hipótesis 1: Afirma el evento “significativo”.

Apunte de cátedra (16)

Límite 0,95: Zona de aceptación de la hipótesis nula. Se rechaza la hipótesis alternativa.

1. Hipótesis estadísticas: H0: H1:

2. Nombre de la prueba estadística:

3. Montos: el valor estadístico relevante de la prueba aplicada.

4. Conclusión: Monto de Sig=

10. CORRELACIÓN LINEAL SIMPLE

Apunte de cátedra (16)

Al considerar las correlaciones estamos permanentemente haciendo referencia a un diagrama XY, en

10.1. CORRELACIÓN DIRECTA

10.2. CORRELACIÓN INVERSA

Apunte de cátedra (16)

10.3. NO EXISTE CORRELACIÓN

Ilustración 5 Ejemplo de correlación. Output SPSS.

En este caso la respuesta sería elaborada como sigue:

a. H0: r=0 (No existe correlación entre las variables X e Y)

Apunte de cátedra (16)

2. Nombre de la prueba estadística: Correlación de Pearson

Coeficiente de determinación (R mayúscula): Es el monto de cambio de variación de variables. Está

Interpretación de R: (Ejemplo) La varianza de la variable asertividad (“y”) explica en un 42% la varianza

Para el ejemplo anterior entonces la respuesta completa sería como sigue:

Apunte de cátedra (16)

b. H1: r≠0 (Existe correlación entre las variables X e Y)

2. Nombre de la prueba estadística: Correlación de Pearson

5. Interpretación: Existe correlación entre Trastorno alimenticio y Puntaje prueba de ansiedad de

10.5. REGRESIÓN LINEAL SIMPLE

Apunte de cátedra (16)

11. PRUEBA T DE STUDENT

Apunte de cátedra (16)

MUESTRAS INDEPENDIENTES: Considera la partición arbitraria de un mismo grupo, en el que se