Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE GRADO EN
FONOAUDIOLOGÍA
APUNTE 16
PRUEBAS ESTADÍSTICA INFERENCIAL
LICENCIATURA EN FONOAUDIOLOGÍA
Para facilitar su utilización se aconseja acompañarlo con la exploración de algún paquete de análisis
estadístico, idealmente SPSS o R*.
Dentro de las variables internas al diseño, se establece la posibilidad de medición o manejo de las
mismas. El manejo estipulado permitirá, o no, el control de cada variable por parte del investigador.
En cada análisis será posible determinar variables de carácter dependiente o independiente, cuestión
que delimitará las pruebas estadísticas que podremos o no realizar.
Una variable dependiente es toda aquella característica que queremos observar su cambio a raíz del
cambio controlado de otra variable, la variable independiente. Esto considera que todo aquel atributo
o característica que sea posible de medir y ser controlado, ya se por selección o de manera directa,
es posible de ser considerada como variable independiente.
1. NIVEL NOMINAL: Son variables cuyos atributos medibles son directamente nombres propios. No
existe una jerarquía propia, y el ordenamiento determinado para el análisis, es del todo arbitrario,
es decir, se ordenan acorde a la frecuencia de aparición.
3
SEMINARIO DE GRADO – UGM V IRT UAL
Algunos ejemplos:
Las variables cuyo nivel de medición es Nominal tiene poca participación dentro de los cálculos
propiamente tal, sin embargo, dan orden y permiten la identificación de distintos grupos de datos.
2. NIVEL ORDINAL: Son variables cuyos atributos medibles pueden, o no, ser nombres propios, sin
embargo, a diferencia de las de nivel Nominal, en este caso si existe una jerarquía propia, siendo
en este caso el ordenamiento determinado para el análisis provisto por los mismos atributos de
la variable en cuestión. Las categorías implican en sí mismas una jerarquía u orden.
Algunos ejemplos:
Variable Atributo
Satisfecho
C3 …
4
SEMINARIO DE GRADO – UGM V IRT UAL
Dependiente de la prueba estadística a querer utilizar, las variables de carácter ordinal permiten
cierto manejo a nivel estadístico, permitiendo además entender el orden jerárquico como parte de
los caculos posibles de realizar.
Por su parte, las variables cuyos atributos son cuantificables, entregan mayor versatilidad al investigador,
quien podrá extraer conclusiones estadísticas que le permitan conocer, respaldado en la estadística,
el comportamiento de fenómenos observados y reportados.
3. NIVEL DE INTERVALO
Intervalo Discreto: Números enteros, que permiten todas las operaciones matemáticas que un
número entero pueda proveer. Tienen sin embargo la salvedad que, si bien se podría obtener un
indicador, este puede ser comprensible sólo desde la noción matemática y no necesariamente desde
la realidad. Tomemos para este ejemplo la variable de intervalo discreto “Número de hijos”, en ella
es posible entender que los atributos podrán ser medidos sólo en números enteros, a razón de que
sólo se puede tener 1, 2 o 3 hijos (o más), pero no se puede tener 1,5 hijos. Sin embargo, al obtener
un promedio de hijos en una comunidad determinada, nos encontramos con la afirmación de que
“existen 2,73 hijos por mujer nacida”, esto último es una noción estadística, esto significa, que puede
darnos una idea que es comprensible, pero no necesariamente tangible.
Intervalo Continuo: Similar al nivel de medición de intervalo discreto, los intervalos continuos entregan
la continuidad de la medición, por ello pueden referirse a la infinidad que puede existir entre un valor
Algunos ejemplos:
Coeficiente intelectual (C.I), velocidad de respuesta (en segundos), tiempo de reacción (en segundos).
El amplio espectro de cálculos que permite esta variable, permite su desarrollo en casi todas las
pruebas estadísticas revisadas en este apunte.
5
SEMINARIO DE GRADO – UGM V IRT UAL
4. Antes de continuar
Es necesario entonces, en este punto, recordar que la estadística funciona como una herramienta,
y que, como tal, será tan exacta y correcta, cómo quien la utiliza y el uso que le dé. En el desarrollo
de una investigación, existe un momento de determinación de las variables, así como sus niveles de
medición, este punto es crucial, pues sienta las bases de aquello que podremos, o no, hacer en última
instancia con los datos levantados, permitiendo el uso de pruebas estadísticas cuándo la planificación
lo haya contemplado.
Se hace necesario entonces, antes de continuar, aplicar y considerar las variables del estudio en curso.
En la figura podemos ver un ejemplo de curva normal, en ella vemos la distribución del Coeficiente
intelectual, en el que ambos extremos se encuentran poco poblados, es decir, existen pocos coeficientes
muy bajos y pocos coeficientes muy altos, sin embargo, es evidente que existe una mayor concentración
al centro, dejando en claro que existe mayor frecuencia en torno al puntaje 100 de coeficiente. 7
Toda distribución de frecuencias que no se comporte de esta manera es, por antonomasia, considerada
como no-paramétrica, esto conlleva varias implicancias, entre ellas que las pruebas estadísticas
aplicadas deben considerar esta forma de distribución.
SEMINARIO DE GRADO – UGM V IRT UAL
6. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central son todos aquellos indicadores que pretenden resumir dentro de si
un número mayor de datos, esto significa que son representantes generales. Pretenden ser indicadores
relevantes, que entreguen información descriptiva al lector. Algunos de ellos son:
MEDIA (≈PROMEDIO): El valor que pretende entregar la mayor información de los datos. En general
se considera que media y promedio como sinónimos, sin embargo, esto no necesariamente es así, y la
diferencia radica en las variables paramétricas o no paramétricas. Para aquellas variables paramétricas,
en las que el promedio se encuentra justo al medio de la distribución, media y promedio, serán
entonces sinónimos. Se hace obvio entonces que, por oposición, esto no será así para las variables
no-paramétricas, pues en ellas el valor más frecuente no necesariamente se encuentra al medio de la
distribución ordenada. Para efectos de esto documento, y por la naturaleza de las pruebas estadísticas
a mostrar, se considerará como sinónimo media y promedio.
El mayor defecto de la media es que puede ser engañosa por sí sola, famosa es la frase de Nicanor
Parra “yo me como dos panes, usted ninguno; consumo promedio: un pan por persona”, por ello suele
ser acompañado de otros indicadores revisados más adelante.
MODO (MODA): Similar a su uso común, la moda es el valor de la distribución que más se repite. Se
pueden repetir bimodal, polimodal.
MEDIANA: Valor de la distribución que la divide en dos mitades. Es por definición el valor que, al
ordenar los datos, se encuentra al medio.
8
SEMINARIO DE GRADO – UGM V IRT UAL
7. MEDIDAS DE VARIABILIDAD:
Para indicar como cambia la variable y como se distribuyen los datos, se usan indicadores generales
que hablan directamente del comportamiento de los datos. Entre ellos tenemos:
Mientras más alta es la variabilidad o desviación estándar, existe menor homogeneidad con respecto
al promedio. Por ejemplo, en un curso, lo homogéneo= notas de un curso similares y lo heterogéneo=
mucha diferencia de notas dentro de un curso.
La utilidad radica en toda la información que puede proveer sólo saber dónde se ubica.
NORMAS: Es el conjunto poblacional de la puntuación directa de la mayor parte del individuo, y que
sirve de parámetro para ubicar y comparar los datos de un individuo. Para poder determinar la ubicación
exacta de un sujeto con respecto a su grupo de referencia, el puntaje bruto debe transformarse en
alguna medida relativa de posición.
8.1 PERCENTILES 10
Al poder determinar lo cantidad porcentual de datos que presentan una característica es también
posible determinar cuántos cumplen con ese valor o menos. Los percentiles son indicadores relevantes
de los porcentajes acumulados de los datos, que nos permiten tener nociones del área en que se
encuentra un dato particular.
Frecuencia acumulada (Fac%) con respecto a su valor total. Esto nos permitiría entender cuántos de
los datos están considerados en que porcentaje de los datos.
SEMINARIO DE GRADO – UGM V IRT UAL
8.2 PUNTAJES Z Y T:
Puntaje Z es una medida relativa a la Desviación Estándar, esto quiere decir que cuándo puedo saber
cómo se comporta una curva normal, puedo saber más datos de ubicación.
Por ejemplo, en una curva donde el promedio se encuentra al centro de la curva, tomando por
ejemplo el Coeficiente intelectual de media = 100, con desviación estándar (S) =±10, sabemos que 1
desviación estándar (1S) significaría estar desplazado hacia la derecha de la curva, y 2S, sería estar aún
más desplazado, y así 3S sería estar 30 puntos sobre el promedio, o 3 desviaciones estándar sobre el
promedio. Entonces, al considerar Desviación estándar como una forma de ubicar un dato, sabremos
que, si es 1,34 S, está sobre el promedio, 1,34 desviaciones estándar; Puntaje Z es ese puntaje, la
cantidad de desviaciones estándar que separan al dato del promedio y puede ser positivo o negativo.
Entonces, con un puntaje Z=-2,324, sabemos que ese dato se encuentra 2,324 desviaciones estándar
bajo el promedio.
Por ello, cuándo Z es cero, el valor es igual al promedio; por ejemplo, en el caso de la estatura de una
persona, cuando el valor de Z dé cero, la persona tendría una estatura igual a la del promedio de la 11
muestra. Cuando el valor de Z nos da negativo, quiere decir que está bajo el promedio (la persona
tendría una estatura por debajo del promedio), y cuando el valor de Z es positivo, estaría por sobre
el promedio en unidades de desviación estándar.
El puntaje T es una forma de transformar el puntaje Z en un valor absoluto y más comprensible. Sólo
pretende aumentar su valor: T= Z*10+50 (valor Z por 10, más 50).
SEMINARIO DE GRADO – UGM V IRT UAL
Y en este caso, T=50 es el promedio, y por ello, bajo 50 es bajo el promedio y sobre 50, sobre el
promedio.
Para poder dar una forma única y consensuada de acercamiento, se elaboran 2 hipótesis antónimas:
Hipótesis nula o hipótesis cero: niega el evento o afirma que éste se debe al azar.
Por ejemplo,
Para determinar si algo es así, científicamente, se utiliza una noción de error posible. Para considerarlo
válido se necesita un error del 5% o menos; esto quiere decir que, sí es que existen diferencias, pero
no puedo asegurar que ocurra el 95% de las veces, como mínimo. Para ello entonces utilizaremos el
concepto de significación o sig.
12
A partir de la observación de la significación de la prueba estadística, podremos aseverar si es que
la CONTINÚA?
Límite (mayor o menor a) 0,005: Zona de rechazo de la hipótesis nula. Se acepta la hipótesis alternativa.
se acepta o rechaza la hipótesis nula, acorde al valor de la significación, mayor o menor a 0,05, etc.
5. Interpretación: se ofrece una interpretación coherente de los datos, más allá de la conclusión
estadística entregada en el punto anterior, se integran los valores de los montos, se responde la
pregunta de origen y se elabora la respuesta en base a la hipótesis aceptada.
Al mapear las ocurrencias de ambas variables, se dibuja una recta inclinada hacia abajo, como se
muestra a continuación:
1. Hipótesis estadísticas:
3. Montos: r= 0,743
4. Conclusión: monto de Sig= 0,000 . Dado sig=0,000 (p ≤0,05) se rechaza hipótesis nula y se acepta
hipótesis alternativa por lo que existe correlación entre las variables X e Y.
5. Interpretación: Para interpretar los dados de correlación es necesario conocer los criterios de 15
evaluación de una correlación.
SEMINARIO DE GRADO – UGM V IRT UAL
CRITERIOS DE EVALUACIÓN DE CORRELACIÓN:
Magnitud: Monto de la correlación, que puede ser clasificado en, bajo (0 – 0,25), Medio Bajo (0, 26
– 0,50), Medio alto (0,51 – 0,75), Alto (0,76- 1).
Dirección: Signo positivo o negativo de correlación. Si el signo es positivo las variables son directamente
proporcionales (ej: si el rendimiento sube, las notas de los alumnos suben). Si en cambio la dirección
es negativa, la proporción es inversamente proporcional, (una sube, la otra baja, ej: si el tratamiento
aumenta, la depresión disminuirá paulatinamente).
R=r por ciento. El valor resultante será explicado en porcentajes. Entonces, diríamos “y” está afectado
en un 23% por la variable “x”, por ejemplo.
1. Hipótesis estadísticas:
3. Montos: r= 0,743
4. Conclusión: monto de Sig= 0,000 . Dado sig=0,000 (p ≤0,05) se rechaza hipótesis nula y se acepta
hipótesis alternativa por lo que existe correlación entre las variables X e Y. 16
Para realizar una interpretación de las variables, podemos bajo criterios de: magnitud, dirección y
coeficiente de determinación, predecir variables de una variable dependiente (y) a partir de la variable
independiente (x), para luego establecer una regresión.
17
SEMINARIO DE GRADO – UGM V IRT UAL
Ilustración 6 Regresión
En la formula en cuestión, Y es el valor que queremos saber a partir de los datos que tenemos de X; a
será el valor constante, simbolizado por la diferencia al inicio de la recta en la ilustración; por último,
b es el coeficiente angular de la recta.
T des student nos provee 2 formatos, que se diferencian por la muestra que involucra su testeo. Se
consideran 2 muestras, las relacionadas o pareadas y las muestras independientes.
MUESTRA RELACIONADA O PAREADA: son las muestras que consideran un solo grupo de referencia,
o una sola población común, de la que se obtienen 2 promedios o medias de 2 variables distintas que
18
contraponen 2 promedios obtenidos para 1 misma variable. En este caso las 2 variables en cuestión
en la prueba ya no son solamente las que arrojarán sus promedios, sino que se necesita de una variable
de agrupación, que nos permita diferenciar las muestras contempladas, separando nuestro grupo
en 2. Por ejemplo, comparar los promedios de la asignatura A para un grupo curso según su sexo.
SEMINARIO DE GRADO – UGM V IRT UAL
11.1. PRUEBA T DE STUDENT PARA MUESTRAS PAREADAS
Prueba para un mismo grupo de mediciones relacionadas, pertenecen al mismo grupo muestral de ahí
que sean “pareadas”. Esta prueba compara dos promedios de dos variables diferentes, en un mismo
grupo. Ambas variables deben ser de intervalo.
1. Planteamiento de hipótesis:
4. Conclusión: Valor de T= xxx y valor de Sig= xxx (si se acepta o rechaza la hipótesis nula) 19
5. Interpretación: Si es que los promedios son iguales, no hay diferencias significativas entre las
variables, una variable no es superior a la otra o inferior a la otra y si son distintos los promedios,
existe una diferencia significativa entre ellas, habiendo una variable superior a otra en cuanto al
promedio.
SEMINARIO DE GRADO – UGM V IRT UAL
11.2. PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES:
Grupos de mediciones diferentes, constituidos por elementos que son diferentes. Las mediciones
independientes no pertenecen al mismo grupo muestral.
Ej: Comparar la nota de evaluación de satisfacción que tuvo la variable “Comer” según el sexo de los
entrevistados, considerando una nota de 1 a 7. En este caso la variable “Comer” es una variable de
intervalo, sin embargo, la variable “Sexo” actúa como variable de agrupación, por lo que su nivel de
medición es nominal, y podría ser ordinal.
1. Planteamiento de hipótesis:
a. Ho: X1=X2; los promedios x1 y x2 son iguales, es decir, no hay diferencia significativa entre los
promedios X1 y X2 según la agrupación de la variable Y.
b. H1: X1≠x2, Existen diferencias significativas entre los promedios de X según la variable de 20
agrupación Y.
Si las varianzas son iguales se acepta la hipótesis nula, si las varianzas son distintas se rechaza la
hipótesis nula.
5. Conclusión: Valor de T= xxx y valor de Sig= xxx (si se acepta o rechaza la hipótesis nula)
6. Interpretación: Si es que los promedios son iguales, no hay diferencias significativas entre las
variables según la variable de agrupación, una variable no es superior a la otra o inferior a la
otra, independiente de los montos de los promedios. Si son distintos los promedios, existe una
diferencia significativa entre ellas, habiendo una variable superior a otra en cuanto los montos
entregados, esta diferencia es significativa.
21
SEMINARIO DE GRADO – UGM V IRT UAL
1. Planteamiento de hipótesis: Planteamiento de hipótesis:
a. Ho: X1=X2=X3; los promedios x1, x2 y x3 son iguales, es decir, no hay diferencia significativa
entre los promedios X1,X2 y X3 según la agrupación de la variable Y.
b. H1: X1≠X2≠X3, Existen diferencias significativas entre los promedios de X según la variable de
agrupación Y.
La salvedad en este punto es que, la consideración de una diferencia entre X1, X2 y X3 no determina
exactamente entre cuales de los promedios involucrados sea la diferencia detectada, de ahí que sea
necesario realizar pruebas post-hoc.
4. ANOVA: Valor estadístico F= xxx y Sig= xxx , se acepta o rechaza la hipótesis nula.
a. Si se acepta H0: las varianzas son iguales, y en las pruebas post-hoc se recomienda usar la
formulación de Tuckey para la comparación múltiple de promedios.
b. Si se acepta H1: las varianzas son distintas, y en las pruebas post-hoc se recomienda usar la
22
SEMINARIO DE GRADO – UGM V IRT UAL
6. Comparación múltiple de promedios: