Documentos de Académico
Documentos de Profesional
Documentos de Cultura
10
1
Objetivos de aprendizaje
Al terminar este capitulo, el alumno será capaz de:
3. Comprender las principales pruebas o métodos estadísticos desarrollados, así como sus
aplicaciones y la forma de interpretar sus resultados.
4. Diferenciar la estadística descriptiva y la inferencial, la paramétrica y la no paramétrica.
2
Aspectos a considerar
Al analizar los datos cuantitativos debemos recordar dos cuestiones: primero, que los modelos estadísticos son representaciones de la
realidad, no la realidad misma; y segundo, los resultados numéricos siempre se interpretan en contexto, por ejemplo, un mismo valor de
presión arterial no es igual en un bebe que en una persona de la tercera edad.
• Datos: Son el conjunto de información recolectada (como mediciones, géneros, respuestas de encuestas).
Tipos de datos:
– Datos cuantitativos (o numéricos): Consisten en números que representan conteos o mediciones.
– Datos categóricos (o cualitativos o de atributo): Consisten en nombres o etiquetas que no son números y que, por lo tanto, no representan conteos ni mediciones.
• Estadística: Es la ciencia que se encarga de planear estudios y experimentos, obtener datos y luego organizar, resumir,
presentar, analizar e interpretar la información para extraer conclusiones basadas en los datos.
Tipos de estadística:
– Estadística descriptiva
– Estadística inferencial
3
Análisis de datos cuantitativos
Se realizan mediante programas computacionales y tomando en cuenta los niveles de medición de las
variables y mediante la estadística.
Nivel de medición nominal
• Se caracteriza por datos que consisten exclusivamente en nombres, etiquetas o categorías. Los datos no se pueden
acomodar en un esquema de orden (como del más bajo al más alto). Ej: sexo, lugar de procedencia.
4
¿Qué procedimiento se siguen para analizar
cuantitativamente los datos?
• Una vez que los datos se han
codificado, transferido a una
matriz, guardado en un archivo y
“limpiado” de errores, el
investigador procede a
analizarlos.
• El análisis cuantitativo de los
datos se lleva a cabo sobre la
matriz que los contiene y por
computadora u ordenador.
Fase o paso 1:
seleccionar el programa de análisis o software
Existen actualmente varios programas que son apropiados para el análisis, entre ellos:
Minitab®.
STATISTICA®.
Stats®.
6
En la mayoría de los programas se trabaja con la matriz de datos para efectuar
los análisis, mediante diversos comandos.
▪ Ejemplos de matrices de datos en varios programas.
7
• Fase 2: ejecutar el programa: La mayoría de los programas son fáciles de usar, pues lo único que
tienes que hacer es solicitar los análisis requeridos seleccionando las opciones apropiadas.
• Fase 3: revisión de la matriz: Se revisa una vez más la base de datos para evaluar que no existan
errores de codificación (ítem por ítem, indicador por indicador, cada recuadro implica un valor de un
caso en un ítem, indicador o equivalente). Acciones para revisar la base o matriz de los datos:
– Solicitar y evaluar las distribuciones de frecuencias.
– Explorar la matriz.
– Generar tablas de contingencia.
– Generar razones.
Los procedimientos mas utilizados para determinar la confiabilidad mediante un coeficiente son:
1. Medida de estabilidad (confiabilidad por test-retest): En este procedimiento un mismo instrumento de medición se
aplica dos o más veces a un mismo grupo de personas o casos, después de cierto periodo.
2. Método de formas alternativas o paralelas: En este esquema no administras el mismo instrumento de medición,
sino dos o más versiones equivalentes de este. Las versiones (casi siempre dos) son similares en contenido,
instrucciones, duración y otras características, y se aplican a un mismo grupo de personas simultáneamente o dentro
de un periodo corto.
3. Método de mitades partidas (split-halves): el conjunto total de ítems o reactivos lo divides en dos mitades
equivalentes y comparas las puntuaciones o resultados de ambas.
4. Medidas de coherencia o consistencia interna: Son coeficientes que estiman la confiabilidad: a) el alfa de Cronbach
(desarrollado por J. L. Cronbach) y b) los coeficientes KR-20 y KR-21 de Kuder y Richardson (1937). El método de
cálculo de estos requiere una sola administración del instrumento de medición. Su ventaja reside en que no es
necesario dividir en dos mitades a los ítems del instrumento, simplemente aplicas la medición y el programa calcula el
coeficiente.
Fase 5: explorar los datos: Este paso implica familiarizarte con tus datos y obtener los primeros resultados descriptivos.
Estadística descriptiva para cada variable: implica el conteo de casos que se presentaron en las categorías de las variables con el
propósito de conocer tendencias.
Distribución de frecuencias o puntuaciones.
Códigos (valores).
Frecuencias absolutas.
▪ Moda.
La moda de un conjunto de datos es el valor que se presenta con mayor
frecuencia. Se utiliza con todos los niveles de medición.
17
Medidas de variabilidad
Intervalos que indican la dispersión de los datos en la escala de medición de la variable.
18
Medidas de forma
Otra estadística descriptiva
Asimetría. El coeficiente de asimetría sirve para evaluar si la distribución Curtosis. Es una medida de la concentración de los valores de la
de los datos se aproxima a una distribución normal. Para calcular la distribución en torno a la media. Es un indicador de lo plana o
simetría es necesario conservar la información tanto del signo como de “picuda” que es una curva
la distancia de cada dato con respecto de la media-centro de simetría.
20
Fase 6: analizar mediante pruebas estadísticas las hipótesis planteadas
(análisis estadístico inferencial: estudios correlacionales y explicativos)
Estadística inferencial: de la muestra a la población. Estadística
para probar hipótesis y estimar parámetros.
En estadística, una hipótesis es una afirmación o aseveración acerca de una propiedad de una
población.
Una prueba de hipótesis (o prueba de significancia) es un procedimiento para someter a prueba una
afirmación acerca de una propiedad de una población.
Para comprender que es la prueba de hipótesis en la estadística inferencial es necesario revisar los conceptos
de distribución muestral y nivel de significancia.
22
¿Qué es una distribución muestral?
Conjunto de valores sobre una estadística calculada de todas las
muestras posibles de determinado tamaño de una población.
• La probabilidad de que un evento ocurra oscila entre cero (0) y uno (1), donde cero implica la imposibilidad de
ocurrencia y uno la certeza de que el fenómeno ocurra.
• Es un nivel de la probabilidad de equivocarte y lo fijas antes de probar hipótesis inferenciales (generalizar los
resultados de tu muestra a la población) o al interpretar los resultados.
Con que porcentaje de confianza el investigador generaliza, para suponer que tal cercanía es real y no por un error de
muestreo? Existen dos niveles convenidos en las ciencias:
a) El nivel de significancia de 0.05, el cual implica que el investigador (tu) tiene 95% de seguridad para generalizar
sin equivocarse y solo 5% en contra. En términos de probabilidad, 0.95 y 0.05, respectivamente; ambos suman la
unidad.
b) El nivel de significancia de 0.01, el cual implica que el investigador tiene 99% en su favor y 1% en contra (0.99 y
0.01 = 1.00) para generalizar sin temor. Muy utilizado cuando las generalizaciones implican riesgos vitales para las
personas (pruebas de vacunas, medicamentos, arneses de aviones, resistencia de materiales de construcción al
fuego o al peso, etcétera).
25
• El procedimiento convencional
de prueba de hipótesis requiere
que probemos directamente la
hipótesis nula, de manera que
nuestra conclusión inicial
siempre será una de las
siguientes:
Los análisis a realizar dependen del planteamiento, tipo de hipótesis y el nivel de medición de las
variables que las conforman.
28
Análisis paramétricos
Para realizar análisis paramétricos debe partirse de los siguientes supuestos:
29
Principales métodos o pruebas paramétricas
X Y
Intervalos o
Hipótesis a probar: correlacional. razón
32
Regresión lineal
• Es un modelo estadístico para estimar el efecto de una variable sobre otra. Se asocia con el coeficiente r de Pearson.
• Ecuación:
33
Prueba t
Es una prueba estadística para que evalúes si dos grupos difieren entre si de manera significativa
respecto a sus medias y distribuciones en una variable.
1. Hipótesis a probar: de diferencia entre dos grupos. La hipótesis de investigación propone que los grupos difieren
entre si de manera significativa y la hipótesis nula plantea que los grupos no difieren significativamente.
2. Variables: la comparación la realizas sobre una variable (regularmente y de manera teórica: dependiente), y la
razón que motiva la creación de los grupos puedes concebirla como una variable independiente (pero debes tener
un sustento solido razonable).
3. Nivel de medición de la variable supuestamente independiente: cualquiera, pero reducida a dos categorías
(individuos productivos-individuos no productivos, genero, dos productos que compiten entre si, preprueba y
posprueba de un grupo experimental).
4. Nivel de medición de la variable de comparación o “dependiente”: intervalos o razón.
5. Cálculo e interpretación: el valor t es calculado por los programas de análisis estadístico, que arrojan varios
resultados, de los cuales los mas necesarios para interpretar son el valor t y su significancia.
34
Ejemplos donde la prueba t es apropiada
Comparar la rapidez con que dos anestésicos generales logran la insensibilidad al dolor.
Comparar el tiempo que dedican a ver televisión los niños y las niñas.
Cotejar el monto promedio de compras mensual en determinado periodo entre los clientes de una tienda
departamental que utilizaron crédito y los que no lo hicieron.
Contrastar la inteligencia emocional de hombres versus mujeres adultos jóvenes.
Prueba de diferencia de proporciones (DP)
Es una prueba estadística para que analices si dos proporciones o porcentajes difieren significativamente
entre si.
36
Ejemplos donde DP resulta apropiada
Comparar la efectividad de dos vacunas diseñadas para reducir el
número de casos positivos del ébola (% de casos positivos después
de la aplicación de ambas vacunas).
Cotejar el porcentaje de jóvenes que están en contra del aborto en
dos municipios.
40
Principales métodos o pruebas no paramétricas
La Chi-cuadrada o χ2.
Las pruebas
no
paramétricas Los coeficientes de correlación e independencia para
más tabulaciones cruzadas.
utilizadas
Los coeficientes de correlación por rangos ordenados
son:
de Spearman y Kendall.
Los coeficientes de correlación entre variables con
distintos niveles de medición.
Chi cuadrada o (Chi-cuadrado)
Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables
categóricas.
Se simboliza: χ2
42
Ejemplos tabla de contingencia
43
Ejemplos donde la χ2 es conveniente
Relacionar género (masculino-femenino) con intención de voto por
dos candidatos (candidato 1-candidato 2): 2X2.
Rangos (jerarquías)
45
Ejemplos donde los coeficientes de
Spearman y Kendall son apropiados I
Relacionar jerarquía en la organización y personalidad autoritaria (rangos en una prueba).
Vincular rangos de precios medios de la vivienda (muy alto, alto, medio, bajo, muy bajo) y cercanía a un nuevo
centro comercial (considerando número de cuadras o manzanas, las cuales no son todas exactamente del mismo
tamaño).
Determinar la vinculación entre el ejercicio físico (rangos) y la capacidad de trabajo (rangos) en determinados
obreros.
Asociar la valoración que hacen dos médicos respecto a la gravedad de sus pacientes (contrastar percepciones de
los galenos a través de correlacionar sus respectivas jerarquizaciones).
Relacionar sentido de vida (alto, medio y bajo) con nivel socioeconómico (segmentos: A, A/B, B, C, D y E).
46
El coeficiente de correlación de Pearson es una
estadística apropiada para variables medidas por
intervalos o razón y para relaciones lineales. La Chi-
cuadrada y demás coeficientes mencionados son
estadísticas adecuadas para tablas de contingencia
con variables nominales, ordinales y de intervalos,
pero reducidas a categorías; para variables
típicamente ordinales tenemos a Spearman y
Kendall.
Estadística multivariada
• Pruebas o métodos para analizar
relaciones y efectos entre diversas
variables independientes y al menos una
dependiente.
48
Métodos estadísticos multivariados
49
Fase 7: realizar análisis adicionales: Este paso implica simplemente que,
una vez realizados tus análisis, es posible que decidas ejecutar otros
Fase 8: preparar los resultados para presentarlos:
análisis o pruebas extras para confirmar tendencias y evaluar los datos
desde diferentes ángulos.
• 1. Revisar cada resultado [análisis general → análisis especifico →
valores resultantes (incluida la significación o significancia) → tablas,
diagramas, cuadros y graficas].
• 2. Organizar los resultados (primero los relativos a la confiabilidad,
validez y estandarización de tus instrumentos de recolección de los
datos; luego los descriptivos, por variable del estudio; posteriormente
• los inferenciales, que puedes ordenar por hipótesis o de acuerdo con su
desarrollo).
• 3. Cotejar diferentes resultados: su congruencia y en caso de
inconsistencia lógica volverlos a revisar.
• 4. Priorizar la información mas valiosa (que es en gran parte resultado
de la actividad anterior), sobre todo si vas a generar reportes ejecutivos
y otros mas extensos.
• 5. Copiar o “formatear” las tablas en el programa con el cual elaboraras
el reporte de la investigación (procesador de textos, como WordR, o uno
para presentaciones, como Power PointR, FlashR, PreziR, PiktochartR,
GeneXusR, PHPR, TableauR, etc., hay decenas).
• 6. Comentar o describir brevemente la esencia de tus analisis, valores,
tablas, diagramas, graficas.
• 7. Volver a revisar los resultados.
• 8. Y, finalmente, elaborar el reporte de investigación.