Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo 6 Procesamiento de Datos PDF
Capítulo 6 Procesamiento de Datos PDF
INFORME Y APLICACIÓN
Cap. 6
Una vez concluidas las etapas de colección y procesamiento de datos se inicia con
una de las más importantes fases de una investigación: el análisis de datos. En
esta etapa se determina como analizar los datos y que herramientas de análisis
estadístico son adecuadas para éste propósito.
La primera tiene como supuestos que la población estudiada posee una distribución
normal y que los datos obtenidos se midieron en una escala de intervalo y de razón. La
segunda no establece supuestos acerca de la distribución de la población sin embargo
requiere que las variables estudiadas se midan a nivel nominal u ordinal (ver Weiers,
1993).
Las tablas diseñadas para el análisis de datos se incluyen en el reporte final y pueden ser
útiles para analizar una o más variables. En virtud de éste último criterio el análisis de
datos puede ser univariado, bivariado o trivariado dependiendo de la cantidad de
variables que se analizan.
A
A
Tipos
Confiabilidad
La confiabilidad de un instrumento de medición
se refiere al grado en que su aplicación
repetida al mismo individuo u objeto produce
resultados iguales (Hernández- Sampieri et al.,
2013; Kellstedt y Whitten, 2013; y Ward y
Street, 2009).
Validez
La validez, en términos generales, se refiere al
grado en que un instrumento mide
realmente la variable que pretende medir.
Para medir el
espesor de una hoja
Factores que pueden afectar la confiabilidad y la validez
Hay diversos factores que llegan a afectar la confiabilidad y la validez de los instrumentos de
recolección de los datos e introducen errores en la medición.
A continuación se mencionarán los más comunes.
La improvisación. Algunas personas creen que elegir un instrumento de medición o
desarrollarlo es algo que puede tomarse a la ligera. Incluso, ciertos profesores piden a los
alumnos que construyan instrumentos de medición de un día para otro o, lo que es igual, de
una semana a otra, lo cual habla del poco o nulo conocimiento del proceso de elaboración de
instrumentos de recolección de los datos. Esta improvisación genera casi siempre
instrumentos poco válidos o confiables.
Aun a los investigadores experimentados les toma tiempo desarrollar un instrumento de
medición.
Además, para construirlo se requiere conocer muy bien la variable que se pretende medir, así
como la teoría y la práctica que la sustentan.
Cuando las mediciones se refieren a seres humanos hay otros factores:
a) Utilizar instrumentos desarrollados en el extranjero que no han sido validados en
nuestro contexto: cultura y tiempo.
Traducir un instrumento, aun cuando adaptemos los términos a nuestro lenguaje
y los contextualicemos, no es ni remotamente una validación. Constituye un primer y
necesario paso, aunque sólo es el principio. En el caso de traducciones, es importante
verificar que los términos centrales tengan referentes con el mismo significado —o
alguno muy parecido— en la cultura en la que se va a utilizar dicho instrumento (vincular
términos entre la cultura de origen y la cultura destinataria). A veces se traduce, se
obtiene una versión y ésta, a su vez, se vuelve a traducir al idioma original (traducción
inversa).
Por otra parte, existen instrumentos que fueron validados en nuestro contexto, pero
hace mucho tiempo. Hay instrumentos en los que hasta el lenguaje “nos suena
anticuado”. Las culturas, los grupos y las personas cambian; y esto debemos tomarlo en
cuenta al elegir o desarrollar un instrumento de medición.
b) Usar instrumentos inadecuados para las personas a quienes se les aplica: no son
empáticos.
Utilizar un lenguaje muy elevado para los sujetos respondientes, no tomar en cuenta
diferencias de género, edad, conocimientos, memoria, nivel ocupacional y educativo,
motivación para contestar, capacidades de conceptualización y otras diferencias en los
participantes, son errores que llegan a afectar la validez y la confiabilidad. Este error ocurre a
menudo cuando los instrumentos deben administrarse a niños. Asimismo, hay grupos de la
población que requieren instrumentos apropiados para ellos, tal es el caso de las personas
con capacidades distintas. En la actualidad se han desarrollado diversas pruebas que las
toman en cuenta (por ejemplo, pruebas en sistema Braille para individuos con capacidades
visuales distintas o pruebas orales para personas que no pueden escribir). Otro ejemplo son
los indígenas o inmigrantes de otras culturas, pues en ocasiones se les aplican instrumentos
en un idioma o contexto que no es el suyo. Quien realiza una investigación debe adaptarse
siempre a los participantes y no al revés, ya que es necesario brindarles todo tipo de
facilidades.
c) Cuestiones vinculadas con los estilos personales de los participantes (Bostwick y Kyte,
2005) como: deseabilidad social (tratar de dar una impresión muy favorable a través de las
respuestas), tendencia a asentir con respecto a todo lo que se pregunta, dar respuestas
inusuales o contestar siempre negativamente.
En un instrumento de medición, la
objetividad se refiere al grado en que
éste es o no permeable a la influencia de
los sesgos y tendencias del investigador
o investigadores que lo administran,
califican e interpretan (Mertens, 2010).
En este sentido, los aparatos y sistemas calibrados (por ejemplo, una pistola láser para
medir la velocidad de un automóvil) son más objetivos que otros sistemas
que requieren cierta interpretación (como un detector de mentiras) y éstos, a su vez,
más objetivos que las pruebas estandarizadas, las cuales son menos subjetivas que las
pruebas proyectivas.
La objetividad se refuerza mediante la estandarización en la aplicación del instrumento
(mismas instrucciones y condiciones para todos los participantes) y en la evaluación de los
resultados; así como al emplear personal capacitado y experimentado en el instrumento.
Por ejemplo, si se utilizan observadores,su proceder en todos los casos debe ser lo más
similar posible y su entrenamiento tendrá que ser profundo y adecuado.
Los estudios cuantitativos buscan que la influencia de las características y las tendencias del
investigador se reduzca al mínimo posible, lo que insistimos es un ideal, pues la
investigación siempre es realizada por seres humanos.
Este tipo de pruebas, permiten determinar con más precisión las respuestas reales, no es
posible responder con total certidumbre.
Significado estadístico
Una premisa fundamental de la diferencia estadística es que es posible que las cifras
difieran en sentido matemático aunque no sean muy significativamente distintas en sentido
estadístico
Las diferencias detectadas se evalúan mediante 3 conceptos:
a) Diferencias matemáticas: Cuando las cifras no son iguales, es decir son distintas. Sin
embargo esto no sugiere que la diferencia sea importante o que tenga significado estadístico
Pruebas de hipótesis
1. Especificar la hipótesis
2. Se elige una técnica estadística para probarla
3. Se especifica una regla de decisión como base para determinar si se va a rechazar
o no la hipótesis nula (Ho)
4. Se calcula el valor de la prueba estadística y se realiza dicha prueba
5. Se llega a la conclusión sobre el problema o pregunta original de la investigación
1) Formulación de la hipótesis
Se plantean 2 maneras fundamentales
Hipótesis nula (Ho), también llamada hipótesis de statu quo, es la que prueba contra su
complemento (Ha)
Hipótesis alterna (Ha), también llamada hipótesis de investigación o de interés
Es conveniente que las hipótesis Ho y Ha deben formularse de manera tal que no puedan
ser verdaderas al mismo tiempo.
Se trata de emplear la evidencia disponible para comprobar cual tiene mas probabilidad de
ser cierta
2) Elección de la prueba estadística adecuada
El analista elegiré la prueba estadística adecuada teniendo en cuenta las características
del caso que va a investigar
3) Desarrollo de una regla de decisión
En este paso:
- Se usa la formula adecuada para calcular el valor de la prueba estadística elegida
- Se compara el valor calculado (previamente) con el valor critico de la prueba estadística
(tomado de la tabla adecuada) con base a la regla de decisión elegida
5) Formulacion de la conclusion
El investigador puede cometer este error porque las diferencias que observa entre los
valores de la muestra y de la poblacion se debe a un error de muestreo.
El Nivel alfa (α): es la probabilidad de cometer un error Tipo I.
1- α= Es la probabilidad de efectuar una decision correcta de no rechazar la Ho cuando es
verdadera
Error tipo II: Se da este caso cuando el investigador no rechaza la Ho cuando es falsa
A este error se llama Error Beta (β)
El valor β nunca se define de antemano, si este aumenta para minimizar el error tipo II, α
disminuye y viceversa para disminuir el error tipo I
Aceptar Ho o no poder rechazar Ho?
La diferencia entre ambas decisiones es importante, al probar la hipótesis se supone que
Ho es verdadera, hasta que se demuestra la posibilidad de que sea falsa.
Las distribuciones que se emplean para comparar los valores calculados son:
-Distribución chi cuadrada (X2)
-Distribución Z
-Distribución t
-Distribución F
Muestras independientes y relacionadas
Para elegir una prueba estadística adecuada el investigador debe considerar si las
muestras son independientes o están relacionadas
Grados de libertad
Chi Cuadrada
Esta prueba solo indica que la variación general entre las frecuencias de las celdas es mayor
de lo que podría esperarse de manera causal y no indica si una celda difiere en forma
significativa de las otras
Pasos:
1º Realizar una conjetura Donde:
2º Plantear las hipótesis Ho y Ha Oi= numero observado en la i-ésima
3º Calcular el valor de X2 categoría
4º Obtener el valor critico E i= Numero esperado en la i-ésima
5º Realizar una comparación entre el X2 categoría
calculado y el valor critico K= numero de categorías
Esta prueba solo indica que la variación general entre las frecuencias de las distintas celdas y
no indica si una celda difiere en forma significativa de otras
b) Prueba de la Chi cuadrada para dos muestras independientes
A fin de formular una estrategia de mercadotecnia, los investigadores de mercado a
menudo necesitan determinar si dos o mas variables están asociadas.
Pasos:
1. Formular las Ho y la Ha 𝑟 𝑘
(𝑂 − 𝐸 ) 2
2.Determinar los totales marginales. 2 = 𝑖𝑗 𝑖𝑗
3, Determinar las frecuencias esperadas 𝑋
𝐸𝑖𝑗
𝑖=1 𝑗=1
4.Calcular las diferencias entre los valores observados con
respecto a los teóricos de cada casilla.
5.Calcular los grados de libertad (gl): gl = (K columnas -1) [r O ij= numero observado en la
hileras -1]. iesima fila de la jesima
6. El valor de X2 se compara con los valores críticos de ji columna
cuadrada de la tabla de valores críticos de X2 y de acuerdo E ij= numero esperado en la
con los grados de libertad, y se determina la probabilidad. iesima fila de la jesima
6.Decidir si se acepta o rechaza la hipótesis Ho. columna
No debe aplicarse esta prueba cuando:
El valor de X2 se distorsiona si más del 20% de las celdas tiene una frecuencia esperada inferior
al 5% o si cualquier celda ofrece un frecuencia esperada inferior a 1.
Prueba de Kolmogorob-Smirnov (Prueba K-S)
Proporciona datos similares a los de la chi cuadrada para determinar la calidad del ajuste.
La magnitud del valor estadístico de la prueba (D) indica si la divergencia entre las
distribuciones probablemente se debió a la causalidad o señala que existe una verdadera
preferencia
Pasos:
Prueba Z
1º Se especifican la Ho y Ha
3º Desviación estándar
𝑆𝑋ത = Error estándar
4º Se calcula el error estándar estimado de la media estimado de la media
(𝑆𝑋ത )
Procedimiento:
𝑝(1 − 𝑝)
1º Se establece la Ho y la Ha 𝑆𝑝 =
2º Se establece α 𝑛−1
3º Se calcula el error estándar estimado
empleando el valor P especificado en Ho
4º Se calcula la prueba estadística
Prueba para determinar las diferencias entre las medias de 2 o más variables independientes
Se utilizan con mayor frecuencia para pruebas de hipótesis sobre las diferencias entre las
medias (C) de varios grupos independientes
Esta permite al Investigador determinar la variabilidad entre o a través de las medias de la
muestra «C» es mayor de lo esperado debido al error de muestreo.
𝑛𝑗
SSE= σ𝑐𝑗=1 σ𝑖=1(𝑋𝑖𝑗 − 𝑋𝐽 )2
5º Se calcula el error medio al cuadrado (MSE)
𝑆𝑆𝐸
MSE =
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
Si las diferencias entre las medias de las muestras son mayores, la SSA se incrementa
6º Prueba F: Estudio de la probabilidad de que cierto valor calculado pueda deberse al azar
𝑀𝑆𝐴
F=
𝑀𝑆𝐸
La distribución de la F al igual que las distribuciones de la t , es un conjunto de distribuciones
cuya forma varia ligeramente según el numero y tamaño de las muestras que participen
Para aplicar la prueba F se deben calcular los grados de libertad del numerador (grados de
libertad del MSA )y denominador (grados de libertad del MSE)
ANÁLISIS BIVARIADO
Son técnicas estadísticas para analizar la relación entre 2 variables
Ventas Precio
Participación en el mercado Gastos de publicidad
de una marca Cantidad de tiendas
detallistas
Las técnicas solo permiten describir la naturaleza de las relaciones estadísticas entre
variables
Tipos de procedimientos
a) Regresión bivariada
Esta sirve para estudiar la relación entre 2 variables cuando una se considera como
variable dependiente y la otra como variable independiente
Naturaleza de la relación
Línea de regresión
Donde:
ത
𝑌=Valor de la función de regresión
ത
E= (Y-𝑌) estimada para un valor dado de X
R2 abarca de 0 a 1
Cuando hay una relación lineal perfecta entre X y Y toda la variación de Y se explica por
la variación de X y R2 =1
Cuando no hay relación entre X y Y , ninguna variación de X explica la variación de Y y R2 =0
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
𝑅2 =
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑡𝑜𝑡𝑎𝑙
Varianza explicada= varianza total- varianza no explicada
𝑛 𝑖 2
σ 𝑖=1 𝑌𝑖 − 𝑌
𝑅2 = 1 + 𝑛
σ𝑖−1(𝑌𝑖− 𝑌)2
σ𝑛
𝑖=1 𝑌𝑖
2
SST= σ𝑛𝑖=1 𝑌𝑖 − 𝑌ത 2 = σ𝑛𝑖=1 𝑌𝑖 2 −( )
𝑛
SSR : La variación explicada o suma de cuadrados debida a la regresión es:
SSR= σ𝑛𝑖=1 𝑌 ത
𝑖−𝑌
2
2
σ𝑛
𝑖=1 𝑌𝑖
SSR= 𝑎 σ𝑛𝑖=1 𝑌𝑖 + 𝑏 σ𝑛𝑖=1 𝑋𝑖 𝑌𝑖 −
𝑛
SSE : Error de suma al cuadrado
2
SSE= σ𝑛𝑖=1 𝑌𝑖 − 𝑌𝑖
Ho: b=0
Ha: b≠ 0
En este caso se puede utilizar la prueba t
Análisis correlacional
Es el estudio del grado de asociación de los cambios de una variable VD con los de otra VI
R= ± 𝑅 Donde R= Coeficiente de
determinación
El valor de R puede ser desde -1 (correlación negativa perfecta) hasta 1 (correlación
positiva perfecta)
𝑛 σ 𝑋𝑌− σ 𝑋 σ 𝑌
R=
𝑛 σ 𝑋2− σ 𝑋 2 𝑛 σ 𝑌2− σ 𝑌 2
ANÁLISIS MULTIVARIADO
Los avances se software y hardware, son la base para este tipo de procedimientos
Los resultados e interpretación de los mismos son iguales que en la regresión bivariada
La ecuación general es: Donde:
Y= Variable dependiente o de criterio
A= Constante estimada
𝑏1−𝑛 =Coeficientes asociados con las
Y= a+𝑏1 𝑋1 + 𝑏2 𝑋2 + 𝑏3 𝑋3 … … . 𝑏𝑛 𝑋𝑛 variables para predicción 𝑋1−𝑛 = Variables
para predicción (independientes que
influyen el la variable dependiente
Ej.: Donde:
𝑌 = Ventas estimadas en unidades
𝑌 = 200 +17𝑋1 + 22𝑋2 𝑋1 = Gastos publicitarios
𝑋2 = Cantidad de vendedores
Posibles aplicaciones de la regresión múltiple
- Para averiguar si existe correlación entre variables, se analiza la matriz y si hay 0,30 o
mayor existe correlación
- Para analizar si esta distorsiona a b, se hace correr el sistema con una sola variable y
luego con todas y se compara b que debe ser similar en todas las corridas
Donde:
𝑋𝑖 = Número individual de una serie de
𝑋𝑖 − 𝑋ത
números
𝜎 ത Media de la serie
𝑋=
𝜎= Desviación estándar de la media
4) Tamaño de la muestra: El valor de R2 depende de la cantidad de
variables para predicción en relación con el tamaño de la muestra.
Se sugiere que la cantidad de observaciones debe ser por lo
menos a 10 a 15 veces el valor de las variables de predicción. (ej.:
Y, esta en función de la publicidad y vendedores (2 variables para
predicción), se requiere de mínimo 20 a 30 observaciones.
Análisis discriminatorio
Donde:
P= Proporción de individuos en el grupo 1
1-P = Proporción de individuos den el grupo 2
Cuando el porcentaje de la tabla es mayor que el calculado, indica que el
modelo funciona mejor de los que podría esperarse por casualidad
Análisis grupal
Es un conjunto de técnicas para identificar objetos o personas similares en cuanto a ciertas
variables o mediciones
Su objetivo es clasificar los objetos o personas en diversos grupos mutuamente exclusivos y
exhaustivos, de manera que las personas incluidas en el grupo tengan el máximo de
semejanza entre ellas, es decir, los grupos deben ser de alta homogeneidad interna (dentro
del grupo) y de alta heterogeneidad externa (entre grupos)
No se trabaja con una variable dependiente
Procedimiento para formar grupos
El método consiste en medir las semejanzas entre las personas u objetos con respecto a los
valores de las variables que se emplean para formar grupos
La semejanza de personas u objetos que se agrupan de acuerdo con algún tipo de medida
de distancia
Los grupos pueden formarse a partir de gráficas de dispersión, aunque es muy tedioso y se
basa en prueba y error, este proceso se complica a medida que aumentan las variables que
se emplean para formar los grupos o el número de objetos que se agrupan
Este procedimiento ya se lo realiza por algoritmos
Análisis factorial
El objetivo del análisis factorial, es el de simplificar los datos, por la reducción de un conjunto
de variables a otro conjunto más pequeño de factores o variables compuestas, mediante la
identificación de dimensiones subyacentes a los datos
𝑆𝑖𝑙𝑒𝑛𝑐𝑖𝑜 𝑒𝑛 𝑒𝑙 𝑣𝑖𝑎𝑗𝑒
𝑉𝑖𝑎𝑗𝑒 𝑎𝑔𝑟𝑎𝑑𝑎𝑏𝑙𝑒
Ej: Lujo de un auto
𝐴𝑙𝑓𝑜𝑚𝑏𝑟𝑎 𝑑𝑒 𝑙𝑢𝑗𝑜
𝑇𝑎𝑝𝑖𝑧 𝑑𝑒 𝑐𝑢𝑒𝑟𝑜
Si exigen varias mediciones de un concepto, se pueden sumar para desarrollar una
codificación compuesta o calcular una calificación promedio del concepto.
Calificaciones factoriales
El análisis factorial produce uno o más «factores» o variables compuestas cuando se aplica
a diversas variables
Factor: Es una combinación lineal de variables.
Es un resumen ponderado de un conjunto de variables relacionadas
En el análisis factorial cada medición se pondera primero según el grado con que contribuye a
la variación de cada factor
En un análisis factorial se calcula la calificación factorial de cada sujeto para cada factor en el
conjunto de datos
Ej.: de ecuaciones utilizadas
F1= 0,40𝐴1 + 0,30𝐴2 + 0,02 𝐴3 + 0,05𝐴4
F2= 0,01𝐴1 + 0,04𝐴2 + 0,45 𝐴3 + 0,37𝐴4
Con estas ecuaciones se calculan 2 calificaciones factoriales a cada sujeto que sustituyen a las
calificaciones que dieron para las variables A1 a An en cada ecuación
Los coeficientes de las ecuaciones, son los coeficientes de calificación factorial que se aplican
a las calificaciones individuales.
En este tipo de diseños se analizan los efectos combinados de dos o más variables
independientes.
gl = grados de libertad
r = hileras
3) Suma de la interacción de los cuadrados por medio de la expresión:
donde:
donde:
gl = grados de libertad
G = grupos
donde:
gl = grados de libertad
N = columnas
EJEMPLO
Para la varianza entre hileras la razón Fo = 15.13 > Fc = 4.49 por lo que no se
acepta la hipótesis nula. La razón F es altamente significativa a nivel a = 0.05.
Para la varianza de la interacción la razón Fo = 15.03 > Fc = 4.49 por lo que no se acepta la
hipótesis de nulidad. La razón F es altamente significativa a nivel a = 0.05.
Los anteriores resultados permiten concluir que existe evidencia estadística para establecer
como conclusión que la incentivación económica tiene influencia significativa en el
aumento de la productividad de los empleados de la compañía de servicios de impresión.