Está en la página 1de 10

Capitulo 10 Anlisis de los datos cuantitativos Hernndez Sampieri Una vez que los datos se han codificado, transferido

a una matriz, guardado en un archivo y limpiado de errores, el investigador procede a analizarlos. El anlisis de los datos en la mayora de los casos se realiza de manera automatizada, mediante software y sobre una matriz de datos. Fases del Anlisis de los datos Fase 1 Seleccionar el programa Fase 2 Ejecutarlo Fase 3 Explorar los datos Fase 4 Evaluar confiabilidad y validez Fase 5 Analizar las Hiptesis Fase 6 Anlisis adicionales Fase 7 Presentar los resultados Paso 1 Seleccionar un programa de anlisis Hay diversos programas, su funcionamiento es muy similar. Se integran de dos partes: * La definicin de las variables * La matriz de los datos Ejemplo de una matriz de datos Caso | Genero | Color de pelo 1 |1 |1 | 35 | 2 |1 |1 | 29 | 3 |2 |1 | 28 | 4 |2 |4 | 33 | | Edad |

Genero 1= masculino 2= femenino Color de pelo 1=negro 2=castao 3=pelirrojo 4= rubio Edad (valor bruto) en aos * SPSS o SPAW Paquete estadstico para las ciencias sociales, desarrollado por la Universidad de Chicago, es uno de los ms difundidos.

* MINITAB Es de bajo costo, tiene un demo en http://minitab.com Paso 2 Ejecutar el programa * Antes de realizar la instalacin del programa, es necesario revisar que nuestro equipo cumpla con todos los requisitos para la ejecucin del paquete, de manera que no se presenten conflictos en el equipo durante la instalacin o en la ejecucin del programa. * El Hardware y el Software son mnimos para ejecutar SPSS Paso 3 Explorar los datos * Esta etapa es inmediata a la ejecucin del programa, es sencilla si se llev a cabo la sucesin de las etapas previas. Etapa 1 Men Analizar/informes/ Estadsticos descriptivos/Frecuencias Se solicitan para todos los tems (variable, matriz por matriz): * Informes de la matriz, para ver los resultados tem por tem o fila por fila Estadsticos descriptivos a) Descriptivos (tabla con las estadsticas fundamentales de todas las variables de la matriz, columnas o tems) b) Frecuencias (tablas de la frecuencia de las variables dela matriz c) Explorar (relacin entre las variables de la matriz) d) Generar tablas de contingencia e) Generar razones Etapa 2 El investigador evala las distribuciones y estadsticas de los tems o columnas, observa que tems tienen una distribucin lgica e ilgica y agrupa a los tems o indicadores en las variables de investigacin (variables compuestas) de acuerdo a sus definiciones operacionales y la forma como desarroll sus instrumentos de medicin. Etapa 3 Men Transformar/Calcular Se indica al programa como debe agrupar los tems en las variables de su estudio. Etapa 4 Men Analizar Se solicitan para todas las variables del estudio: a) Estadsticas descriptivas (tablas con los estadsticos fundamentales de todas las variables) b) Un anlisis de frecuencias con estadsticas, tablas y grficas. DATOS ESTADSTICOS

* Variable de la matriz de datos Es una columna o un tem * Variable de investigacin Son las propiedades medidas y que forman parte de las hiptesis o que se pretenden describir Variable compuesta Es cuando la variable de investigacin est integrada por varias variables de la matriz o tems. * El anlisis de los datos depende de tres factores a) Nivel de medicin de la variable b) Como se formularon las hiptesis u objetivos c) Inters del investigador El anlisis descriptivo final es sobre las variables del estudio La estadstica no es un fin en s misma sino una herramienta para evaluar datos y probar hiptesis. Estadstica descriptiva Distribucin de frecuencias Es el conjunto de puntuaciones ordenadas en sus respectivas categoras. Distribucin de frecuencias (como desea que se le llame tnicamente) Categoras | Cdigos (valores) Hispano |1 | 52 | Latino |2 | 88 | Latinoamericano |3 |6 Americano | 4 | 22 | Otros | 5 | 20 | No respondieron |6 | 12 Total | | 200 | Distribucin de frecuencias Cuando la descripcin de la s frecuencias son tantas es necesario resumirla en rangos. Ejemplo: 1- 10 11-20 21-30 Etc. Distribucin de frecuencias (cooperacin del personal en el proyecto de calidad de la empresa) | Frecuencias | | |

Categoras | Cdigos (valores) acumulado | Se ha obtenido colaboracin No se ha obtenido colaboracin No respondieron |3 | 26 Total | | 122 | 100 |

| Frecuencias | Porcentaje vlido |1 | 91 | 74.6 | 74.6 | |2 |5 | 4.1 | 78.7 | | 21.3 | 100 | |

Porcentaje

Distribucin de frecuencias (motivos de la preferencia de su personaje preferido) | | Frecuencias | Porcentaje | Validos | Divertidos | 142 | 72.1 | Buenos | 10 | 5.1 | 5.2 | Tienen poderes | 23 | 11.7 | Son fuertes | 19 | 9.6 | 9.8 | Total | 194 | 98.5 | 100 | Perdidos | No contestaron |3 Total | | 197 | 100 | | | Porcentaje vlido | 73.2 | 78.4 | 11.9 | 100 | | 1.5 | | 73.2 | | | 90.2 | | | | | | Porcentaje acumulado

Otras maneras de presentar la distribucin de frecuencias * Grfica de Histogramas * Grfica de Barras * Grfica de Circulares * Polgono de frecuencias Relaciona las puntuaciones con sus respectivas frecuencias por medio de grficas tiles para describir los datos Medidas de la tendencia central Valores medios o centrales de una distribucin que sirven para ubicarla dentro de la escala de medicin. Moda Es la categora o puntuacin que se presenta con mayor frecuencia Mediana Valor que divide la distribucin por la mitad Clculo de la Mediana N+1 _______ 2 = 9+1 ________= 5 2

Media Es el promedio aritmtico de una distribucin y es la medida de tendencia central ms utilizada Es la suma de todos los valores entre el nmero de casos

Medidas de variabilidad Son intervalos que indican la dispersin de los datos en la escala de medicin Rango (Recorrido) Indica la extensin total de los datos en la escala XM-Xm Desviacin estndar Promedio de desviacin de las puntuaciones con respecto a la media que se expresa en las unidades originales de medicin de la distribucin. Varianza Se usa en los anlisis inferenciales. Otra estadstica descriptiva Asimetra y curtosis Estadsticas que se usan para conocer cunto se parece una distribucin a la distribucin terica llamada curva normal o campana de Gauss Traduccin de estadsticas al ingls Moda Mode Mediana . Median Media Mean Desviacin estndar Standar devation Varianza Variance Mximo Maximum Mnimo Minimum Rango Range Asimetra Skewness Curtosis - Kurtosis Puntuaciones Z Son medidas que indican la direccin y el grado en que un valor individual de aleja de la media, en una escala de unidades de desviacin estndar. Razn Es la relacin entre dos categoras La razn de hombres a mujeres 60/30=2 Categora | Frecuencia | Masculino | 60 | Femenino | 30 | Tasa Es la relacin entre el nmero casos de una categora y el nmero total de observaciones Tasa= Nmero de eventos/ Nmero total de eventos posibles Tasa= Nmero de nacidos vivos en la Cd/ Nmero de habitantes Tasa= 10,000/300,000X 1000=33.33 Es decir hay 33.33 nacidos vivos por cada 1000 Paso 4 Evaluar la confiabilidad y la validez lograda por el instrumento de medicin Puede oscilar entre 0 nula confiabilidad y 1 mximo de confiabilidad. La confiabilidad de las escalas se calcula mediante diversos mtodos:

Medida de estabilidad (test retest) Se calcula aplicando a los participantes la misma prueba dos veces y luego aplicando un coeficiente de correlacin entre las puntuaciones de ambas aplicaciones. Mtodo de formas alternativas o paralelas Se calcula a travs de un coeficiente de correlacin entre los resultados de dos pruebas supuestamente equivalentes. Se aplica en prueba - postprueba Mtodo de mitades partidas. Se calcula por medio de un coeficiente de correlacin entre las puntuaciones de las mitades del instrumento. La Validez La validez del contenido se obtiene al asegurarse que las dimensiones medidas por el instrumento sean representativas del universo o dominio de dimensiones de las variables de inters. La evidencia de validez de criterio se produce al correlacionar las puntuaciones de los participantes, con sus valores obtenidas en el criterio. Correlacin implica asociar puntuaciones obtenidas por la muestra en dos o ms variables. Paso 5 Analizar mediante pruebas estadsticas las hiptesis planteadas (Anlisis estadstico inferencial) Se utiliza para probar hiptesis y estimar parmetros, se basa en la distribucin muestral. Prueba de la hiptesis Consiste en probar si la hiptesis es congruente con los datos de la muestra Los resultados posibles seran: 1. Aceptar una hiptesis verdadera (decisin correcta) 2. Rechazar una hiptesis falsa (decisin correcta) 3. Aceptar una hiptesis falsa (error beta o tipo II) 4. Rechazar una hiptesis verdadera(error alfa o tipoI) Distribucin muestral Una distribucin muestral es un conjunto de valores sobre una estadstica calculada de todas las muestras posibles de una poblacin. Nivel de significancia Es un nivel de la probabilidad de equivocarse y que fija un manera a priori del investigador Debe partirse de los siguientes supuestos: 1.- La distribucin poblacional de la variable dependiente es normal 2.- El nivel de medicin de la variable dependiente es por intervalos o razn 3.- Cuando las poblaciones en cuestin poseen una dispersin similar en sus distribuciones Anlisis paramtricos Coeficiente de correlacin Pearson Es una prueba estadstica para analizar le relacin entre 2 variables medidas en un nivel por intervalos o de razn. Prueba t Es una prueba estadstica para evaluar si 2 grupos difieren entre s de manera significativa respecto a sus medias. Se utiliza para 2 grupos Prueba de diferencia de proporciones Es una prueba estadstica para analizar si 2 proporciones difieren significativamente entre s.

Anlisis de varianza Es una prueba estadstica para analizar si mas de 2 grupos difieren significativamente entre s en cuanto a sus medias y varianzas. Se utiliza para 3, 4 o mas grupos. Prueba de diferencia de proporciones Es una prueba estadstica para analizar si 2 proporciones difieren significativamente entre s. Anlisis No paramtricos Debe partirse de las siguientes consideraciones: 1.- No requieren de presupuestos acerca de la forma de la distribucin poblacional 2.- No necesariamente tienen que estar medidas en intervalos o de razn, pueden analizar datos nominales u ordinales. Chi cuadrada Es una prueba estadstica para evaluar hiptesis entre dos variables categricas. Se utiliza para probar hiptesis correlacionales. Coeficientes de Spearman y Kendall Son medidas de correlacin para variables en un nivel de medicin ordinal; los individuos u objetos de la muestra pueden ordenarse por rangos. Coeficientes para tabulaciones cruzadas Adicionales a la Chi cuadrada, existen estos coeficientes para evaluar si las variables incluidas en la tabulacin cruzada estn correlacionadas. Paso 6 Realizar anlisis adicionales Despus de realizar nuestro anlisis, es posible que decidamos agregar otros anlisis o pruebas extras para confirmar tendencias y evaluar los datos desde diferentes ngulos. Paso 7 Preparar los resultados para presentarlos Se recomienda, una vez que se obtengan los resultados de los anlisis estadsticos, las siguientes actividades: 1.- Revisar cada resultado Anlisis general y especfico de valores resultantes, tablas, diagramas, cuadros y grficas. 2.- Organizar los resultados Primero los descriptivos, por variable, luego los resultados relativos a la confiabilidad y la validez y posteriormente los inferenciales. 3.- Cotejar los diferentes resultados Su congruencia y en caso de inconsistencia lgica volverlos a revisar. 4.- Priorizar la informacin ms valiosa 5.- Copiar las tablas en el programa con el cual se elaborar el reporte Vaciar en procesadores de texto o uno para presentaciones como word o power point, las tablas elaboradas por programas como SPSS o Minitab. 6.- Comentar o describir brevemente La esencia de los anlisis, valores, tablas, diagramas, grficas. 7.- Volver a revisar los resultados. 8.- Y, finalmente, elaborar el reporte de investigacin. Conclusiones Podemos concluir diciendo que hemos visto las diferentes fases del anlisis de los datos cuantitativos.

Se han visto superficialmente algunos programas para elaborar el anlisis de los datos en la investigacin. Hemos trabajado con las estadsticas necesarias para elaborar el anlisis de los datos. Para la probacin de hiptesis existen mtodos paramtricos y no paramtricos. Capitulo 7 Recopilacin de datos y estadstica descriptiva. Salkind El proceso de recopilacin de datos implica cuatro pasos: * La construccin de formatos para recabar la informacin. * La codificacin que sirve para representar esos datos. * La recopilacin en si de los datos * Su asentamiento en el formato de recopilacin de datos. * La codificacin: Los datos se codifican cuando se transfieren del formato de recopilacin original a un formato que se presta al anlisis de los datos. * La nica regla para codificar datos es usar cdigos lo mas sencillos posibles. Los diez mandamientos de la recopilacin de datos: 1.- Cuando comience a considerar un procesos de investigacin piense desde entonces el tipo de datos que se tendr que recopilar para contestar la pregunta. 2.-Hay pensar tambien de donde los vamos a obtener. 3.-Asegurarse que el formato de recopilacion de datos sea facil de usar. 4.-Preparar una copia del archivo de datos. 5.-No depender de otras personas para recopilar los datos. 6.-Hacer un programa detallado de cuando y donde recabara sus datos. 7.-Cultivar las posibles fuentes de su grupo de sujetos. 8.-Tratar de contactar a los sujetos que faltaron a la entrevista. 9.-Nunca desechar los datos originales. 10.-Obedecer los otros nueve. El anlisis de los datos se puede realizar por medio de la estadstica descriptiva y la inferencial * El primer paso del anlisis de los datos es describirlos, o la distribucin de puntajes. * La comparacion de distribucion de puntajes se puede realizar por medio de las Medidas de tendencia central. Hay tres tipos de medidas de tendencia central: La media, mediana y la moda. * La media es la sumatoria de un conjunto de puntajes dividida entre el numero de puntajes. * La mediana es el puntaje de una distribucion por arriba de la cual se encuentra la mitad de los puntajes. * La moda es el puntaje que ocurre con mayor frecuencia. Medidas de variabilidad. La variabilidad es el grado de dispersin que caracteriza a un grupo de puntajes y es el grado en que un conjunto de puntajes difiere de alguna medida de tendencia central generalmente la media. Las medidas de la variabilidad son: El intervalo que es la diferencia entre el puntaje mas alto con el mas bajo. La desviacion estandar: Es la cantidad promedio en que cada uno de los puntajes individuales varia respecto a la media del conjunto de puntajes. Conclusiones

La etapa del anlisis de los datos se realiza en cuatro pasos. Se mencionaron los 10mandamientos para el anlisis de los datos. Hemos conocido las tres medidas de tendencia que se manejan en el anlisis de los datos. Estas estadsticas son: media, mediana y la moda. se conocieron las medidas de varianza del anlisis de datos: intervalo y la desviacin estandar

Capitulo 8 Mtodos de Investigacin Salkind La estadstica descriptiva sirve para describir las caractersticas de una muestra, la estadstica inferencial sirve para inferir algo acerca de la poblacin de la cual se extrajo la muestra. La significancia estadstica es el grado de riesgo que estamos dispuestos a asumir de que rechazaremos un hiptesis nula cuando en realidad es cierta. Al riesgo que corremos al cometer este tipo de error se le conoce como error tipo 1 y tipo 2. Al error tipo 1 se le han asignado ciertos niveles convencionales que es el 0.1 y el 0.5. Y el error tipo 2 es aceptar una hiptesis nula falsa. Pruebas de Significancia Nos ayudan a tomar decisiones acerca de las poblaciones. Se basan en el hecho de cada que cada tipo de hiptesis nula tiene asociado un tipo de estadistica especifico. Pasos a seguir para una prueba estadstica 1. Expresion de la hiptesis nula. 2. Establecer el nivel de riesgo asociado a la hiptesis nula. 3. Seleccin de la prueba estadistica apropiada. 4. Calculo del valor de la prueba estadistica. 5. Determinacion del valor requerido para rechazar la hiptesis nula. 6. Comparacion del valor obtenido con el valor critico 7. Si el valor obtenido es mas extremo que el valor critico no es posible aceptar la hiptesis nula. 8. Si el valor no excede el valor critico la hiptesis nula es la mas atractiva. Prueba T para medidas independientes Es una prueba inferencial de la significancia de la diferencia entre dos medias basadas en dos grupos independientes. Algunas pruebas de significancia son: * Prueba t para muestras independientes. * Prueba t para muestras dependientes. * Analisis de varianza Tcnicas para evaluar una variable dependiente * Anlisis de varianza multivariado:Es una tcnica avanzada que determina la ocurrencia de diferencias por grupo en mas de una variable dependiente.

* Anlisis factorial: Permite al investigador reducir el numero de variables que representan un constructo en particular y luego usar los llamados puntajes de factores como variables dependientes. Conclusiones Hemos conocido los mtodos para el anlisis de datos. Estos mtodos son: pruebas de significancia, pruebas t, para muestras independientes y Prueba t para muestras dependientes. Se conocieron los pasos para una prueba estadstica.

También podría gustarte