P. 1
Análisis de datos cuantitativos

Análisis de datos cuantitativos

4.69

|Views: 68.152|Likes:
Metodologia de la Investigacion,
Metodologia de la Investigacion,

More info:

Published by: Jose Rigoberto Rivera Castellon on May 04, 2008
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PPTX, PDF, TXT or read online from Scribd
See more
See less

04/16/2015

pdf

text

original

Análisis de los Datos Cuantitativos

Analisis de datos cuantitativos

Paso 9 Analizar los datos
 Decidir

el programa de análisis de datos que se utilizara  Explorar los datos obtenidos en la recolección  Analizar descriptivamente los datos por variable  Visualizar los datos por variable  Evaluar la confiabilidad, validez y objetividad de los instrumentos de medición utilizados  Analizar e interpretar mediante pruebas estadísticas las hipótesis planteadas (análisis Estadístico Inferencial)  Realizar análisis adicionales  Preparar los resultados para presentarlos

¿Qué Procedimiento se sigue para analizar cuantitativamente los datos?
En la actualidad el análisis de datos se lleva a cabo por computadora. Se centra en la interpretación de los resultados de los métodos de análisis cuantitativo y no en los procedimientos de calculo.

Fase 1
Seleccionar un programa estadístico en computadora para analizar datos

Fase 2
Ejecutar el programa: SPSS, Minitab, Stats, SAS u otro equivalente

Fase 3
Explorar los datos: a)Analizar los datos de la variable b) Visualizar los datos por variable

Fase 5 Fase 6
Realizar análisis adicionales Analizar mediante pruebas estadísticas las hipotesis planteadas (análisis estadístico Inferencial)

Fase 4
Evalúa la confiabilidad y validez logradas por el instrumento de medicion

Fase 7
Preparar los resultados para presentarlos (tablas, graficas, cuadros, etcétera)

Esquema del proceso de análisis

Paso 1: Seleccionar un programa de Análisis
Esto incluye dos partes o segmentos : 3. Definiciones de Variables, que a su vez explican los datos (Los elementos de la codificación ítem por ítem). 2. La Matriz de datos. Una vez recolectados los datos, es definir los parámetros de la matriz de datos en el programa e introducir los datos en la matriz.

•Genero( 1=masculino y 2 = femenino) •Color de cabello( 1=negro, 2=castaño, 3=pelirrojo, 4=rubio) •Edad( dato “bruto o crudo” en años)

Statistical Package for the Social Sciences (Paquete Estadistico para las Ciencias Sociales (SPSS)
El diagrama Q-Q Se utiliza para verificar que tanto la distribucion de nuestras variables es “normal”.

Minitab
Es un paquete que goza de popularidad por su relativamente bajo costo. Incluye un considerable numero de pruebas estadisticas, y cuenta con un tutorial para aprender a utilizarlo y practicar; ademas, es muy sencillo de manejar.

Tipos de estadisticas: •Basicas: descriptivas, correlacion, covarianza, chi-cuadrada •Regresion lineal y multiple •Analisis de varianza (ANOVA) •Diagramas de dispersion, pareto, causa-efecto… •Analisis multivariado; conglomerado, analisisde factores(validacion), •Analisis distante decorrespondencia

Paso 2: Ejecutar el Programa
En el caso de SPSS y Minitab, ambos paquetes son faciles de usar, pues lo unico que hay que hacer es solicitar los analisis requeridos seleccionando las opciones apropiadas. Obviamente antes de tales analisis, se debe verificar que el programa “corra” o funcione en nuestra computadora.

Paso 3: Explorar los Datos
1. Formulamos la pregunta de investigacion que pretendemos contestar. 2. Visualizamos un alcance (exploratorio, descriptivo, correlacional y/o explicativo) 3. Establecimos nuestras hipotesis (o estamos conscientes de que no las tenemos) 4. Definimos las variables 5. Elaboramos un instrumento (conocemos que items miden que variables y que nivel de medicion tiene cada variable) 6. Recolectamos los datos.

Apunte 1
Las variables de la matriz de datos son columnas o ítems. Las variables de investigación son las propiedades medidas y que forman parte de la hipótesis o que se pretende describir. En ocasiones las variables de la investigación requieren un único ítem para ser medidas, pero en otras necesitan varios ítems. Cuando solo se precisa de un ítem, las variables de la investigación ocupan una sola columna de la matriz(una variable de la matriz) No confundir las variables de la matriz de datos con las variables del estudio, están vinculadas pero son distintas

Estadistica Descriptiva para cada Variable
La primera tarea es describir los datos, los valores o las puntuaciones obtenidas para cada variable. Por ejemplo si aplicamos a 2112 niños el cuestionario sobre los uso y las gratificaciones que la televisión tiene para ellos.. Para describir estos datos se hace la distribución de las puntuaciones o frecuencias de cada variable.

Que es una distribución de frecuencias? ordenadas en sus respectivas Conjunto de puntuaciones
categorías. Ejemplo en un estudio entre 200 personas latinas que viven en el estado de california, EE.UU. Se les pregunto: como prefiere que se refieran a usted en cuanto a su origen étnico?

Que otros elementos contiene una distribucion de frecuencias?
Las distribuciones de frecuencias pueden completarse agregando los porcentajes de casos en cada categoría. El porcentaje acumulado constituye lo que aumenta en cada categoría de manera porcentual y progresiva (en orden descendente de aparición de las categorías), tomando en cuenta los porcentajes validos. Las columnas porcentaje y porcentaje valido son iguales (mismas cifras o valores) cuando no hay valores perdidos; pero si tenemos valores perdidos, la columna porcentaje valido presenta los cálculos sobre el total menos tales valores.

De que otra manera pueden presentarse las distribuciones de
Las distribuciones de frecuencias, especialmente cuando utilizamos los porcentajes, pueden presentarse en forma de histogramas o graficas de otro tipo.

Las distribuciones de frecuencias tambien se pueden graficar como poligonos de frecuencias
Relacionan las puntuaciones con sus respectivas frecuencias, por medio de graficas utiles para describir los datos. Ademas del poligono de frecuencias, deben calcularse las medidas de tendencia central y de variabilidad o dispersion.

Medidas de tendencia central
Son puntos en una distribución, los valores medios o centrales de esta, y nos ayudan a ubicarla dentro de la escala de medición. Las principales medidas de tendencia central son Moda Mediana Media

Moda
Es la categoría o puntuación que ocurre con mayor frecuencia.

Mediana
Es el valor que divide la distribución por la mitad. Esto es la mitad de los datos caen por debajo de la mediana y la otra mitad se ubica por encima de la mediana

Mediana =

Media
Es la medida de tendencia central más utilizada y puede definirse como el promedio aritmético de una distribución.

Medidas de variabilidad
Indican la dispersion de los datos en la escala de medición y responden a la pregunta ¿Dónde están diseminados las puntuaciones o los valores diseminados? Las más utilizadas son: Rango Desviación estándar Varianza

Rango
También llamado recorrido, es la diferencia entre la puntuación mayor y la puntuación menor, e indica el número de unidades en la escala de medición que se necesitan para incluir los valores máximo y mínimo. XM-Xm

Desviación Estandar
Es el promedio de desviación de las puntuaciones con respecto a la media. Cuanto mayor sea la dispersión de los datos alrededor de la media mayor será la desviación

Varianza
Es la desviación estándar elevada al cuadrado (s2). Es un concepto estadístico muy importante principalmente en estadística inferencial, ya que en estadística descriptiva generalmente se utiliza la desviación estándar

Puntuaciones Z
Son transformaciones que se pueden hacer a los valores o las puntuaciones obtenidas, con el propósito de analizar su distancia respecto a la media, en unidades de desviación estándar. Una puntuación Z nos indica la dirección y el grado en que un valor individual obtenido se aleja de la media, en una escala de desviaciones estándar.

Razón
Es la relación que existe entre dos categorías.

La razón de hombres a mujeres es cada dos hombres hay una mujer

o sea que por

Taza
Es la relación que existe entre el numero de casos, frecuencia o eventos de una categoría y el numero total de observaciones, multiplicado por un múltiplo de 10, generalmente 100.

La taza de aprobados fue de

Confiabilidad
Medida de la estabilidad Se calcula aplicando a los participantes la misma prueba dos veces y luego obteniendo el coeficiente de correlación entre las puntuaciones de ambas aplicaciones. Método de formas alternativas o paralelas Que se calcula a través de un coeficiente de correlación entre los resultados de dos pruebas supuestamente equivalentes. Método de mitades partidas Que se calcula por medio de un coeficiente de correlación entre las puntuaciones de las mitades del instrumento.

Estadistica inferencial
Es la que utiliza para obtener los datos de la población, a partir de la información muestral. Estadígrafo Los resultados de los datos que se han recolectado de una muestra. Parámetros Son las estadísticas de la población o universo. La estadística inferencial se utiliza para dos procedimientos •Probar hipótesis •Estimar parámetros

Prueba de hipótesis
Una hipótesis en el contexto de la estadística inferencial es una proporción respecto a uno o varios parámetros, y lo que el investigador hace por medio de la prueba de hipótesis es determinar si la hipótesis es congruente con los datos obtenidos en la muestra. Para comprender lo que es la prueba de hipotesis en la estadística inferencial es necesario revisar el concepto de: •Distribución muestral •Nivel de significancia

Distribución muestral
Es un conjunto de valores sobre una estadística calculada de todas las muestras posibles de determinado tamaño de la población. Muy rara vez se obtiene la distribución muestral es mas bien un concepto teórico definido por la estadística para los investigadores.

Nivel de significancia
Es un nivel de la probabilidad de equivocarse y se fija antes de probar hipótesis inferenciales. También es conocida como nivel alfa En ciencias sociales existen dos niveles convenidos •El nivel de significancia de 0.05 •El nivel de significancia de 0.01

Aceptación o rechazo de la hipótesis sobre la media poblacional
1. Sobre bases firmes (revisión de la literatura e información disponible) establecer una hipótesis sobre el parámetro poblacional. 2. Definir el nivel de significancia 3. Recolectar los datos de una muestra significativa 4. Estimar la desviación estándar de la distribución muestral usando la formula 7. Transformar la media a nuestra puntuación Z 8. En la tabla de áreas bajo la curva normal buscar aquella puntuación Z que deje a 2.5 por encima de ella. 9. Comparar el valor de nuestra transformada con el valor obtenido de la tabla.

Aceptación o rechazo de la hipótesis sobre la media poblacional
1. El promedio de horas diarias que se exponen los niños de la ciudad de Valladolid a la televisión es de 3.0 2. Nivel de significancia 0.05 3. Muestra=312 niños, Media=2.9, Desviación Estándar=1.2 4. Estimar la desviación estándar de la distribución muestral usando la formula

8. Transformar la media a nuestra puntuación Z

Intervalo de confianza
Procedimiento de la estadística inferencial que construye un intervalo donde se localiza un determinado parámetro. Intervalo de confianza = estadígrafo + Z S

La media poblacional esta entre 2.767 y 3.033 horas, con un 95% de probabilidades de no cometer error.

Errores en la estadistica inferencial
Nunca estaremos completamente seguros de nuestra estimación. Trabajamos con altos niveles de seguridad, pero, aunque el riesgo es mínimo podría cometerse un error. Los resultados posibles al probar hipótesis serían: 5. Aceptar una hipótesis verdadera (decisión correcta) 6. Rechazar una hipótesis falsa (decisión correcta) 7. Aceptar una hipótesis falsa (conocido como error Tipo II o error beta) 8. Rechazar una hipótesis verdadera (conocido como error Tipo I o error alfa)

Prueba de hipótesis
Hay dos tipos de análisis estadísticos que pueden realizarse para probar hipótesis 3. Los análisis paramétricos 4. Los análisis no paramétricos

Análisis paramétricos
Para realizar los análisis paramétricos debe partirse de los siguientes supuestos : 3. La distribución poblacional de la variable dependiente es normal. 4. El nivel de medición de la variable dependiente es por intervalos o razón. 5. Cuando dos o mas poblaciones son estudiadas, tienen una varianza homogénea.

Muchas gracias por su atención

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->