Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de datos
RECOLECTAR LOS DATOS
• Técnicas cualitativas: en las que los datos son presentados de manera verbal
(o gráfica) - como los textos de entrevistas, las notas, los documentos…-
• Técnicas cuantitativas: en las que los datos se presentan en forma numérica
Las etapas constituyen más bien acciones que se efectúan para cumplir con los
objetivos de la investigación y responder a las preguntas del estudio, además
son iterativas o recurrentes.
1. La redacción de resúmenes:
reduce la masa de información
pero no utiliza métodos muy
específicos (no es replicable por
otros investigadores). En el
resumen se procura identificar los
conceptos relevantes y cómo
éstos se relacionan entre sí.
Análisis Cualitativo
2. Reducción de los Datos
Si regresamos a los códigos, debemos recordar que éstos se asignan a las categorías (se
etiquetan), con la finalidad de que el análisis sea más manejable y sencillo de realizar,
además son una forma de distinguir a una categoría de otras.
1. Método de emparejamiento
2. Método iterativo:
2.- Método iterativo: Abordaje de los datos con mínima formalización teórica y
construcción progresiva de una explicación. (Requiere conocimiento de las diferentes
teorías que pueden explicar el fenómeno y la realización de un trabajo reiterado sobre
los datos).
Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis
4. Análisis transversal
4. Análisis transversal
Dolor de No dolor de
rodilla rodilla
Obesos a b a+b
No obesos c d c+d
a+c b+d
Análisis Cualitativo
4. Análisis transversal
Datos de sección transversal y de series de tiempo
Datos de sección transversal son los Los datos de series de tiempo son datos
obtenidos en el mismo o obtenidos a lo largo de varios periodos.
aproximadamente el mismo momento
(punto en el tiempo).
Análisis Cuantitativo
1. Análisis descriptivos
2. Análisis ligados a las hipótesis
Pruebas Estadísticas
Análisis Cuantitativo
Diagrama de Dispersión y Línea de Tendencia
Diagrama de Dispersión es una representación gráfica de la relación entre dos variables
cuantitativas y una línea de tendencia es una línea que da una aproximación de la relación.
Análisis Cuantitativo
Diagrama de Dispersión y Línea de Tendencia
Diagrama de Dispersión es una representación gráfica de la relación entre dos variables
cuantitativas y una línea de tendencia es una línea que da una aproximación de la relación.
Análisis Cuantitativo
Distribución de Frecuencias
Tendencia Central
Medidas de Variabilidad
Análisis Paramétrico
No Paramétrico
Análisis Cuantitativo
Análisis descriptivos
Análisis descriptivos
Barras deben ir
Sobre cada Etiqueta
separadas
Análisis descriptivos
Son valores medios o centrales de una distribución que sirven para ubicarla dentro de la
escala de medición.
Las principales medidas de tendencia central son tres: moda, mediana y media. El nivel
de medición de la variable determina cuál es la medida de tendencia central apropiada
para interpretar.
Análisis descriptivos
Media Aritmética
La media aritmética es el promedio o medición de tendencia central de uso más
común. Se calcula sumando todas las observaciones de una serie de datos y luego
dividiendo el total entre el número de elementos involucrados.
Media Aritmética
Determina el centro de gravedad de un conjunto de datos, es decir es el valor más
representativo
Media Aritmética
Si los datos son datos de una muestra, la media se denota ; si los datos son datos de
una población, la media se denota con la letra griega μ.
Para calcular la media de una población use la misma fórmula, pero con una notación
diferente para indicar que trabaja con toda la población. El número de observaciones
en una población se denota N y el símbolo para la media poblacional es μ.
Análisis descriptivos
En este caso, la población está definida por todos los focos que se produzcan con el filamento nuevo. Para
evaluar las ventajas del filamento, se fabricaron 200 focos. Los datos recolectados de esta muestra dan el
número de horas que duró cada foco hasta que se quemara el filamento.
Si no hay empates, la mitad de las observaciones serán menores y la otra mitad serán
mayores.
La Mediana (Me)
Donde :
Li : limite inferior del intervalo de la clase que contiene a la Me
c : Tamaño del intervalo de clase
n : Total de frecuencias absolutas
Fa : Frecuencia absoluta acumulada anterior a la clase que contiene a la Me
fi : frecuencia absoluta de la clase que contiene a la Me
Análisis descriptivos
La Mediana (Me)
La gerencia de mercadeo de DirecTv ha decidido realizar un estudio acerca de la edad promedio de los
clientes de su servicio de televisión satelital. Se ha elegido una muestra de 300 clientes recogida
durante todo un mes típico . Aplicada la encuesta se han obtenido los siguientes resultados :
La Moda ( Mo) La moda es la categoría o puntuación que ocurre con mayor frecuencia.
La moda o modo es el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la
moda no se ve afectada por la ocurrencia de los valores extremos.
Análisis descriptivos
La Moda ( Mo) La moda es la categoría o puntuación que ocurre con mayor frecuencia.
La moda o modo es el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la
moda no se ve afectada por la ocurrencia de los valores extremos.
La Moda ( Mo) La moda es la categoría o puntuación que ocurre con mayor frecuencia.
Donde :
Li : limite inferior del intervalo de la clase que contiene a la Moda
c : Tamaño del intervalo de clase
n : Total de frecuencias absolutas
fp : Frecuencia absoluta posterior a la clase que contiene a la Moda
fa : frecuencia absoluta anterior de la clase que contiene a la Moda
Análisis descriptivos
La Moda ( Mo)
a. Moda de datos agrupados
En los conjuntos de datos que no tienen muchos valores repetidos, el percentil p divide
a los datos en dos partes.
Cerca de p por ciento de las observaciones tienen valores menores que el percentil p y
aproximadamente (100 - p) por ciento de las observaciones tienen valores mayores que
el percentil p. El percentil p se define como sigue:
También es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el
valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de
observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se encuentran el 20 por ciento de las observaciones.
Percentil
Con frecuencia es conveniente dividir los datos en cuatro partes; así, cada parte
contiene una cuarta parte o 25% de las observaciones. En la figura se muestra una
distribución de datos dividida en cuatro partes. A los puntos de división se les conoce
como cuartiles y están definidos como sigue:
Del ejemplo de los sueldos, el cuartil Q2, la mediana, ya se tiene identificado, y es 3505.
Análisis Cuantitativo
Cada una de las hipótesis planteadas en el estudio debe ser objeto de una
verificación. Cuando los datos recolectados son de naturaleza cuantitativa, esta
verificación se realiza con la ayuda de herramientas estadísticas que se definen
sobre la base de 3 aspectos principales:
Es conveniente resaltar que el fin de los muestreos es extraer una muestra lo suficientemente
representativa de una población para que las conclusiones muestrales obtenidas puedan
extrapolarse a nivel poblacional, de ahí que sea de suma importancia la minuciosa elección y
preparación en la recogida de datos.
Bibliografía
Pruebas Estadísticas
Descripción
Permite predecir el comportamiento de una variable a partir de otra.
Presunciones o requisitos
Se asume que ambas variables son representadas en escalas de intervalo o radio.
Adicionalmente, la variable dependiente debe estar normalmente distribuida
alrededor de la línea de predicción.
Para esto se asume que las variables están relacionadas linealmente. Usualmente,
ambas variables deben estar normalmente distribuidas. Se pueden aceptar
también a variables dicótomas (de solo dos niveles) como variables
independientes.
Para el análisis de regresión lineal simple nos interesan 3 componentes en los resultados. El primero se
llama “Resumen del modelo” en el que aparece el cálculo del R cuadrado (llamado coeficiente de
determinación). El R cuadrado nos indica la proporción de varianza de la variable dependiente que se
puede explicar a través de la variación de la variable independiente. El segundo la significancia un valor
menor a 0,05 indica una regresión linear significativa. Y Al final el cálculo de los coeficientes como: Y =
a + bX
Pruebas Estadísticas
Ecuación: Y = a + bX
Salario: -18970,501 + 3699,115(años de educación)
* Para 12 años de servicio: -18970,501 + 3699,115(12)
= 25419,38
* Para 16 años de servicio: -18970,501 + 3699,115(16)
= 40215,84
Pruebas Estadísticas
Presunciones o requisitos
Las distribuciones de las cuales se han tomado los valores deben ser normales. No
obstante, la prueba t es un test robusto que puede soportar violaciones de la
presunción de normalidad en las distribuciones. La variable dependiente debe
estar medida en escalas de intervalo o radio.
La prueba t asume una igualdad en las medias
Por lo tanto, un resultado con significación indica que la media de la muestra no es equivalente a la
media de la población (de allí viene el término “diferencia significativa”). Un resultado que no es
significativo se refiere a que no existe una diferencia significativa entre las medias. No significa que son
iguales.
Pruebas Estadísticas
En nuestro ejemplo se presenta un valor t de 3,903, con 3 grados de libertad, y un nivel de significación de
0,030. La diferencia entre las dos medias (la de nuestra muestra y la de la población) es de 10,25 puntos.
Una prueba t de una muestra se utilizó para comparar la media de la muestra con la media de la
población que tiene un valor de 70,00. Se encontró una diferencia significativa (t(3) = 2,377, p < 0,05). La
media de la muestra de 80,25 (ds = 5,25) fue significativamente superior a la media de la población.
Escritura