Está en la página 1de 40

ANÁLISIS DE DATOS

Es la técnica que consiste en el estudio de los hechos


y el uso de sus expresiones en cifras para lograr
información, la cual debe ser válida y confiable.
El análisis pretende “hacer explicitas las
propiedades, notas y rasgos de todo tipo que, en
relación a las variables estudiadas se derivan de las
tablas en las que se condesa la clasificación”, mientras
que la interpretación intenta precisarla significación y
el alcance de las propiedades y rasgos.
OBJETIVOS QUE SE PROPONEN LOS INVESTIGADORES
CUANDO ANALIZAN LOS DATOS

Tenemos:
a. Hallar lo que hay en los datos.
b. Conocer que variaciones ocurren.
c. Como están distribuidos los datos.
d. Que relación existe entre las variables.
e. Las estimaciones que resultan de los datos
f. Describir las estimaciones entre grupos y variables.
g. Determinare variables que causan variación en
otras variables.
USO DE TÉCNICAS PARA CUMPLIR CON LOS
OBJETIVOS
OBJETIVO DEL ANÁLISIS TÉCNICA ESTADÍSTICA
Hallar que hay en los datos Media, mediana, moda
Desviación estándar, rango, varianza
Conocer que tanto varían los datos
y desviación promedio
Cómo están distribuidos los datos Frecuencia
Que relación existen entre las
Correlación y medidas de asociación
variables
Estimación de punto e intervalor.
Estimaciones y predicciones
Regresión y serie de tiempo
Describir las diferencias entre
Prueba de T, Z y análisis de varianza
grupos y variables
Demostrar causalidad Prueba de T, Z y análisis de varianza
CLASES DE ANALISIS DE DATOS
Existen diversas formas de clasificar:
• De acuerdo al número de variables, puede ser univariable, bivariable y
multivariable.
• De acuerdo al carácter del análisis, puede ser exploratorio, si se quiere
encontrar nuevas hipótesis y se quiere verificar la hipótesis antes formulada
será de tipo confirmatorio.
• Según su naturaleza, es cuantitativo cuando su naturaleza es formal
(estadístico o matemático) y es cualitativo cuando su naturaleza no es
formal, es decir usa precisiones conceptuales.
• Será causal, cuando se quiere llegar a las causas.
• De cambios, si se pretende llegar a las modificaciones.
• De Decisiones, si se logra conocer la adopción de medidas.
• De grupos, si se aspira a conocer determinados conjuntos.
• De Sistemas, si se quiere conocer conjuntos ordenados en relaciones
determinadas.
CUADRO SINTÉTICO DE ANÁLISIS DE DATOS

Objeto de Clasificación Criterio Nombre del Análisis


Univariable
Número de variables del
Bivariable
Análisis
Multivariable
Exploratorio
El carácter del Análisis
Confirmativo
Cuantitativo
ANÁLISIS DE DATOS La naturaleza del Análisis
Cualitativo
Causal
De Cambios
Objetivo del Análisis De Decisiones
De Grupos
De Sistemas
USO DEL ANÁLISIS SEGÚN EL NÚMERO DE
VARIABLES
Tenemos:
a. Sintetizar lo que se observa en una variable.
b. Comparar lo que se observa en dos variables.
c. Expresar la asociación que existe entre dos o
más variables.
d. Inferir conocimientos a partir de los logros a),
b) y c).
IMPORTANCIA DE LA DISTINCIÓN DE
VARIABLES
Las variables se clasifican según su utilidad, entonces tenemos:
a. Variables Nominales, los números que se asignan a las categorías
se usan como símbolos o códigos para su ulterior clasificación.
Ejemplo: 1 para aprobados y 2 para desaprobados.
b. Variables Ordinarias, cuyos números se asignan a quienes una
característica determinada. Ejemplo: 1 para quienes tienen notas
entre 17 y 20, 2 para quienes tienen promedio entre 14 y 16 y así
sucesivamente.
c. Variables Intervalares, se caracterizan por expresar distancias
iguales. Ejemplo: promedio entre 15 y 17, promedio entre 13 y 15.
d. Variables Proporcionales, tienen las mismas características de las
intervalares , pero además poseen un cero real. Por ejemplo: La
edad de las personas, los años de estudio, entre otros.
Técnicas Estadísticas que se pueden usar con las clases de variables

Grupo de Técnicas Estadísticas N°1 Grupo de Técnicas Estadísticas N°2


*Dist de Frecuencias *Coeficientes de Rango
*Coeficiente de Contingencia *Mediana
*Prueba de Chi Cuadrado *Gamma
*Moda

Nominales Ordinales
VARIABLES
Proporcionales Intervalares
Grupo de Técnicas Estadísticas N°4
*Mediana
Grupo de Técnicas Estadísticas N°3 *Media aritmética
*Desviación Estándar
*Correlación Múltiple
*Admiten todas las Técnicas *Coeficiente de correlación de
Pearson
TÉCNICAS ESTADÍSTICAS DEL ANÁLISIS UNIVARIADO
QUE PUEDE EMPLEAR QUIEN ELABORA UNA TESIS

Tenemos:
1° El investigador toma como punto de partida los
resultados estadísticos.
2° Ejecuta la normalización de los resultados, el investigador
formula las pautas para realizar comparaciones.
3° Hace comparaciones entre unos valores de la variable
que analiza con otros de la misma variable.
4° Enuncia las conclusiones del análisis estadístico.
5° Contrasta sus hallazgos con la teoría existente.
MEDIDAS DESCRIPTIVAS CON PROPIEDADES DE
POSICIÓN, DISPERSIÓN Y FORMA
ESTUDIO DE DATOS DE UNA VARIABLE
Propiedad Tipo de Medida Expresiones (estadísticas)
Media aritmética
Medidas de Tendencia Central Mediana
Posición Moda
Medidas de Tendencia no central Cuantiles

Recorrido
Medidas de dispersión o Varianza
Dispersión
variabilidad Desviación Estándar
Coeficiente de Variación
Simetría Asimetría o sesgada
Forma Modalidad Modos de distribución
Curtosis Razón de momentos de Pearson
APLICACIÓN DE LA RELACIÓN DE PEARSON

• Es
  una aplicación práctica de la moda siempre
que la distribución no sea bimodal y se acerque
a la modal, se expresa como:
MEDIDAS DE TENDENCIA NO CENTRAL

Son medidas útiles para una posición “no central”


empleadas para resumir y describir un conjunto de datos
• CUANTILES, constituyen una clase de los (n-1) valores
de participación de una variable aleatoria que dividen
a la frecuencia total de una población o de una
muestra dado el en un número de n de partes iguales.
• CLASES DE CUANTILES, dividen a una distribución en n
partes iguales. Cuando estás partes son cuatro se
nominan “cuartiles”; si son diez, deciles; si son cien,
percentiles.
OBTENCIÓN DE DECILES Y PERCENTILES

• Para obtener deciles el total de frecuencias se


divide entre 10
• Para obtener percentiles el total de
frecuencias se divide entre 100. Ejemplo: si un
estudiante de un total de 50 preguntas
contesta 41, representa el 82% del total.
LAS MEDIDAS DE DESVIACIÓN
* Concepto, Son las medidas que usa el investigador
para ofrecer información sobre la heterogeneidad i
homogeneidad de los datos. Nos se puede eludir debido
a que en las medidas de tendencia central se pueden
encontrar distintas medidas de dispersión.
• Rango o recorrido, es la diferencia entre el valor
máximo y el valor mínimo. Ejemplo: En un centro
poblado la mayor edad es de 62 años y la menor es de
15 años, entonces tenemos:
Recorrido= 62 – 15 =47
LAS MEDIDAS DE DESVIACIÓN
• La varianza o media de los cuadrados, expresa el grado de
dispersión o diseminación de los valores respecto de los
valores de una serie con relación a la media aritmética.
• Varianza según la extensión de los grupos que se
estudian, pueden ser:
1. Varianza de población, estudia la dispersión de datos
correspondiente a una población completa, es decir, a un
universo.
2. Varianza de muestras, cuando no es posible estudiar
toda la población.
LAS MEDIDAS DE DESVIACIÓN
• Varianzas según el conocimiento de las influencias, tenemos:
1. Varianza sistemática, es aquella variabilidad que encuentra su
explicación en las influencias que se conocen. Ejemplo: La
variabilidad de las puntuaciones de un estudiante que recibe
entrenamiento en comprensión de lectura suele ser más que de
aquellos que no recibió ningún entrenamiento.
2. Varianza ente grupos de medida experimental, se denomina así
por expresar diferencias sistemáticas entre grupos de medidas.
Ejemplo: La aplicación de métodos de ventas A y B a dos grupos
de clientes.
3. Varianza por error, obedecen a la casualidad, debido a hechos
que el investigador ignora o no conoce bien. Muchas veces son
inevitables.
LAS MEDIDAS DE DESVIACIÓN
• LA DESVIACIÓN ESTÁNDAR, dispersión de
datos relacionada con la varianza, pues en
tanto, esta última se expresa en unidades
elevadas al cuadrado. Indica qué tan dispersos
están los datos con respecto a la media.
• EL COEFICIENTE DE VARIACIÓN, Se usa encaso
de que exista una diferencia grande entre las
medidas de las diferentes muestras.
Coeficiente de Variación
V=Coeficiente de Variación
ܵ
ܸൌ S=Desviación Estándar
‫ݔ‬
X=Media Aritmética
LAS MEDIDAS DE DESVIACIÓN
IMPORTANCIA DEL USO DE LA DESVIACIÓN ESTÁNDAR,
tenemos
* La desviación estándar resulta más estable de un
muestreo a otro.
• Sus propiedades permiten que los investigadores
puedan hacer interpretaciones que se le aplican en
las inferencias estadísticas.
• Se aplica en el análisis de inversión y medición de
riesgos . A menor desviación estándar, menor riesgo.
Medición de satisfacción de los trabajadores
Industria Quimica Industria Automotriz Industria de Calzado Industria Electrónica
Media D Estándar Media D Estándar Media D Estándar Media D Estándar
6.7 1.1 6.7 1.2 6.6 3.2 6.5 1.3
Es homogéneo el nivel de satisfacción en todas
las industrias, excepto en la industria de calzado.
LA PRESENTACIÓN DE DATOS

Es la forma como el investigador expone


al jurado y a los lectores, los datos que
encontró al aplicar sus instrumentos de
medición.
LA PRESENTACIÓN DE DATOS
Formas posibles de presentar los datos, tenemos:
LA TABLA DE FRECUENCIAS, los datos se ordenan en clases o
intervalos, donde queda claramente determinada la frecuencia como se
producen los hechos. Presentamos las siguientes prescripciones:
• El título expresa variables, de las cuales se ofrecen datos.
• Seguidamente se establecen las clases o intervalos.
• La Tabla expresa el tamaño del muestreo.
• Hacer el conteo de cada clase o intervalo y presentarlo en forma de
frecuencia.
• Si el investigador presenta los datos secundarios, incluirá una
indicando allí las fuentes.
• El número de clases o intervalos, así como su tamaño debe definirse
de tal manera que cada uno de los números pertenezca siempre sólo a
una clase o intervalo.
LA PRESENTACIÓN DE DATOS
¿Cómo establecer las clases de distribución?
Debemos seguir los siguientes pasos:
1. Determinar el rango.
2. Se decide el número de clases. Es recomendable extraer la raíz
cuadrada del muestreo.
3. Se establece la amplitud de la clase de intervalo. Es recomendable
dividir el rango entre el número de clases.
4. Establecer los intervalos preliminares. Considerar un número menor
por debajo del valor más pequeño del límite inferior, para establecer
el límite superior se suma el límite inferior con la amplitud de la clase.
5. Presentar claramente las clases. Bajo ningún punto la distribución
que se presente admita la repetición de un mismo número en dos
clases diferentes.
LA PRESENTACIÓN DE DATOS
En caso de que se usen números continuos, se instrumentará el
signo “<“ de tal manera que en las clases o intervalo aparezcan
expresiones cómo:
2a<5
5 a <8
8 a <11, etc.
Ejemplo: Producción de una fábrica en los últimos 28 meses:
Producción de la Fabrica Textil X en millones de metros
121.1 100.1 33.7 79.2 Donde:
14.4 19.2. 45.1 81.3 Rango 107.90 (121-13.2)
90.7 13.2 116.4 59.5 Raíz 2 del Muestreo 5.29 (28^1/2)
54.8 112.6 119.1 45.3 Amplitud de Clase 17.98 (107.9/6)
13.5 29.2 99.8 121.6 Límite Inf 13.00 (13<13.2)
66.5 38.7 100.2 108.1 Límite Sup 30.98 (13+17.98)
77.3 46.2 58.1 39.7
DISTRIBUCIÓN DE FRECUENCIAS
CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS
Clase Frecuencia
13<31 5
31<49 6
49<67 4
67<85 3
85<103 4
103<121 6

Una vez establecidas las frecuencias, se deben


considerar como si tuviéramos 100 elementos.
Cuando el investigador presenta tablas con
porcentajes, debe indicar la base numérica sobre la
descansa la tabla: nunca obtener porcentajes basados en
cifras menores que 20. Se debe tener especial cuidado
en el redondeo ya que pueden incomodar la exactitud.
ANÁLISIS E INTERPRETACIÓN BIVARIADO

¿Qué es correlación?¿Qué es correlación entre variables?


La correlación denota interdependencia entre datos
cuantitativos y cualitativos.
Conexión para el más amplio y concordancia para el más
restringido, respecto a la co varianza: “Correlación de los
rangos que mide la intensidad de correlación entre dos
conjuntos de ordenamientos y el grado de correspondencia
entre ellos..
El ANÁLISIS BIVARIADO ES UN ANÁLISI ESTADÍSTICO CUYO
OBJETIVO PRINCIPAL ES EL HALLAZGO DE UNA RELACIÓN
POSIBLE ENTRE DOS VARIABLES.
ANÁLISIS E INTERPRETACIÓN BIVARIADO

• DIAGRAMA DE DISPERSIÓN, es una gráfica en dos


dimensiones, donde es posible el registro simultáneo
de los valores de dos variables que están asociadas a
un hecho o a un evento. Ejemplos:
• El tiempo diario dedicado al estudio fuera del aula y
las calificaciones en promedio que obtienen los
estudiantes.
• El rendimiento en el test de aptitud matemática y el
rendimiento en una prueba de ciencias.
• La temperatura del día y la veta de helados.
ANÁLISIS E INTERPRETACIÓN BIVARIADO
• LAS CLASES DE CORRELACIÓN, Correlación Lineal “Es una
expresión fuera de uso empleada en su tiempo para
denotar: (a)la correlación del momento producto en caso
de que las regresiones correspondientes fueran lineales, (b)
un coeficiente de correlación construido por medio de
funciones lineales de las observaciones.
Correlación no lineal: expresión referida a la correlación
entre dos variables aleatorias en las que la regresión es no
lineal.
Teniendo en cuenta el sentido de las modificaciones
pueden ser: positivas, negativas y nulas.
ANÁLISIS E INTERPRETACIÓN BIVARIADO

COEFICIENTE DE CORRELACIÓN
Son los índices numéricos que se logran haciendo
operaciones estadísticas que expresan con exactitud el
grado de correlación que existe entre dos variables.
Ejemplo correlación entre variables que oscilan entre 0 y
1 ó 1 y 1.
IMPORTANCIA DE QUE EL INVESTIGADOR USE EL
COEFICIENTE DE RELACIÓN, la importancia está en el
hecho de que así puede determinar el grado de
asociación entre variables y establecer de esta manera en
que medida corrobora la hipótesis que formuló
ANÁLISIS E INTERPRETACIÓN BIVARIADO

EL COEFICIENTE DE CORRELACIÓN DE
PEARSON, es el análisis de información
cuantitativa que se usa para detectar y medir la
asociación entre variables intervalares o de
razón.
Fórmula para hallar la correlación de intervalos:
ANÁLISIS E INTERPRETACIÓN BIVARIADO

CORRELACIÓN ENTRE DOS VARIABLES NOMINALES


Todos los coeficientes tienen que estar
basados en una comparación entre las
frecuencias y las frecuencias correspondientes a
la independencia.
ANÁLISIS E INTERPRETACIÓN BIVARIADO

EL COEFICIENTE DE SPEARMAN o
CORRELACIÓN POR RANGOS.
Éste coeficiente se usa para estudiar la relación
entre variables nominales que se asocian siempre
que el número de casos sea relativamente
pequeño, digamos hasta 30 casos.
Luego se puede determinar si la relación es
positiva, negativa o si no existe ninguna relación
(nula).
ANÁLISIS E INTERPRETACIÓN BIVARIADO

PRUEBA DE SIGNIFICACIÓN DE “ ᵨ” (Spearman)


Se usa para precisar la probabilidad de error
muestral que produce la correlación.
ANALISIS DE VARIANZA
Consiste en descomponer la variación total existente
en un conjunto de datos en los distintos elementos
que lo componen.
La variación total de un conjunto de observaciones,
medida por la suma de los cuadrados de las
desviaciones con respecto a la medida (que) puede, en
ciertas circunstancias, ser separada en componentes
asociadas a fuentes definidas de variación utilizadas
como criterio para las observaciones.
ANALISIS DE VARIANZA
FACTORES QUE INTERVIENEN EN LA VARIANZA
Tenemos:
• La Varianza Total, suma de la varianza interagrupos
más la varianza intergrupos.
• La Varianza Intergrupos, es la modificación que ocurre
en cada uno de los grupos cuando estos se someten a
un tratamiento, es decir a una manipulación
experimental.
• La Varianza Interagrupos, definida como el error
aleatorio y se da por equivocación en el muestreo.
ANALISIS DE VARIANZA
Calculo de la Varianza Total

El ANOVA - de un solo Factor


Es el análisis consistente en analizar el efecto de un solo factor .
El análisis de varianza de dos variables.
Estudia el efecto de dos o más variables independientes no
métricas sobre una variable dependiente métrica.
ANÁLISIS DE REGRESIÓN
La regresión es una técnica estadística que
describe una relación entre una variable
dependiente y una o más variables
independientes mediante una línea o ecuación
matemática. Con el análisis de regresión el
investigador determina la significación
estadística de la relación entre la variable
dependiente y la variable independiente.
ANÁLISIS DE REGRESIÓN
La regresión concibe si una variable es
aleatoria y esta formada por dos componentes:
Una variable aleatoria y un elemento
sistemático, es decir si:

‫ݕ‬ൌ
݂‫ ݔ‬൅ ‫א‬ ‫ݕ‬ൌ
݂ሺ‫ݔ‬ሻ

Análisis de Regresión Múltiple


Correlación entre una variable dependiente y dos independientes
Variable Independiente Variable Independiente
1. Puntaje de Una Prueba de aptitud 1. Cantidad de Graduados
2. Edad
ANÁLISIS DE REGRESIÓN
USOS DE LA REGRESIÓN MÚLTIPLE EN LA
INVESTIGACIÓN CIENTÍFICA
A. Como modelo descriptivo para hacer predicciones.
B. Como modelo de inferencias para probar hipótesis.
C. Como modelo estadístico en la prueba de hipótesis
estadísticas específicas: el investigador trata de
probar la hipótesis nula.
ANÁLISIS DE REGRESIÓN
En el Análisis de Regresión, las hipótesis que se
plantean los investigadores tienen las siguientes formas:
a. No existe relación lineal entre la variable dependiente
y un conjunto de variables independientes. Ejemplo: el
rendimiento promedio de los alumnos no depende de
la cantidad de libros que tienen los padres.
b. Una variable independiente no tiene relación lineal
con la varianza independiente: liquidez y deuda externa
tienen más bien una relación por fluctuaciones
muestrales.

También podría gustarte