Está en la página 1de 76

INTRODUCCIÓN AL ANÁLISIS

CUANTITATIVO DE LOS DATOS

Dr. Alberto Cayón P.


Tel: 0414 – 6309121
acayonp@gmail.com

Marzo 2017
ESTADÍSTICA
“Es la disciplina que se ocupa :

La obtención de
La recolección, inferencias a partir
organización, de un volumen
resumen y de datos cuando
análisis de datos, se examina una
parte de ellos”.

(Daniel, 2004:2)
Tipos de estadística

DESCRIPTIVA: INFERENCIAL:
Métodos que incluyen la Métodos que hacen
recolección, presentación posible la estimación de
y caracterización de un una característica de
conjunto de datos con el una población o la toma
fin de describir de una decisión
apropiadamente las referente a una
diversas características de población, basándose
ese conjunto de datos. sólo en los resultados
de la muestra.
INFERENCIA ESTADÍSTICA
Proceso y resultado de extraer conclusiones respecto a una población a partir
de una o más muestras.
conclusiones

P M

El eslabón absolutamente crucial entre los resultados que se obtienen


de la muestra y la capacidad para generalizar esos resultados a la
población, es el supuesto de que un muestreo repetido de la población
producirá un conjunto de datos representativos de la población. Si esto
no sucede, no se podrá aplicar las pruebas de la estadística inferencial.
TIPOS DE INVESTIGACIÓN

Descriptiva: Consiste en detallar las situaciones, hechos y fenómenos


predominantes de la variable dentro de un contexto.

Comparativa: Persigue establecer semejanzas o diferencias del


comportamiento de una variable entre dos o más grupos.

Correlacional: Pretende encontrar asociaciones entre


variables en los mismos sujetos.

Explicativa: Establece la naturaleza de la relación de


causalidad y efecto entre una o diversas variables independientes
con una o varias variables dependientes.
UNA VARIABLE:

 SE MIDE

 CAMBIA
¿Cuál gráfico representa una variable?

Diseño de un vehículo

Internet

Software
educativo

Satisfacción Laboral

Rendimiento académico
Las variables se clasifican en……
Naturaleza o tipo de estudio
Nivel de medición

NOMINAL

CUALITATIVA
ORDINAL

VARIABLE
INTERVALO
CUANTITATIVA
(Discreta, continua)

RAZÓN
Las variables se miden……
ESCALA O NIVEL DE MEDICIÓN: medida del grado de información de la
variable. Indica la clase de operación que se puede realizar para resumir y
presentar los datos y las técnicas estadísticas que pueden llevarse a cabo.

RAZÓN
INTERVALO
ORDINAL Las variables de razón
poseen las mismas
la distancia entre los
NOMINAL números de su escala
características de las
Si las categorías pueden variables de intervalo,
es igual. En las
ordenarse, hablamos de con la diferencia que
Se agrupa sin ninguna variables de intervalo
variable ordinal. Se cuentan con un cero
jerarquía entre sí, el cero es arbitrario
establecerse relaciones absoluto. Operaciones
como por ejemplo: Las operaciones
de mayor que, menor tales como la
nombres de personas, posibles son todas las
que o igual que, entre multiplicación y la
grupos sanguíneos, de escalas anteriores,
los elementos como por división tienen
estado civil, raza, más la suma y la
ejemplo: grados de significado. ejemplos:
resta.
desnutrición. altura, peso.
TIPO DE VARIABLE

TIPO DE PALABRAS
INTERVALO Y
INVESTIGACIÓN CLAVES ORDINAL Y NOMINAL
RAZÓN

MODA
MEDIA, MEDIANA,
DESCRIBIR, CLASIFICAR, DISTRIBUCIONES DE VARIANZA.
FRECUENCIA
DESCRIPTIVA CATEGORIZAR EQUIPARAR
GRÁFICOS, HISTOGRAMAS,
DESVIACIÓN TÍPICA
IGUALAR CONTRASTAR CURTOSIS
PASTELES
ASIMETRÍA

2G WILCOSON t de student
GRUPOS
COMPARAR, DIFERENCIAR,
COMPARACIÓN EQUIPARAR, IGUALAR,
>2G ANOVA
CONTRASTAR KRUSKAL WALLIS
GRUPOS PRUEBA DE MEDIAS
FRIEDMAN
(TUKEY, LSD)

RELACIONAR, ASOCIAR
CHI CUADRADO, CORRELACIÓN DE
RELACIÓN VINCULAR
RANGOS DE SPEARMAN PEARSON
(UNIÓNM NEXO)

CONSECUENCIA ANÁLISIS MULTIVARIADO


CORRELACIONES CANÓNIGAS REGRESIÓN SIMPLE
CAUSA
CAUSA - EFECTO EFECTO
FACTORES COMUNES REGRESIÓN
ANÁLISI CLUSTER MÚLTIPLE
INCIDENCIA ANÁLISIS DISCRIMINANTES
Para cada una de las siguiente variables determine lo siguiente:
Variable Valores Tipo
Estado de salud de una persona Cualitativa Discreta - Continua
Cuantitativa Ninguna

Tipo de pasto que tiene sembrado una vivienda Cualitativa Discreta - Continua
Cuantitativa Ninguna

Número de llamadas que recibe un sujeto Cualitativa Discreta - Continua


Cuantitativa Ninguna

Marca de Microondas que posee una familia Cualitativa Discreta - Continua


Cuantitativa Ninguna

Analgésico que toma una persona para aliviar un dolor Cualitativa Discreta - Continua
Cuantitativa Ninguna

Diámetro de la punta de un bolígrafo Cualitativa Discreta - Continua


Cuantitativa Ninguna

Metros cuadrados de un inmueble Cualitativa Discreta - Continua


Cuantitativa Ninguna

Tipo de cirugía a la que es sometido un paciente Cualitativa Discreta - Continua


Cuantitativa Ninguna

Tiempo de préstamo de cierto libro Cualitativa Discreta - Continua


Cuantitativa Ninguna

Monto de un cheque cambiado en un banco Cualitativa Discreta - Continua


Cuantitativa Ninguna
Determine su nivel de medición:
Variable Tipo

Nivel de ansiedad medido por prueba estandarizada Nominal, Ordinal, Numérica

Precio de un auto usado Nominal, Ordinal, Numérica

Severidad de las quemaduras de una persona rescatada en un incendio Nominal, Ordinal, Numérica

Puesto que ocupa una persona en una compañía Nominal, Ordinal, Numérica

Antigüedad de un auto usado Nominal, Ordinal, Numérica

Tipo de complicación que sufrió un bebé al nacer Nominal, Ordinal, Numérica

Intensidad de un dolor de cabeza Nominal, Ordinal, Numérica

Tiempo que tarda un paciente en ser atendido Nominal, Ordinal, Numérica

Consumo diario de agua que hace una persona Nominal, Ordinal, Numérica

Variedad de Sorgo que se cultiva en una región Nominal, Ordinal, Numérica


CONCEPTOS BÁSICOS
POBLACIÓN: Cualquier colección de unidades:
animales, personas o cosas de cualquier naturaleza
sobre el que estamos interesados en estudiar. No
debe existir ambigüedad (delimitarse en el tiempo y
en el espacio). Normalmente es demasiado grande
para poder abarcarla.

MUESTRA: subconjunto o parte representativa de la


población a la que tenemos acceso.

UNIDAD DE OBSERVACIÓN: unidad a través de la cual se


obtiene la información.
PARÁMETRO: medida de resumen que describe una
característica de una población, denotado generalmente
con letras griegas:  ,  ,  

ESTADÍSTICO: medida de resumen que describe una característica de la


muestra, sirve para estimar parámetros y se denota por letras de nuestro
alfabeto: x , s , p 

VARIABLE: propiedad, atributo, rasgo o aspecto observable que puede


tomar diferentes valores o modalidades (no necesariamente numéricos) de la
unidad de observación y cuya variación es susceptible de medirse. Se denota
por letras de nuestro alfabeto: X, Y , A, B, 
DATO: valor observado o medido de una variable. Se le conoce también como
observación, valor, medición, etc. y se denota por: Xi , Yi , Ai , Bi , 

MEDICIÓN: proceso que nos permite asignar números a objetos y eventos


de acuerdo a reglas (Stevens, 1951). Proceso de vincular conceptos abstractos
con indicadores empíricos (Carmines y Zeller, 1979). Si expresa magnitud se
denomina Medición Cuantitativa y si registra categorías se denomina
Medición Cualitativa.
Statistical Package for
the Social Sciences

Paquete Estadístico para


las Ciencias Sociales
El SPSS…
Es una potente herramienta para realizar análisis y gráficos estadísticos.
Es el programa informático de estadística con mayor difusión a nivel
mundial.
Efectúa los cálculos más complejos en el mundo de la estadística de
manera eficiente y eficaz
y con un mínimo de esfuerzos.
  Vista de datos
 1. Editor de datos 
  Vista de variables

SPSS  2. Ventana de resultados


 3. Archivo de sintaxis
Barra de menú

Barra de herramientas

Columnas

Filas
Celdas

Vistas
Acceso alAcceso Acceso
conjunto
a la de rápido
Ayuda en
descripcióna las
línea sobre
Realiza
Permite todas
Todas las funciones controlar
las
Permite Acceso
la
que realizar al conjunto de
Contiene el conjunto de de ventanas
gráficos estadísticos
las de datos,
todo
variables el
del de SPSS
paquete
sefunciones
forma en
pueden típicas programas
la cualquier
hacer que
con deselave función
la de SPSS, que
acciones que se pueden resultados,
fichero activo, de sintaxis
creación
edición:
pantalla
cortar, van
principal,
copiar,
conducente
archivos: Abrir, cerrar, desde
a crearla generación
llevarbuscar,
controlamos
eliminar, a cabo conde
lasvariables
barras losuna tabla de de grupos de variables,
guardar, nuevas
importar, a partir
que
reemplazar,datos:
aparecen etc.
en definir
frecuencias
ella así a análisis así como edición de los
exportar, de otras
imprimir, etc.existentes o no:
como la propiedades
forma en lade que las
multivariantes menús
transformar, recodificar,
variables,los
se presentan seleccionar complejos
asignardatosrangos, etc.
casos, ordenar casos,
etc.
Introducir los datos al SPSS
TABULACIÓN DIRECTA por el teclado introduciendo los
datos en el Editor de datos.

IMPORTANDO ARCHIVO desde el mismo programa, la


data existente en una fuente externa de datos: archivo de
texto (Microsoft Word), hoja de cálculo (Excel) o bases de
datos (MSAccess, Dbase).

CORTADO y PEGADO desde otra tabla de datos.


TABULACIÓN DIRECTA
Ejemplo: Un estudio realizado de 8 casos y 25 variables: Género, Profesión,
Antigüedad en el cargo, Estado civil, Edad y 20 ítems.

Antigüedad Estado
Caso Género Profesión en el cargo civil Edad i1 i2 i3 i4 i5 i6 i7 i8 i9 i10 i11 i12 i13 i14 i15 i16 i17 i18 i19 i20
1 Femenino Docente 10 Casado 35 4 3 1 1 1 1 4 4 1 3 3 4 4 3 3 1 3 3 3 2
2 Masculino No docente 26 Soltero 52 3 1 3 3 4 4 4 4 4 4 3 3 3 4 4 1 3 4 4 1
3 Masculino Docente 2 Casado 29 3 2 1 2 3 4 4 4 4 2 1 3 3 4 3 3 3 3 2 3
4 Femenino No docente 25 Casado 60 3 4 3 3 3 2 4 3 1 3 3 3 3 3 3 1 3 3 3 2
5 Femenino No docente 4 Otro 35 3 1 3 3 3 3 4 1 3 3 3 4 3 3 4 4 3 3 4 3
6 Masculino No docente 1 Casado 26 3 3 3 1 2 3 4 4 3 4 4 4 3 4 4 3 2 4 4 1
7 Masculino Docente 8 Soltero 30 3 3 1 3 1 3 4 4 3 4 0 4 3 3 4 1 1 4 3 1
8 Masculino Docente 12 Casado 42 3 4 4 1 4 4 4 1 2 4 4 4 3 4 4 4 4 4 4 1
TABULACIÓN DIRECTA
Selecciona la pestaña Vista de variables y en la columna Nombre

Escribes la abreviatura del nombre de cada variable


TABULACIÓN DIRECTA

Una vez que hayas escrito el nombre de todas las variables, te queda:
TABULACIÓN DIRECTA
En la columna Tipo aparece Numérico por defecto, si necesitas cambiarlo:

Clic
TABULACIÓN DIRECTA
TABULACIÓN DIRECTA

En la columna Etiqueta escribe el nombre completo de cada variable o un


comentario del contenido de la variable
TABULACIÓN DIRECTA
TABULACIÓN DIRECTA

En la columna Valores

Clic

Género tiene dos atributos: Femenino, al que le asignaremos el código 1; y


a Masculino el código 2. La variable Estado Civil tiene 3 atributos: Soltero
(1), Casado (2) y Otro (3)
TABULACIÓN DIRECTA

Clic
TABULACIÓN DIRECTA
 De nuevo escribes en Valor: 2
 Etiqueta: Masculino
 clic en Añadir

Clic

Haces lo mismo para la variable Estado Civil


TABULACIÓN DIRECTA
Dar un nombre al archivo y guardar, seleccionas:

Archivo → Guardar como…. Ejercicio 01


Guardar en: Escritorio
Para introducir los datos TABULACIÓN DIRECTA

Clic

Escribes la data en cualquier celda, por filas o por columnas (recomendable por
columnas)
TABULACIÓN DIRECTA

Para la variable Caso, escribes cada número en una celda de la columna


respectiva:
TABULACIÓN DIRECTA

Para Género, colocas los códigos de las categorías correspondientes a cada caso:

O haces clic en el icono Etiquetas de valor de la Barra de Herramientas y


seleccionas según sea el caso:
Clic
TABULACIÓN DIRECTA
Para Profesión, escribes sus categorías en la columna respectiva :

Para Antigüedad, escribes sus valores en la columna respectiva :


Para Estado Civil, haces igual que para Género:

Para Edad y los 20 ítems escribes los números en la columna respectiva,


resultando:

Para Salvar, sigues la ruta Archivo 


Guardar o haces clic en el icono
Para salir de SPSS, sigues la ruta: Archivo Salir y a continuación se cerrará

la sesión.
LECTURA DE UN ARCHIVO

Ejemplo: Un estudio realizado de 8 casos y 25 variables: Género, Profesión,


Antigüedad en el cargo, Estado civil, Edad y 20 ítems.

Antigüedad Estado
Caso Género Profesión en el cargo civil Edad i1 i2 i3 i4 i5 i6 i7 i8 i9 i10 i11 i12 i13 i14 i15 i16 i17 i18 i19 i20
1 Femenino Docente 10 Casado 35 4 3 1 1 1 1 4 4 1 3 3 4 4 3 3 1 3 3 3 2
2 Masculino No docente 26 Soltero 52 3 1 3 3 4 4 4 4 4 4 3 3 3 4 4 1 3 4 4 1
3 Masculino Docente 2 Casado 29 3 2 1 2 3 4 4 4 4 2 1 3 3 4 3 3 3 3 2 3
4 Femenino No docente 25 Casado 60 3 4 3 3 3 2 4 3 1 3 3 3 3 3 3 1 3 3 3 2
5 Femenino No docente 4 Otro 35 3 1 3 3 3 3 4 1 3 3 3 4 3 3 4 4 3 3 4 3
6 Masculino No docente 1 Casado 26 3 3 3 1 2 3 4 4 3 4 4 4 3 4 4 3 2 4 4 1
7 Masculino Docente 8 Soltero 30 3 3 1 3 1 3 4 4 3 4 0 4 3 3 4 1 1 4 3 1
8 Masculino Docente 12 Casado 42 3 4 4 1 4 4 4 1 2 4 4 4 3 4 4 4 4 4 4 1
AGRUPACIÓN DE DATOS
(Distribuciones de frecuencia)

Las distribuciones de frecuencia se construyen por las


siguientes razones:
A. Resume conjunto grande de datos
B. Se logra cierta comprensión respecto a la naturaleza
de los datos
C. Se logra tener un avance para construir gráficas
importantes
Cuando obtenemos datos de una
variable cualitativa, la forma de
presentar esos datos (en nuestros
resultados de nuestra tesis) es a
través de la distribución de
frecuencias de la variable

TABLAS GRÁFICOS
DISTRIBUCIONES DE
FRECUENCIA
Cuando se trabaja con conjuntos grandes de datos, es útil organizarlos y
resumirlos por medio de la construcción de una tabla que liste los distintos
valores posibles de los datos, individual o por grupos, junto con el número
de veces que se presentan dichos valores. (frecuencias)

Diferencia entre ordenamiento de datos y frecuencia

Ordenamiento de notas en Estadística Clase Frecuencia


9 9 10 11 11 9 - 11 6
11 12 12 13 13 12 - 14 9
13 14 14 14 14 15 - 17 3
16 17 17 19 20 18 - 20 2
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Ejemplo: Puntaje obtenido en un examen de Estadística (Variable de Intervalo
continua) de 57 estudiantes . Notas entre 1 - 20
Es muy difícil decir algo
sobre el comportamiento
16,87 16,87 13,13 18,87 12,91 14,26en este grupo
de la nota
11,70 13,47 15,85 16,98 13,58 14,15
16,98 10,75 13,96 15,85 12,08 15,28
18,49 19,25 20,00 15,70 17,21 13,36
13,21 19,62 17,77 13,96 18,04 15,62
15,62 18,11 15,47 14,45 13,58 11,25
16,30 19,25 16,23 14,72 14,94 13,36
18,11 16,23 12,79 16,87 12,04
11,70 17,74 13,92 12,45 10,75
17,66 15,25 16,75 20,00 11,47

Ordenar los datos con su frecuencia.


Se puede:
Agruparlos en intervalos de clase (exhaustivos y excluyentes)
COLOCAMOS LAS NOTAS EN EL SPPS Y LE PEDIMOS SU
FRECUENCIA: OBTENEMOS LOS SIGUIENTES RESULTADOS
10,75 2 15,25 1
11,25 1 15,28 1
11,47 1 15,47 1
poco adecuada para sacar
11,70 2 15,62 2
conclusiones ya que la mayoría
12,04 1 15,70 de los1 valores se presentan
12,08 1 15,85 sólo una
2 vez
12,45 1 16,23 2
12,79 1 16,30 1
12,91 1 16,75 1
13,13 1 16,87 3
13,21 1 16,98 2
13,36 2 17,21 1
13,47 1 17,66 1
13,58 2 17,74 1
13,92 1 17,77 1
13,96 2 18,04 1
13,96 1 18,11 2
14,15 1 18,49 1
14,26 1 18,87 1
14,45 1 19,25 2
14,72 1 19,62 1
14,94 1 20,00 2
Lo obtenido por el SPSS, no es adecuado para
presentar los datos, ¿Porqué?

Para obtener una mejor comprensión de los datos, hay que agruparlos
en lo que se llama intervalos de clase. Es necesario primero
determinar el número óptimo de clases o categorías (k) y luego
construirlos.

Regla de Spiegel: Se construyen entre 5 clase y 20 Número de


clases. estudiantes.
Número que
debe ser menor
Regla Empírica:k  57  7,55  8. de 500

Regla de Sturges: k  1  3,322  log57  6,83  7.


TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
16,87 16,87 13,13 18,87 12,91 14,26
11,70 13,47 15,85 16,98 13,58 14,15
16,98 10,75 13,96 15,85 12,08 15,28
18,49 19,25 20,00 15,70 17,21 13,36
13,21 19,62 17,77 13,96 18,04 15,62
15,62 18,11 15,47 14,45 13,58 11,25
16,30 19,25 16,23 14,72 14,94 13,36
18,11 16,23 12,79 16,87 12,04
11,70 17,74 13,92 12,45 10,75
17,66 15,25 16,75 20,00 11,47

PARA LOGRAR LA COMPRENSIÓN DE LOS DATOS,


TOMAMOS LA DECISIÓN DE CREAR 7 CLASES
Una vez tomada la decisión del número de clases, debemos
calcular los intervalos de clase, sigue los siguientes pasos:

Calcula el ancho o amplitud de la clase (a) mediante la r


a .
fórmula: k

Donde: r  rango  valor más alto  valor más bajo.


k  número de clases.

20,00  10,75
a  1,32  1,4
7

1,4 Intervalo
o Ancho de Clase
Una vez calculado el ancho de clase, se calculan entonces las diferentes
clases.

(1,4  0,01  1,39) Que significa esto?

Frecuencia
Frecuencia
Intervalo de Frecuencia Relativa
Relativa
clase 10,75+1,39
Absoluta Acumulada
(%)
(%)
12,15+1,39
10,75 – 12,14
13,55+1,39
12,15 – 13,54
14,95+1,39
13,55 – 14,94
16,35+1,39
14,95 – 16,34
17,75+1,39
16,35 – 17,74
17,75 – 19,1419,15+1,39
19,15 – 20,54
Se ubican los datos en el intervalo a que pertenecen (Frecuencia Absoluta)

10,75 – 12,14 12,15 – 13,54 13,55 – 14,94 14,95 – 16,34 16,35 – 17,74 17,75 – 19,14 19,15 – 20,54
10,75 12,45 13,58 15,25 16,75 17,77 19,25

10,75 12,79 13,58 15,28 16,87 18,04 19,25

11,25 12,91 13,92 15,47 16,87 18,11 19,62

11,47 13,13 13,96 15,62 16,87 18,11 20,00

11,70 13,21 13,96 15,62 16,98 18,49 20,00

11,70 13,36 14,15 15,70 16,98 18,87 5


12,04 13,36 14,26 15,85 17,21 6
12,08 13,47 14,45 15,85 17,66

8 8 14,72 16,23 17,74


14,94 16,23 9
10 16,30

11
EJERCICI
O
Frecuencia
Frecuencia
Número de Frecuencia Relativa
¿Cuántos individuos tienen menos de 2 hijos Absoluta
Relativa
Acumulada
(%)
hijos? (%)

0 419 27,7 27,7


 Frecuencia A.(0 hijos) + Frecuencia A.(1
hijo) 1 255 16,8 44,6
= 419 + 255
2 375 24,8 69,5
= 674 individuos.
3 215 14,2 83,7

4 127 8,4 92,1


¿Qué porcentaje de individuos tiene 6
hijos o menos? 5 54 3,5 95,7
 97,3%. 6 24 1,5 97,3

>6 40 2,6 100,0

¿Qué porcentaje de individuos tiene 3 Total 1509 100


hijos o más?
No contesta 8 0,5
 30,5%.
Total 1517 100
Trabajando con la escala de Likert
Creación de un Baremo para interpretar las medias obtenidas
Mide las actitudes o comportamientos de alguien. Utiliza opciones de
respuesta que van de un extremo a otro.
A 15 participantes se les hacen las siguientes preguntas y deben responder de
acuerdo a la siguiente escala de valoración (Likert)
5 = Totalmente de acuerdo 4 = De acuerdo
3 = Ni de acuerdo ni en desacuerdo 2 = En desacuerdo
1 = Totalmente en descuerdo
1. Los servicios públicos son excelentes.
Obtenemos las siguientes respuestas:
4 3 5 2 5 3 2 4 3 2 4 2 3 2 4

Pregunta:
2. El cafetín de la Universidad tiene diversidad de productos.
Obtenemos las siguientes respuestas:
3 2 1 2 3 2 4 2 3 1 1 1 2 3 3

Una vez, las respuestas introducidas en el SPSS,


calcular las medias ruta:
Analizar > Estadísticos descriptivos > Descriptivos
Una vez creadas las variables e introducidos los datos, obtenemos las
medias, con los siguientes resultados:

Estadísticos descriptivos

N Media
SerPublicExcelent 15 2,2000
CafetUNivDiversidad 15 3,2000
N válido (por lista) 15

Que debo de hacer para


poder interpretar las medias
obtenidas de las variables
1. Tener claridad en cuantas “clases” son las apropiadas para construir
el Baremo. Para el caso anterior pueden ser adecuadas 3 ó 4 clases
para interpretar las medias obtenidas. Ejemplo:
3 Clases: Alto, Medio, Bajo
4 Clases: Alto, Moderadamente alto, Moderadamente Bajo, Bajo
Seleccionamos 3 clases, porque es lo mas adecuado para nuestros
objetivos.
Para crear los intervalos de clase, sigue los siguientes pasos:

Calcula el ancho o amplitud de la clase (a) mediante la fórmula: r


a .
k
Donde: r  rango  valor más alto  valor más bajo.
k  número de clases.


Ancho de
Clase
1,00 + 1,33 = 2,33
2,34 + 1,33 = 3,67
3,68 + 1,33 = 5,01 = 5

B a r e m o para interpretar las


medias
Estadísticos descriptivos
5,00 – 3,68 Alto
N Media 3,67 – 2,34 Medio
SerPublicExcelent 15 2,2000
CafetUNivDiversidad 15 3,2000 2,33 – 1,00 Bajo
N válido (por lista) 15

Ahora si, podemos interpretar las medias.


La primera pregunta referida a los servicios públicos,
obtuvo una media de 2,2 por lo que se ubica dentro del
Baremo en la categoría de: Bajo
La segunda pregunta referida a la diversidad de productos
del cafetín, obtuvo una media de 3,2 por lo que se ubica
dentro del Baremo en la categoría de: Media
GRÁFICOS DE DISTRIBUCIÓN DE FRECUENCIAS
Gráficos para variables cualitativas
Gráfico de barras
El eje horizontal representa las
modalidades.
El eje vertical representa las
frecuencias (absoluta o relativa).
Las frecuencias de cada grupo quedan
representadas por las longitudes de las
correspondientes barras.

Gráfico de sectores (tortas o tartas, pastel,


polar)
A cada modalidad le corresponde un arco del círculo o
sector cuya área es proporcional a su frecuencia
(absoluta o relativa).
No usarlo con variables ordinales.
Pictogramas
Expresan con un dibujo alusivo al
tema de estudio las frecuencias de las
modalidades de la variable.
Utilizados en los medios de
comunicación para público no
especializado.
Gráficos para variables cuantitativas

Son diferentes en función de que las variables sean discretas o continuas. Sirven con
frecuencias absolutas o relativas.
419
400 375

Gráficos de barras (discretas) 300

255

Se deja un hueco entre las barras estrechas 215

para indicar los valores que no toma la variable. 200

127

100

250 54
24 23 17
200

Histogramas (continuas)
Recuento

0 1 2 3 4 5 6 7 Ocho o más

La superficie de cada barra o rectángulo indica la frecuencia (absoluta o


150

100
Número de hijos

50 relativa) de los valores (normalmente agrupados en intervalo de clases).


20 40 60 80

Edad del encuestado

Al unir los puntos medios de la base superior


de los rectángulos del gráfico de barras o del
histograma según la variable sea agrupada o
no agrupada se obtiene el Polígono de
frecuencias.
MEDIDAS DE TENDENCIA CENTRAL
Medidas de localización
Media Aritmética

Se obtiene sumando todos los valores de una población o


muestra y dividiéndolo entre el número de valores
sumados.
∑ xi
∑ xi µ=
x= n N
Los valores extremos influyen sobre la media, y en algunos casos
puede distorsionarla tanto que llega a ser indeseable como medida
de tendencia central.
Medidas de localización
La Moda
La moda en un conjunto de valores, es aquel que ocurre con mayor
frecuencia
Si todos los valores son diferentes, no hay moda.
Un conjunto de valores puede tener mas de una moda

Ejemplo:
¿Cual es la moda en los siguientes datos?
12 14 09 04 12 33 23 17 33 31 12 24 09 18
16 09 25 07 15
Medidas de localización
La Mediana

La mediana de un conjunto finito de valores es aquel valor


que divide al conjunto de números ordenados en dos
partes iguales.
Ninguna observación extrema en un conjunto de datos
afecta a la mediana, en consecuencia, siempre que una
observación extrema esté presente, es adecuado usar la
mediana en lugar de la media para describir un conjunto de
datos.
50  x  n1 /2 , si n es impar
% 50% 
Me   x n/2  x  n/2  1
 , si n es par
 2
MEDIDAS DE TENDENCIA CENTRAL
CÁLCULO DE LA MEDIANA

EJEMPLO

Cinco ingenieros son llamados a declarar sus honorarios por prestar sus
servicios. Se reporta lo siguiente:
x 1  7.500 Bs.F, x 2  7.500 Bs.F, x 3  8.000 Bs.F, x 4  8.000 Bs.F y
x 5  280.000 Bs.F

n = 5 (impar)
x (5+1)/2  x 6/2  x 3  8.000 Bs.F
El cobro mediano es:

x= 62.200 La media no sería representante


del conjunto de datos
MEDIDAS DE DISPERSIÓN

AMPLITUD o RANGO
RANGO INTERCUARTÍLICO
VARIANZA
DESVIACIÓN ESTÁNDAR
o TÍPICA

COEFICIENTE DE VARIACIÓN
DISPERSIÓN PUNTUACIONES Z
MEDIDAS DE DISPERSIÓN
Rango

Diferencia entre el valor mayor y el valor menor de un conjunto


de datos obtenidos en una medición.

Rango = X más grande – X más pequeño

 El rango mide la dispersión total en un conjunto de datos.


Aunque es una medida sencilla de la variación total de los
datos, su debilidad característica consiste en que no toma en
cuenta como se distribuyen los datos entre los valores mas
grande y más pequeños.

 No es necesariamente una medida de típica de dispersión


porque la presencia de un valor extremo puede cambiar
radicalmente su valor
MEDIDAS DE DISPERSIÓN
La Varianza
 La varianza es una medida de la dispersión que emplea
todos los valores de los datos. Se basa en la diferencia
entre cada valor y la media (Elevada al cuadrado).
 Varianza Mide el promedio de las desviaciones
(al cuadrado) de las observaciones con respecto a la
media.
 La diferencia entre cada valor del dato Xi y el
promedio (x para una muestra y µ para una
población) se llama desviación respecto al
promedio.
MEDIDAS DE DISPERSIÓN
Varianza
 Dado un conjunto de observaciones, se llama varianza de dicho
conjunto, a la sumatoria de las diferencias entre cada observación y la
media aritmética elevadas al cuadrado, y dividido por el número de
observaciones
( X1 – X )2 + ( X2 – X )2 + ….........…. ( Xi – X )2
S2 =
n-1
La varianza de la muestra, es la
VARIANZA ∑ ( Xi – X ) 2
suma de los cuadrados de las
diferencias de los datos con
MUESTRAL S2 = n-1 relación a la media aritmética
divida entre el tamaño de la
muestra menos 1
VARIANZA ∑ ( Xi –  )2 Unidades de la varianza son al
POBLACIONAL σ 2= N cuadrado.
 Es sensible a valores extremos (alejados de la media).
 Sus unidades son al cuadrado.

∑ ( Xi –  )2
MEDIDAS DE DISPERSIÓN
Desviación estándar

Es la raíz cuadrada de la varianza


Indica como se agrupa o distribuye un conjunto de datos
alrededor de la media.

 La desviación estándar también se define como la raíz


cuadrada positiva de la varianza.
 Desviación estándar muestra s= s2

 Desviación estándar población σ = σ2


MEDIDAS DE FORMA
MEDIDAS DE
Asimetría: Una
FORMA
distribución es simétrica si la mitad izquierda de su distribución es
la imagen especular de su mitad derecha. La distribución de los datos es simétrica o
no lo es. Si no lo es, recibe el nombre de distribución asimétrica o sesgada.

 En las distribuciones simétricas media y mediana


coinciden. Si sólo hay una moda también coincide
media > mediana: Sesgo positivo o a la derecha
media = mediana: simetría o sesgo cero
media < medina: sesgo negativo o a la izquierda
 Las discrepancias entre la media y la mediana indican
asimetría.
 La asimetría es positiva o negativa en
función de a qué lado se encuentra la cola
de la distribución.
Sesgo (+)
Sesgo (-)

 La simetría de una función de distribución se mide por el


coeficiente de sesgo de la misma.
 El coeficiente de sesgo no debe sobrepasar el valor de ± 2
(para considerarse una distribución Normal)
CURTOS
IS
 El coeficiente de curtosis mide el mayor o menor
aplanamiento de la curva de distribución

 El coeficiente de sesgo no debe sobrepasar el valor de ± 2


(para considerarse una distribución Normal)

Curtosis = 0 Curtosis > 0 Curtosis < 0


CORRELACIÓN
CORRELACIÓ
N
 CORRELACIÓN
Grado de asociación entre dos variables (Berenson, 2001: 503)
Medida de la magnitud de la relación lineal entre dos variables (Lind, 2001: 371

 COEFICIENTE DE CORRELACIÓN
Fuerza de relación entre dos variables de una población, cuyos valores
varían de -1 para una correlación negativa perfecta a +1 para una
correlación positiva perfecta.
r = -1 Correlación perfecta negativa.
r= 0 No asociación lineal. Ninguna correlación.
r = +1 Correlación perfecta positiva.
Correlación y Causalidad:

Son conceptos asociados pero distintos. Si dos variables están


correlacionadas, ello no necesariamente implica que una será causa
de otra.
Ejemplo:
Supongamos que una empresa fabrica un producto que se vende
poco y decide mejorarlo, lo hacen y lanzan una campaña publicitaria
por radio y televisión. Después se observa un aumento en las ventas
del producto. Se puede decir que el incremento de las ventas está
relacionada con la campaña publicitaria.
Si no se demuestra causalidad, no es posible asegurar que la campaña
haya causado tal incremento. Quizás la causa en sí fue la mejora del
producto, o una combinación de ambas.
Como saber si existe correlación entre dos variables?
1. La manera más directa es mediante un “diagrama de dispersión”
2. Determinar el “coeficiente de correlación”
Diagramas de dispersión
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersión.
100
90
80
t ura
a l
70 la
Pesa 77 kg. con
a
60 ment
au
peso
50 Pesa 50 kg. el
e que Mide 187 cm.
40 ec
Par
30
Mide 161 cm.
140 150 160 170 180 190 200
GRAFICA DE COEFICIENTE DE
CORRELACIÓN

y Línea con pendiente y


negativa
r=1
.

Línea con pendiente


r = -1
positiva

x x
Correlación negativa perfecta Correlación positiva perfecta
Medidas de Asociación
ESTUDIOS CORRELACIONALES

Medida de Escala de Observaciones Procedimiento en


Asociación Medición el SPSS
Son medidas del grado
de Asociación lineal entre Analizar >correlación
dos variables
bivariada > Pearson
El coeficiente toma valor
Correlación de Intervalo o de entre -1 y 1, e indican
Pearson Razón máximo de asociación
lineal positiva o negativa

Correlación Si una de las dos Analizar > correlación


variables es cualitativa Bivariada > Spearman
de con orden, o ambas.
Spearman
Coeficiente de correlación lineal de Pearson
• variables cuantitativas “r”
• Es adimensional
• Sólo toma valores en entre -1 y +1
• No existe correlación cuando r = 0
• Relación lineal perfecta entre dos variables r = +1 ó r = -1
• Cuanto más cerca esté “r “ de +1 ó de -1 mejor será el grado de relación lineal.
• Siempre que no existan observaciones anómalas.
Relación
inversa Relación
perfecta directa
Variables sin
perfecta
correlación

-1 0 +1
INTERPRETACIÓN DEL COEFICIENTE DE
CORRELACIÓN DE PEARSON

r = +/- 1 Perfecta
r = +/- 0,81 a +/- 0,99 Muy alta
r = +/- 0,61 a +/- 0,80 Alta
r = +/- 0,41 a +/- 0,60 Media o moderada
r = +/- 0,21 a +/- 0,40 Baja
r = +/- 0,01 a +/- 0,20 Muy Baja
r = 0 Nula

También podría gustarte