Documentos de Académico
Documentos de Profesional
Documentos de Cultura
LECCIÓN 1
CREACIÓN DE MATRIZ DE DATOS
POBLACIÓN
• Definición 1: El conjunto de personas, animales o cosas que son
objeto de nuestro estudio.
• Definición 2: Es totalidad de las observaciones en las cuales se tiene
cierto interés.
• Cada miembro de la población debe tener al menos una característica
en común.
Elemento o Unidad Estadística:
• Son las personas, animales o cosas que forman la población.
• Si la población estuviera fueran todos los estudiantes de la
universidad cada estudiante sería un elemento o unidad estadística.
• Los elementos de una población poseen una serie de cualidades,
propiedades o rasgos comunes que se denominan en estadística
CARACTERES ó VARIABLES.
Ejemplo
En un estudio sobre personal de la se define como población a todos los
empleados de la municipalidad, estos empleados poseen una serie de
características:
• Edad.
• Estado civil.
• Número de hijos.
• Nivel de instrucción alcanzado.
• Antigüedad en el trabajo.
• Tarea que realiza.
• Remuneración que recibe.
• Etc.
Variables
• Son las características que tienen los miembros de la población.
• Es observable y pueden tomar diferentes valores, puede ser medido.
• Estas Características o Variables pueden tomar valores diferentes, en
el ejemplo anterior los miembros de la administración pública
podrían tener diferentes edades, diferentes estados civiles, etc.
Color de ojos, estado
Nominales civil, religión, sexo
Cualitativas
Nivel de instrucción,
Ordinales grado académico, nivel de
satisfacción
VARIABLES
Cantidad de
Discretas estudiantes, cantidad
Cuantitativas de hijos.
Ordinal Clasificar y
Variables Ordinal
Orden
Según su
escala de Clasificar, orden
medición Intervalo
Y distancia
Escala
Razón o Clasificar, orden,
Proporción Distancia y origen
Escala Nominal
• Una escala nominal o de clasificación consiste en clasificar objetos
reales según ciertas características, tipologías o nombres, “distinción”
dándoles una denominación o símbolo, sin que implique ninguna
relación de orden, distancia, o proporción entre esos objetos.
1. Sexo
2. Estado Civil
a. Soltero
b. Casado
c. Divorciado
d. Viudo
3. Dirección de residencia
4. Nivel de Instrucción.
a. Primaria
b. Secundaria
c. Superior Técnica
d. Superior Universitaria
5. Edad
6. Ingresos Mensuales
DICCIONARIO DE DATOS
Nombre Tamaño Decimales Formato Etiqueta Tipo
p1 1 0 N Sexo Nominal
1 Masculino
2 Femenino
P2 1 0 N Estado Civil Nominal
1 Soltero
2 Casado
3 Divorciado
4 Viudo
P3 200 0 C Dirección de residencia Nominal
P4 1 0 N Nivel de Instrucción Ordinal
1 Primaria
2 Secundaria
3 Sup. Técnica
4 Sup. Universitaria
P5 2 0 N Edad Escala
P6 5 0 N Ingresos Mensuales Escala
LECCIÓN 2
CREACIÓN DE MATRIZ DE DATOS DESDE
CUESTIONARIO
CUESTIONARIO
• Un cuestionario o formulario es, por definición, un instrumento de
recopilación de datos, adecuadamente estandarizado, que traduce de
manera concreta los objetivos de la investigación.
• Usualmente está conformado por una serie de preguntas diseñadas y
organizadas para obtener información acerca de un sujeto o un tópico
a través de un informante o entrevistado (unidad estadística).
TIPOS DE PREGUNTAS DE ACUERDO AL TIPO
DE VARIABLE.
Tipos de Variables Tipo de Preguntas
Nominales Dicotómicas Cerradas
Cerradas
Semicerradas
Nominales Politómicas Abiertas
Mixtas o Semiabiertas
No excluyentes o de respuesta múltiple
Cerradas
De tipo Likert
Ordinales
De Evaluación o Valoración
De Ordenamientos
Cuantitativas Abiertas
VARIABLES NOMINALES DICOTÓMICAS
Se utilizan generalmente preguntas cerradas
Sexo
( ) Masculino
( X ) Femenino
VARIABLES NOMINALES POLITÓMICAS
Se utilizan varios tipos de preguntas ¿Cuál es pasatiempo favorito?
Cerradas Visitar el Zoológico
¿Cuál es el área de su profesión? ………..…………..……
( ) Ciencias de la Salud
( ) Ciencias Sociales Mixtas o Semiabiertas
( X ) Ingenierías ¿Ha llevado algún curso virtual en otra plataforma
educativa?
Semicerradas ( X ) Ninguno
¿Cuál es su actual país de residencia? ( ) Si, ¿Sitio web de dicha plataforma?
( ) Perú …………………
( ) México
( X ) Argentina No excluyentes o de respuesta múltiple
( ) España ¿Además del español cuales de los siguientes idiomas
( ) Otro………………………………. habla usted?
( X ) Inglés
Abiertas ( ) Francés
¿Cuál es su deporte favorito? ( X ) Portugués
Tenis ( ) Italiano
………..…………..…….
VARIABLES ORDINALES
Cerradas De Evaluación o valoración
¿Cuál es su grado académico? Valore del 1 al 10 la calidad del material brindado
( ) Pregrado durante el curso, donde 1 representa la máxima
( X ) Bachiller insatisfacción y 10 la máxima satisfacción
( ) Maestría 1 2 3 4 5 6 7 8 9 10
( ) Doctorado Calidad del material
Etapa Edad
Joven Menos de 30 años
Adulto De 30 a 59 años
Anciano De 60 años a más
Ejemplo 2
• Categorizar la ciudad en Regiones
Ciudad Región
Lima(46) Lima (1)
Trujillo (22), Ica(23), Chiclayo(28), Piura(30),
Costa (2)
Tacna(35)
Arequipa(12), Puno(13), Moquegua(14), Ancash(24),
Junín(37), Cerro de Pasco(43), Ayacucho(44), Sierra (3)
Apurímac(48), Cajamarca(49), Huánuco(50)
Pucallpa(11), Bagua(29), Iquitos(52) Selva (4)
Ejemplo 3
• Categorizar el puntaje en Orientación Espacial en las siguientes tres
categorías de Condición
g1 < 0 g1 = 0 g1 > 0
Asimétrica Negativa Simétrica Asimétrica Positiva
Moda > Media > Mediana Moda = Media = Mediana Moda < Media < Mediana
Medidas de Forma
• Coeficiente de Curtosis
Esta medida nos permite identificar si los datos se distribuyen de forma
uniforme alrededor del punto central (Media aritmética)
g2 < 0 g1 = 0 g1 > 0
Platicúrtica Mesocúrtica Leptocúrtica
Distribución dispersa Distribución concentrada
LECCIÓN 7
ANÁLISIS EXPLORATORIO DE DATOS
Análisis Exploratorio de Datos
• Es un conjunto de técnicas estadísticas cuya finalidad es conseguir un
entendimiento básico de los datos y de las posibles relaciones
existentes entre las variables analizadas.
• El análisis exploratorio tiene el mismo objetivo que el análisis
descriptivo, pero además se busca detectar anomalías o errores en las
distribuciones de los datos, también se intenta descubrir patrones de
comportamiento en los datos.
Objetivo del AED
• Preparar y organizar los datos (Análisis descriptivo)
• Detectar fallos en el diseño y recogida de los mismos (Diagrama de tallos y
hojas, diagrama de cajas y bigotes)
• Tratamiento y evaluación de datos ausentes (omitir variables, omitir casos
e imputación).
• Identificación de casos atípicos (diagrama de cajas y bigotes).
• Comprobación de los supuestos subyacentes en la mayor parte de las
técnicas multivariantes (normalidad, linealidad, homocedasticidad).
Diagrama de tallos y hojas.
Frecuencia Tallo Hojas
2 2 19
2 3 47
4 4 2679
3 5 579
10 6 0456788999
7 7 0344557
8 8 11126777
4 9 0147
Ancho del tallo: 10
Cada hoja: 1 caso
• Hay 2 alumnos con notas de 21 a 29, de ellos uno tiene 21 y otro 29.
• Hay 2 alumnos con notas de 34 a 37, de ellos uno tiene 34 y otro 37.
• Hay 4 alumnos con notas de 42 a 49, de ellos uno tiene 42, uno 46, uno 47 y uno 49.
Diagrama de Cajas y Bigotes.
• Un diagrama de caja es un
resumen gráfico de los datos
basado en cinco datos y nos da
una idea de forma de la
distribución de los datos, además
de poder determinar si tenemos
valores atípicos.
• Son valores atípicos los q se
muestren fuera de los bigotes.
Diagrama de cajas y Asimetría
90%
5% 5%
LECCIÓN 8
ANÁLISIS DE CORRELACIÓN Y REGRESIÓN
Asociación entre variables
• La existencia de algún tipo de asociación entre dos o más variables
representa la presencia de algún tipo de tendencia o patrón de
emparejamiento entre los distintos valores de esas variables.
ASOCIACIÓN
RELACIÓN
Para saber si hay relación entre las variables se comparan los valores observados con los esperados