Documentos de Académico
Documentos de Profesional
Documentos de Cultura
OM
El método científico y el proceso de investigación.
El método
científico
permite:
.C
Contrastar
Replicabilidad
DD
nuestras
hipótesis
LA
3. Formulación de hipótesis.
4. Elaboración de un plan de recolección de datos.
5. Recolección de datos.
6. Análisis de datos.
OM
❖ Directas: mediante percepción o captación directa de atributos
observables.
❖ Indirectas: ocurre con conceptos que no tienen un referente
empírico inmediato /constructos). Se deben buscar
procedimientos que permitan una medición indirecta mediante
.C
manifestaciones externas, empíricas y observables (indicadores
operacionales).
DD
Definición conceptual y operacional de medición:
➢ Definición teórica: un término se define en base a otros
conceptos, que conforman un sistema teórico integrado.
➢ Definición operacional: especifica las actividades u operaciones
LA
OM
relaciones.
• Equivalencia.
• Orden.
• Intervalo.
.C
• Proporcionalidad.
Niveles de medición (variables):
DD
Los niveles de medición van de forma gradual y cada nivel siguiente
posee las cualidades de los anteriores.
✓ Nominal: en este nivel de medición los números se usan para
LA
OM
categoría.
2) Excluyentes: una categoría debe excluir a la otra.
➢ Clasificación:
o Variables cuantitativas:
.C
▪ Discretas
▪ Continuas
o Variables cualitativas: se expresan en categorías que reflejan
DD
diferentes características.
UNIDAD 2
¿Qué es la estadística?
LA
OM
Estadística Descriptiva: organización de los datos.
La utilización de tablas y gráficos facilita la comprensión de los
datos obtenidos en una investigación, ya que hacen que el patrón
numérico se comprenda fácilmente y a simple vista:
.C
o Tablas de frecuencias.
▪ Frecuencia absoluta simple (f): es el número de veces
DD
que aparece en la muestra de un determinado valor
de la variable. (cantidad de casos que presenta una
categoría).
▪ Frecuencia relativa simple (f’): es el cociente entre la
LA
OM
central más utilizadas.
• Modo: es el valor de la variable que más se
reitera en un conjunto de observaciones.
• Mediana: es el valor de la variable que deja la
misma cantidad de observaciones por encima y
.C
por debajo.
• Media: es la suma de las puntuaciones
DD
observadas dividida por la cantidad de
observaciones. Es sensible a las puntuaciones
extremas.
Los estadísticos de variación: describen el grado de diferenciación
LA
presente en la muestra.
• Rango.
• Varianza.
• Desviación estándar: es una medida de la
FI
Puntajes Z:
Permite transformar a una métrica en común variables diferentes (es
decir, permiten la comparación de fenómenos muy disimiles).
Esta nueva distribución posee origen y unidades de medida constante.
Z= X – M Media: 30 Pb. 15 20 25 30 35 40 45
DE (S) Desvió estándar: 5 z -3 -2 -1 0 1 2 3
OM
Las puntuaciones z pueden ser tanto negativas como positivas y
generalmente sus valores varían entre -3,00 y +3,00, pudiendo ubicarse
los diferentes puntajes naturales en una nueva escala.
✓ Valores mayores a la media -> valores grandes de la variable -> z
positivo.
.C
✓ Valores menores a la media -> valores pequeños de la variable -> z
negativo
DD
UNIDAD 4
Relaciones entre variables:
Describir y definir la existencia de relaciones sistemáticas entre dos o
LA
OM
▪ Puede ser directa o inversa.
Intensidad:
▪ Indica la fortaleza de una relación.
▪ Que tan a menudo los cambios se acompañan entre sí.
.C
UNIDAD 5
Regresión lineal.
Correlación y regresión.
DD
La correlación entre variables y la regresión
están íntimamente ligadas:
La correlación tiene que La regresión consiste
ver con la magnitud y en utilizar dicha
LA
OM
Relación entre variables y predicción:
El conocimiento de una relación (magnitud y dirección) implica una
utilidad práctica, ya que el conocimiento de una variable permitiría
predecir los cambios en otra.
.C
Regresión lineal:
El problema que enfrentamos habitualmente es que trabajamos con
relaciones que no son perfectas.
DD
¿Cómo podemos determinar una única línea recta que describa de
forma aceptable todos los datos?
La solución consiste en trazar una línea que minimice los errores de
predicción.
LA
OM
∑(Y’-Y)2
• La recta que genere el valor más bajo es la que
seleccionaremos para hacer las predicciones. Esta recta se
denomina: recta de regresión por mínimos cuadrados.
.C
Regresión:
DD
• La recta de regresión representa la mejor estimación de los
datos de Y a partir de los valores de X. Es decir, es la que
minimiza los errores de predicción.
• Esta recta está dada por la fórmula:
LA
Y’= by X+ay
• El procedimiento descripto es útil para predecir datos,
siempre y cuando exista una relación lineal entre las
FI
variables.
UNIDAD 6
OM
frecuencias observadas (fo).
.C
DD
Magnitud de la relación: Phi de Cramer:
❖ A partir del valor de Chi Cuadrado podemos calcular el tamaño
de efecto de la relación.
LA
OM
Suponiendo que la tabla es la siguiente:
Coeficiente intelectual f (cantidad de casos)
Deficiencia mental profunda 10
Deficiencia mental media 30
.C
Deficiencia mental superficial 70
Limítrofe (bordeline o 200
fronterizo)
DD
Poco inteligente 400
Normal 1500
Inteligente 500
Brillante 205
LA
Superdotado 85
n (total) 3000
2-Nivel de medición.
Nominal:
Sexo F (cantidad de casos)
OM
Masculino 49
Femenino 51
Ordinal:
.C
Nivel de educación F (cantidad de casos)
Primario (A) 50
Secundario (B) 75
DD
Terciario (C) 20
Universidad (D) 100
Se puede establecer un orden, y puedo decir que A < C y que D > A.
Intervalar:
LA
50-69 78
70-79 200
80-89 400
90-109 1500
110-119 500
120-129 205
130 o superior 85
Aca si puede establecer un orden y cálculos matemáticos (saber la
distancia entre una categoría y la otra)
Temperatura
-15 a -10
OM
Proporcional:
Cantidad de materias aprobadas
0
1
.C
2
3
4
DD
5
Acá si parte de un 0 absoluto, puedo hacer cálculos matemáticos, puedo
saber la distancia entre una categoría y la otra ya que son números. No
puede tener signos negativos.
LA
3
4
5
OM
Terciario (C) 20 0,08 145 0,59
Universidad (D) 100 0,41 245 1,00
n (total) 245 1,00
A ver si entendimos algo:
.C
✓ f Hay 75 casos de secundario y también 100 casos de universidad!
✓ f’ La proporción de primario es de 0,20 (20%) y la de secundario es
de 0,31 (31%)
DD
✓ F Hay 125 personas incluyendo el secundario y el primario
✓ FHay 145 personas incluyendo terciario, secundario y primario
✓ F Hay 245 personas incluyendo universidad, terciario, secundario
y primario (lógico que
LA
primario
✓ F’ Hay una proporción del 1,00 (100%) incluyendo universidad,
terciario, secundario y primario (lógico que coincide con el 100%
OM
donde la variable tiene categorías cuantitativas (cantidad) las categorías
son números.
El histograma se puede transformar en polígono de frecuencias
(progreso de una empresa, por ejemplo). Se obtiene pasando por la
.C
marca de clase de cada clase.
La ojiva se utilizan las F o F’, por eso el grafico va siempre hacia arriba
(siempre aumentando, va acumulando) y termina cuando llega a la
DD
última clase.
5- Clases.
Las clases sirven para agrupar categorías así es más fácil la lectura de la
LA
tabla:
Edad f f’ F F’
0-20 años 50 0,21 50 0,21
FI
OM
misma amplitud). En este caso vemos que todas las clases tienen
una amplitud de 20. (límite superior-límite inferior. Ej: 20-0=20 /
41-21=20 / etc.)
▪ Marca de clase (MC) es el valor que está en el MEDIO de cada
.C
clase, se obtiene promediando los limites (ej: (20+0)/2=10)
6- Medidas de centralidad.
DD
En las variables nominales:
֍ La proporción es simplemente la f’.
֍ El modo/moda es la categoría que tiene la mayor f. Pueden ser:
o Modo: cuando es una categoría que está de moda.
LA
Casado 150
n 500
Acá la moda es la categoría soltero.
Ej: bimodal
Enfermedad f (cantidad de casos)
Esquizofrenia 120
Psicosis 40
OM
Secundario (B) 75 0,31 150 0,61
Terciario (C) 20 0,08 170 0,69
Universidad (D) 75 0,31 245 1,00
n 245 1,00
Acá la moda es primario, secundario y universidad.
.C
En variables ordinales:
֍ La mediana: es la categoría que deja por debajo a la mitad de
DD
observaciones y deja por debajo y por arriba de ella la misma
cantidad de casos.
֍ Hay que usar la F.
LA
Ej:
CI f(cantidad de casos) F(acumulación de f)
Defic. mental profunda 10 10
FI
OM
֍ Medidas no centrales: cuando hablen de cuartil, hablan de cuatro.
o Primer (1) Cuartil: ¼*n (corresponde al 25% de las
observaciones).
o Tercer (3) Cuartil: ¾*n (corresponde al 75% de las
.C
observaciones).
Ej:
DD
Nivel de educación f f’ F F’
Primario (A) 75 0,31 75 0,31
Secundario (B) 75 0,31 150 0,61
Terciario (C) 20 0,08 170 0,69
LA
OM
para las ordinales en donde no se puede hacer buenos cálculos
matemáticos entre las categorías ya que no son variables métricas.
7- Forma de la distribución:
La distribución puede ser:
.C
o Simétrica: cuando =Mdn (ej: la media vale 5 y la mediana
vale 5)
DD
o Asimétrica hacia la izquierda: cuando < Mdn (ejemplo
=5 y Mdn=7)
o Asimétrica hacia la derecha: cuando > Mdn (ejemplo =5
y Mdn=1)
LA
Medidas de Dispersión:
Recorrido/rango: se obtiene haciendo: valor máx.-valor min. (Ej: si se
tiene 3, 3, 5, 7, 8 seria 8-3=5, el recorrido es 5.
FI
OM
El cálculo para sacar el puntaje Z es: x -
S
Ej: Suponiendo que el promedio de notas de un parcial de una muestra
de 500 casos es de =7 con una desviación estándar s=2,7
.C
Una persona saco un 5 y quiere saber cuándo se desvía del promedio:
Entonces se hace 5-7/2,7 = - 0,74 =Z.
DD
El puntaje Z es negativo por lo tanto esa persona se desvía por debajo
de la media.
Si otra persona se sacó un 3 resolviendo Z= -1,48, por lo tanto, ambas
LA
Otra persona se sacó un 10, Z=1,11, positivo y por encima de 0, está por
encima del promedio.
9- Relaciones entre variables.
OM
tenga una de las variables y tantas columnas (verticales) como
categorías tenga la otra variable.
Ej: tipo de hogar (v1) y la relación con los pares (v2) podemos estableces
la siguiente tabla bivariada (2 variables) con sus respectivas categorías.
.C
Tipo de hogar Relación con los pares
Sumisión Rebeldía Liderazgo
Monoparental Materno
DD
Monoparental paterno
Nuclear
Extendido
Podemos creer que el tipo de hogar influye en la relación con los partes,
LA
OM
No podemos identificar a una Si podemos identificar a una
variable como previa a la otra. variable como previa a la otra.
.C
DIRECTA INDIRECTA
Cuando los valores de una Cuando los valores de una
variable aumentan, la otra variable aumentan, los valores de
DD
también aumenta. Ej: relación la otra disminuyen. Ej: relación
entre estudiar y promedio de la entre salir al boliche y promedio
carrera: a mayor estudio, mayor de la carrera: a mayor boliche,
promedio. menor promedio.
LA
OM
10- Intensidad y forma de la relación entre variables.
Se analizará la relación entre dos o más variables de distinto tipo, y se
verá cuan fuerte o débil es, y en algunos casos, que dirección tiene la
relación. Para cada tipo de variable, existen distintos tipos de
.C
coeficientes de relación que analizar.
➢ Para variables nominales dicotómicas (con dos categorías):
o Q de Kendall: su fórmula es:
DD
o AxD – CxB
o AxD + CxB
▪ Y nos permite conocer la intensidad de la relación que
hay entre las variables. El resultado siembre va a estar
LA
intensa.
➢ Para variables nominales:
o C de Pearson.
o V de Cramer.
▪ Antes de calcular estos dos coeficientes de la relación,
debemos calcular le puntaje ‘’Chi Cuadrado (x2)’’
▪ Chi Cuadrado: se calcula para ver la diferencia entre
las frecuencias esperadas y las frecuencias
OM
negativos y el resultado siembre va a estar entre C y C
máxima. Consta de dos pasos, primero calcular C. LA
fórmula es:
o X2 (en ambos es x al cuadrado)
.C
o X2+n
▪ En donde X2 (x al cuadrado) es chi cuadrado y n es el
número de los casos totales. El segundo paso es
DD
calcular C máx. La fórmula del mismo es:
o (fila o columna) -1
o Fila o columna
▪ La cantidad de fila o columnas totales menos uno,
LA
OM
▪ El coeficiente de correlación, va de -1 a +1. Siendo la
relación intensa (fuerte) mientras más cerca de 1 se
encuentre, ya sea -1 o +1; y una relación débil
mientras más cerca de 0 este. Aquí el signo nos dirá la
.C
direccionalidad que tiene la relación.
▪ La dirección puede ser:
• Directa: cuando aumenta una variable, la otra
DD
también aumenta y si disminuye una variable,
disminuye la otra. Si el coeficiente tiene un signo
positivo, es porque tiene una relación directa.
• Inversa: cuando aumenta una variable, la otra
LA
OM
.C
DD
LA
FI