Documentos de Académico
Documentos de Profesional
Documentos de Cultura
28/3
Clase 1, presentación.
4/4
m= muestra
Variables ej: grupo sanguíneo “nominal” 4 datos
Tabla de frecuencia: número de veces que aparecen los valores de una variable cualitativa.
X: grupo sanguíneo, cualitativa nominal.
A 14 0,35 35
B 7 0,17 7,5
AB 3 0,075 17,5
0 16 0,4 40
40 1 100
Tablas de contingencia
Se usan para comparar dos variables, para comprobar si hay dependencia o no entre dos variables. Pocos
datos, es bueno para expresarlo en forma porcentual.
Puedo trabajar con porcentajes sobre total de filas, columnas o sobre el total general.
Los números dentro de la tabla se llaman frecuencias dobles porque responden a la categoría de dos
variables.
Ej: 13 sexo femenino, nivel universitario.
Sexo/NF P S U Total
Femenino 5 5 13 23
Masculino 3 8 6 17
Total 8 13 19 40
Masculino 7,5 20 15
Porcentajes indican “32,5% de ésta muestra es de sexo femenibo y tiene título universitario”
P S U
Representa el porcentaje sobre por ejemplo el total de las mujeres en nivel secundario.
X: localidad
Variable cualitativa y nominal
MDP 17
Batan 3
Mechongue 1
Miramar 8
Necochea 7
Olavarria 1
Otamendi 2
Santa clara 1
40
- comparativa
Pareto
Si tiene un problema que tiene muchas causas, no se puede abordar todo junto.
El principio de pareto dice que el 80% de un problema se resuelve atacando solo el 20% de las causas.
Cuantitativa
- discretas: valores enteros (número de hijos, hermanos)
- continuas: toman infinitos valores dentro de un intervalo (nivel de glucemia, colesterol, altura, peso)
asume muchos valores en un intervalo.
Cuantitativa discreta
Estadística descriptiva: tratar de resumir la información
X variable: número de veces que se practica deporte
X Fi Fr Fp Fa Far Fap
7 6 0,15 15
40 1 100 40 1 100
Datos de la tabla:
m = 40
Fr = Fi/m debe dar el total 1
Fp = Fr x 100 debe dar el total 100
Fa = el primero es igual a Fi, el resto es + Fi (diagonal) la última acumulada debe coincidir con el total de la
observación.
Far = el primero es igual a Fr, el resto es + Fr (diagonal) debe dar el total 1
Farp = el primero es igual a Fp, el resto es + Fp (diagonal) también se puede hacer Far x 100. El total debe
dar 100.
Fa= acumulando frecuencias, la primera es la misma que tengo y después voy sumando.
Far= primero es igual, voy sumando far + fr
Fap= fa/m x 100
11/4
Variables cuantitativas continuas
Rango de datos: XM -Xm = 230 - 98 = 132 (diferencia entre el que tiene el colesterol más alto y más bajo)
Intervalos (K): 5
debo repartir mi rango total 132 en 5
m=40 1 100
Histograma: hacer rectángulos de una determinada amplitud con una altura proporcional a lo que me indica
la frecuencia. Rectángulos proporcionales a la altura de las frecuencias y al peso de cada intervalo.
La amplitud de los intervalos es la misma para todos, mi ancho de la base
tiene que ser igual para todos los intervalos y puedo elegir la unidad de
medida. Todas deben ser iguales (mismo ancho) eje numérico.
Hay una continuidad en los valores de la variable.
18/4
Estadística descriptiva: Nos sirve para resumir lo que pasa con 1 o más variables.
● Identificar la o las variables. (grupo sanguíneo, nivel de colesterol) Saber de qué estoy hablando
● Clasificar variables en cualitativa o cuantitativa.
● Saber cómo representar / graficar.
● Medidas descriptivas: números que resumen valores, describen lo que pasa con una variable.
Tipos de medidas:
● De tendencia central: las que están en el centro de la distribución. Donde se ubica el promedio.
Promedio o media: m
Está influenciado por valores extremos. Siempre para variables cuantitativas.
Valores de la variable por su correspondiente cantidad (XiFi) se usa para sacar el promedio. Fi
por X (el valor que se repite).
ejemplo:
Resultado: significa que el número de veces que practican deporte es de 3,125 días por semana.
Mediana: me
La que va al medio. No influenciada por los extremos.
Valor que si ordenamos de menor a mayor está en el centro.
Para calcularla se usa la columna de frecuencias acumuladas. Calculamos la mitad de F i y luego
buscamos la primera frecuencia acumulada más grande que esa mitad. Ejemplo: en este caso sería 20
la mitad de Fi y 4 es la mediana porque su frecuencia acumulada es 26.
Modo: mo
Variable que se repite más veces.
Ejemplo: en este caso el 0; porque tiene la frecuencia más alta.
Cuando hay dos que tienen mayor frecuencia, el modo puede ser doble, la serie sería bimodal. Perdería el
sentido del modo, que es destacar del resto.
● de posición: Aquellas que nos dan el posicionamiento, en qué lugar están esas medidas
● De variabilidad: indica como varía los valores de la variable con respecto a algo, nos indica cuán
variable es.
X variable de colesterol
Intervalo Fi Xi XiFi Fa
98-125 6 111,5 669 6
40 6629
E XiFi 6629
m = —---------- = —---------- = 165,725
n 40
Modo:
mo = Xli + di / (di + d2) x a
Xli = límite interior de los intervalos donde esta el limite mas bajo y donde está el modo.
di = Diferencia (resta) entre la frecuencia donde está el modo y la frecuencia anterior.
d2 = diferencia entre la frecuencia del intervalo modal y la posterior
a = amplitud de los intervalos
M= 165,25
Mo= 172,5
me= 166,72
25/4
Xi = punto medio del intervalo (suma el intervalo dividido 2)
Intervalo Fi Fa Xi XiFi
50-56 10 10 53 530
56-62 12 22 59 709
62-68 20 42 65 1300
68-74 30 72 71 2130
74-80 8 80 77 616
m=80 5284
m = 66,05
me = es el intervalo 62 - 68
El modo va a estar en la frecuencia más alta, que esta en el intervalo 68 - 74
Fractiles
Las
sición son los fractiles, es decir partir.
Valores que parten a la distribución en distintas partes.
Pueden ser:
● Cuartiles: 4
● Quintiles: 5
● Deciles: 10
● Percentiles: 100
Son medidas de posición, como la mediana (2).
El numero entre las partes me da el peso maximo y el peso minimo de las partes.
Q1 = peso maximo del 25% y minimo del otro 75%
Q3 deja un 75% abajo y un 25% arriba. Es decir que su valor es el peso máximo del 75%, y el mínimo del
25%.
Ya no se usa n/4 porque sería la primera cuarta parte. Se usa 3*n / 4.
68 + ((60-42) / 30 ) * 6 = 71,6 = Q3
Ecuación de decil:
Min= 50
Q1= 61
Me= 67,4
Q3= 71,6
Max= 80
En este caso es mas grande el bigote de la izq, lo que significa que la caja esta mas sobre la derecha.
Dónde está la caja significa donde está mas los datos.
Para verificar: con calculadora el min con Q1, el max con Q3.
2/5
Datos anómalos: demasiado lejos, se usa la mediana.
Normal: Si la serie es simétrica exacta.
Medidas de variabilidad:
X̅ = 66,05 (media)
S = √ 4015,8 / 80 = √50,19 = 7,08
S = desviación = 7,08
4015,8
TP:
Preguntas teóricas
Pero no definiciones, con conceptuales.
No hay que graficar pero hay preguntas.
Hay para hacer tablas.
Se calculan medidas.
Multiple choice casi todo (menos la tabla).
Es virtual. Abre a las 10 y cierra 11.30.
Es hasta medidas.
23/5
30/6
INTERVALO PARA UNA PROPORCIÓN POBLACIONAL
π parámetro poblacional
Punto 7 de la guia:
Muestra = m = 400
P = 250/400 = 0,625 = estimación puntual
1 = α = 0,98
P = 340/500 = 0,68
B) m?
i-
6/6
Tipos de prueba
PASO 1:
Ho: ϴ= ϴo
ϴ > ϴo
ϴ < ϴo
H1 : : ϴ ≠ ϴo BILATERAL
H1 : : ϴ ≥ ϴo UNILATERAL (cola derecha)
H1 : : ϴ ≤ ϴo UNILATERAL (cola izq)
PASO 2:
Riesgo de significación (probabilidad de cometer errores) : α
α = numero chiquito (menor al 10%) Lo más común es usar el 5%
Nivel de significacion, si no lo tengo lo invento entre 0 y 10.
PASO 3:
Calcular el valor observado del estimador de la prueba según la muestra.
ϴ obs (fórmula).
PASO 4:
Calcular el valor crítico del estimador de la prueba. Ese valor sale de una tabla.
Tita crítico: ϴcrit = nº
Puede haber dos: cuando es bilateral. Si es unilateral es uno solo.
PASO 5:
Decidir: acepto o rechazo la hipótesis nula (Ho).
de pruebas de hipótesis hacer hasta el 9 inclusive. Puede que en vez de Mu diga Pi
13/6
Prueba para comparar dos medias poblacionales (M1 y M2)
Muestra 1
n1: 24
X̅ 1: 45
g12: 200
Muestra 2:
n2: 36
X̅ 2: 55
g22: 276
α: 1%
α: 0,01%
Paso 1
Ho: M1 = M2
H1: M1 ≠ M2 bilateral
Paso 2
α: 0,01
Paso 3
Aplicar fórmula
= -2,5
Paso 4
Paso 5
Acepto Ho
- No hay diferencia significativa entre los promedios de ambos métodos.
- Los promedios no difieren, son iguales.
Mu es un parámetro desconocido de toda una población. es variable, varia en funcion de la muestra que uno
tome
X̅ es un estimador, permite estimar Mu. Valor que toma ese promedio, pero un grupo
Ejercicio 15 de la guía
Muestra 1 (día)
m1: 500
p1: 14/500 = 0,028
Muestra 2 (noche)
m2: 700
p1: 22/700 = 0,031
- α: 0,05
Paso 1
Observo que M1 es menor que M2 por eso planteo lo opuesto:
Ho: π1 > π2
H1: π1 < π2
Paso 2
α: 0,05
Paso 3
Fórmula = -0,3
Paso 4
Paso 5
Acepto Ho
Acepto que π1 > π2
No tiene que aplicar ningún programa