Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Cualitativas o categóricas
1. No ordinales : no hay orden entre las categorías (Sexo, Estado civil, Nacionalidad,…
2. Ordinales : hay una gradación entre las categorías. (Nivel educativo, Estado de salud,
Consumo de alcohol,… )
2. Cuantitativas o numéricas
1. Discretas : puede tomar un número nito de valores (nº no decimales ) . (Nº de delitos en
un n de semana, Nº denuncias por maltratos en un mes, Nº hijos,… )
2. Continuas : dentro de un intervalo todos los valores son posibles. (Nº decimales) (Altura,
Peso, Tasa de alcoholemia, Glucosa en sangre,…)
- ( = no incluye, [ = incluye .
HISTOGRAMA :
- Seleccionamos una celda para el valor min : =min (seleccionar todas las celdas de datos)
- Seleccionamos otra celda para el valor máximo : =max (seleccionar todas las celdas de
datos)
- Rango de entrada = seleccionar todas las celdas que contienen los datos
- Rango de clases = seleccionar todas las celdas que contienen los intervalos
- Rango de salida = pulsar celda donde queremos que nos ponga el resultado
1
fi
fi
fi
fi
- Solo nos muestra en la parte de abajo el dato del intervalo de la derecho (ej: si el intervalo es
4-5, nos pondrá un 5)
ESTADÍSTICA DESCRIPTIVA :
- Rango de entrada = seleccionar todas las. celdas que contienen los datos
- Rango de salida = pulsar celda donde queremos que nos ponga el resultado
- Si nos preguntan la distribución : uniforme (en todos los intervalos por igual) no uniforme (en
unos intervalos más que en otros)
DIAGRAMA DE BARRAS :
DISTRIBUCIÓN NORMAL :
- m : media
- S : desviación estándar
- Acumulado : 1
ENUNCIADOS :
- ¿Cuál es la distribución de los decisores a lo largo de esta escala de motivación? ¿Es uniforme?
Las posiciones intermedias, ¿son las más comunes?
- Realizar la descripción grá ca de los datos y calcular los estadísticos resumen de la muestra,
comentando los resultados.
- Obtener las representaciones grá cas y los estadísticos resumen que ayuden a decidir si
ACORN tiene razón.
- ¿Hay diferencias en las distribuciones de las puntuaciones de los dos grupos?
- Comparar las sentencias de los jueces.
- Comparar la distribución de homicidios en las diferentes regiones.
- Estudiar y representar estos datos.
- Estudiar estos datos. Utilizar grá cas y estadísticos.
2
fi
fi
fi
T2 :REGRESIONES
- Marcamos rótulos
Comentario :
- Coe ciente de correlación múltiple : relación directa entre x e y (cuanto mas cercano a 1
mayor relación)
- La Tercera tabla nos da la recta, que podemos calcular si llegamos a la conclusión de la que
las dos variables están relacionadas ( intercepción = y, el otro dato es x) -> recta = y + dato
x*x (Ej 2.1)
- El índice de la última tabla si es + muestra relación directamente proporcional, y si es -
relación inversamente proporcional
- Seleccionamos los azules y con el botón derecho del ratón seleccionamos agregar línea
de tendencia (Ej 2.1)
- Puntos agrupados en una franja con pendiente positiva = nos indica que al tomar x valores
mas altos la y tmb toma valores más altos = relación directa entre las variables.
- Puntos se agrupan en una franja de pendiente negativa hay una relación inversa (a + de una
variable, - de la otra).
- Si los puntos están dispersos los indica que no hay relación entre las variables.
- Podemos calcular el coe ciente de correlación de varias variables para ver cuál es la que más
in uye :
3
fl
fi
fi
fi
fi
fi
REGRESIÓN MÚLTIPLE : (Ej 2.3)
- En lugar de una variable x introducimos 2 (las dos columnas tienen que estar una al lado de la
otra) (en este quitamos la curva de regresión.
- El objetivo es explicar mejor la variable Y, así que hemos de comparar el modelo (la recta de
regresión) que tiene una variable X con el modelo que tiene 2 variables X, comparando en
concreto el coe ciente de determinación de ambos.
ENUNCIADOS :
- ¿Existe relación entre el índice de exposición y la mortalidad por cáncer? ¿La relación es
positiva? ¿Por qué? ¿Qué signi ca que la relación sea positiva? ¿Qué mortalidad tendría un
condado con un índice de exposición de 1,5?
- Determina la variable con mayor coe ciente de correlación con la variable Tasa (número de
delitos denunciados).
- Realiza una regresión simple para explicar la variable Tasa, a partir de la variable del apartado
anterior. ¿Cuál es el coe ciente de determinación asociado?
- Compara los coe cientes de correlación de los apartados b y d,. ¿A qué se debe el incremento
tan pequeño?
- Realiza una regresión múltiple para explicar la variable Tasa, a partir de las variables Desp0 y
Sur. Compara y comenta el coe ciente de correlación obtenido con los anteriores.
4
fi
fi
fi
fi
fi
fi
T3 : INFERENCIA EN UNA POBLACIÓN
- Consiste en a partir de los datos decir algo sobre toda la población. Si la muestra es muy
grande será mas able.
- Intervalo de con anza : dos valores entre los que esta la media de la población. Si estos dos
valores están muy cercanos nos darán una estimación que sirve, mejor predicción, si están
más alejados será más pobre.
µ= Media de la población
S=desviación típica de la muestra
N= tamaño de la muestra
X barra = media muestral de una población
SE = Error típico
S / RAÍZ ( N ) : error estándar
PREGUNTA EXAMEN :
Mu = µ = media de la población.
- Nos pueden pedir dar una aproximación de µ -> intervalo de con anza
- Preguntas relacionadas con la media (para X nos dan un valor concreto)
INTERVALO DE CONFIANZA :
- Rango de entrada = seleccionar todas las celdas que contienen los datos
- Rango de salida = pulsar celda donde queremos que nos ponga el resultado
- Marcar nivel de con anza (si no nos dicen nada lo dejamos al 95%)
2. Intervalo : media - nivel de con anza en una celda y en la otra media + nivel de con anza
- Mu^*0 es el nº que nos da el enunciado (ej: pasan 15h en el patio ? , mu^0 = 15)
4. P valor = DISTR.T (t ; cuenta -1; 1) si nos pide >/< o (t; cuenta - 1; 2) si nos pide =
- Si nos pregunta si un dato exacto está en el intervalo de con anza = xbarra-t*error/ raíz mu0;
xbarra-t*error/ raíz
5
fi
fi
fi
fi
fi
fi
fi
fi
fi
fi
SI NO TENEMOS ESOS DATOS (Ej 3.6)
Intervalo de con anza ( media + nivel de con anza ) ( media - nivel de con anza )
T = distr.t.inv ( probabilidad; n-1)
CONTRASTE DE HIPÓTESIS
- Puede ser :
- Bilateral : H0 : µ = 50 , H1 : µ ≠ 50
- Rango. De entrada = seleccionar todas las celdas que contienen los datos
- Rango de salida = pulsar celda donde queremos que nos ponga el resultado
- Marcar nivel de con anza (si no nos dicen nada lo dejamos al 95%)
4. P valor = DISTR.T (t ; cuenta -1; 1) si nos pide >/< o (t; cuenta - 1; 2) si nos pide =
6
fi
fi
fi
fi
fi
fl
fi
fi
fi
fi
fi
fi
fi
fi
fi
T4 : ANÁLISIS DE DOS MUESTRAS .
(< / > siempre va en H1)
SE = error típico
1. Identi car si las variables son independientes o emparejadas y establecer las hipótesis
2. Comprobamos el p valor (P(F<=f) una cola) (</> 0,05) (si es mayor NO rechazamos, si es
menor sí rechazamos )
Si no rechazamos= SON IGUALES -> prueba t para dos muestras suponiendo varianzas
iguales
- Calculamos SE ( =√ 1 ^2 + 2 ^2)
- Calculamos ts = ( 1− 2 ) / SE
- Calculamos p-valor =DISTR.T (t ; cuenta -1; 1) si nos pide >/< o (t; cuenta - 1; 2)si nos pide =
- EMPAREJADAS : esta relacionado / se presentan por parejas … (EJ 4.2, 4.4, 4.8)
- Intervalo de con anza ( ej 4.9 )
3. Intervalo de con anza ( media - nivel de con anza ) ( media + nivel de con anza )
7
fi
fi
fi
𝑆
𝑆
𝐸
𝐸
𝑥̅
fi
𝑥̅
𝑆
𝐸
fi
𝑛
𝑆
𝑛
𝐸
𝑥̅
fi
𝑥̅
𝑡
𝑆
𝐸
𝑥̅
𝑥̅
𝑡
𝑆
𝐸
fi
- Contraste de hipótesis :
8
fi
fi
fi
fi
fi
fi
fi
fi
fi
fi
fi
TEMA 5 : ANÁLISIS DE 2 O MÁS MUESTRAS
H0 : M1 = M2 = M3 = M4
EXCEL :
3. Calculamos SMax y SMin (Valor máx / Valor min), si es <2 sí que se cumplen las condiciones
de aplicabilidad
- Análisis de datos -> prueba t para dos muestras suponiendo variantes iguales
- Miramos el p valor (en este caos el de 2 colas porque ya hemos rechazado la igualdad)
9
TEMA 6 : ANÁLISIS DE DATOS CATEGÓRICOS
- Tenemos una información general (con la que calculamos unos “datos esperados” si fuera cierta
la información que me han dado ) y unos datos observados ( hay que comparar esperados con
observados) -> TEST X2
- H1 = No lo son
8. P valor = DISTR.CHI (valor estadístico chi; número de categorías -1) y lo comparamos con
0,05
- P = datos observados
- P ^ = datos esperados
1. A simple vista, según los datos del enunciado, ¿se cumple la direccionalidad?
2. Hacemos tabla y Calculamos estadístico chi y Pvalor (LO DIVIDIMOS ENTRE 2 PORQUE HAY
DIRECCIONALIDAD)
————
3. El test direccional solo se puede hacer con 2 categorías . Si tenemos más tenemos que juntar
las categorías.
——————
Proporción = p^
10
fi
fi
OBSERVADOS :
- Siempre tenemos que tener 2 variables , si hay más hay que juntarlos
Homicidios O1 O3 A1
Hurtos O2 O4 A2
ESPERADOS :
Consumen drogas No consumen
ESTADÍSTICO CHI :
Homicidios EC 1 = ( O1 - O1 )2 / O1 EC 3 = ( O3 - O3 )2 / O3
Hurtos EC = ( O2 - O2 )2 / O2 EC 4 = ( O4 - O4 )2 / O4
11