Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2
1º) Seleccionamos la pestaña de “Estadísticos” de la parte superior, pinchamos a “Resúmenes”
y luego “Test de normalidad”. Nos saldrá una pestaña y debemos buscar donde ponga
“Resumir por grupos”
Nos saldrán todas las variables con las que queramos trabajar. Pinchamos en las que nos
convengan y pulsamos aceptar.
3
(En el caso del ejercicio 5, separaremos por un lado hombres y por otro lado mujeres)
1ª) Pincharemos en la pestaña de la parte superior “Datos” luego seleccionamos “Conjunto
de datos activo” y finalmente “Filtrar el conjunto de datos activo”
2º) Se nos abrirá una pestaña. En esta aparecerá “Expresión de selección” que deberemos
poner Sexo==”H” (esto que ponemos debe ser ir igual que lo tenemos, mismas mayúsculas, minúsculas…)
3º) Se nos creará como una nueva hoja, que si pinchamos nos aparecerán las hojas creadas.
Para calcular los intervalos de confianza de las mujeres; Debemos volver a la hoja principal, ya
que esta seleccionada la hoja de hombres (como podemos ver en la imagen aportada).
La hipótesis nula ¿Son iguales? Si es cierto que son iguales , la probabilidad (p-value)
En el caso del ejc 5 rechazaría con un 95% (que es lo que nos dicen) que los hombres ganan lo
mismo que las mujeres.
La diferencia entre lo que ganan los hombres y lo que ganan las mujeres esta puesto en el
intervalo de confianza para el intervalo de las medias
Para saber cuánto ganan más los hombres que las mujeres, podríamos sacar la media de ese
intervalo.
4
CLASE PRÁCTICA 22/12/2022
Estadísticos Resúmenes Resúmenes numéricos
-Rango intercuartílico: la distancia que hay entre Q3 y
Q1(cuartil 75-cuartil 25). El intervalo de valores en los que esta
comprendido el 50% de mis datos.
Ejercicio 1 de la práctica 2:
1º) Exportamos los datos a R
2º) EstadísticosResúmenes Resúmenes numéricos Resumir por grupos y se nos abrirá
una pestaña con todas las variables cualitativas, en este caso solo tenemos 1 (sexo)
¿Quiénes ganan más interpretando dichos resultados?
Los hombres porque tiene una media mayor
¿Qué salario es más variable?
El de los hombres porque la desviación típica es mayor
El salario de los hombres varía un 35% de la media y el de las mujeres un 13%
¿Asimetría y curtosis?
Son números pequeños.
Las que salen negativas son relativamente aplastadas
La Kurtosis es un número que compara con el apuntamiento de la normal
Negativo Más aplastada que la normal
Positivo Más apuntada que la normal
5
Podemos observar que la distribución de los hombres esta más a la derecha (o que su media
esta más hacia la derecha) y más dispersa que la de las mujeres.
¡!
¿PODEMOS PENSAR QUE LOS HOMBRES Y LAS MUJERES GANAN LO MISMO?
6
4) Usaremos una distribución T para saber si las medias son iguales.
EstadisticosMediasTest T para muestras independientes
Podemos observar:
-El resultado del test es 4,6782 (la famosa T calculada)
Df: grados de libertad
-P-value: podemos decir que no aceptamos que las medias son iguales, no podemos aceptar
que los hombres estén ganando lo mismo que las mujeres. Debido a que es <5%
-El intervalo de confianza para la diferencia de las medias esta entre 126 y el 312. Lo que
significa que con una seguridad del 95% los hombres en el conjunto de la muestra ganan entre
126 y 312 más que las mujeres.
O de otra forma: yo con un nivel de significación del 5% no puedo rechazar que los hombres
ganan distinto que las mujeres.
NO ENTRA ¿Qué pasaría si el punto 1 y el punto 2 ambos salieran que no son normales?
Estadísticos Test no paramétricosTest Wilkons para dos muestras
7
EJERCICIO 3, PRÁCTICA 2
Si quiero elegir una muestra al azar, elegimos una tabla de número aleatorios.
Excel Funciones->Matemáticas->Aleatorio() Es una función sin argumentos
En esa casilla que pongamos la función cada vez nos generara un número aleatorio
Cogemos esos datos, y los pegamos como valores en una hoja nueva para que no se nos
muevan para importarlos a R
GráficasHistograma
Elegimos la uniforme
(vemos en la gráfica que tiene
una forma de una distribución
uniforme)
Elegimos normal
(vemos que se parece más
a una distribución normal)
8
EJERCICIO 2, PRÁCTICA 2
1º) Copiamos los datos en una hoja nueva en Excel para poder exportarlos a R
2º) Exportamos a R los datos
3º) Me pregunta por la normalidad de los datos Estadísticos->Resúmenes->Test de normalidad
W = 0.96557, p-value = 0.3171
Podemos decir que con una seguridad del 95% esa muestra de semillas es normal.
4º) Sacamos la media y las demás estadísticas Estadísticos->Resúmenes-> Resúmenes numéricos
mean sd se(mean) IQR cv skewness kurtosis
19.48818 3.567004 0.5945006 3.092651 0.1830342 -0.1380253 0.6390203
5º) ¿Puedo aceptar que la población de la que procede esta muestra tiene un peso medio
mayor de 20 gramos? Pues como me ha dado una media de 19,48 es difícil aceptarlo, pero
vamos a comprobarlo. Me esta preguntando por un test unilateral
1- La normalidad: que ya la hemos visto con el p-value
2- Igualdad de las varianzas: no me hace falta porque solo tengo una muestra
3- Si es una media de una población normal Distribución t
4- Calculamos el valor t X-u(20g)/error estándar >=20
19,48818-20/0,5945006= 0,860924
5- Estadísticos->Medias-> Test T para una muestra
data: PMG
t = -0.86092, df = 35, p-value = 0.8024
alternative hypothesis: true mean is greater than 20
95 percent confidence interval:
18.48373 Inf
sample estimates:
mean of x
19.48818
Como el P-value es mayor del 5% si que
puedo aceptar que la población procede de una muestra cuya media es mayor de 20
El intervalo de confianza es asimétrico.
9
Funciones:
Distrib: z,t,g.l Distr.T()
Cuantiles: P g l Inv.t()
Tabla dinámica Insertar en tabla (se abre una pestaña)
De la tabla dinámica copiar como valores
Boton derecho, configuración de campos de valor,
Ordenar, con el filtro
¿Ganan lo mismo o no ganan lo mismo?
¿Normales? Test de normalidad
-P<0,05 No
-P>0,05 SI sigma1 al cuadrado=sigma al cuadrado2? Puede se rque si o ono
Ejercicio 3
Tabla de números aleatorios
Ejc 2
data: PMG
t = -0.86092, df = 35, p-value = 0.8024
alternative hypothesis: true mean is greater than 20
95 percent confidence interval:
18.48373 Inf
sample estimates:
mean of x
19.48818
Podemos aceptar la hipótesis ya que el 19,48818 esta dentro del intervalo de confianza
Podemos escribir en la parte superior de R luego para calcularla, podemos darle a ejecutar
10