Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1)
No todos los cangrejos van a tomar la misma cantidad de metal pesado.
A medida que aumenta el n, esto no afecta al parámetro. Al tener más datos solo se estima
mejor al mismo.
Si una variable tiene cierta variación o ruido, por sacar más datos esta variación no sube ni
baja.
A medida que aumenta el n, disminuye la amplitud en el intervalo de confianza (aumenta la
precisión y se hace más angosto). La amplitud del intervalo de confianza se hace menor a
medida que aumenta el n porque en la formula de intervalo de confianza se achica.
(Campana de gauss se hace mas chica)
Entonces lo que si es sensible al n es el error estandar, y no el desvio estándar ni la
varianza. Es decir, el error estándar va a ser el desvio estándar de un estimador (de x raya
por ejemplo).
Sigma/ raíz de n = Error estándar para la media
A medida que aumenta el n, las medias muestrales van a ser más parecidas entre si y más
parecidas a mu. La curva normal de la media se hace cada vez más empinada y menos
variable.
2)
Cuando se habla de intervalo de confianza, no se hace referencia a un valor de
probabilidad. No se habla de probabilidad, sino de confianza.
Esto aplica una vez que se calculó el intervalo de confianza.
La probabilidad se refiere a eventos antes de que ocurran. Ej.: antes de tirar un dato
Una vez que se hizo el experimento, se calcularon los datos y el intervalo de confianza,
entonces ya ahí se habal de confianza.
Previo a armar el intervalo, se puede decir que “al sacar una muestra y calcular la media y
se establezcan los límites, se va a tener una probabilidad del 95% de contener al
parámetro”. Pero una vez que se establece el parámetro de confianza, ahí se habla de
confianza.
3)
Ejemplares juveniles y adultos no puede ser porque se estarían mezclado poblaciones
distintas. Se está hablando de cangrejos adultos, y si se agregan juveniles, no se puede
hacer inferencia porque las conclusiones no van a ser ciertas.
4)
La población es donde se está haciendo la inferencia. La población va a tener las mismas
características de la muestra.
Al decir sobre quien se generalizan los resultados, se debe ser lo más preciso posible al
indicar cual es la población.
5)
El estimador va a tener un valor que depende de la muestra que se tome. El estimador va a
tomar valores como una variable aleatoria.
Si se saca repetidamente a un estimador, con distintas muestras, si se le saca el promedio
a esos estimadores, se va a llegar al parámetro. Es decir, la esperanza del estimador
coincide con el parámetro.
Los valores limites del intervalo de confianza tienen las mismas unidades que la variable.
11)
No hay una relación lineal entre la amplitud del intervalo y el numero de muestra. No se
debe aumentar el doble el tamaño muestral si se quiere disminuir a la mitad.
No es una relación lineal sino cuadrática.
Si se quiere disminuir la amplitud del intervalo de confianza a la mitad (se quiere reducir por
2), se tiene que aumentar el tamaño muestral por 4.
Si se quiere disminuir la amplitud del intervalo 4 veces, el tamaño muestral tiene que
aumentarse 16. (Se toma 16 veces el tamaño muestral que se tenia para disminuir la
amplitud 4 veces).
n2 veces se aumenta el tamaño muestral, para disminuirlo n veces la amplitud.
13)
En este ejercicio no se puede calcular porque no se cumple el supuesto (tienen que haber 5
éxitos o 5 fracasos), y solo hay 3 éxitos en este caso.
14)
Con una muestra de por lo menos n=30 y 5 éxitos o 5 fracasos, ya funciona bien la
aproximación normal.
Para un intervalo de proporción:
Muestra aleatoria
Al menos 5 éxitos o 5 fracasos en la muestra.
Tamaño de la muestra grande.
Si la variable es normal, no se requieren de muestras n>30 para que x raya sea normal.
En cambio, para la proporción si se necesita que n sea grande. (Para la aproximación de la
binomial a la normal)
A diferencia del intervalo de confianza, en donde el objetivo es tener una idea del
parámetro. En cambio, la prueba de hipótesis es una herramienta para ayudar en la toma de
decisiones, en un contexto de incertidumbre.
Pregunta que se busca responder: ¿Vitamina E es efectiva para engordar? - Mu > 100g/día
Es decir, al agrega vitamina E se espera que tengan una ganancia de peso diaria mayor a
100g/día.
100g/día es la media poblacional (mu). Es un promedio (es imposible que todos tengan el
mismo valor con el que engordan).
Para concluir que la vitamina E sea efectiva, el parámetro tiene que cambiar (los 100g/día
tienen que cambiar).
Tiene que haber un: Mu > 100g/día
La respuesta es sí o no.
La prueba de hipótesis es binaria: si/no (se da o no se da esto), es decir, el universo se
divide en dos posibilidades
Luego se llega a una conclusión (sirve o no), y esta decisión se está tomando con una
muestra. Por lo tanto, no va a haber certeza (no hay 100% de seguridad). Puede haber
errores.
Se van a utilizar probabilidades a los errores (probabilidades o chances de que haya error).
No se usa confianza, confianza solo en intervalos de confianza.
La prueba de hipótesis es una herramienta que permite decidir entre dos situaciones, en un
contexto de incertidumbre, basándonos en muestras y controlando la probabilidad de error.
Mu= 1,2mm (conocimiento que va más allá de un conjunto de datos o una muestra).
Hipótesis1: ¿El glifosato retrasa el desarrollo embrionario?
Hipótesis 2: ¿El glifosato afecta al desarrollo embrionario?
Para la Hipotésis1:
Para la Hipótesis 2:
H0: Mu=1,2mm (No afecta)
H1: Mu > 1,2mm y Mu< 1,22mm (Mu distinto a 1,2mm) (Afecta)
Si hay un cambio, es decir, el glifosato afecta, significa que el glifosato puede propiciar o
retrasar el crecimiento
En las hipótesis nulas siempre tiene que haber una igualdad, el igual siempre está en
a nula porque por definición de la hipótesis nula, todo sigue igual y no hay cambio en el
parámetro.
(Puede estar acompañado de un > o <, pero el signo igual siempre va a estar en la nula)
El procedimiento que se hace para decidir es: ¿nos quedamos con la hipótesis nula o la
rechazamos?
Se hace el muestreo y se contrasta la evidencia muestral (lo que pasó en el experimento o
muestreo), con la hipótesis nula.
Si los datos no concuerdan (lo que pasa en el experimento), es muy distinto (o
contradictorio) de lo que dice H0.
Es decir, si el resultado no concuerda, en términos probabilísticos con la hipótesis nula (H0),
se rechaza y entonces me quedo con H1.
n=20
Con esta información hay definir si se rechaza o no, H0.
(Valores sacados con medidas resumen).
X raya y S (son de la muestra).
La x raya da 1,08mm que es menora 1,2mm, sin embargo, no se puede confirmar nada
todavía porque las muestras son variables y puede dar otra cosa si se repitiera el
experimento o muestreo.
Otra manera:
Estadísticas/ inferencia basada en una muestra / prueba de t para una media/ se elige la
variable en cuestión.
Y luego se elige el tipo de prueba: en este caso, es unilateral izquierda (es así cuando la
alternativa dice menor).
Se saca intervalo de confianza.
Y parámetro, se pone el valor de referencia (1,2).
Y se obtienen los siguientes resultados:
Valor p= 0.039
Si H0 fuera verdadera, hay un mu = 100 ( en rojo). Para H1 (mu> 100) en rojo.
Hay que calcular el área a la derecha en este caso. La prueba es unilateral derecha. Lo
que va a favor de H1
La probabilidad es menor al alfa (menor al 5%), entonces es bastante chica.
Conclusión:
Como el valor p (0.039) < alfa (0.05), se rechaza H0. Por lo tanto se acepta H1.
Y si acepto H1, la conclusión es que la vitamina E engorda, y por lo tanto se recomienda.
Sin embargo, no se está totalmente seguro de que la vitamina E engorda y que la muestra
salió de la curva azul. La evidencia es a favor de esto, pero por azar se pudo haber obtenido
una muestra rara que salió de la roja y se la atribuyó a la azul.
¿Con qué probabilidad pudo haber salido una muestra rara de la curva roja? Con una
probabilidad de 5%.
El nivel de significación es el error que se está dispuesto a admitir. Se contempla
hasta un 5% de posibilidad de que la muestra salga de la roja, y que por error se la
atribuya a la azul.
Va a haber una probabilidad, como máximo del 5%, de falsos positivos. Es decir, a
decir que la vitamina E ayuda, cuando en realidad no lo hace.
El error: 5% de recomendar la vitamina E, cuando en realidad no es efectiva.
El error de rechazar H0 erróneamente, se llama error tipo 1. Y se lo controla, es decir, se
fija de antemano.