Está en la página 1de 8

TEÓRICO:

A) ESTIMACIÓN DE PARÁMETROS
La Estadística tiene dos funciones: a) describir un conjunto de datos b) probar
hipótesis y estimar parámetros, estas dos últimas corresponden a la Estadística
inferencial. Las muestras son tomadas para estimar parámetros y para probar
hipótesis de esos parámetros.
En el primer teórico habíamos definidos los conceptos de parámetro y
estadístico.
Parámetro: son las medidas estadísticas de la población, por ejemplo la Media
aritmética y el Desvío estándar de la población.
Estadísticos: Son las medidas que calculamos en la muestra, por ejemplo la
Media aritmética y el Desvío estándar de la muestra.
Los parámetros de la población se desconocen generalmente, siendo uno de los
primordiales principios de la estadística el estimarlos. El método o estadístico
empleado para ello se denomina estimador del parámetro poblacional.
Supongamos que extraemos una muestra de una población y calculamos la
media, si tomamos otra muestra, la media tendrá otro valor y así sucesivamente.
Lo mismo pasa con las varianzas de cada una de las muestras, son distintas en
cada muestra. Con las medias obtenidas, podemos construir una distribución de
frecuencias para los valores de las medias de cada muestra bien, a medida que
aumenta el número de muestras extraídas de tamaño n, esa distribución se
aproxima a una distribución teórica que denominaremos distribución muestral del
estadístico media. La media de la distribución muestral es igual a la media de la
población. Esta distribución muestral se distribuye normalmente (teorema
central del límite)
La variabilidad de las medias muestrales se puede medir por su desviación
estándar. Esta medida se conoce como el error estándar y tiende a disminuir
cuando aumenta el tamaño de la(s) muestra(s).

Si conocemos el desvío estándar de la población la fórmula es:

Si no conocemos el desvío estándar de la población:

Ejemplo: Consideremos que en una muestra de tamaño n = 20 se determinó que


la media muestral y la desviación estándar eran 162 y 11,5 respectivamente. El
error estándar estimado de la media surge de la ecuación: 11,5/4,47 = 2,57

En los teóricos presenciales habíamos planteado 4 distribuciones probabilísticas:


a) Distribución normal
b) Distribución binomial
c) Chi cuadrado
d) t de Student
Ya expliqué las tres primeras, ahora voy a desarrollar la t de Student.
Ya habíamos visto que la elección de una prueba estadística determinada,
adecuada para el caso estudiado depende de:
1-la naturaleza de las variables (cualitativas o cuantitativas discretas o continuas)
2-el nivel de medición de las variables
3-el número de casos de la muestra.
4-Si los datos se distribuyen normalmente o no.
Esta prueba estadística se usa en los niveles intervalar y racional. Se aplica
cuando queremos estimar la media aritmética de la población y para comparar
medias y se tienen muestras pequeñas (consideramos muestras chicas a las que
tienen menos de 30 casos. El estadístico t es como el puntaje z. Hay diferentes
distribuciones t según los grados de libertad (gl) se refiere al número de valores
que pueden variar libremente después que se han impuesto ciertas restricciones
a la serie de datos (en clase di el ejemplo con la ingesta de huevos en un grupo
¿Se acuerdan?
La distribución t es unimodal y simétrica con media igual a 0. Es semejante a la
curva normal pero más aplanada y más alargada. La forma precisa depende del
número de casos. En la curva normal zc=+-1,96 definen la zona de rechazo de
la Ho a un nivel de significación del 5% en una prueba de dos extremos. En
cambio en una distribución t con gl=3 el tc que define una idéntica zona de
rechazo sería tc=3,18. A medida que aumentan los grados de libertad las
diferencias entre la CN y la t de Student se hacen mínimas. Cuando los grados
de libertad son mayores a 30 la distribución t puede ser reemplazada por la
normal.

Aplicaciones de la t de Student
1-Prueba de hipótesis sobre el valor de una media paramétrica con muestras
pequeñas y se desconoce el Desvío estándar de la población.

2-Prueba de hipótesis sobre diferencias entre medias con muestras pequeñas.


Es una prueba para evaluar si dos grupos difieren entre sí de manera significativa
respecto a sus medias en una variable.
Ho= los grupos no difieren significativamente
Ha= los grupos difieren significativamente
Por ejemplo: dos escuelas contrastadas en los resultados de un examen.
La prueba t se basa en una distribución muestral de diferencias de medias. Los
grados de libertad son determinantes ya que nos indican que valor de t debemos
esperar dependiendo del tamaño de los grupos. En este caso los grados de
libertad son gl=n1+n2=
3-Estimación de parámetros para muestras menores a 30 casos.

Estimación puntual: es cuando asignamos al parámetro de la población un


valor concreto. Los mejores estimadores puntuales de la media poblacional es
la media de la distribución normal y de la desviación estándar de la población el
error estándar de la distribución muestral.

Ejemplo si los valores de una muestra son 5-8-10-9-6 y hallamos la media


aritmética:

Media aritmética=∑x/n 38/5=7,6


Sabemos que el mejor estimador de la media poblacional es la media de la
muestra, por lo tanto podemos decir que la media de la población es igual a 7,6

Por ejemplo, si se pretende estimar la talla media de un determinado grupo de


individuos, puede extraerse una muestra y ofrecer como estimación puntual la
talla media de los individuos de la muestra.

 La media de la población se puede estimar puntualmente mediante la


media de la muestra:

 La desviación típica de la población se puede estimar puntualmente


mediante la desviación típica de la muestra, aunque hay mejores
estimadores:

Estimación por intervalos:


como no se puede esperar que un estimador puntual suministre el valor exacto
del parámetro poblacional, se suele calcular una estimación por intervalo al
sumar y restar al estimador puntual una cantidad llamada margen de error.
Estimador puntual ± margen de error
La amplitud de un intervalo de confianza para la media poblacional depende de
tres factores:
- el nivel de confianza
- la desviación estándar poblacional
- el tamaño de muestra.
El intervalo de confianza está determinado por dos valores dentro de los cuales
afirmamos que está el verdadero parámetro con cierta probabilidad. Son unos
límites o margen de variabilidad que damos al valor estimado, para poder
afirmar, bajo un criterio de probabilidad, que el verdadero valor no estará por
fuera de esos límites.
En la estimación por intervalos se usan los siguientes conceptos:
• Variabilidad del parámetro: Si no se conoce, puede obtenerse una
aproximación en los datos o en un estudio piloto. También hay métodos para
calcular el tamaño de la muestra que prescinden de este aspecto. Habitualmente
se usa como medida de esta variabilidad la desviación típica poblacional y se
denota σ.
• Error de la estimación: Es una medida de su precisión que se corresponde
con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la
estimación de un parámetro, más estrecho deberá ser el intervalo de confianza
y, por tanto, menor el error, y más sujetos deberán incluirse en la muestra
estudiada.
•Nivel de confianza: Es la probabilidad de que el verdadero valor del parámetro
estimado en la población se sitúe en el intervalo de confianza obtenido. El nivel
de confianza se denota por (1-α), aunque habitualmente suele expresarse con
un porcentaje ((1-α)·100%). Es habitual tomar como nivel de confianza un 95%
o un 99%, que se corresponden con valores α de 0,05 y 0,01, respectivamente.
• Valor α: También llamado nivel de significación. Es la probabilidad de fallar en
nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de
confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del
95%, el valor α es (100-95)/100 = 0,05.
• Valor crítico: Se representa por Zα/2. Es el valor de la abscisa en una
determinada distribución que deja a su derecha un área igual a α/2, siendo 1-α
el nivel de confianza. Normalmente los valores críticos están tabulados o pueden
calcularse en función de la distribución de la población. Por ejemplo, para una
distribución normal, de media 0 y desviación típica 1, el valor crítico para α = 0,05
se calcularía del siguiente modo: se busca en la tabla de la distribución ese valor
(o el más aproximado), bajo la columna "Área"; se observa que se corresponde
con -0,64. Entonces Zα/2 = 0,64.
Intervalo de confianza para la media con varianza conocida
Utilizamos z con el desvío estándar de la población (error estándar)
Intervalo de confianza para la media con varianza desconocida y n>30
Utilizamos z con el desvío estándar de la muestra (error estándar)
Intervalo de confianza para la media con varianza desconocida y n<30
Partiendo de una población Normal, en estas condiciones la variable aleatoria
se distribuye como una t-Student con n-1 grados de libertad.
Ejercicios:
Se acuerdan cuando vimos Curva Normal y queríamos hallar el valor de la
variable X utilizábamos:

X= z.S+M

La siguiente fórmula es para hallar entre qué valores estará la media


poblacional cuando conocemos el desvío estándar de la población.

Se ha obtenido una muestra de 25 alumnos de una Facultad para estimar la


calificación media de los expedientes de los alumnos en la Facultad. Se sabe por
otros cursos que la desviación típica de las puntuaciones en dicha Facultad es
de 2.01 puntos. La media de la muestra fue de 4.9.
1. Estime entre que valores se encuentra la media poblacional con un intervalo
de confianza al 90 %.
La media poblacional estará con un nivel de probabilidad de 90% entre 4,24 y
5,56 puntos.
Intervalo de confianza para la media con σ desconocida.
Se ha obtenido una muestra de 15 vendedores de una Editorial para estimar el
valor medio de las ventas por trabajador en la Empresa. La media y el desvio
estándar de la muestra (en miles de euros) son 5 y 1,41, respectivamente.
1. Estime entre qué valores estará la media poblacional con un intervalo de
confianza para la venta media por trabajador en la Editorial al 90 %.
En este caso vamos a utilizar la t de Student porque es una muestra de menos
de 30 casos

Utilizamos la siguiente fórmula:


La media poblacional estará con un nivel de probabilidad de 90% entre 4,33 y
5,66 puntos
B) PRUEBA DE HIPÓTESIS
En el teórico presencial habíamos definido qué es una hipótesis, los pasos de la
prueba de hipótesis.
Ahora vamos a ver la prueba de la Media
En el teórico de Curva Normal vimos como podíamos transformar puntajes
originales, los que obtuve por ejemplo en una prueba a otro tipo de puntajes
llamados puntaje z estándar que están expresados en unidades de desvío
estándar.
Si las condiciones son:

a) La variable X tiene distribución normal y conocemos el desvío estándar


poblacional σ

Entonces el estadístico que se usa es el puntaje z:

b) Si las condiciones son (lo único que cambia es que no conocemos el desvío
poblacional), utilizamos el puntaje t

 La variable X es normal
 No conocemos el desvío estándar poblacional σ, así que lo estimamos
usando el desvío estándar muestral S

Usamos:
La distribución es t de student con n-1 grados de libertad.
En el caso a) realizamos el siguiente procedimiento
1-Establecemos la hipótesis de que la media de la muestra pertenece a la
población
2-Establecemos la hipótesis de nulidad. Ho= No hay diferencia entre la media de
la muestra y la media de la población, a un nivel de significación del 5%, dicho
de otro modo con un nivel de confianza del 95%
3-Establezco la hipótesis alternativa hay diferencias entre la media de la muestra
y la media de la población
4- Reducimos la diferencia entre la media poblacional y la media muestral a
puntajes z

5-Buscamos en la tabla de curva normal el valor de z teniendo en cuenta el


nivel de significación elegido 5%, me quedaría de cada lado de la curva el
2,5%. Entonces buscaría el área del 47,5% y el z que le corresponde es z=+/-
1,96.
6-Hallo el z empírico con los datos de la muestra

7-Comparo el z hallado en la tabla con el z calculado con la fórmula


Si el z hallado en la tabla es mayor que el z calculado no rechazamos la
hipótesis nula y decimos que las diferencia entre las medias no son signi-
ficativas.
Si el z hallado en la tabla es menor que el z calculado rechazamos la hipótesis
nula y decimos que la media de la muestra no pertenece a la población, con un
riesgo a equivocarnos del 1% (si trabajé con un nivel de aceptación del 99%

Podemos cometer dos errores:


El error tipo I, también llamado alfa (α), se comete al rechazar la hipótesis nula
(H0) siendo esta verdadera. Así, la probabilidad de cometer un error de tipo I
es α, que es el nivel de significación que hemos establecido para nuestra prueba
de hipótesis.
Si por ejemplo el α que habíamos establecido es de 0.05, esto indicaría que
estamos dispuestos a aceptar una probabilidad del 5% de equivocarnos al
rechazar la hipótesis nula.
El error tipo II o beta (β), se comete al aceptar la hipótesis nula (H0) siendo
esta falsa. Es decir, la probabilidad de cometer un error tipo II es beta (β), y
depende de la potencia de la prueba (1-β).
Para reducir el riesgo de cometer un error tipo II, podemos optar por asegurarnos
de que la prueba tiene suficiente potencia. Para ello, deberemos asegurarnos de
que el tamaño de la muestra es lo suficientemente grande como para detectar
una diferencia cuando ésta realmente exista.
Ejercicio:
La media de una muestra es 30 puntos y el desvio estándar de la población es
igual a 6 puntos. Vamos a usar la fórmula

30-32/6√100=3,33
Si trabajáramos con un nivel de significación del 1% (error máximo que estamos
dispuestos a cometer), vamos hallar el z teórico (el que surge de la tabla, voy a
buscar el área de 49,5%) z= 2,58
Comparo el z calculado 3,33 con el z de la tabla 2,58. Rechazamos la hipótesis
nula, aceptamos la alternativa y decimos que la media de la muestra no
pertenece a la población con un riesgo de equivocarnos del 1%

También podría gustarte