Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE CINTALAPA
ESTADISTICA
2°ï
DOCTOR:LUDWI RODRIGUEZ
INTEGRANTES
CINTALAPA CHIAPAS
CAMPANA DE GAUS (DISTRIBUCION NORMAL)
En estadística y probabilidad se llama distribución normal, distribución de
Gauss, distribución gaussiana o distribución de Laplace-Gauss, a una de
las distribuciones de probabilidad de variable continua que con más frecuencia
aparece en estadística y en la teoría de probabilidades.1
La gráfica de su función de densidad tiene una forma acampanada y es simétrica
respecto de un determinado parámetro estadístico. Esta curva se conoce
como campana de Gauss y es el gráfico de una función gaussiana.2
La importancia de esta distribución radica en que permite modelar numerosos
fenómenos naturales, sociales y psicológicos. 3Mientras que los mecanismos que
subyacen a gran parte de este tipo de fenómenos son desconocidos, por la
enorme cantidad de variables incontrolables que en ellos intervienen, el uso del
modelo normal puede justificarse asumiendo que cada observación se obtiene
como la suma de unas pocas causas independientes.
De hecho, la estadística descriptiva sólo permite describir un fenómeno, sin
explicación alguna. Para la explicación causal es preciso el diseño experimental,
de ahí que al uso de la estadística en psicología y sociología sea conocido
como método correlacional.
La distribución normal también es importante por su relación con la estimación
por mínimos cuadrados, uno de los métodos de estimación más simples y
antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el
modelo de la normal son:
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
INTERVALOS DE CONFIANZA PARA LA MEDIA DE LA POBLACION
En estadística, se llama intervalo de confianza a un par o varios pares de números
entre los cuales se estima que estará cierto valor desconocido con un determinado
nivel de confianza. Formalmente, estos números determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional.
El nivel de confianza representa el porcentaje de intervalos que tomados de 100
muestras independientes distintas contienen en realidad el valor desconocido. En
estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto
es, el número de intervalos sobre 100 que no contienen el valor1
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma
que un intervalo más amplio tendrá más probabilidad de acierto (mayor nivel de
confianza), mientras que para un intervalo más pequeño, que ofrece una
estimación más precisa, aumenta su probabilidad de error.
Para la construcción de un determinado intervalo de confianza es necesario
conocer la distribución teórica que sigue el parámetro a estimar, θ.2 Es habitual
que el parámetro presente una distribución normal. También pueden construirse
intervalos de confianza con la desigualdad de Chebyshev.
En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un
parámetro poblacional θ que sigue una determinada distribución de probabilidad,
es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es
la función de distribución de probabilidad de θ.
Intervalo de confianza de la media de una población[editar]
De una población de media y desviación típica se pueden
tomar muestras de elementos. Cada una de estas muestras tiene a su vez una
media. Se puede demostrar que la media de todas las medias muestrales coincide
con la media poblacional:3
Pero además, si el tamaño de las muestras es lo suficientemente grande, 4 o la
distribución poblacional es normal, la distribución de medias muestrales es,
prácticamente, una distribución normal (o gaussiana) con media μ y una
desviación típica dada por la siguiente expresión: . Esto se representa como
sigue: . Si estandarizamos, se sigue que:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del
cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo
hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje
deseado (véase el uso de las tablas en una distribución normal).
En esta distribución normal de medias se puede calcular el intervalo de confianza
donde se encontrará la media poblacional si solo se conoce una media muestral
(con una confianza determinada. Habitualmente se manejan valores de confianza
del 95 y del 99 por ciento. A este valor se le llamará (debido a que es el error que
se cometerá, un término opuesto).
Para ello se necesita calcular el punto —o, mejor dicho, su versión
estandarizada o valor crítico— junto con su "opuesto en la distribución" . Estos
puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente
imagen:
Ejemplo práctico[editar]
Una máquina llena tazas con helado, y se supone que está ajustada para verter la
cantidad de 250 g. Como la máquina no puede llenar cada taza con exactamente
250 g, el contenido que se añade a cada taza individual presenta cierta variación y
se le asigna una variable aleatoria X. Se asume que esta variación se ajusta a
una distribución normal de alrededor de la cantidad promedio deseada de 250 g,
con una desviación estándar de 2.5 g.
Para determinar si la máquina está adecuadamente calibrada, se toma una
muestra aleatoria de n = 25 tazas de helado para pesarlas. La medición resultante
es X1, ..., X25, una muestra aleatoria procedente de X.
Para μ, es suficiente con dar una estimación. El estimador adecuado es la media
muestral:
La muestra señala los pesos reales x1, ..., x25, con media:
Al tomar otra muestra de 25 tazas, es esperable, de igual manera, que la masa
presente valores como 250.4 o 251.1 gramos. Un valor medio muestral de
280 gramos en cambio, sería extremadamente excepcional si el contenido medio
de las tazas está en la práctica cerca de 250 gramos. Hay un intervalo en torno al
valor observado de 250.2 gramos de la media muestral, para el que si la media de
la población completa efectivamente toma un valor en este rango, los datos
observados no podrían ser considerados particularmente inusuales. Tal intervalo
se denomina intervalo de confianza para el parámetro μ. ¿Cómo se calcula tal
intervalo? Los extremos del intervalo deben calcularse a partir de la muestra para
que resulten funciones estadísticas de la muestra X1, ..., X25 y de este modo son
variables aleatorias a su vez.
En este caso, se determinarán los extremos considerando la media
muestral X que como proviene de una distribución normal está también
normalmente distribuida con la misma esperanza μ, pero con un error estándar de:
Por estandarización, se obtiene una variable aleatoria:
dependiente del parámetro μ que debe ser estimado, pero con una distribución
normal estándar independiente del parámetro μ. Por lo tanto, es posible hallar
números −z y z, independientes de μ, entre los cuales está Z con probabilidad
1 − α, una medida de cuán confiados queremos estar.
Tomamos 1 − α = 0.95, por ejemplo. Así, tenemos:
https://es.wikipedia.org/wiki/Intervalo_de_confianza
http://www.est.uc3m.es/esp/nueva_docencia/comp_col_leg/ing_tec_inf_gestion/
estadistica/Documentacion/Temario_sinpres/InferMuestrasGrandes/
Apuntes_InferGrandes.pdf