Está en la página 1de 7

CAMPUS CANCÚN

INGENIERÍA EN GESTIÓN EMPRESARIAL


ESTADÍSTICA INFERENCIAL I
“Distribuciones normal y t de Student”

Autor
19530569 JANET ORTA
Grado y grupo: GEG09007A
Horario: 9 a 10 hrs.

Cancún Q. Roo 28 de junio del 2021

1
Distribución normal.

El uso del término “normal” tiene un significado especial en estadística, que difiere
del que se utiliza en el lengua-je cotidiano. El concepto de una distribución normal
se describirá más adelante, aunque por ahora usaremos una distribución de
frecuencias, para ayudarnos a determinar si los datos tienen una distribución
aproximadamente normal. Una característica fundamental de una distribución
normal es que, cuando se grafica, el resultado tiene forma de “campana”; y al
inicio las frecuencias son bajas, luego se incrementan hasta un punto máximo y
luego disminuyen. Por ahora, consideraremos que una distribución de frecuencias
es aproximadamente normal al determinar si tiene las siguientes características:

1.Al inicio las frecuencias son bajas, después se incrementan hasta un punto
máximo y luego disminuyen.

2.La distribución debe ser aproximadamente simétrica, y las frecuencias tiene


nque distribuirse de manera uniforme a ambos lados de la frecuencia máxima.
(Las frecuencias de 1, 5, 50, 25, 20, 15, 10, 5, 3, 2, 1 no se distribuyen de forma
simétrica alrededor de la puntuación máxima de 50, ni satisfacen los requisitos de
simetría).

Las distribuciones de probabilidad continua pueden tomar varias formas, pero un


gran número de variables aleatorias observadas en la naturaleza poseen una
distribución de frecuencia que tiene más o menos la forma de montículo, o bien,
como diría un esta-dístico, es aproximadamente una distribución normal de
probabilidad. La fórmula que genera esta distribución se muestra a continuación.

Los símbolos e y p son constantes matemáticas dadas en forma aproximada por


2.7183 y 3.1416, respectivamente; m y s (s 0) son parámetros que representan la
media poblacional y desviación estándar, respectivamente.

2
La gráfica de una distribución normal de probabilidad con media m y desviación
estándar s se muestran en la figura 6.5. La media m localiza el centro de la
distribución, y la distribución es simétrica alrededor de su media m. Como el área
total bajo la distribución normal de probabilidad es igual a 1, la simetría implica que
el área a la derecha de m es .5 y el área a la izquierda de m es también .5. La
forma de la distribución está determinada por s, la desviación estándar de la
población. Como se puede ver en la figura 6.6, valores grandes de s reducen la
altura de la curva y aumentan la dispersión; valores pequeños de s aumentan la
altura de la curva y reducen la dispersión. La figura 6.6 muestra tres distribuciones
normales de probabilidad con diferentes medias y desviaciones estándar. Nótense
las diferencias en forma y ubicación.

La distribución normal (en ocasiones llamada distribución gaussiana) es la


distribución continua que se utiliza más comúnmente en estadística. La
distribución normal es de vital importancia en estadística por tres razones
principales:

3
•Muchas variables continuas comunes en el mundo de los negocios tienen
distribuciones que sea semejan estrechamente a la distribución normal.

•La distribución normal sirve para acercarse a diversas distribuciones de


probabilidad discreta, como la distribución binomial y la distribución de Poisson

.•La distribución normal proporciona la base para la estadística inferencial clásica


por su relación con el teorema de límite central.

La distribución normal se representa por la clásica forma de campana, ilustrada en


el panel A de la figura 6.1. En la distribución normal, uno puede calcular la
probabilidad de que varios valores ocurran dentro de ciertos rangos o intervalos.
Sin embargo, la probabilidad exacta de un valor particular dentro de una
distribución continua, como la distribución normal, es cero. Esta propiedad
distingue a las variables continuas, que son medidas, de las variables discretas,
las cuales son conta-das. Como ejemplo, el tiempo (en segundos) se mide y no se
cuenta. Por lo tanto, es factible determinar la probabilidad de que el tiempo de
descarga para una página principal en un navegador de la Web esté entre 7 y 10
segundos o que la probabilidad de que el tiempo de descarga esté entre 8 y
9segundos, o la probabilidad de que el tiempo de descarga esté entre 7.99 y 8.01
segundos. Sin embargo, la probabilidad de que el tiempo de descarga sea
exactamente de 8 segundos es cero.

La distribución normal tiene importantes propiedades teóricas:

•Tiene una apariencia de forma de campana (y, por ende, es simétrica).

•Sus medidas de tendencia central (media, mediana y moda) son todas idénticas.

•Su “50% central” es igual a 1.33 desviaciones estándar. Esto significa que el
rango inter cuartil está contenido dentro de un intervalo de dos tercios de una
desviación estándar por debajo de la media y de dos tercios de una desviación
estándar por encima de la media.

•Su variable aleatoria asociada tiene un rango infinito (−∞< X< ∞). En la práctica,
muchas variables tienen distribuciones que se asemejan a las propiedades

4
teóricas de la distribución normal. Los datos de la tabla 6.1 representan el espesor
(en pulgadas) de10,000 pulidores de cobre producidos por una gran empresa. La
variable continua de interés, el es-pesor, puede aproximarse a la distribución
normal. Las medidas del espesor de los 10,000 pulidores de cobre, se agrupan en
el intervalo de 0.0190 a 0.0192 pulgadas y se distribuyen simétricamente al-
rededor de ese agrupamiento formando un patrón con forma de campana. Como
se demuestra en la tabla 6.1, si este listado que no se traslapa (es mutuamente
excluyente) contiene todos los intervalos de clase posibles (es colectivamente
exhaustivo), las probabilidades sumarán 1. Tal distribución de probabilidad es una
distribución de frecuencia relativa, como se describe en el apartado 2.3 donde, a
excepción de dos clases abiertas al final, el punto medio de cada dos intervalos
representa los datos en ese intervalo.

Distribución t Student.

Al comenzar el siglo XX, un especialista en estadística de la Guinness Breweries


en Irlanda (vea la referencia 3) llamado William S. Gosset deseaba hacer
inferencias acerca de la media cuando la σ fuera desconocida. Como a los
empleados de Guinness no se les permitía publicar el trabajo de investigación bajo
sus propios nombres, Gosset adoptó el seudónimo de “Student”. La distribución
que desarrolló se conoce como la distribución t Student. Si la variable aleatoria
X se distribuye normalmente, entonces el siguiente estadístico tiene una
distribución t con n– 1 grados de libertad

Esta expresión tiene la misma forma que el estadístico Zen la ecuación (7.4) de la
página 211, con la excepción de que S se usa para estimar la σ desconocida. El
concepto de grados de libertad se explica más adelante en la página 245.

Propiedades de la distribución t

5
En apariencia, la distribución tes muy similar a la distribución normal
estandarizada. Ambas distribuciones tienen forma de campana. Sin embargo, la
distribución t tiene mayor área en los extremos y menos en el centro, a diferencia
de la distribución normal (vea la figura 8.4). Puesto que el valor de σ es
desconocido, y se emplea S para estimarlo, los valores t son más variables que
los valores Z

Los grados de libertad n– 1 están directamente relacionados con el tamaño de la


muestra n. A medida que el tamaño de la muestra y los grados de libertad se
incrementan, S se vuelve una mejor estimación de σ y la distribución t
gradualmente se acerca a la distribución normal estandarizada hasta que ambas
son virtualmente idénticas. Con una muestra de 120 o más, S estima σ con la
suficiente precisión como para que haya poca diferencia entre las distribuciones ty
Z. Por esta razón, la mayoría de los especialistas en estadística usan Z en lugar
de t cuando el tamaño de la muestra es mayor a 120.Como establecimos antes, la
distribución t supone que la variable aleatoria X se distribuye normalmente. En la
práctica, sin embargo, mientras el tamaño de la muestra sea lo suficientemente
grande y la población no sea muy sesgada, la distribución t servirá para estimar la
media poblacional cuando σ sea desconocida. Cuando se trabaje con una muestra
de tamaño muy pequeño y una distribución poblacional sesgada, la validez del
intervalo de confianza es una preocupación. Para evaluar la suposición de
normalidad, se evalúa la forma de los datos muestra usando un histograma, una
gráfica de tallo y hoja, un diagrama de caja y bigote o una gráfica de probabilidad
normal. Usted encontrará los valores críticos de t para los grados de libertad
adecuados en la tabla parala distribución t(vea la tabla E.3). Las columnas de la
6
tabla representan el área de la cola superior de la distribución t. Cada fila
representa el valor t determinado para cada grado de libertad específico. Por
ejemplo, con 99 grados de libertad, si se quiere un nivel de confianza del 95%, se
encuentra el valor t apropiado como se muestra en la tabla 8.1. El nivel de
confianza del 95% significa que el2.5% de los valores (un área de .025) se
encuentran en cada extremo de la distribución. Buscando en la columna para un
área de la cola superior y en la fila correspondiente a 99 grados de libertad, se
obtiene un valor crítico para t de 1.9842. Puesto que tes una distribución simétrica
con una media de0, si el valor de la cola superior es +1.9842, el valor para el área
de la cola inferior (.025 inferior) se-ría –1.9842. Un valor t de –1.9842 significa que
la probabilidad de que t sea menor a –1.9842, es de0.025, o 2.5%.

Bibliografía

Berenson M., Levine D., Krehbiel T. (2006). Estadística para administración. (4ª.
Ed.). PEARSON EDUCACIÓN, México. P. 177-243.

Mendenhall, W., Beaver, R. J., & Beaver, B. M. 2002. Introducción a la


Probabilidad y Estadística. CENGAGE Learning. México. P.223-224.

Triola, M. F. (2004). Estadística (9a. ed., 9a. reimp.). MEXICO: PEARSON


EDUCACION. P. 46.

También podría gustarte