Está en la página 1de 36

1

INSTITUTO TECNOLÓGICO SUPERIOR DE COATZACOALCOS

CARRERA: INGENIERÍA INDUSTRIAL

Ciclo Escolar: Agosto – Diciembre 2023

Asignatura: Estadística Inferencial 1

Unidad 1: Distribuciones Fundamentales Para El Muestreo

Alumno: Janely Divanhi Lima Montiel

No. De Control: 22080883 Semestre: 3 Grupo: C

Nombre Del Docente: Ing. Jimenes Ventura Bricio

Fecha: 02 de Octubre 2023


TABLA DE CONTENIDO
2
Introducción............................................................................................................3

1.1 Introducción a la estadística inferencial....................................................4

Inferencia Paramétrica e Inferencia No Paramétrica.....................................4

Inferencia paramétrica.....................................................................................4

Principales procedimientos inferenciales......................................................5

1.2 Muestreo: Introducción al muestreo y tipos de muestreo........................6

Tipos de Muestreo............................................................................................6

1.3 Teorema del límite central.........................................................................10

1.4 Distribuciones fundamentales para el muestreo.....................................12

1.4.1 Distribución muestral de la de media....................................................15

1.4.2 Distribución muestral de la diferencia de medias................................17

1.4.3 Distribución muestral de la proporción................................................20

1.4.4 Distribución muestral de la diferencia de proporciones.....................22

1.4.5 Distribución t-student.............................................................................24

1.4.6 Distribución muestral de la varianza.....................................................28

1.4.7 Distribución muestral de la relación de varianzas...............................30

Glosario de términos........................................................................................... 33

Bibliografías..........................................................................................................34
3
INTRODUCCIÓN
“El muestreo además de ser una ciencia estadística es un arte”

El muestreo en la estadística inferencial es un proceso o conjunto de


métodos que se utilizan para obtener una muestra finita de una población finita o
infinita con el fin de estimar valores de parámetros o corroborar hipótesis sobre la
forma de una distribución de probabilidades o sobre el valor de un parámetro de
una o más poblaciones.

El uso de estos métodos de muestreo, como su propio nombre indica, nos


ayuda a obtener información fiable de la población a partir de una muestra de la
que extraer inferencias estadísticas con un margen de error medido en términos
de probabilidades.

La estadística inferencial se preocupa de producir y sacar conclusiones


para una población, tomando hola cómo va hace una muestra es decir una parte o
trozo de dicha población. Hoy teniendo en cuenta que cualquier predicción
siempre ha de hacerse bajo un cierto grado de fiabilidad o confianza. Como es de
notar existe una relación entre la estadística inferencial y el muestreo, la cual
entenderemos más adelante

A lo largo de esta investigación podremos conocer más acerca del


muestreo, sus tipos y sus distribuciones. Esto con el fin de alcanzar el aprendizaje
esperado de la unidad y a fomentar la investigación como método de aprendizaje
en los alumnos.

También al final de esta investigación podemos encontrar la conclusión


obtenida durante la investigación, al igual que un glosario de términos.
4
1.1 INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL .

La Estadística Inferencial es la parte de la Estadística que se encarga de


estudiar procedimientos para la obtención de conclusiones, referentes al total de la
población, a partir de la información proporcionada por la muestra o muestras
seleccionadas.

Es de gran utilidad en todos aquellos estudios de investigación llevados a


cabo en poblaciones demasiado grandes como para poder realizar mediciones en
todos y cada uno de los individuos de dichas poblaciones.

INFERENCIA PARAMÉTRICA E INFERENCIA NO PARAMÉTRICA


Supongamos que estamos estudiando una variable X en una población
suficientemente grande.

Para poder llevar a cabo el proceso de Inferencia Estadística es habitual


representar a dicha variable como una variable aleatoria X sobre un espacio de
probabilidad (modelización del problema).

La distribución de probabilidad de esta variable aleatoria X se supone


desconocida, en todo o en parte.

 Si suponemos que la distribución de probabilidad de X es conocida


en su totalidad salvo por uno o varios parámetros, diremos que estamos
ante un problema de Inferencia Paramétrica.
 Si suponemos que la distribución de probabilidad es totalmente
desconocida, diremos que estamos ante un problema de Inferencia No
Paramétrica.

La Inferencia No Paramétrica es más complicada, y no será objeto de


estudio en esta asignatura.

INFERENCIA PARAMÉTRICA

 Sea X variable cuantitativa en una población cuya distribución de


probabilidad es conocida salvo por un parámetro θ.
 θ parámetro desconocido asociado a la distribución de probabilidad
5
2
de X (por ejemplo, la media poblacional, µ, la varianza poblacional, σ , la
proporción asociada a una distribución binomial, p etc.)
 Sean x 1, . . . , x n las mediciones de la variable X sobre una muestra de
la población tomadas de forma independiente y bajo las mismas
condiciones. A este conjunto de mediciones se le llama Muestra Aleatoria
Simple de la variable X.
 La Inferencia Paramétrica consiste en obtener información sobre el
parámetro θ a partir de la Muestra Aleatoria Simple de X.

PRINCIPALES PROCEDIMIENTOS INFERENCIALES

En términos generales, hay dos grandes tipos de procedimientos


inferenciales:

 Los procedimientos de estimación

Su finalidad es proporcionarnos las herramientas necesarias para


poder determinar buenas aproximaciones (a los que llamaremos
estimaciones) a aquellos valores desconocidos en la población (a los que
técnicamente se les denomina parámetros) y que estamos interesados en
conocer.

 Los procedimientos de contraste de hipótesis

Su finalidad es proporcionarnos los mecanismos necesarios para


poder decidir, con cierta probabilidad de error, sobre la veracidad o no de
determinada afirmación realizada en la población bajo estudio.

Teniendo en cuenta que las técnicas estadísticas a utilizar con cada uno de
ellos serán diferentes, es importante saber distinguir claramente cuando estamos
ante un problema de estimación y cuando estamos ante un problema de contraste
de hipótesis.
6
1.2 MUESTREO: INTRODUCCIÓN AL MUESTREO Y TIPOS DE MUESTREO .

Se denomina muestreo al proceso por el que generamos las muestras. Una


muestra es una parte (un subconjunto) de la población, y se desea que la muestra
sea lo más representativa posible de la población de la que procede. Sin embargo,
por muy cuidadosa que sea la selección de la muestra difícilmente será una
representación exacta de la población. Un concepto clave de muestreo es el de
representatividad: Los procedimientos de muestreo tienen por objeto generar
muestras lo más representativas posible de las poblaciones dados los
objetivos de la investigación y las circunstancias que afectan al muestreo.

Desde un punto de vista aplicado, se denomina muestreo el proceso de


selección de la muestra o muestras a utilizar para la investigación. Esto supone
generar una o pocas muestras.

Desde un punto de vista teórico, el concepto de muestreo es fundamental


para la Inferencia Estadística. El hecho de que las muestras no sean exactamente
representativas de las poblaciones significa que las inferencias presentan cierto
margen de incertidumbre.

Las muestras singulares generadas para investigación con sujetos suelen


utilizarse para obtener algunos estadísticos (Media, proporción, cuasivarianza,
etc.) con los que se realiza el proceso de inferencia. En cambio, las muestras
simuladas por ordenador suelen ser utilizadas para obtener distribuciones
muestrales y realizar inferencia. Esto es de interés cuando se dan circunstancias
especiales que no aconsejan utilizar los procedimientos habituales. Las
distribuciones muestrales son las distribuciones de estadísticos de muestras
que pertenecen a la misma población. Por ejemplo, la distribución muestral de la
Media es la distribución de las Medias de muestras de un mismo tamaño extraídas
de la misma población.

TIPOS DE MUESTREO
1. PROBABILISTICO:
Es requisito que todos y c/u de los elementos de la población tengan la
7
misma probabilidad de ser seleccionados (azar)

Se debe tener disponible un listado completo de todos los elementos de la


población, a esto se le llama MARCO DE MUESTREO.

a) ALEATORIO SIMPLE (Muestreo Simple al Azar)


Cada sujeto tiene una probabilidad igual de ser seleccionado
para el estudio.
Se necesita una lista numerada de las unidades de la
población que se quiere muestrear.
Opciones:
 Fichas de lotería o bolitas numeradas
 Tabla de números aleatorios

Pasos :

 Determinar el tamaño de la muestra


 Numerar los individuos de 1 a n
 Tirar unidades al azar (probabilidad igual)

Ejemplo :

Cobertura de la vacuna anti- sarampión entre 1200 niños de


una escuela X :

 Muestra = 60
 Hacer una lista de todos los niños
 Numerarlos de 1 a 1200
 Selección aleatoria de 60 números
b) MUESTREO ESTRATIFICADO.

Cuando la muestra incluye subgrupos representativos


(estratos) de los elementos de estudio con características
específicas: urbano, rural, nivel de instrucción, año académico,
8
carrera, sexo, grupo étnico, edad, paridad etc.

En cada estrato para obtener el tamaño de la muestra se


puede utilizar el muestreo aleatorio o sistemático.

Ejemplo:

Estudiantes de la Carrera de Medicina 2005

I año =20% II año=18%

III año =15% IV año=30%

c) MUESTREO ALEATORIO SISTEMÁTICO.


Se toman todos los individuos de la lista y se selecciona c/3,
c/7, o cualquier otro número.
Para comenzar se utiliza un número al azar.
Ejemplo :
 Población (N) : 12,000
 Muestra requerida (n) : 600
 Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20
 Escoger el 1er número al azar [1 - 20]
 Añadir k para escoger la siguiente unidad y así sucesivamente
hasta completar n.
D) MUESTREO POR RACIMOS (CLUSTER O CONGLOMERADO)
Conglomerados: son unidades geográficas (distritos, pueblos,
organizaciones, clínicas)

Unidad de análisis: sujeto o sujetos

Unidad Muestral en este caso: conglomerado a través del cual


se logra el acceso a la unidad de análisis.

Selección en 2 etapas:
 Los racimos o conglomerados
9
 En los racimos se seleccionan a los sujetos a ser medidos.

2. NO PROBABILISTICO:
a) MUESTREO POR CONVENIENCIA
Es la muestra que está disponible en el tiempo o periodo de
investigación.
Ejemplo: Todos los pacientes que asistan a una clínica en
particular cierto día, semana, pueden ser requeridos para
participar.
DESVENTAJA: la muestra puede ser poco representativa de
la población que se desea estudiar.
b) MUESTREO POR CUOTAS
Todos los elementos conocidos de la población tienen que
aparecer en la muestra.
Se debe asegurar que estos aparezcan en la misma
proporción que en la población.
El investigador entrevista a todas las personas de cada
categoría que pueda encontrar hasta que haya llenado la cuota.
c) ACCIDENTAL O BOLA DE NIEVE
Se aprovecha o utiliza personas disponibles en un momento
dado que se corresponda con el propósito del estudio.
De los tres tipos de muestreo no probabilístico resulta el más
deficiente.
10
1.3 TEOREMA DEL LÍMITE CENTRAL .

El teorema del límite central nos dice que la estimación puntual de la


media muestral, x , proviene de una distribución normal de x 's. Esta
distribución teórica se denomina distribución muestral de x 's. Ahora investigamos
la distribución de muestreo para otro parámetro importante que deseamos estimar;
p de la función de densidad de probabilidad binomial.

El teorema central del límite es un resultado matemático que garantiza que,


si sumamos variables cualesquiera (no necesariamente normales), la variable
suma también seguirá una distribución normal (esto siempre que se cumplan
algunas condiciones básicas).

Así, cuando un dato o resultado es la suma de contribuciones


independientes, de igual magnitud y “con un tamaño típico”, este resultado
corresponderá a una distribución Gaussiana siempre que el número de
contribuciones (el número de sumandos) sea un número considerable (no
pequeño).

Con un tamaño típico se quiere garantizar que las contribuciones tienen que
“estar controladas”, esto es, las contribuciones extremas tienen que estar
controladas por una probabilidad muy pequeña (En jerga matemática las
contribuciones deben tener varianza finita).

Este teorema asegura, de manera esquemática, que, cuando sumamos un


número grande de variables, la variable resultante sigue una distribución normal.

De manera general, si X 1 , X 2 , … , X n son variables de media o esperanza


2
μ I =E( X i) y varianza σ i =Var ( X i ), i=1 , … , n, se verifica que la variable suma
Y = X 1 + X 2 +…+ X n (si n es un número tendiendo a infinito) se puede aproximar por
una variable normal, de media la suma de las medias y varianza la suma de
varianzas (desviación típica = raíz de la suma de varianzas), es decir:
11

Este teorema (del que damos únicamente una idea general, sin establecer
las hipótesis matemáticas reales) establece la importancia de la distribución
normal. Su resultado es que, cuando se suma un número grande de variables
aleatorias, la variable resultante es una variable con distribución aproximadamente
igual a la distribución normal. Incluso, el término número grande (porque
matemáticamente el teorema se establece cuando n tiende a infinito) no lo es
tanto, porque, en la práctica, con tener que n sea un número mayor o igual a 30,
la aproximación ya proporciona buenos resultados.

Además, el teorema es cierto independientemente de la distribución que


sigan las variables que se sumen (no importa si son exponenciales, binomiales,
etc.). Lo único que se necesita es saber su media y su varianza.
12
1.4 DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO .

Las muestras aleatorias obtenidas de una población son, por


naturaleza propia, impredecibles. No se esperaría que dos muestras
aleatorias del mismo tamaño y tomadas de la misma población tenga la
misma media muestral o que sean completamente parecidas; puede
esperarse que cualquier estadístico, como la media muestral, calculado a partir
de las medias en una muestra aleatoria, cambie su valor de una muestra a otra,
por ello, se quiere estudiar la distribución de todos los valores posibles de un
estadístico. Tales distribuciones serán muy importantes en el estudio de la
estadística inferencial, porque las inferencias sobre las poblaciones se harán
usando estadísticas muestrales.

Como el análisis de las distribuciones asociadas con los estadísticos


muestrales, podremos juzgar la confiabilidad de un estadístico muestral como
un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.

Como los valores de un estadístico, tal como x, varían de una muestra


aleatoria a otra, se le puede considerar como una variable aleatoria con su
correspondiente distribución de frecuencias.

La distribución de frecuencia de un estadístico muestral se denomina


distribución muestral. En general, la distribución muestral de un estadístico
es la de todos sus valores posibles calculados a partir de muestras del mismo
tamaño. Suponga que se han seleccionado muestras aleatorias de
tamaño 20 en una población grande. Se calcula la madia muestral x para cada
muestra; la colección de todas estas medias muestrales recibe el nombre de
distribución muestral de medias, lo que se puede ilustrar en la siguiente figura:
Suponga que se eligen muestras aleatorias de tamaño 20, de una población
13
grande, y se calcula la desviación estándar de cada una. La colección de
todas estas desviaciones estándar muestrales se llama distribución muestral
de la desviación estándar, y lo podemos ver en la siguiente figura:

Ejemplo: Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la


población de valores 0, 2, 4 y 6. Encuentre: , la media poblacional. , la
desviación estándar poblacional. x, la media de la distribución muestral de
medias. x, la desviación estándar de la distribución muestral de medias. Además,
grafique las frecuencias para la población y para la distribución muestral de
medias. Solución: a) La media poblacional b) La desviación

estándar de la población

La media de la distribución muestral de medias es:

La desviación estándar de la distribución muestral de medias es:


De aquí que podamos deducir que: Como para cualquier variable aleatoria,
14
la distribución muestral de medias tiene una media o valor esperado, una
varianza y una desviación estándar, se puede demostrar que la distribución
muestral de medias tiene una media igual a la media poblacional. Esto es:

Después de haber realizado el ejercicio anterior se puede ver que una


distribución muestral se genera extrayendo todas las posibles muestras del mismo
tamaño de la población y calculándoles a éstas su estadístico.

Si la población de la que se extraen las muestras es normal, la distribución


muestral de medias será normal sin importar el tamaño de la muestra.

Si la población de donde se extraen las muestras no es normal, entonces el


tamaño de la muestra debe ser mayor o igual a 30, para que la distribución
muestral tenga una forma acampanada. Mientras mayor sea el tamaño de la
muestra, más cerca estará la distribución muestral de ser normal.

Para muchos propósitos, la aproximación normal se considera buena si


se cumple n=30. La forma de la distribución muestral de medias sea
aproximadamente normal, aún en casos donde la población original es bimodal, es
realmente notable.
1.4.1 DISTRIBUCIÓN MUESTRAL DE LA DE MEDIA .
15
La distribución muestral de la media (o distribución muestral de
medias) es la distribución que resulta de calcular la media muestral de cada
muestra posible de una población. Es decir, el conjunto de medias
muestrales de todas las muestras posibles de una población forma la
distribución muestral de la media.

Dicho con otras palabras, si estudiamos todas las muestras que se pueden
extraer de una población y calculamos la media de cada una de las
muestras, el conjunto de valores calculados forma una distribución muestral
de la media muestral.

En estadística, la distribución muestral de la media sirve para calcular


la probabilidad que se tiene de acercarse al valor de la media de la población
al analizar una sola muestra.

Dada una población que sigue una


distribución de probabilidad normal de media μ y
desviación estándar σ y se extraen de ella muestras
de tamaño n, la distribución muestral de la media
también estará definida por una distribución normal
con las siguientes características:

Donde μ xes la media de la distribución muestral de la media y σ x es


σ
su desviación típica. Asimismo, es el error estándar de la distribución
√n
muestral.

Por lo tanto, como la distribución muestral de la media


sigue una distribución normal, la fórmula para calcular
cualquier probabilidad relacionada con la media de una
muestra es la siguiente:

 x es la media de la muestra.
 μ la media de la población.
16
 s la desviación típica de la población
 n el tamaño de la muestra.
 Z una variable definida por la distribución normal estándar N(0,1).

Ejemplo resuelto

El peso de los estudiantes de una universidad sigue una distribución normal


de media 68 kg y desviación estándar 9 kg. Determina:

1. ¿Cuál es la probabilidad de que la media de una muestra aleatoria


de 25 alumnos esté por debajo de 66 kg?
2. Si se extraen 300 muestras con un tamaño de 25 alumnos cada una,
¿cuántas medias muestrales tendrán un valor por debajo de 66 kg?

En primer lugar, tenemos que calcular el valor del estadístico


correspondiente, para ello, aplicamos la fórmula que hemos visto más arriba:

De modo que la probabilidad que estamos buscando es la correspondiente


al valor Z=-1,11 de la cola izquierda de la distribución normal estándar, que se
puede obtener fácilmente de la tabla de probabilidades de Z. Así pues, usamos la

tabla de Z para determinar la probabilidad que nos pide el problema:

Ahora que ya sabemos la probabilidad de que la media de una muestra


aleatoria esté por debajo de 66 kg, para saber el número de medias muestrales
que están por debajo de 66 kg al sacar 300 muestras iguales tenemos que
multiplicar la probabilidad calculada por el número total de muestras tomadas:
Por lo que aproximadamente 40 de las muestras extraídas tendrán una
17
media por debajo de 66 kg.
1.4.2 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE MEDIAS .
18
La distribución muestral de la diferencia de medias es la distribución
que resulta de calcular las diferencias entre las medias de todas las muestras
posibles de dos poblaciones diferentes.

Es decir, para obtener la distribución muestral de la diferencia de


medias se deben seleccionar todas las muestras posibles de dos poblaciones
de estudio, luego se calcula la media de cada muestra seleccionada y, por
último, se calcula la diferencia entre todas las medias calculadas de las dos
poblaciones. Así pues, el conjunto de valores obtenidos después de aplicar

todas estas operaciones, forman la distribución muestral de la diferencia de


medias.

La distribución muestral de la diferencia de medias sirve para calcular


la probabilidad de que la diferencia entre dos medias de las muestras
seleccionadas al azar de dos poblaciones distintas se acerque a la diferencia
de las medias de las poblaciones.

Si el tamaño muestral es suficientemente grande (n1≥30 y n2≥30), la


distribución muestral de la diferencia de medias sigue una distribución
normal. En concreto, los parámetros de dicha distribución se
calculan de la siguiente manera:
Por lo tanto, como la distribución muestral de la diferencia de medias
19
está definida por una distribución normal, la fórmula para calcular el
estadístico de la distribución muestral de la diferencia de medias es la
siguiente:

Donde:

 x i es la media de la

muestra i.
 μi la media de la

población i.
 σ ila desviación estándar de la población i.

 ni el tamaño de la muestra i.

 Z una variable definida por la distribución normal estándar N(0,1).

Ejemplo

En un estudio estadístico se quiere analizar la diferencia entre la


estatura de los chicos y las chicas de una determinada edad. Se sabe que la
distribución que define la población de los chicos de esa edad tiene una
media de 157 cm y una desviación estándar de 9 cm y, por otro lado, la
distribución que define la población de las chicas de esa edad tiene una
media de 148 cm y una desviación estándar de 7 cm. Si se selecciona una
muestra de 30 chicos de esa edad y una muestra de 35 chicas de esa edad
¿cuál es la probabilidad de que la estatura media de la muestra de chichos
sea 12 cm más grande que la estatura media de la muestra de chicas?

Para resolver este problema, lo primero que debemos hacer es


calcular el estadístico de la distribución muestral de la diferencia de medias.
Por lo que aplicamos la fórmula vista más arriba:
20
1.4.3 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN .
21
La distribución muestral de la proporción (o distribución muestral de
proporciones) es la distribución que resulta de calcular la proporción de cada
muestra posible de una población. Es decir, las proporciones muestrales de
todas las muestras posibles de una población forman la distribución muestral
de la proporción.

Dicho de otra forma, la distribución muestral de la proporción se


obtiene de estudiar todas las muestras que se pueden seleccionar de una
población y sacar la proporción muestral de cada muestra. De manera que el
conjunto de proporciones muestrales calculadas conforman la distribución
muestral de la proporción.

Por si te preguntas para qué sirve la distribución muestral de la


proporción, en estadística se utiliza para calcular la probabilidad que se tiene
de acercarse al valor de la proporción poblacional al analizar una sola
muestra.

Según el teorema central del límite, para tamaños grandes (n>30)


podemos aproximar una distribución binomial a
una distribución normal. Por lo tanto, la
distribución muestral de la proporción se
aproxima a una distribución normal con los
siguientes parámetros:

Donde pes la probabilidad de éxito y q es la probabilidad de fracaso q=1-p.

Por lo tanto, como se puede aproximar la distribución


muestral de la proporción a una distribución normal, la
fórmula para calcular cualquier probabilidad relacionada
con la proporción de una muestra es la siguiente:

Donde:

 ^
P es la proporción de la muestra.
 P es la proporción de la población.
22
 Q es la probabilidad de fracaso de la población, q=1-p.
 N es el tamaño de la muestra.
 Z es una variable definida por la distribución normal estándar N(0,1).

Ejemplo resuelto

Una empresa industrial compra lotes de piezas a una fábrica que


afirma producir las piezas con tan solo un 3% de piezas defectuosas.
Para comprobarlo, la empresa decide analizar un pedido de 500 piezas,
¿cuál es la probabilidad de encontrar más del 5% de piezas defectuosas
en la muestra?

En este caso, la proporción de la población que queremos estudiar


es de 0,03, por lo tanto, el parámetro q es equivalente a 0,97.

Finalmente, buscamos la probabilidad de P[Z≤2,62] en la tabla de la


distribución Z y calculamos la probabilidad que nos pedía el problema:

En conclusión, la
probabilidad de encontrar más de
5% piezas defectuosas en la
muestra analizada es del 0,44%.
1.4.4 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE PROPORCIONES .
23
La distribución muestral de la diferencia de proporciones es la
distribución que resulta de calcular las diferencias entre las proporciones
muestrales de todas las muestras posibles de dos poblaciones diferentes.

Es decir, el proceso para obtener la distribución muestral de la


diferencia de proporciones consiste en, primero, extraer todas las muestras
posibles de dos poblaciones diferentes, en segundo lugar, se determina la
proporción de cada muestra extraída y, por último, se calcula la diferencia
entre todas las proporciones de las dos poblaciones. De manera que el
conjunto de resultados obtenidos después de hacer estas operaciones

forman la distribución muestral de la diferencia de proporciones.

En estadística, la distribución muestral de la diferencia de


proporciones sirve para calcular la probabilidad de que la diferencia entre las
proporciones muestrales de dos muestras seleccionadas aleatoriamente se
acerque a la diferencia de las proporciones poblacionales.

La distribución muestral de la diferencia de proporciones se puede


aproximar a una distribución normal con las siguientes características:
Por lo tanto, como se puede aproximar la distribución muestral de la
24
diferencia de proporciones a una distribución normal, la fórmula para calcular
el estadístico de la distribución muestral de la diferencia de proporciones es
la siguiente:

Donde:

 ^
Pies la proporción de la muestra i

 pies la proporción de la población i.


 q ila probabilidad de fracaso de la

población i, q_i=1-p_i.
 ni es el tamaño de la muestra i.
 Z es una variable definida por la distribución normal estándar N(0,1).

Ejemplo resuelto

Se quiere analizar la precisión de dos plantas de producción, una


planta produce de manera que tan solo el 5% de las piezas producidas tienen
defectos, mientras que el porcentaje de piezas defectuosas de otra planta es
del 8%. Si tomamos una muestra de 200 piezas de la primera planta y otra
muestra de 280 piezas de la segunda planta, ¿cuál es la probabilidad de que
el porcentaje de defectos de la primera planta de producción sea mayor que
el porcentaje de defectos de la segunda planta de producción?

Para acabar de conocer todos los datos del problema, primero


calcularemos la proporción de piezas bien producidas de cada planta:
1.4.5 DISTRIBUCIÓN T-STUDENT.
25
La distribución t de Student es una distribución de probabilidad muy
utilizada en estadística. En concreto, la distribución t de Student se usa en la
prueba t de Student para determinar la diferencia entre dos medias
muestrales y para hacer intervalos de confianza.

La distribución t de Student fue desarrollada por el estadístico William


Sealy Gosset en el año 1908 bajo el pseudónimo «Student».

La distribución t de Student queda definida con su


número de grados de libertad, que se obtiene restando una
unidad al número total de observaciones. Por lo tanto, la
fórmula para determinar los grados de libertad de una
distribución t de Student es ν=n-1.

Gráfica
De la gráfica de la distribución t de Student se pueden deducir las siguientes
26
propiedades:

 La distribución t de Student es simétrica centrada en el 0 y tiene


forma de campana.
 La distribución t de Student es más dispersa que la distribución
normal, es decir, la curva de la distribución t de Student es más
ancha.
 Cuantos más grados de libertad tiene la distribución t de Student,
menor es su dispersión.

En el gráfico de arriba se ha representado la función de densidad de


la distribución t de Student según sus grados de libertad. Sin embargo, abajo
puedes cómo varia la función de probabilidad acumulada de la distribución t
de Student:
Características
27
 El dominio de la distribución t de Student son todos los números
reales.

 Para distribuciones t de Student con más


de un grado de libertad, la media de la
distribución es igual a 0.
 La varianza de una distribución t
de Student se puede calcular
mediante la siguiente expresión:
 La mediana y la moda de la distribución t de Student,
independientemente del número de grados de libertad, siempre es 0.

 La función de densidad de la
distribución t de Student queda definida mediante la siguiente fórmula:

 La función de distribución de probabilidad acumulada de la distribución

t de Student se define con la siguiente fórmula:


 Para distribuciones t de Student con grados de libertad mayor que 3,
el coeficiente de asimetría es nulo porque se trata de una distribución
simétrica.
 Si los grados de libertad de la distribución t de Student son más que
28
cuatro, la curtosis se puede calcular dividiendo seis entre los grados
de libertad menos cuatro.

Las aplicaciones de la distribución t de Student se basan en analizar


conjuntos de datos que en teoría siguen una distribución normal pero que el
número total de observaciones es demasiado pequeño como para utilizar
este tipo de distribución.
1.4.6 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA
29
La distribución muestral de la varianza es la distribución que resulta
de calcular la varianza de cada muestra posible de una población. Es decir,
el conjunto de todas las varianzas muestrales de todas las muestras posibles
de una población forma la distribución muestral de la varianza.

En estadística, la distribución muestral de la varianza sirve para


calcular la probabilidad que se tiene de obtener el valor de la varianza
poblacional al extraer una sola muestra. Por ejemplo, en el análisis del riesgo
de inversiones se utiliza la distribución muestral de la varianza.

La distribución muestral de la varianza


está definida por la distribución de probabilidad
chi-cuadrado. Por lo tanto, la fórmula del
estadístico de la distribución muestral de la
varianza es la siguiente:

Donde:

 2
x es el estadístico de la distribución muestral de la varianza, el cual
sigue una distribución chi-cuadrado.
 N es el tamaño muestral.
 2
S es la varianza de la muestra.
 2
σ es la varianza de la población.

Ejemplo resuelto

De una población con varianza conocida σ=5 se escoge una muestra


aleatoria de 17 observaciones. ¿Cuál es la probabilidad de obtener una
varianza muestral mayor que 10?

Primero de todo, tenemos que sacar el estadístico de la distribución


muestral de la varianza. Así que aplicamos la fórmula explicada en el
apartado anterior:
30
Como el tamaño de la muestra es n=17, la distribución chi-cuadrado tendrá
16 grados de libertad (n-1). Por lo tanto, la probabilidad de que la varianza
muestral sea mayor que 10 es equivalente a la probabilidad de tomar un
valor de una distribución chi-cuadrado con 16 grados de libertad que sea
mayor que 32.

Así pues, buscamos la probabilidad correspondiente en la tabla de la


distribución chi-cuadrado y de este modo resolvemos el problema.

En definitiva, la probabilidad de sacar una muestra con una varianza mayor


que 10 es del 1%.
1.4.7 DISTRIBUCIÓN MUESTRAL DE LA RELACIÓN DE VARIANZAS
31
La distribución muestral de la relación de varianzas, también
conocida como la distribución F de Fisher, es un concepto fundamental en
estadísticas inferenciales que se utiliza para comparar las varianzas de dos
poblaciones o grupos. Esta distribución desempeña un papel crucial en
diversas áreas, como la investigación científica, la calidad del control de
procesos y la evaluación de tratamientos médicos.

En muchas situaciones, es esencial comparar las varianzas de dos o


más poblaciones o grupos. Por ejemplo, podríamos estar interesados en
determinar si un nuevo método de fabricación reduce la variabilidad en la
producción en comparación con el método anterior. La distribución muestral
de la relación de varianzas es la herramienta clave para abordar estas
preguntas.

La distribución muestral de la relación de varianzas sigue una


distribución F de Fisher. Esta distribución es asimétrica y depende de dos
grados de libertad: uno para el numerador y otro para el denominador. Los
numeradores y denominadores se relacionan con las varianzas de las
poblaciones o grupos que estamos comparando.

La forma de la distribución F es tal que las colas son más pesadas


que las de una distribución normal, lo que significa que es más probable
encontrar valores extremos. La forma y la posición de la distribución F
dependen de los grados de libertad y pueden variar según el contexto.

La distribución F se utiliza principalmente en dos tipos de análisis


estadísticos:

 Análisis de Varianza (ANOVA): La distribución F se utiliza para


comparar las varianzas entre tres o más grupos en un experimento.
Se emplea para determinar si existen diferencias significativas entre
las medias de estos grupos.
 Comparación de Varianzas: También se utiliza para comparar las
32
varianzas de dos poblaciones o grupos. Esto es útil en situaciones
donde es crucial evaluar si la variabilidad en un grupo es
significativamente diferente de la variabilidad en otro grupo.
Conclusión 33

Con base en la información de esta investigación se pudo concluir


que el muestreo hoy es el método que mayor beneficio aporta puesto que
sus resultados suelen ser más representativos. este resulta de gran
importancia ya que durante una investigación en una determinada población
facilita y permite obtener mayor éxito en cuestión de resultados hoy esto
debido a que requieren un menor tiempo y recurso.

De igual manera descubrimos que las distribuciones fundamentales


para el muestreo son pilares para la materia de estadística inferencial.
Dichas distribuciones ayudan a los estadísticos y analistas a comprender
cómo se distribuyen las estadísticas de muestra como medias, proporciones,
varianza, entre otros, al tomar múltiples muestras de una población.

Lo visto en esta investigación es fundamental para el análisis de


investigaciones realizadas a poblaciones. En especial para nosotros los
pertenecientes a la carrera de ingeniería industrial hola quién es con base a
estas investigaciones y análisis podemos tomar decisiones acertadas o
necesarias para diferentes problemáticas, necesidades o estudios.
34
GLOSARIO DE TÉRMINOS
 Población.
Es la totalidad de los elementos los cuales contienen las
características de interés

 Muestra.
Un subconjunto más o menos representativo de una población
estadística, aislado del resto con fines de evaluación y estudio.

 Distribución.
Es una distribución estadística, o distribución de probabilidad,
describe cómo se distribuyen los valores para un campo.

 Varianza.
Es una medida fiable a la hora de analizar los datos de una
distribución.

 Análisis estadístico.
Es la ciencia de recopilar, explorar y presentar grandes cantidades
de datos para descubrir patrones y tendencias implícitos.

 Límite central.
Es aquella que describe la distribución de la media de una muestra
aleatoria proveniente de una población con varianza finita.

35
BIBLIOGRAFÍAS
Ambientales, C. L. en. (s/f). Tema 6: Introducción a la inferencia estadística.
Unex.es. Recuperado el 29 de septiembre de 2023, de
https://matematicas.unex.es/~mota/ciencias_ambientales/tema6_nuevo.pdf

Del Rio, A. Q. (2019, septiembre 4). 6.5 El teorema central del límite.
Bookdown.org. https://bookdown.org/aquintela/EBE/el-teorema-central-del-
limite.html

Estadística, P. y. (2023, enero 19). ▷ Distribución muestral de la media.


Probabilidad y Estadística. https://www.probabilidadyestadistica.net/distribucion-
muestral-de-la-media/

Estadística, P. y. (2023b, enero 20). Distribución muestral de la diferencia de


medias. Probabilidad y Estadística.
https://www.probabilidadyestadistica.net/distribucion-muestral-de-la-diferencia-de-
medias/

Estadística, P. y. (2023c, enero 20). Distribución muestral de la proporción.


Probabilidad y Estadística. https://www.probabilidadyestadistica.net/distribucion-
muestral-de-la-proporcion/

Estadística, P. y. (2023d, enero 21). Distribución muestral de la diferencia de


proporciones. Probabilidad y Estadística.
https://www.probabilidadyestadistica.net/distribucion-muestral-de-la-diferencia-de-
proporciones/

Estadística, P. y. (2022, noviembre 30). Distribución t de Student. Probabilidad y


Estadística. https://www.probabilidadyestadistica.net/distribucion-t-de-student/

Estadística, P. y. (2023, enero 21). Distribución muestral de la varianza.


Probabilidad y Estadística. https://www.probabilidadyestadistica.net/distribucion-
muestral-de-la-varianza/

2.1 Introducción. (s/f). Www.uv.es. Recuperado el 29 de septiembre de 2023, de


https://www.uv.es/webgid/Inferencial/21_introduccin.html

(S/f). Bvs.hn. Recuperado el 29 de septiembre de 2023, de


http://www.bvs.hn/Honduras/UICFCM/Discapacidad/Escolares/Tipos.de.Muestreo.
Rev.IE_31_Oct_17.pdf

(S/f). Studocu.com. Recuperado el 29 de septiembre de 2023, de


https://www.studocu.com/es-mx/document/universidad-tecnologica-el-retono/data-
communication/competencia-1-distribuciones-fundamentales-para-el-muestreo/
36
41481842

También podría gustarte