Está en la página 1de 14

Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

UNIDAD 1

DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO.

La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación


de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o
para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado,
de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que
eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la
investigación científica.

La palabra viene del latín “statisticus” que significa “del estado”. Las estadísticas como las
conocemos hoy día tomaron en desarrollarse varios siglos y muchas mentes privilegiadas.
John Graunt (1620-1674), un inglés que estudiaba los expedientes de los nacimientos y
muertes descubrió que nacían más niños que niñas, pero también encontró que por estar
los hombres más expuestos a accidentes ocupacionales , a enfermedades y la guerra, el
número de hombres y mujeres en la edad de casarse era más o menos la misma. Graunt
fue el primero en publicar sobre el análisis estadístico y su trabajo llevó al desarrollo de
las ciencias actuariales utilizadas por las compañías de seguros.

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad, se usa para la toma de
decisiones en áreas de negocios o instituciones gubernamentales.

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

La estadística se divide en dos grandes áreas:

 La estadística descriptiva, se dedica a la descripción, visualización y resumen de


datos originados a partir de los fenómenos de estudio. Los datos pueden ser
resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos
son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma,
pirámide poblacional, gráfico circular, entre otros.
 La estadística inferencial, se dedica a la generación de los modelos, inferencias y
predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la
aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas si/no (prueba de hipótesis),
estimaciones de unas características numéricas (estimación), pronósticos de
futuras observaciones, descripciones de asociación (correlación) o modelamiento
de relaciones entre variables (análisis de regresión). Otras técnicas de
modelamiento incluyen anova, series de tiempo y minería de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.
Hay también una disciplina llamada estadística matemática, la que se refiere a las bases
teóricas de la materia. La palabra «estadísticas» también se refiere al resultado de aplicar
un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas,
estadísticas criminales, entre otros.

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.1 INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

El arte de obtener con confianza conclusiones sobre


el modo de proceder del fenómeno que se estudia es
el objeto de las diferentes técnicas existentes de
Inferencia Estadística.

La estadística inferencial es una parte de la


estadística que comprende los métodos y
procedimientos que por medio de la inducción
determina propiedades de una población
estadística, a partir de una pequeña parte de la
misma.

La estadística inferencial o inductiva plantea y resuelve el problema de establecer


previsiones y conclusiones generales sobre una población a partir de los resultados
obtenidos de una muestra. Los modelos estadísticos actúan como puente entre lo
observado (muestra) y lo desconocido (población).

Su construcción y estudio están basados en el cálculo de probabilidades.

Podemos concluir entonces que la Inferencia Estadística es la metodología tendente a


hacer descripciones, predicciones, comparaciones y generalizaciones de una población
estadística a partir de la información contenida en una muestra. Utiliza resultados
obtenidos mediante la Estadística Descriptiva y se apoya fuertemente en el cálculo de

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

probabilidades.
La estadística inferencial comprende aspectos importantes como:

 La toma de muestras o muestreo, que se refiere a la forma adecuada de


considerar una muestra que permita obtener conclusiones estadísticamente
válidas y significativas.
 La estimación de parámetros o variables estadísticas, que permite estimar valores
poblacionales a partir de muestras de mucho menor tamaño.
 El contraste de hipótesis, que permite decidir si dos muestras son
estadísticamente diferentes, si un determinado procedimiento tiene un efecto
estadístico significativo, etc.
 El diseño experimental(es una técnica estadística que permite identificar y
cuantificar las causas de un efecto dentro de un estudio experimental)
 La inferencia bayesiana (las evidencias u observaciones se emplean para
actualizar o inferir la probabilidad de que una hipótesis pueda ser cierta.)
 Los métodos no paramétricos(Prueba de X2 de Bondad de Ajuste, Prueba de
Kolmogorov-Smirnov con una Muestra, Prueba de Kolmogorov-Smirnov con dos
Muestras, Prueba de Rangos de Wilcoxon, Prueba de Wilcoxon-Mann-Whitney
con Dos Muestras, Prueba de Kruskal-Wallis con k Muestras, Prueba de los
Signos, Prueba de la Mediana, entre otras)

La estadística inferencial puede dar respuestas a muchas de las necesidades que la


sociedad actual puede requerir. Su tarea fundamental es el análisis de los datos que se
obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla.
La estadística inferencial se centra en tomar una pequeña muestra representativa de la
población y a partir de ésta, infiere que el resto de la población tiene el mismo
comportamiento.

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.2 MUESTREO: INTRODUCCIÓN AL MUESTREO Y TIPOS DE MUESTREO

El muestreo estadístico es la herramienta que la Matemática utiliza para el estudio de las


características de una población a través de una determinada parte de la misma. La
muestra de estudio debe ser lo más pequeña posible ya que del hecho de que una
muestra sea más grande, no se desprende necesariamente que la información sea más
fiable. Además, la muestra elegida debe serlo por un proceso aleatorio para que sea lo
más representativa posible.

Términos usuales en un estudio estadístico

 Población: conjunto de todos los individuos que son objeto del estudio.

 Muestra: parte de la población en la que miden las características estudiadas.

 Muestreo: proceso seguido para la extracción de una muestra.

 Encuesta: proceso de obtener información de la muestra.

TIPOS
DE

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.2.1.− Muestreo no probabilístico

No se usa el azar, sino el criterio del investigador.

Es aquél para el que no se puede calcular la probabilidad de extracción de una


determinada muestra. Por tal motivo, se busca seleccionar a individuos que tienen un
conocimiento profundo del tema bajo estudio y se considera que la información aportada
por esas personas es vital para la toma de decisiones. A veces, para estudios
exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a
métodos no probabilísticos, aun siendo consciente de que no sirven para realizar
generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa,
ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos

1.2.1.1. Muestreo por cuotas


Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En
primer lugar es necesario dividir la población de referencia en varios estratos definidos por
algunas variables de distribución conocida (como el género o la edad). Posteriormente se
calcula el peso proporcional de cada estrato, es decir, la parte proporcional de población
que representan. Finalmente se multiplica cada peso por el tamaño de n de la muestra
para determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado
en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la
muestra dentro de cada estrato. Ejemplo: En un estudio en donde el investigador quiere
comparar el rendimiento académico de los diferentes niveles de clases del secundario, su
relación con el género y la situación socioeconómica, el investigador identifica primero los
subgrupos. Por lo general, los subgrupos son las características o variables del estudio. El
investigador divide a toda la población en niveles de clase, cruzados con el género y el
nivel socioeconómico. Luego, toma nota de las proporciones de estos subgrupos en toda
la población y a continuación hace un muestreo de cada subgrupo

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.2.1.2. Muestreo de bola de nieve


Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en
contacto entre sí. Consiste en identificar sujetos que se incluirán en la muestra a partir de
los propios entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen
los requisitos necesarios, servirán como localizadores de otros con características
análogas. Este tipo se emplea muy frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

1.2.1.3. Muestreo subjetivo por decisión razonada


En este caso las unidades de la muestra se eligen en función de algunas de sus
características de manera racional y no casual. Una variante de esta técnica es el
muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal forma
que la media de la muestra para determinadas variables se acerque a la media de la
población. La cual funciona en base a referencias o por recomendación después se
reconoce por medio de la estadística.

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.2.1.4. Muestreo Discrecional


Se lleva acabo de acuerdo el criterio del investigador, los elementos son elegidos sobre lo
que él cree que pueden aportar al estudio. Los sujetos se seleccionan a base del
conocimiento y juicio del investigador. El investigador selecciona a los individuos a través
de su criterio profesional. Puede basarse en la experiencia de otros estudios anteriores o
en su conocimiento sobre la población y el comportamiento de ésta frente a las
características que se estudian.

1.2.1.5. Muestreo de Conveniencia


Consiste en seleccionar a los individuos que convienen al investigador para la muestra.
Esta conveniencia se produce porque al investigador le resulta más sencillo examinar a
estos sujetos, ya sea por proximidad geográfica, por ser sus amigos, etc. Es el tipo de
muestreo que pretende seleccionar unidades de análisis que cumplen los requisitos de la
población objeto de estudio, sin embargo, no son seleccionadas al azar. Se utiliza
preferentemente en estudios exploratorios. Las pruebas pilotos, también usan con
frecuencia éste tipo de muestreo

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.2.2.− Muestreo probabilístico o aleatorio:

Es el muestreo en el cual todos los elementos de la población tienen la posibilidad de ser


seleccionados, suele ser más objetivo que el determinístico, pero también más costoso,
requiere más tiempo y es más difícil de aplicar. Solo estos métodos de muestreo
probabilísticos nos aseguran la representatividad de la muestra extraída y son por tanto
los más recomendables.

1.2.2.1.− Muestreo aleatorio simple:


Se asigna un número a cada uno de los individuos de la población, y seguidamente se
van eligiendo al azar los componentes de la muestra. La elección de un individuo no
debe afectar a la del siguiente, por tanto debe reemplazarse el nº, una vez extraído.

1.2.2.2. Muestreo aleatorio sistemático


En un muestreo aleatorio sistemático se elige un individuo al azar y a partir de él, a
intervalos constantes, se eligen los demás hasta completar la muestra. Suponemos que
queremos saber la opinión sobre un profesor de una clase de 60 personas. Dichas
personas están ordenadas por orden alfabético en la lista de alumnos de clase. Para
realizar la encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12.

Entre sujetos :

Ahora elegimos al azar un número entre 1 y k = 5. Suponemos que nos sale i = 2. La


muestra resultado mediante el muestreo sistemático será:

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.2.2.3.− Muestreo estratificado

Se divide la población total en clases homogéneas (estratos). La muestra se escoge


aleatoriamente en número proporcional al de los componentes de cada estrato.

1.2.2.4. Muestreo por etapas múltiples


Esta técnica es la única opción cuando no se dispone de lista completa de la población de
referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se
obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso.
En el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados
que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se
desarrolla en varias fases o extracciones sucesivas para cada nivel. (otra muestra si se
necesitan más datos).
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país
determinado, éstos pueden subdividirse en unidades primarias representadas por
circunscripciones didácticas y unidades secundarias que serían los propios profesores. En
primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos
tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente
una muestra de unidades secundarias de cada una de las primarias seleccionadas en la
primera extracción.

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.2.2. 5. Muestreo por conglomerados


En el muestreo por conglomerados, en lugar de seleccionar a todos los sujetos de la
población inmediatamente, el investigador realiza varios pasos para reunir su muestra de
la población. Se utiliza cuando la población se encuentra dividida, de manera natural, en
grupos que se supone que contienen toda la variabilidad de la población, es decir, la
representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo
algunos de estos grupos o conglomerados para la realización del estudio. Dentro de los
grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a
encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir,
los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al
azar. Este método tiene la ventaja de simplificar la recogida de información muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para
integrar la muestra, el diseño se llama muestreo bietápico.

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.3 TEOREMA DEL LÍMITE CENTRAL

El teorema del límite central o teorema central del límite indica que, en condiciones muy
generales, la distribución de la suma de variables aleatorias tiende a una distribución
normal cuando la cantidad de variables es muy grande. Este teorema, perteneciente a la
teoría de la probabilidad, encuentra aplicación en muchos campos relacionados, tales
como la inferencia estadística o la teoría de renovación.

El teorema en un curso de estadística inferencial para pregrado se puede enunciar de la


siguiente forma:

TEOREMA: Sea 𝑋1, 𝑋2, … … … . . , 𝑋𝑛 una muestra aleatoria de una población cuya
distribución tiene por media 𝜇 y por desviación estándar 𝜎. Entonces si n es
suficientemente grande la variable aleatoria:

NOTA: Para poder determinar la probabilidad de una muestra aleatoria es


preciso hacer uso de las tablas de distribución normal estándar

Con carácter general, o al menos en los modelos de probabilidad clásicos, se admite una
aproximación aceptable al modelo normal siempre que n sea mayor o igual que 30, a
pesar de que esta cifra es insuficiente en determinados casos y excesiva en otros; por lo
que debemos ser cautelosos en su aplicación. En el enlace modelos de probabilidad, se
establece una relación de algunos modelos, con aproximaciones particulares, que en la
mayoría de los casos derivan del teorema del límite central.

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

Ejemplo # 1. Una empresa eléctrica industrial fabrica focos que tienen una duración que
se distribuye aproximadamente en forma normal, con media de 800 horas y desviación
estándar de 40 horas.
Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una
vida promedio de menos de 775 horas.

Solución:
De acuerdo con el enunciado, se conoce la variable 𝑋𝑖 como la duración del i-esimo
foco en la muestra tomada. Así la variable aleatoria 𝑋𝑖 proviene de una población con
media 𝜇 = 800 Horas y desviación 𝜎 = 40 ℎ𝑜𝑟𝑎𝑠. De esta forma por el teorema del límite
central, si se toman muestras de esta población de tamaño n = 16 y se calculan sus
promedios la variable aleatoria 𝑋̅ se distribuye aproximadamente normal con media 𝜇𝑋̅
= 800 y desviación 𝜎𝑋̅ = 40. El problema requiere el cálculo de la probabilidad.

DATOS:

𝑋̅ = 725

𝜇 = 800

𝜎 = 40

𝑛 = 16

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro
Estadística Inferencial I UNIDAD 1: Distribuciones Fundamentales para el Muestreo.

1.4 DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO

1.4.1 Distribución Muestral Media

Instituto Nacional de México Instituto Tecnológico de Comitán Ing. Jesús Alejandro Escandón Villatoro