Está en la página 1de 29

TECNOLÓGICO NACIONAL DE MÉXICO

Instituto Tecnológico Superior De Coatzacoalcos

Instituto Tecnológico Superior de


Coatzacoalcos
División de Ingeniería INDUSTRIAL
PERIODO: SEPTIEMBRE 2020 – ENERO 2021
Nombre de los Alumnos: ALOR MARTINEZ LUZ AZUCENA, GOMEZ
CARDENAS ALAIN ARTURO, JIMENEZ FELIPE FLOR NAYELI, RODRIGUEZ
GRACIA GUSTAVO ADOLFO, RAMOS LOPEZ KAREN ARLETTE, PAREDES
VALADES FRANCISCO

ASIGNATURA: ESTADISTICA INFERENCIAL


INVESTIGACION UNIDAD 2
No. Control:19080790 Semestre: 3º Grupo: 3EI
DOCENTE JIMENEZ VENTURA BRICIO

Apellido Paterno Apellido Materno Nombre(s)

Fecha: 03 – Noviembre – 2020

1
INDICE
2.1 Introducción. Página 3

2.2 Características de un estimador. Página 6

2.3 Estimación puntual. Página 9

2.4 Estimación por intervalos. Página 11

2.4.1 Intervalo de confianza para la media. Página 14

2.4.2 Intervalo de confianza para la diferencia de medias. Página 16

2.4.3 Intervalos de confianza para la proporción. Página 17

2.4.4 Intervalos de confianza para la diferencia de proporciones. Página 18

2.4.5 Intervalos de confianza para la varianza. Página 19

2.4.6 Intervalos de confianza para la relación de varianzas. Página 20

2.5 Determinación del tamaño de muestra. Página 21

2.5.1 Basado en la media de la Población. Página 23

2.5.2 Basado en la proporción de la Población. Página 24

Conclusión Página 26

Glosario Página 28

Fuentes bibliográficas Página 29

2
2.1 INTRODUCCIÓN
Antes de comenzar con los contenidos específicos de la estimación es conveniente
recordar cuál es la situación habitual con la que nos encontramos en un proceso de
inferencia.
Nuestro interés se centra en el estudio de una característica determinada de una
población. Dicha característica puede denotarse por una variable aleatoria X
definida sobre la población y con función de densidad f(x). Si conocemos f(x)
tendremos caracterizada a la variable aleatoria X y el problema queda resuelto. Sin
embargo, la mayoría de las veces no ocurre eso. En principio, es habitual disponer
solo de cierta información a priori sobre el comportamiento de la variable aleatoria
X (dicha información, normalmente proviene de las conclusiones de un estudio
previo de esa variable realizado sobre la misma población u otra diferente).

La función f(x) puede ser totalmente desconocida o bien conocida solamente en su


forma, es decir, sabemos qué tipo de distribución es, pero nos falta especificarla
porque desconocemos el valor de uno o más parámetros de esta.

Por ejemplo, podemos conocer que la variable aleatoria X sólo puede tomar dos
valores, éxito o fracaso, y que además la probabilidad de éxito es muy baja. Según
esta información podemos suponer que X se distribuye como una Poisson. No
obstante, nos falta información para poder definir esa distribución (función de
densidad de la variable aleatoria X) puesto que desconocemos el valor de su media.

El objetivo de la inferencia estadística es resolver este problema. Para ello se han


de seguir los siguientes pasos:

1. Obtención de la muestra.

2. Cálculo del estadístico que nos interese


(utilizando la información muestral).

3
3. Utilización del estadístico calculado en el
apartado previo como estimador del parámetro poblacional que desconocemos.

De lo anterior se deduce que un estimador no es más que una función de los datos
muestrales que se utiliza como valor de un parámetro poblacional. O, dicho de otra
manera, un estimador no es más que un estadístico asociado a un valor poblacional.
Por ejemplo, podríamos decir que la media muestral es el estimador de la media
poblacional.
El estadístico media muestral se calcula a través de la siguiente función.

Cuando se establece una relación entre este estadístico y un parámetro, en este


caso concreto la media poblacional, el primero se convierte en estimador del
segundo.
El interrogante que surge a continuación es porqué la media muestral es un
estimador de la media poblacional, o más concretamente, ¿qué propiedades tiene
el estadístico media muestral para ser considerado un buen estimador de la
media poblacional?

En el presente tema nos centraremos en el estudio de los siguientes aspectos:

A. Tipos de estimación. Distinguiendo entre estimación puntual, procedimiento


mediante el cual se estima el valor del parámetro poblacional basándose en los
datos muestrales mediante el uso de un estadístico, y estimación por intervalos, en
el cual para realizar la estimación del parámetro poblacional se determina un
intervalo en el que de forma probable se encuentra el valor del parámetro. Dicho
intervalo recibirá el nombre de intervalo de confianza.

B. Propiedades que debemos exigir a un estimador puntual.

C. Métodos disponibles para la construcción de estimadores puntuales.

4
D. Métodos disponibles para la estimación de intervalos de confianza de un
parámetro poblacional.

E. Determinación del tamaño de la muestra para que la estimación presente una


determinada precisión.

5
2.2 CARACTERÍSTICAS DE UN ESTIMADOR
Se dice que un estimador es insesgado si la Media de la distribución del estimador
es igual al parámetro.
Estimadores insesgados son la Media muestral (estimador de la Media de la
población) y la Varianza (estimador de la Varianza de la población):
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100)
y hallan que la Media de las Medias muestrales es igual a 5.09, (la media
poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana
de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay
diferencia ya que la Mediana es un estimador sesgado.
La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas
obtenidas con la Varianza

en un muestreo de 1000 muestras (n=25) en que la Varianza de la población es


igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la
Cuasi varianza

la Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la
Varianza de la población ya que la Cuasi varianza es un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro


cuanto mayor es n (tamaño de la muestra).
Algunos estimadores consistentes son:

6
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:

vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el
mismo valor que la Media de la población.

3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza de


la distribución muestral del estimador es menor a la del otro estimador. Cuanto
menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la
muestra aproxime al parámetro poblacional.
Ejemplo
La Varianza de la distribución muestral de la Media en un muestreo aleatorio
(número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la
distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este
resultado muestra que la Media es un estimador más eficiente que la Mediana).

Un estimador es un estadístico al que se le exigen ciertas condiciones para que


pueda calcular con ciertas garantías ciertos parámetros de una población.

Es decir, un estimador es un estadístico. Ahora bien, no es un estadístico


cualquiera. Es un estadístico con ciertas propiedades. Un ejemplo podría ser
la media o la varianza. Estas métricas tan conocidas, son estimadores.

7
Nombramos estos dos por ser los más sencillos, pero en estadística existen muchos
más. Ahora bien, volviendo a la definición, ¿Qué entendemos por ciertas
condiciones para que puedan calcular con ciertas garantías ciertos parámetros?

8
2.3 ESTIMACION PUNTUAL
Una estimación puntual de un parámetro poblacional es cuando se utiliza un único
valor para estimar ese parámetro, es decir, se usa un punto en concreto de la
muestra para estimar el valor deseado.
Cuando estimamos un parámetro de forma puntual, podemos saber con certeza,
cuál es ese valor. Imaginemos una población de 30 personas de las que
seleccionamos una muestra de 20 para las que conocemos sus edades. Estimar de
forma puntual la media de edad, sería tan sencillo como sumar esos 20 datos y
dividirlos entre el total de la muestra estadística.
Propiedades deseables de un estimador
Las propiedades deseables de un estimador son las siguientes:

• Insesgadez: Un estimador es insesgado cuando la esperanza matemática del este


es igual al parámetro que se desea estimar. Por tanto, la diferencia entre el
parámetro a estimar y la esperanza de nuestro estimador tendría que ser 0.

• Eficiente: Un estimador es más eficiente o tiene la capacidad de estimar de forma


precisa cuando su varianza es reducida. Por lo tanto, ante 2 estimadores, siempre
elegiremos el que tenga una varianza menor.

• Consistencia: Un estimador consistente es aquel que a medida que la medida que


la muestra crece se aproxima cada vez más al valor real del parámetro. Por lo tanto,
cuantos más y valores entran en la muestra, el parámetro estimado será más
preciso.

Ejemplos de estimaciones puntuales

Para obtener una estimación puntual se usa un estadístico que recibe el nombre de
estimador o función de decisión. Algunos ejemplos de estadísticos son:

La media muestral que sirve como estimación puntual de la media poblacional.

9
La desviación típica muestral que sirve de estimación para la desviación típica de
la población.

10
2.4 ESTIMACION POR INTERVALOS

La estimación por intervalos consiste en establecer el intervalo de valores donde es


más probable se encuentre el parámetro. La obtención del intervalo se basa en las
siguientes consideraciones:

a) Si conocemos la distribución muestral del estimador podemos obtener las


probabilidades de ocurrencia de los estadísticos muéstrales.

b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la


probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.

c) El problema es que el parámetro poblacional es desconocido, y por ello el


intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran
número de veces y definimos un intervalo alrededor de cada valor del estadístico
muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido
de ocasiones. Este intervalo es denominado "intervalo de confianza".

Tipos de estimación por intervalos

Intervalo de confianza

El intervalo de confianza es una expresión del tipo [θ1, θ2] o θ1 ≤ θ ≤ θ2, donde θ
es el parámetro por estimar. Este intervalo contiene al parámetro estimado con un
determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando
la muestra no garantiza un axioma o un equivalente circunstancial.

Variabilidad del Parámetro

Si no se conoce, puede obtenerse una aproximación en los datos aportados por la


literatura científica o en un estudio piloto. También hay métodos para calcular el
tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como

11
medida de esta variabilidad la desviación típica poblacional y se denota σ.

Error de la estimación

Es una medida de. su precisión que se corresponde con la amplitud del intervalo de
confianza. Cuanta más precisión se desee en la estimación de un parámetro, más
estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el
error, más observaciones deberán incluirse en la muestra estudiada. En caso de no
incluir nuevas observaciones para la muestra, más error se comete al aumentar la
precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1) /2.

Límite de Confianza

Es la probabilidad de que el verdadero valor del parámetro estimado en la población


se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por
(1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α) ·100%). Es
habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con
valores α de 0,05 y 0,01 respectivamente.

Valor α

También llamado nivel de significación. Es la probabilidad (en tanto por uno) de


fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de
confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del 95%,
el valor α es (100-95) /100 = 0,05

Valor crítico

Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución


que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.
Normalmente los valores críticos están tabulados o pueden calcularse en función

12
de la distribución de la población. Por ejemplo, para una distribución normal, de
media 0 y desviación típica 1, el valor crítico para α = 0,1 se calcularía del siguiente
modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo
la columna "Área"; se observa que se corresponde con -1,28. Entonces Zα/2 = 1,64.
Si la media o desviación típica de la distribución normal no coinciden con las de la
tabla, se puede realizar el cambio de variable t =(X-μ)/σ para su cálculo.

Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una
estimación de la media con un margen de error de 0,6 y un nivel de confianza del
99%", podemos interpretar que el verdadero valor de la media se encuentra entre
2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando
y sumando, respectivamente, la mitad del error, para obtener el intervalo de
confianza según las definiciones dadas.

Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van
relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del
intervalo de confianza, tenemos también una mayor probabilidad de éxito en nuestra
estimación, es decir, un mayor nivel de confianza

13
2.4.1 INTERVALOS DE CONFIANZA PARA LA MEDIA
Un intervalo de confianza es una técnica de estimación utilizada en inferencia
estadística que permite acotar un par o varios pares de valores, dentro de los cuales
se encontrará la estimación puntual buscada (con una determinada probabilidad).
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una
media muestral (uno superior y otro inferior). Estos valores van a acotar un rango
dentro del cual, con una determinada probabilidad, se va a localizar el parámetro
poblacional.

Intervalo de confianza = media +- margen de error


Conocer el verdadero poblacional, por lo general, suele ser algo muy complicado.
Pensemos en una población de 4 millones de personas. ¿Podríamos saber el gasto
medio en consumo por hogar de esa población? En principio sí. Simplemente
tendríamos que hacer una encuesta entre todos los hogares y calcular la media. Sin
embargo, seguir ese proceso sería tremendamente laborioso y complicaría bastante
el estudio.
Ante situaciones así, se hace más factible seleccionar una muestra estadística. Por
ejemplo, 500 personas. Y sobre dicha muestra, calcular la media. Aunque
seguiríamos sin saber el verdadero valor poblacional, podríamos suponer que este
se va a situar cerca del valor muestral. A esa media le sumamos el margen de error
y tenemos un valor del intervalo de confianza. Por otro lado, le restamos a la media
ese margen de error y tendremos otro valor. Entre esos dos valores estará la media
poblacional.
Ejemplo de intervalo de confianza para la media, asumiendo normalidad y conocida
la desviación típica
El estadístico pivote utilizado para el cálculo sería el siguiente:

14
Vemos como en el intervalo a la izquierda y derecha de la desigualdad tenemos la
cota inferior y superior respectivamente. Por tanto, la expresión nos dice, que la
probabilidad de que la media poblacional se sitúe entre esos valores es de 1-alfa
(nivel de confianza).

15
2.4.2 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS.

Consideramos dos variables aleatorias independientes X1 y X2 con distribuciones


normales de parámetros (μ1, σ1) y (μ2, σ2), respectivamente, de las que vamos a
tomar muestras aleatorias independientes de tamaños n1 y n2, respectivamente.
Nuestro objetivo, en este caso, es obtener un intervalo de confianza para la
diferencia de las medias de ambas distribuciones, es decir, para μ1 – μ2. Pero previo
al cálculo de este intervalo, debemos determinar si las varianzas de ambas
distribuciones o, equivalentemente, sus desviaciones típicas, σ1 y σ2, aun siendo
desconocidas, pueden asumirse iguales o no. El cálculo del intervalo de confianza
se realiza de forma diferente dependiendo El cálculo del intervalo de confianza se
realiza de forma diferente dependiendo de si las varianzas (desviaciones típicas)
pueden asumirse iguales o no.

Si S12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaño
n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas pero iguales, entonces un intervalo de confianza del

100( ) por ciento para la diferencia entre medias es:

16
2.4.3 INTERVALOS DE CONFIANZA PARA PROPORCION
Un estimador puntual de la proporción P en un experimento binomial está dado por
la estadística P=X/N, donde X representa el número de éxitos en N pruebas.
Por tanto, la proporción de la muestra p=x/n se utilizará como estimador puntual del
parámetro P.
Si no se espera que la proporción P desconocida este demasiado cerca de 0 o de
1, se puede establecer un intervalo de confianza para P al considerar la distribución
muestral de proporciones.

Si intentamos despejar el valor de P nos encontramos con que

Pero ¿Cómo podemos encontrar P si también está del lado derecho de la ecuación?
Lo que haremos es aproximar la proporción de la población por la de la muestra, es
decir, sustituir P por la proporción de la muestra P siempre y cuando el tamaño de
muestra no sea pequeño.

Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 o a


1, el procedimiento del intervalo de confianza que se establece aquí no es confiable
ya que realmente se debería emplear la distribución binomial, por tanto, no se debe
utilizar. Para estar seguros, se debe requerir que np y n(1-p) sea mayor o igual a 5.
El error de estimación será la diferencia absoluta entre p y p, y podemos tener el
nivel de confianza de que esta diferencia no excederá el valor de

17
2.4.4 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE
PROPORCIONES
Los limites para el intervalo de una diferencia de proporciones correspondientes a
dos muestras independientes son:

Donde el símbolo Za/n es el mismo valor critico que antes, prob(Z>Za/2) = a/2,
corresponde a un intervalo de confianza 1 – a %.
• Este intervalo puede utilizarse de manera alternativa al contraste de hipótesis
para decidir (con nivel de significación a %) si hay igualdad de los dos grupos.
Se decidirá por la igualdad de los grupos si el valor 0 queda incluido en
cualquier posición en el intervalo.
• Aunque se haga el contraste de dos proporciones, en primer lugar, es
aconsejable obtener el intervalo de confianza de la diferencia de medias, si
este ha resultado significativo, puesto que ayudara a interpretar si existe
significación aplicada además de la estadística.
• Si se dispone de alguna información previa y solo quiere calcularse algunos
de los intervalos unilaterales, bastara sustituir Za/2 y descartar el límite
superior o inferior según el caso. Por ejemplo, el intervalo unilateral derecho
corresponde a:

18
2.4.5 INTERVALOS DE CONFIANZA PARA LA VARIANZA.
Un intervalo de confianza al nivel 1 − α para la varianza de una distribución
gaussiana (cuyos parámetros desconocemos) lo obtenemos como σ 2 ∈ " (n − 1)Sˆ2
χ 2 n−1,1−α/2 , (n − 1)Sˆ2 χ 2 n−1,α/2 # Ejemplo Se estudia la altura de los individuos
de una ciudad, obteniéndose en una muestra de tamaño 25 los siguientes valores:
x = 170 cm S = 10 cm Calcular un intervalo de confianza con α = 0, 05 para la
varianza σ 2 de la altura de los individuos de la ciudad. Solución: σ 2 ∈ [63, 45; 201,
60] Por tanto, para el valor poblacional de la desviación típica tenemos que
Antes de realizar un estudio de inferencia estadística sobre una variable, lo primero
es decidir el número de elementos, n, a elegir en la muestra aleatoria. Para ello
consideremos que el estudio se basara en una variable de distribución normal, y
nos interesa obtener para un nivel de significación α dado, una precisión (error) d.
Para ello, recordemos que un intervalo de confianza para una media en el caso
general se escribe como: µ = X ± tn−1,1−α/2 · Sˆ √ n | {z} precisión d Si n es
suficientemente grande, la distribución t de Student se aproxima a la distribución
normal. Luego una manera de obtener la precisión buscada consiste en elegir n con
el siguiente criterio: n ≥ z 2 1−α/2 d 2 Sˆ2 Donde Sˆ2 es una estimación puntual a
priori de la varianza de la muestra. Para obtenerla nos podemos basar en una cota
superior conocida por nuestra experiencia previa, o simplemente, tomando una
muestra piloto que sirve para dar una idea previa de los parámetros que describen
una población.

19
2.4.6 INTERVALOS DE CONFIANZA PARA LA RELACIÓN DE
VARIANZAS
Si queremos comparar, en vez de las medias, las desviaciones típicas (para ver
si una población tiene mayor variabilidad que otra), utilizaremos el cociente de
varianzas σ22/σ21.σ22/σ21. Una estimación puntual de este cociente es el que
se obtiene dividiendo las cuasi varianzas muestrales, y el intervalo de confianza
para el cociente de las varianzas es:
(Fn−1, m−1,1−α/2ˆS2m−1ˆS2n−1, Fn−1, m− 1, α/2ˆS2m−1ˆS2n−1),
siendo Fn−1, m−1, α/2 el valor de una F de Snedecor con n−1 y $ m-1$ grados
de libertad que deja a la derecha α/2 de área.

Los límites para el intervalo de una diferencia de medias correspondientes a dos


muestras independientes son: d o n d e e l s í m b o l o tα/2e s el mismo
v a l o r c r í t i c o q u e a n t e s , p r o ( T>tα/2) = α / 2 , corresponde
a un intervalo de confianza 1 − α %. Este intervalo puede utilizarse de manera
alternativa al contraste de hipótesis para decidir ( c o n n i v e l d e s i g n i f i c a c i ó n
α % ) s i h a y i g u a l d a d d e l o s d o s g r u p o s . S e d e c i d i r á p o r l a igualdad
de los grupos si el valor 0 queda incluido en cualquier posición en el intervalo,
es decir, el número 0 no ha de estar forzosamente en el centro del intervalo para aceptar
H0. Sí se ha planteado el contraste más general H0: μ 1− μ2=d0bastará que
el valord0quedeincluido en el intervalo. Aún si se hace el contraste T de dos
muestras, en primer lugar, es aconsejable obtener el intervalo de confianza de la
diferencia de medias, si éste ha resultado significativo, puesto que ayudará a
interpretar si existe significación aplicada además de la estadística. S í se d i sp o n e
d e a lg u n a in f o rm a ció n p re v ia y q u ie r e ca lcu la rse só lo a lg u n o d e lo s
d o s intervalos unilaterales, bastará sustituir tα/2portαy descartar el límite
superior o inferior del intervalo según el caso. Por ejemplo, el intervalo unilateral
derecho corresponde.

20
2.5 DETERMINACION DEL TAMAÑO DE MUESTRAS.
Decidir cuál es el mejor tamaño para una muestra es una de las preocupaciones
principales relativas al muestreo. El primer aviso es que no existe un tamaño bueno
para todo, según el tipo de muestreo que se vaya a realizar, los objetivos que se
persigan, las características de la población y las condiciones en las que se van a
realizar las estimaciones serán aconsejables unos tamaños u otros.
El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden
incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que
estará en campo.

Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:

Tamaño de la población. Una población es una colección bien definida de objetos o


individuos que tienen características similares. Hablamos de dos tipos: población
objetivo, que suele tiene diversas características y también es conocida como la
población teórica. La población accesible es la población sobre la que los
investigadores aplicaran sus conclusiones.
Margen de error (intervalo de confianza). El margen de error es una estadística que
expresa la cantidad de error de muestreo aleatorio en los resultados de una
encuesta, es decir, es la medida estadística del número de veces de cada 100 que
se espera que los resultados se encuentren dentro de un rango específico.
Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor con
una determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95%
significa que los resultados de una acción probablemente cubrirán las expectativas
el 95% de las veces.
La desviación estándar. Es un índice numérico de la dispersión de un conjunto de
datos (o población). Mientras mayor es la desviación estándar, mayor es la
dispersión de la población.

CÁLCULO DEL TAMAÑO DE LA MUESTRA DESCONOCIENDO EL TAMAÑO DE


LA POBLACIÓN

21
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de
la población es la siguiente:

En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)

CÁLCULO DEL TAMAÑO DE LA MUESTRA CONOCIENDO EL TAMAÑO DE LA


POBLACIÓN
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la
población es la siguiente:

En donde,
N = tamaño de la población
Z = nivel de confianza
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (Error máximo admisible en términos de proporción).

22
2.5.1 DETERMINACIÓN DEL TAMAÑO DE MUESTRA BASADO EN
LA MEDIA DE LA POBLACIÓN
El determinar el tamaño de una muestra representa una parte esencial del método
científico para poder llevar a cabo una investigación. Al muestreo lo podemos definir
como el conjunto de observaciones necesarias para estudiar la distribución de
determinadas características en la totalidad de una población, a partir de la
observación de una parte o subconjunto de una población denominada muestra.
.

23
2.5.2 DETERMINACIÓN DEL TAMAÑO DE MUESTRA BASADO EN
LA PROPORCIÓN DE LA POBLACIÓN
En poblaciones dicotómicas con una proporción de éxitos el estimador puntual del

parámetro es la proporción muestral


de éxitos, p, que coincide con la media de la muestra cuando se codifica como 1 la
característica que se considera como éxito y 0 la que se considera no éxito. A partir de
un tamaño muestral moderadamente grande el estadístico p tiene una distribución
aproximadamente normal. El intervalo de confianza para la proporción poblacional está
centrado en la proporción muestral; siendo sus límites superior e

inferior donde z /2 es el valor crítico correspondiente al grado de

confianza 1- de la distribución normal tipificada y es el error típico de la


proporción.

Para obtener el intervalo de confianza y contrastar hipótesis sobre la proporción una

alternativa consiste en tratar a la proporción como la media poblacional de una


variable dicotómica codificada como se ha descrito anteriormente (éxito=1, no éxito=0) y
la secuencia es:

• Para el intervalo de confianza:

Analizar

Estadísticos Descriptivos

Explorar

• Para contrastar la hipótesis nula

Analizar

24
Comparar medias

Prueba T para una muestra

Utilizando este criterio los resultados numéricos no coinciden exactamente con los que
se obtendrían aplicando la expresión del error típico de la proporción; no obstante, la
discrepancia es despreciable si el número de observaciones es suficientemente grande.

Otras alternativas para realizar este contraste son de naturaleza no paramétrica.

25
CONCLUSIÓN:

Estimar qué va a ocurrir respecto a algo (o qué está ocurriendo, o qué ocurrió), a pesar
de ser un elemento muy claramente estadístico, está muy enraizado en nuestra
cotidianidad. Dentro de ello, además hacemos estimaciones dentro de un intervalo de
posibilidades. Por ejemplo: “creo que terminaré la tarea en unos 5-6 días”. Lo que
hacemos en el terreno del análisis de datos es aplicar matizaciones técnicas a este
hábito. Vamos a dedicar este documento al concepto de estimación, comenzando con la
estimación puntual. Después nos ocuparemos de desarrollar un modelo de estimación
por intervalo donde identificaremos los elementos fundamentales, con su significado y
símbolo. Y, por último, habrá que desarrollar cómo se calculan esos elementos. Estimar
puede tener dos significados interesantes. Significa querer e inferir. Desde luego, el
primer significado es más trascendente. Pero no tiene ningún peso en la estadística,
disciplina que no se ocupa de los asuntos del amor. El segundo significado es el
importante aquí. Una estimación estadística es un proceso mediante el que establecemos
qué valor debe tener un parámetro según deducciones que realizamos a partir de
estadísticos. En otras palabras, estimar es establecer conclusiones sobre características
poblacionales a partir de resultados muestrales. Vamos a ver dos tipos de estimaciones:
puntual y por intervalo. La segunda es la más natural. Y verás que forma parte habitual
de nuestro imaginario como personas sin necesidad de una formación estadística. La
primera, la estimación puntual, es la más sencilla y, por ese motivo, vamos a comenzar
por ella. Ocurre, además, que la estimación por intervalo surge, poco más o menos, de
construir un intervalo de posibles valores alrededor de la estimación puntual. Una
estimación puntual consiste en establecer un valor concreto (es decir, un punto) para el
parámetro. El valor que escogemos para decir “el parámetro que nos preocupa vale X”
es el que suministra un estadístico concreto. Como ese estadístico sirve para hacer esa
estimación, en lugar de estadístico suele llamársele estimador. Así, por ejemplo,
utilizamos el estadístico “media aritmética de la muestra” como estimador del parámetro
“media aritmética de la población”. Esto significa: si quieres conocer cuál es el valor de la
media en la población, estimaremos que es exactamente el mismo que en la muestra que
hemos manejado. Los estimadores siempre suministran dispersión aleatoria. Como

26
sabemos del monográfico sobre muestreo, el conjunto de todas las muestras de un
mismo diseño que provienen de una misma población suministra valores diferentes. Esta
circunstancia indica que existe una variación aleatoria con la que hay que vivir porque es
inevitable. Pero todavía sería peor. Es posible que el estimador escogido tenga sesgo,
es decir, que no solo esté variando alrededor de un punto, sino que el punto sobre el que
varía no es el valor poblacional, verdadero u objetivo de nuestro interés. Esto si es
evitable. Así que los estimadores que utilizamos intentamos que sean insesgados, es
decir, que carezcan de sesgo. El recurso que utilizamos para ello es el valor esperado,
es decir, la media aritmética de la distribución muestral del estimador. Ya lo viste en el
monográfico sobre muestreo. El valor esperado es, como dice la expresión, el valor que
esperamos. Cabe elegir un estimador tal que el valor esperado coincida con el parámetro.
Esto ocurre si utilizamos la media aritmética de la muestra como estimador de la media
aritmética de la población, pues E (X̄) =μ. También ocurre con las proporciones, pues
E(p) = π. Pero no ocurre así con la varianza (y, por tanto, tampoco con la desviación tipo)
pues E (S 2) ≠ σ 2. Esto ya lo hemos abordado en el monográfico sobre muestreo. Lo
que hacemos entonces es escoge otro estimador. En el muestreo aleatorio simple donde
las poblaciones son de gran tamaño, es la cuasi varianza el estadístico escogido como
estimador de la varianza poblacional, pues E (Ŝ 2) = σ 2, es decir, la cuasi varianza es
un estimador insesgado de la varianza poblacional.

27
GLOSARIO:

Estadística Descriptiva: Trata de los estudios que se hacen sobre el total de individuos
de una población con el fin de establecer las principales características de interés para el
investigador.

Estadística Inferencial: Se refiere a los estudios que se hacen sobre una parte de la
población (muestra), con el fin de obtener (inferir) conclusiones sobre las características
de interés de toda la población. Es un camino de deducción con riesgo, con probabilidad
de error.

Teoría de Probabilidades: Es una rama de la matemática de gran importancia en los


estudios inferenciales, dado que los valores que se obtienen sobre el análisis de una
muestra no son exactamente iguales a los correspondientes parámetros de toda la
población. Estudia el comportamiento matemático del azar con un control de los
fenómenos aleatorios.

Población: Grupo completo de individuos u objetos que constituyen la base de interés


para un estudio estadístico. Es el conjunto de todos los elementos que cumplen una
determinada característica que deseamos medir y estudiar. Muestra Parte representativa
de una población. Es todo subconjunto de una población sobre el que se va a realizar el
estudio. El número de elementos de la muestra se denomina tamaño de la muestra.
Individuo En estadística se considera individuo (objeto) a cada uno de los elementos de
la población. Carácter Cada uno de los aspectos o propiedades que se pueden estudiar
en los individuos de una población recibe el nombre de carácter o estadístico. Esto
permite clasificar a los individuos.

28
BIBLIOGRAFÍA:

Anderson D., Sweeney D., Williams T. Estadística para la administración y economía. Décima
edición. Cengage Learning. 2008 https://economipedia.com/definiciones/estimacion-puntual.html

Berenson M., Levine D., Krehbiel T. Estadística para administración. Segunda edición. Prentice
Hall. 2000 https://economipedia.com/definiciones/estimacion-puntual.html

Blair C., Taylor R. Bioestadística. Peason. Prentice Hall.


2008https://www.coursehero.com/file/37863364/ESTADISTICA-UNIDADdocx/

Daniel W. Bioestadística. Cuarta edición. Limusa Wiley. 2006


https://www.google.com/search?q=2.4.5+Intervalos+de+confianza+para+la+varianza.&oq=2.4.5
+Intervalos+de+confianza+para+la+varianza.&aqs=chrome..69i57.828j0j7&sourceid=chrome&ie
=UT

https://www.google.com/search?q=2.4.6+Intervalos+de+confianza+para+la+relaci%C3%B3n+de
+varianzas&source=lmns&bih=632&biw=1242&hl=es&sa=X&ved

Devore J. Probabilidad y Estadística para ingeniería y ciencias. Séptima edición. Cengage


Learning. 2008

Johnson R. Probabilidad y Estadística para ingenieros. Octava edición. Pearson2012

https://www.google.com/search?q=2.4.6+Intervalos+de+confianza+para+la+relaci%C3%B3n

29

También podría gustarte