Final Inferencia-Estadistica

Paso 2 actividades sobre distribuciones muéstrales y estimación
Por
Eliana Vasquez
Código:
Sandy Torres
Código:
Ana Silvia Espinosa Ramírez
Código: 1118122381
Sonia Fuentes
Código:
María Zulma Alarcón Ávila
Código: 52996069
Inferencia Estadística
551112- 5
Presentado a
Freddy Yesid Villamizar
Universidad Nacional Abierta y a Distancia UNAD

CEAD Yopal-
Escuela ciencias de la educación -ECDU
04 de Julio de 2020
Introducción
La estadística como rama de las matemáticas que con sus métodos y técnicas de muestreo
permiten recolectar, organizar, calcular, analizar y formular conclusiones, encontrando las
principales características de una variable en grupo de individuos o de cualquier situación que
esta requiera.
En el presente trabajo abordaremos contenidos asociados con la estadística inferencial
que se encarga de generalizar al total de la población las características obtenidas al analizar una
muestra. El muestreo es uno de los principales aspectos a considerar en la prueba de hipótesis.
A continuación, se relacionan conceptos que van desde la medida de tendencia central a
las medidas de dispersión, diferentes tipos de ejercicios donde nos permiten interactuar con
cada uno de los conceptos expuestos.

Objetivos
Objetivo general
Estudiar conceptos básicos y propiedades de la estadística inferencial, para poder
formular hipótesis sobre una población objeto de estudio partir de una muestra, mediante la
resolución de situaciones del contexto real.
Objetivos específicos
1. Consultar propiedades de las diferentes distribuciones muéstrales.
2. Reconocer propiedades y características de las diferentes distribuciones muéstrales.
3. Resolver ejercicios donde intervengan media, mediana y moda.

Parte A
Consultar la definición, propiedades, cuando o para qué se utiliza de las siguientes palabras
1.1. Distribución de muestreo, distribución normal y distribución de probabilidad
Teoría Del Muestreo
Uno de los propósitos de la estadística inferencial es estimar las características
poblacionales desconocidas, Mirar la información obtenida de una muestra, de una población. El
punto de interés es la muestra, la cual debe ser representativa de la población objeto de estudio.
Se seguirán ciertos procedimientos de selección para asegurar de que las muestras
reflejen observaciones a la población de la que proceden
Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto
observa. Una muestra es un subconjunto de observaciones seleccionadas de una población.
Errores en el Muestreo Errores en el Muestreo Cuando se utilizan valores muéstrales
(parámetros), o estadísticos para estimar valores poblacionales, pueden ocurrir dos tipos
generales de errores: El error muestral y El error no muestral.
El error muestral se refiere a la variación natural existente entre muestras tomadas de la
misma población. Aún si se ha tenido gran cuidado para asegurar que dos muestras del mismo
tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticas
en todos sus detalles. El error muestral es UN concepto importante que ayudará a entender mejor
la naturaleza de la estadística inferencial. Los errores que surge al tomar las muestras y que no
pueden clasificarse como errores muéstrales y se denominan errores no muéstrales. El sesgo de

las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia
sistemática inherente a un método de muestreo que da estimaciones de un parámetro que son, en
promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro real. Ejemplo:
la longitud del dedo índice de personas de la misma edad y sexo. El sesgo muestral puede
suprimirse, o minimizarse, usando la aleatorización.
La aleatorización se refiere a cualquier proceso de selección de una n muestra de la
población en el que la selección es imparcial o no está sesgada; una muestra elegida con
procedimientos aleatorios se llama muestra aleatoria muestra aleatoria.
Los tipos más comunes de técnicas de muestreo aleatorios son:
 El muestreo aleatorio simple.
 El muestreo estratificado.
 El muestreo por conglomerados
 El muestreo sistemático.
Si una muestra aleatoria se elige de tal manera que todos los elementos de la población
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
 La distribución muestral resulta de considerar todas las muestras posibles tomadas de una
población.
 Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de
acercarse al parámetro de la población.
 El muestreo puede hacerse con o sin reposición y la población de partida puede ser
infinita o finita.
 Una población finita en la que se efectúa muestreo con reposición puede considerarse
infinita teóricamente. Una población muy grande puede considerarse como infinita.
 En todas las posibles muestras de tamaño n en una población. Para cada muestra es
posible calcular un estadístico (media, desviación típica, proporción) que variará de una a
otra. Así se obtiene una distribución del estadístico que se llama distribución muestral.
 Las dos medidas fundamentales de esta distribución son la media y la desviación típica,
también denominada error típico.
 Si el tamaño de la muestra es lo suficientemente grande las distribuciones muestrales son
normales y en esto se basarán todos los resultados que se encuentren.
1.2. Desviación típica
Conocida como desviación estándar y representada de manera abreviada por la letra
griega minúscula sigma σ o la letra latina s, así como por las siglas SD (de standard desviation,
en algunos textos traducidos del inglés).
Es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto
de datos numéricos.
Una desviación estándar baja indica que la mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media (también denominada el valor esperado), mientras
que una desviación estándar alta indica que los datos se extienden sobre un rango de valores más
amplio.
La desviación estándar de una variable aleatoria, población estadística, conjunto de datos
o distribución de probabilidad es la raíz cuadrada de su varianza. Es algebráicamente más simple,
aunque en la práctica menos robusta, que la desviación media. Una propiedad útil de la
desviación estándar es que, a diferencia de la varianza, se expresa en las mismas unidades que
los datos a partir de los que se calcula.
La desviación estándar se usa comúnmente para medir la fiabilidad de las conclusiones
estadísticas. Como el margen de error en los datos de los sondeos de opinión.
La desviación estándar se denomina "error estándar" de la estimación o "error estándar de
la media" (cuando se refiere a una media). Se calcula como la desviación estándar de todas las
medias que se calcularían a partir de esa población si se extrajera un número infinito de muestras
y se calculase la media para cada muestra.
La desviación estándar de una población y el error estándar de una estadística obtenida a
partir de esa población (como la media) son bastante diferentes pero están relacionados
(relacionados por la inversa de la raíz cuadrada del número de observaciones).
El margen de error de una encuesta se calcula a partir del error estándar de la media (o
alternativamente, del producto de la desviación estándar de la población y la inversa de la raíz
cuadrada del tamaño de la muestra, que es lo mismo) y es por lo general, aproximadamente el
doble de la desviación estándar: la mitad del ancho de un intervalo de confianza del 95 por
ciento.
Cuando solo está disponible una muestra de datos de una población, el término
desviación estándar de la muestra o desviación estándar muestral, puede referirse a la cantidad
mencionada anteriormente aplicada a esos datos o también a una cantidad sobre la que se realiza
un ajuste que sirve de estimación no sesgada de la desviación estándar de la población (es decir,
de la desviación estándar de toda la población).

1.3. Distribución normal y distribución muestral
1.3.1. Distribución normal
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre
(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más
profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más
comúnmente, como la "campana de Gauss". La distribución de una variable normal está
completamente determinada por dos parámetros, su media y su desviación estándar, denotadas
generalmente por μ y σ .
Imagen 1. Campana de Gauss
Imagen 1. Campana de Gauss Tomada de: https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png
Formula de la Distribución Normal

−1 X −μ
1 2
(
σ
)²
f ( X )= e
√2 πσ
e=¿ constante matemática con valor aproximado de 2,71828
π=¿ constante matemática con valor aproximado de 3,14159
μ=¿ media de la población
σ =¿ desviación estándar de la población
La distribución normal es de vital importancia en estadística por tres razones
fundamentales:
 Muchas variables continuas en el mundo de los negocios tienen distribuciones que se
asemejan estrechamente a la distribución normal.
 la distribución normal sirve para acercarse a diversas distribuciones de probabilidad
discreta como la distribución binominal y la distribución de Poisson.
 la distribución normal proporciona las bases para la estadística inferencial clásica por su
relación con el teorema de limite central. [ CITATION Mar06 \l 3082 ]
La desviación estándar indica que tan agrupados o dispersos están los datos alrededor de
la media, debido a la baja o alta dispersión de los datos.
Cuando la desviación estándar es pequeña la curva de Gauss está concentrada alrededor
de la media y es señal de una baja dispersión de los datos.
Cuando la desviación estándar es muy grande la campana de Gauss se aplana y se va a los
extremos esto debido a que los datos se encuentran más alejados de la media.
N (μ,σ)
μ= Mediade la poblacion
σ =Desviación estándar
Propiedades o Características
 La forma de la campana de Gauss depende de los parámetros de media μ y de la
deviación estándar σ .
 El área bajo la curva es 1.

 La curva normal es asintótica
 Es simétrica respecto al centro, exactamente igual a ambos lados de la media.
 Tiene una única moda que coincide con su media y su mediana.
 El 50% de los valores se encuentras a cada lado de la media, 50% al lado
izquierdo y 50% lado derecho.
 Tiene una asíntota en el eje y cerca a cero.
 Puede tomar cualquier valor entre −∞ , ∞
 A mayor valor de σ mayor dispersión, ruido o distanciamiento de los datos
alrededor del valor medio. Es decir, a mayor σ la forma de campana es más
abierta. En cambioσ pequeño indica que los dados se ciñen a la media y la forma
de la campana es más cerrada o puntiaguda.
Cuando o para que se utiliza: la Distribución Normal permite modelar diferentes
fenómenos como lo son los fenómenos naturales, sociales y psicológicos.
Se utiliza muy a menudo porque hay muchas variables asociadas a fenómenos naturales
que siguen el modelo de la norma. Para analizar características morfológicas de individuos
como; personas, animales, plantas, entre otros. Se realizan análisis como por ejemplo de peso,
talla, diámetro, distancia, perímetro, entre otros. Características fisiológicas como, por ejemplo:
efecto de una misma dosis de un fármaco, o la misma cantidad de un fertilizante.
Dentro de los fenómenos sociales, se encuentran estudios relacionados como, por
ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de
examen. En cuanto los fenómenos psicológicos, por ejemplo: cociente intelectual, grado de
adaptación a un medio, fenómenos relacionados con la violencia familiar, abuso sexual a niños,
entre otros.
Valores estadísticos muéstrales como la media, varianza y moda.
1.3.2. Distribución muestral

Es el conjunto de estadísticos (valores que resultan del análisis del muestreo), que pueden
obtenerse de las diferentes muestras de igual tamaño que conforman una población determinada.
Es una distribución de probabilidades de una estadística muestral calculada a partir de todas las
muestras posibles de tamaña “n” elegidas al azar de una población determinada.
Una distribución muestral es una distribución de probabilidad de una estadística muestral
calculada a partir de todas las muestras posibles de tamaña “n” elegidas al azar de una población
determinada. Generalmente nos interesa conocer una o más de las siguientes características de la
distribución muestral.
Propiedades o Características
 Su forma funcional; como aparece en su representación gráfica.

 Su media
 Su desviación estándar; error estándar.
Tipos de distribuciones muéstrales
 Distribución de la media
 Distribución de la varianza
 Distribución de la proporción
 Distribución de la diferencia de medias
 Distribución de la diferencia de proporciones
 Distribución del cociente variancias
Distribución muestral de medias
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si
consideramos cada una de estas medias como valores de una variable aleatoria podemos
estudiar su distribución que llamaremos distribución muestral de medias.
 Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la
distribución muestral de medias sigue también una distribución normal
σ
N (μ, )
√n
 Si la población no sigue una distribución normal, pero n>30, aplicando el
llamado Teorema central del límite la distribución muestral de medias se aproxima
también a la normal anterior.
Distribución de la varianza
Si se tiene una muestra aleatoria X 1 , X 2 , … , X n de tamaño n de una población normal
con media μ y varianza σ ² si bien no se puede determinar la distribución de probabilidades de la
varianza muestral S ², es posible hacerlo para una función S ². [ CITATION Lóp06 \l 3082 ]
Distribución muestral de proporciones
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la
variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una
distribución binomial y cuando la extensión de la población es grande la distribución binomial
B(n,p) se aproxima a la normal N (np , √ npq)
 Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una
√ pq
(
distribución normal N p ,
n ) donde p es la proporción de uno de los valores que
presenta la variable estadística en la población y q=1-p.
Distribución de la diferencia de medias

Cuando el tamaño de dos muestras es mayor o igual a 30, la distribución muestral de la
diferencia entre las medias de las muestras sigue la distribución normal con media m 1−m2=0 y
2 2
error estándar √(σ /n )+(σ /n ) CITATION Alf99 \l 3082 (Alfons Sarria Arrufat, 1999)
1 1 2 2
Distribución de la diferencia de proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino
que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos
reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución
muestral de medias, a excepción de que al extraer las muestras de la población se calcula el
estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y
"n" el tamaño de la muestra) en lugar del estadístico media.
Imagen 2. Representación gráfica de la distribución normal de proporciones

Imagen 2. Tomada de: http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01b.html
Distribución del cociente variancias

Dadas dos muestras independientes de sendas poblacionales normales N ( μ1 ; σ 21 ) y
N ( μ2 ; σ 22 ), las variables aleatorias.
( n−1 ) S 21 ( n−1 ) S 22
2
y 2
σ1 σ2
Tiene distribución X 2 con n−1y m−1 grados de libertad respectivamente, siendo ambas
independientes. [ CITATION Her07 \l 3082 ]
Imagen 3. Esquema de muestra aleatoria simple. Estadísticos muéstrales

Imagen 3. Tomada de [CITATION Her07 \p 44 \l 3082 ]
1.4. Distribuciones de frecuencia relativas y distribución de probabilidad normal
1.4.1. Distribuciones de frecuencia relativas
Una distribución de frecuencia relativa describe los porcentajes del número total de
observaciones correspondiente a cada categoría. Una distribución de frecuencia relativa no nos
indica cuál es el número de observaciones en cada categoría, sino cuál es el porcentaje de
observaciones en cada categoría. Esta información es muy valiosa.
La distribución o tabla de frecuencias es una tabla de los datos estadísticos con sus
correspondientes frecuencias, dónde:

1) Frecuencia absoluta: el número de veces que aparece un valor, se representa con f i donde el
subíndice representa cada uno de los valores. La suma de las frecuencias absolutas es igual al
número total de datos, representado por N.
f 1+ f 2 + f 3+ f 4+ f 5 +…+ f n
Equivalente a
∑ fi
i=1
2) Frecuencia relativa: El resultado de dividir la frecuencia absoluta de un determinado valor
entre el número total de datos, se representa por ni. La suma de las frecuencias relativas es
igual a 1. Lo cual puede verse fácilmente si se factoriza N.
fi
ni =
N
3) Frecuencia acumulada: la suma de frecuencias absolutas de todos los valores iguales o
inferiores al valor considerado, se representa por f i .
4) Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre el
número total de datos, se representa por ni .
Ejemplo 1:
Se realiza una tabla de frecuencia con los datos del problema número 2. “La siguiente tabla muestra
las ventas, en miles de dólares de 20 vendedores de una compañía de computadoras”.
Tabla 1: Tabla de frecuencia
Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia Relativa

Clase X absoluta f relativa fr acumulada F Acumulada Fr
25,10 - 40,04 25,1+ 40,04 12 12 12 12
=0,6
2 20 20
32,57
40,04 - 55,04 47,54 5 0,25 12+5=17 17
20
55,04 - 69,98 62,51 1 0,05 18 18
20
69,98 - 84,92 77,45 0 0 18 18
20
84,92 - 99,86 92,39 2 0,1 20 20
20
312,46 20 1
Tabla 1; Realizada por Zulma Alarcón en base a datos del problema 2.
1.4.2. Distribución de probabilidad normal
Es una distribución de probabilidad continua, también nombrada distribución de Gauss, modelo
probabilístico más importante, sus parámetros son: μ= Mediade la poblacion y
σ =Desviación estándar.
Sus características
 Media, Mediana y Moda coinciden en el máximo de la curva.
 El área encerrada bajo la campa y el eje X es igual a la unidad.
 Los puntos de inflexión son los puntos μ+σ y μ−σ
Imagen 4: Campana da Gauss distribución probabilidad normal
Imagen 4: Campana de Gauss tomada de https://image.slidesharecdn.com/distribucion-normal-181008205048/95/distribucion-

normal-4-638.jpg?cb=1539032130
1.5. Desviación estándar de la distribución muestral de variable aleatoria
La desviación estándar de la distribución muestral de un estadístico se conoce como error
estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por σ x ,
es 1.58. Con esto se puede demostrar que, si de una población se eligen muestras de
tamaño n con reemplazo, entonces el error estándar de la media es igual a la desviación
estándar de la distribución de los errores muestrales.
En general se tiene: σ x =σ e
Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la
formula siguiente para encontrar σ x .
σ N −n
σ x=
√
√ n N −1
donde σ x es la desviación estándar de la población de donde se toman las muestras, n es el
tamaño de la muestra y N el de la población.
Como regla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población es al
menos 20 veces el tamaño de la muestra ( N ≥ 20), entonces se puede usar la fórmula.
N −n
El factor
√ N −1
se denomina factor de corrección para una población finita.
Ejemplo: Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de
tres maestros universitarios de matemáticas:
Tabla 2. Tabla de datos

Maestro de matemáticas Antigüedad
A 6
B 4
C 2
Tabla 2; Realizada por Elina Vasquez
Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo.
Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error
estándar, o la desviación estándar de la distribución muestral.
Solución: Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras
posibles de tamaño 2, con sus respectivas medias muestrales.
Tabla 3. Media muestral
Muestras Antigüedad Media Muestral

A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
Tabla 3; Realizada por Elina Vasquez
2+ 4+6
La media poblacional es: μ= =4
3
5+4 +3
La media de la distribución muestral es: μ X = =4
3
La desviación estándar de la población es:
( 6−4 )2 + ( 4−4 )2 + ( 2−4 )2

σ=
√ 3
=1.63
Entonces, de acuerdo a los datos de la tabla el promedio de la antigüedad es 4 y con respecto a la
misma la dispersión (distancia) o desviación estándar entre los datos es de 1.63

El error estándar o la desviación estándar de la distribución muestral es:
(5−4 )2 + ( 4−4 )2 + ( 3−4 )2

σ x=
√ 3
=0.816
Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que:
σ 1,63
σ x= = =1.152
√ n √2
Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección
obtendremos el valor correcto:
σ N −n 1,63 3−2
σ x=
√ =
√ n N −1 √ 2 3−1 √
=0,816
Imagen 5. Diagrama de flujo de las decisiones que deben tomarse cuando se calcula el
valor del error estándar:

Imagen 5: tomada de: http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01b.html
1.6. Muestra aleatoria de una distribución normal con media
Si tenemos una muestra aleatoria de una población N (m , s) , se sabe (Teorema del
límite central) que la fdp de la media muestral es también normal con media m y varianza s2/n.
Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para
poblaciones cualesquiera. Es decir σ / √ n es el error típico, o error estándar de la media.
¿Cómo usamos esto en nuestro problema de estimación?
1º problema: No hay tablas para cualquier normal, sólo para la normal m=0 y s=1 (la
llamada z); pero haciendo la transformación (llamada tipificación)
X́ −μ
z= una normal de media m y desviación s se transforma en unaz.
σ / √n
Llamando z a al valor de una variable normal tipificada que deja a su derecha un área bajo
la curva de a, es decir, que la probabilidad que la variable sea mayor que ese valor es a (estos son
los valores que ofrece la tabla de la normal)
Imagen 6: Campana de Gauss para la distribución normal de medias

Imagen 6: Tomada de; http://www.hrc.es/bioest/esti_medias.html
Podremos construir intervalos de la forma
X́ −μ
z 1−σ < <z
2 σ / √n σ2
Para los que la probabilidad es 1 - a.
Teniendo en cuenta la simetría de la normal y manipulando algebraicamente
σ σ σ
X́ −Z = < μ< X́ + ¿Z = ¿ La cual también se puede escribir X́ ∓ Z = o, haciendo énfasis en
a/2
√n √n
a /2
√n a/2
σ
que es el error estándar de la media, X́ ∓ Z EE( X́ )
a
√n 2
Recuérdese que la probabilidad de que m esté en este intervalo es 1 - a. A un intervalo de
este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - a)%,
o nivel de significación de 100a%. El nivel de confianza habitual es el 95%, en cuyo
caso a=0,05 y z a /2=1,96.Al valor X́ se le denomina estimación puntual y se dice que X́ es un
estimador de m.
Ejemplo: Si de una población normal con varianza 4 se extrae una muestra aleatoria de
tamaño 20 en la que se calcula X́ =5,3 se puede decir que m tiene una probabilidad de 0,95 de
estar comprendida en el intervalo
2
5,3 ∓ 1,96 =(4,42 6,18)
√ 20
Que sería el intervalo de confianza al 95% para m
En general esto es poco útil, en los casos en que no se conoce m tampoco suele
conocerse s2; en el caso más realista de s2 desconocida los intervalos de confianza se construyen
con la t de Student (otra fdp continua para la que hay tablas) en lugar de la z.
s
X́ ∓t =
a/2
√n
s
o, haciendo énfasis en que es el error estándar estimado de la media,
√n
^ ( X́ )
X́ ∓t E E
a
2
Esta manera de construir los intervalos de confianza sólo es válida si la variable es normal.
Cuando n es grande (¿ 30) se puede sustituir t por zsin mucho error.
1.7. Estimación, estimación puntual, estimación real y estimador del parámetro objetivo
1.7.1. Estimación: Una estimación estadística es un proceso mediante el que establecemos
qué valor debe tener un parámetro según deducciones que realizamos a partir de
estadísticos. En otras palabras, estimar es establecer conclusiones sobre características
poblacionales a partir de resultados muestrales.
son estadísticos independientes de los parámetros de la población, y que se utilizan para
aproximarlos. Si θ es el parámetro de interés, el estimador se denotará por ˆθ. En el caso de una
población Normal, podemos considerar la media muestral como estimador de la media
poblacional (es decir, X = µˆ) y la varianza muestral como estimador de la varianza poblacional
( s ²=σˆ ²) Para una distribución Bi(m, p), donde m denota el número de pruebas de Bernoulli, la
proporción p se puede estimar a partir de la proporción poblacional (que denotaremos por pˆ).
Por tanto, X́ , s ² y pˆ son estimadores puntuales de µ ,σ ² (en distribución Normal) y p (en
distribución Binomial), respectivamente.
Un estimador es una regla, a menudo expresada como una fórmula, que indica como calcular
el valor de una estimación con base en las mediciones contenidas en una muestra. Sáez, A.
(2010).
1.7.2. Estimación puntual: Una estimación puntual consiste en establecer un valor concreto
(es decir, un punto) para el parámetro. El valor que escogemos para decir “el
parámetro que nos preocupa vale X” es el que suministra un estadístico concreto.
Como ese estadístico sirve para hacer esa estimación, en lugar de estadístico suele
llamársele estimador. Así, por ejemplo, utilizamos el estadístico “media aritmética de
la muestra” como estimador del parámetro “media aritmética de la población”. Esto
significa: si quieres conocer cuál es el valor de la media en la población, estimaremos
que es exactamente el mismo que en la muestra que hemos manejado:
Algunos estimadores frecuentes son: media muestral, proporción muestral, Varianza muestral,
Cuasi-varianza muestral. (Manzano Arrondo 2012-2014)
Imagen 7: Estimación puntual y por intervalo
Imagen 7: https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcQmAip9MywqitUZRRhFW5qxFKlRLH8MVPQlbA&usqp=CAU
No podemos evaluar la bondad de un procedimiento de estimación puntual en base
en el valor de una sola estimación; más bien, debemos observar los resultados cuando
el procedimiento de estimación se usa en innumerables veces. Como la estimación son
números, evaluamos la bondad del estimador puntual al construir una distribución de
frecuencias de los valores de estimaciones un muestreo repetida y observar como se
agrupa esta distribución alrededor del parámetro objetivo. Sáez, A. (2010). Pag,392.
1.7.3. Estimación real
La información de la muestra se puede utilizar para calcular el valor de una estimación
puntual, una estimación de intervalo o amabas. En cualquier caso, la estimación real se logra
con el uso de un estimador del parámetro objetivo. Sáez, A. (2010).
1.7.4. Estimador del parámetro objetivo
Propiedades de los estimadores Varianza de un estimador Si dos estimadores son centrados,
¿cuál podríamos considerar mejor? Aquel que tenga menor varianza es más probable que dé
lugar a estimaciones que estén más próximas al verdadero valor del parámetro. Llamamos
eficiencia o precisión de un estimador:
Eficiencia [ θ^ ] =1/var [ θ^ ] Menor varianza= Mayor eficiencia.
Cuando damos un valor estimado de un parámetro, sería lógico dar una medida de la precisión
de esa estimación Error estándar del estimador El error estándar de un estimador es la desviación
típica de dicho estimador: Si la desviación típica depende del parámetro, la sustitución del
parámetro por su estimación da lugar al error estándar estimado:
1.8. Estimación de intervalo y sesgo

Estimador por intervalo: Par de valores de estadísticos que se utilizan para estimar el
parámetro poblacional. (como variables aleatorias que son tendrán su correspondiente
distribución en el muestreo)
Estimación por intervalo: Valores numéricos concretos que toma el estimador por
intervalo para una muestra determinada.
1.9. Error de estimación, colas de la densidad de probabilidad y límite probabilístico en
el error de estimación
1.9.1. Error de estimación
Una forma de evaluar la bondad de cualquier procedimiento de estimación puntual es en
términos de las distancias entre la estimación que genera y el parámetro objetivo. Esta cantidad,
que varia aleatoriamente en muestreo repetido, se denomina Error de estimación. Por supuesto
que nos gustaría que el Error de estimación fuera tan pequeño como fuera posible.
Error de estimación ε es la distancia entre un estimador y su parámetro objetivo. Esto es,
^ |.
ε =|θ−θ
Como θ es una variable aleatoria, el valor de estimación también es una cantidad aleatoria y no
podemos decir que tan grande o pequeña será para una estimación particular , pero podemos
plantear enunciados de probabilidad acerca de él. Sáez, A. (2010).
1.9.2. Teoría de colas
Uno, que comprende la teoría de colas (líneas de espera), se refiere al número de personas
(u objetos) que esperan servicio en un punto particular en el tiempo, La teoría de colas es

también importante para determinar el número de cajeras para un supermercado y para diseñar
hospitales y clínicas.
1.9.3. límite probabilístico en el error de estimación
La teoría estadística brinda cálculos probabilísticos del tamaño deseado del error muestral para
una estadística en particular o estimación; estos usualmente son expresados en términos de error
estándar
1.10. Intervalos de confianza, estimador de intervalo y límites de confianza superior e
inferior
1.10.1. Intervalo de confianza
Un intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que
permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación
puntual buscada (con una determinada probabilidad). Un intervalo de confianza nos va a permitir
calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores
van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el
parámetro poblacional.
Intervalo de confianza=media ± margen de error
El intervalo de confianza no sirve para dar una estimación puntual del parámetro poblacional,
si nos va a servir para hacernos una idea aproximada de cuál podría ser el verdadero de este. Nos
permite acotar entre dos valores en dónde se encontrará la media de la población.
1.10.2. Estimador de intervalo

La estimación por intervalos consiste en establecer el intervalo de valores donde es más
probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
a. Si conocemos la distribución muestral del estimador podemos obtener las probabilidades
de ocurrencia de los estadísticos muéstrales.
b. Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c. El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se
establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y
definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se
sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
1.10.3. Límites de confianza superior e inferior
En cuanto a los limites superiores e inferiores de un intervalo de confianza se puede comprender
desde la imagen 9
Imagen 8: Estructura de un intervalo de confianza con sus límites superiores e
inferiores.
Imagen 8: se realizó en base a imagen 9

Imagen 9 Ejemplo de intervalo de confianza superior e inferior
Imagen 9 tomada de; https://slideplayer.es/slide/10235578/
Parte B
Realizar los siguientes ejercicios y comparar cada uno de ellos con ayuda de un
Software, ya sea GeoGebra, R o RStudio, presentar evidencias del apoyo de este y justificar
los resultados presentados.
Desarrollado por
1. La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:

a. Construya las distribuciones de frecuencia relativa, de frecuencia absoluta y
distribución acumulada.
Tabla 4. Tabla de datos ordenados.
DATOS ORDENADOS
25 28 32 33 35 36
38 42 44 44 47 48
48 49 51 52 53 56
57 58 58 59 61 63
66 67 69 72 76 78
Tabla 5. Tabla de frecuencias
Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia Relativa

Clase X absoluta f relativa fr acumulada F Acumulada Fr
25 3 30,5 5 0,166666667 5 0,166666667

6
36 4 41,5 5 0,166666667 10 0,333333333
7
47 5 52,5 9 0,3 19 0,633333333
8
58 6 63,5 7 0,233333333 26 0,866666667
9
69 8 74,5 4 0,133333333 30 1
0
30 1
b. Calcular la media, mediana, moda y desviación estándar.
Calcular la media, mediana, moda y desviación estándar.
Media
25+28+32+… .+72+76+78
=51.67
30
Mediana
Se ordenan los datos de menor a mayor y se encuentra el que queda en el medio. En este caso
como el dato es par se ubica los números que están en el medio y se saca el promedio.
Mediana = 51.5
Moda
El valor que más se repite: 44, 48, 58
Desviación Estándar
∑ ¿ x−μ∨¿2 ¿
σ=
√ N
Haciendo el cálculo
σ =14.82
2. La siguiente tabla muestra las ventas, en miles de dólares de 20 vendedores de una
compañía de computadoras.
Desarrollo
1. Primero se ordenan los datos en una tabla, para poder apreciar mejor cada uno de ellos.
Tabla 6. Tabla de datos ordenados.
Datos Ordenados
25,1 25,4 26,9 28,7 29,3
31,7 32,3 35,6 35,6 36,8
37,8 39,7 40,2 42,9 44,2
45,2 50,6 55,2 88,2 99,8
a. Calcular la media
Para calcular la media es de recordar que esta se halla al sumar todos los datos y dividir el
resultado entre el número total de datos.
X́ =
∑ xi
N
851,2
X́ = =42,56
20
X́ =42,56
Por lo tanto y de acuerdo a lo anterior se puede identificar que la media para los datos en
miles de dólares sobre las ventas realizadas por 20 vendedores en una compañía de
computadores es de: $42,56. Mil dólares.
b. Calcular la mediana
Para el caso de la mediana se tiene presente que es el valor que ocupa el lugar central de
todos los datos una vez estos están ordenados; cuando el número de datos es impar solo es tomar
exactamente el que ocupa el lugar central, pero como en este caso que el número de datos es par,
se toman los dos datos centrales (estando ordenados) y se halla el promedio, es decir;
~ 36,8+37,8
X= =37,3
2
~
X =37,3
c. Calcular la desviación estándar
La desviación estándar es igual a la raíz cuadrada de la diferencia entre el promedio de
los cuadrados de los valores y el cuadrado del promedio. Por tales motivos es que antes se
tiene que hallar la varianza recordando que esta es; promedio de los cuadrados de las
desviaciones medias alrededor de la media. Esta se halla teniendo presente los tipos de datos
que estemos analizando si estos son de una población a de una muestra.
Formula
σ=
√ ∑ ( x−μ )
n
σ =desviaci ó n est á ndar poblacional
n=Tamaño de la poblaciòn
x=Cada valor de la poblaciòn
μ= Media poblacional
 Primer paso:
Se halla el promedio sumando todos los datos y dividiéndolos en el número de datos.
25,1+25,4+ 26,9+28,7+…+ 88,2+ 99,8

μ=
20
852,2
μ= =42,56
20
μ=42,59 miles de dolares

 Segundo paso:
Se halla la varianza, esta se halla tomando cada uno de los datos, menos el promedio
elevado al cuadrado. Como lo indica la formula.

2
σ 2
=
∑ ( X−μ )
n
( 25,1−42,59 )2 +(25,4−42,59)² +(26,9−42,59) ²+( 28,7−42,59)²+ …+(88,2−42,59) ²+( 99,8−42,59)²

σ 2=
20
7195,768
σ 2= =359,7884
20
σ 2=359,7884 miles de dòlares ²
 Tercer paso:
Se halla la desviación estándar
σ =√ 359,7884=18,9680
Si se tomaran los datos como una muestra

2
2
s=
∑ ( X −μ )
n−1
2 ( 25,1−42,59 )2+(25,4−42,59)²+(26,9−42,59)²+(28,7−42,59) ²+…+(88,2−42,59)² +(99,8−42,59) ²

s=
19
7195,768
s2= =378,7246
19
s2=378,7246 miles de dòlares ²
s= √378,7246=19,4608
d. ¿Qué medias de tendencia central y de dispersión se elegirían y por qué?
En cuanto a medidas de tendencia central elegiría; la media, la mediana; estas sirven como
punto de referencia para la interpretación de datos, además que se necesitan para sacar otros; en
el caso de la media es la suma de cada uno y todos los valores dividida entre el total de los datos,
sin embargo, no se debe fiar de esta únicamente para un análisis mas exacto puesto que esta
puede ser afectada por los valores de los datos extremos. La mediana; es la que ocupa el valor
central en un conjunto de datos para lo que los datos deben estar ordenados, de esta manera la
mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, es
muy recomendado y apropiado el uso de la media cunado se tienen que hacer observaciones
extremas.
En cuanto a medidas de dispersión elegiría; la varianza, deviación estándar, el rango, la
varianza y la deviación estándar se realizan de pendiendo de si los datos que se tienen son de una
población o de una muestra lo que indica que los datos obtenidos son más precisos. El rango es
la diferencia entre el mayor y el menor de los datos de una distribución estadística.
En términos generales las medidas de dispersión muestran la variabilidad de una distribución,
indicando por medio de números, se las diferentes puntuaciones de una variable están muy
alejadas de la media. Cuando mayor sea ese valor, mayor será la variabilidad, cuando menor sea,
mas homogénea será la media. Así se puede identificar si todos los datos son parecidos o si por
el contrario se evidencian grandes variaciones entre ellos.

3. La duración de las bombillas producidas por cierto fabricante tiene una media de 20000
horas y una desviación típica de 40 horas. La población sigue una distribución normal. Si
se ha comprado 9 bombillas como muestra aleatoria:
a. Hallar la varianza de la media muestral
∑ ( x−x )2
s2=
n−1
∑ ( x −x )2
σ=
n−1
σ =40 horas
σ 2=402
σ 2=1.600 horas
b. Hallar el error estándar de la media muestral
σ 40
σ x= = =13,333
√ n √9
4. En la secretaría de cierta universidad se ha comprobado que la nota media de los
candidatos para la admisión a la maestría a Matemáticas sigue una distribución normal
con desviación típica de 0,45. Se toma una muestra aleatoria de 25 solicitudes y se
obtiene una media muestral de calificaciones igual a 2,1
a. Calcule un intervalo de confianza del 95% para la media poblacional
0,95
95 %= =0,475 valor z=1,96
2
Datos:
n=25
x́=2,1
σ =0,45
1−∝=95 %
z=1,96
σ
formula: x́ ± z
√n
0,45
2,1 ±1,96
√ 25
0,45
μ=2,1± 1,96
5
μ=2,1± 1,96(0,09)
μ=2,1± 0,1764
μ=2,1+ 0,1764=2,2764
μ=2,1−0,1764=1,9236
μ=(1.9236 ; 2.2764)
b. Calcule un intervalo de confianza del 99% para la media poblacional
0,99
99 %= =0,4950 valor z=2,58
2
Datos:
n=25
x́=2,1
σ =0,45
1−∝=99 %
z=2,58
σ
formula: x́ ± z
√n
0,45
2,1 ±2,58
√ 25
0,45
μ=2,1± 2,58
5
μ=2,1± 2,58(0,09)
μ=2,1± 0,2318
μ=2,1+ 0,2318=2,3318
μ=2,1−0,2318=1,8682
μ=(1.8682 ; 2.3318)
5. Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra.
Diseña un experimento en el que se observa las tensiones de ruptura, en libras, de 16
hilos del proceso seleccionados aleatoriamente. Las tensiones son 20.8, 20.6, 21.0, 20.9,
19.9, 20.2, 19.8, 19.6, 20.9, 21.1, 20.4, 20.6, 19.7, 19.6, 20.3, 20.7. Supóngase que la
tensión de ruptura de una fibra se encuentra modelada por una distribución normal con
desviación estándar de 0.45 libras. Construir un intervalo de confianza estimado del 98%
para el valor real de la tensión de ruptura promedio de la fibra.

0,98
98 %= =0,49 valor z=2,3263
2
Datos:
n=16
x́=20.38
σ =0,45
1−∝=98 %
z=2,3263
σ
formula: x́ ± z
√n
0,45
20,38 ±2,33
√ 16
0,45
μ=20,38± 2,3263
4
μ=20,38± 2,3263(0,1125 )
μ=20,38± 0,2617
μ=20,38+0,2617=20,6417
μ=20,38−0,2617=20.1183
μ=(20.1183 ; 20.6417)
Conclusiones
El anterior trabajo fue muy importante para reforzar los conocimientos previos sobre
estadística abordados en otros cursos. Su contenido puede ser transportado al contexto real, ya
que nos enseña a la resolución de problemas estadísticos, el cual se calcula distribuciones
muéstrales y de estimación, y acertar en una probabilidad porcentual confiable de una población
utilizando intervalos, aspectos que pueden vincularse a nuestra vida cotidiana. Como futuros
licenciados en matemáticas el conocimiento y técnicas abordadas previamente nos permite o
aplicarlos en el proceso la enseñanza-aprendizaje dentro y fuera del aula a partir de una muestra
disponible para llegar inferir sobre una población.
Las medidas de tendencia central, nos permiten interpretar los valores más
representativos de los datos de acuerdo a la forma como se tienden a concentrar; la media indica
el promedio de los datos, en otras palabras, indica el valor que obtendrá cada una de las unidades
de análisis si se distribuyen los valores en partes iguales, la media indica es el valor que separa
los datos en partes iguales, cada una de las cuales cuenta con el cincuenta de por ciento de los
datos.
Se puede concluir que este trabajo es muy importante porque aporta a nuestra vida cotidiana,
ya que nos enseña a la resolución de problemas estadísticos, el cual se calcula distribuciones
muéstrales y de estimación, y acertar en una probabilidad porcentual confiable de una población
utilizando intervalos. El cual nos permite como futuros licenciados matemáticos llevarlos a cabo
dentro la enseñanza-aprendizaje de nuestros estudiantes.

Bibliografía
Alfons Sarria Arrufat, J. G. (1999). Introducción a la estadística en Psicología. Barcelona
España: Universidad de Barcelona.
Canavos, G., Meyer, P., Spiegel, M., & Mendenhall, S. (1988). Probabilidad y estadística.
Aplicaciones y métodos. Recuperado de https://gsosa61.files.wordpress.com/2008/03/10-
canavos-g-probabilidad-y-estadistica-aplicaciones-y-metodos.pdf
Herrerias Pleguezuelo , R., & Palacios Gonzalez, F. (2007). Cursom de Inferencia Estadistica y
Del Modelo Lineal Simple . Madrid España: DELTA.
López Casuso, R. (2006). Calculo de Probabilidades e Inferencia Estadistica con topicos de
Econometria. Caracas - Venezuela: UCAB.
Mark L. Berenson, D. M. (2006). ESTADISTICA PARA ADMINISTRACION. Mexico: Pearson
Educación.
Sáez, A. (2010). Métodos Estadísticos con R y R Commander, Universidad de Jaen,. Recuperado
de https://cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf
Vicente Manzano Arrondo – 2012-2014. Estimación estadística, recuperado de;
http://asignatura.us.es/dadpsico/apuntes/EstimacionEstadistica.pdf
Wackerly, D., Mendenhall, W., & Scheaffer, R. (2009). Wackerly, D.D. and Mendenhall, W. and
Scheaffer, R.L. Estadística Matemática Con Aplicaciones, Séptima Edición, Cengage Learning.
Recuperado de https://docs.google.com/viewer?
a=v&pid=sites&srcid=Y2llbmNpYXMudW5hbS5teHxtLWVzdGFkaXN0aWNhMXk
WedGrafia
https://moodle2.unid.edu.mx/dts_cursos_mdl/pos/ME/TD/AM/07/La_distribucion_normal.pdf
https://www.youtube.com/watch?v=CuKr7GzohbI
https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/
https://www.youtube.com/watch?v=VTTqr5cAzvw
https://es.khanacademy.org/math/statistics-probability/sampling-distributions-library
https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png
https://es.slideshare.net/djpachoncito/distribucion-normal-por-wallter-lopez
https://economipedia.com/definiciones/intervalo-de-confianza.html
https://www.uv.es/webgid/Inferencial/5_estimacin_por_intervalos.html#:~:text=b)%20Si%20conoci
%C3%A9ramos%20el%20valor,se%20establece%20alrededor%20del%20estimador.

Final Inferencia-Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Final Inferencia-Estadistica

Cargado por

Copyright:

Formatos disponibles

Paso 2 actividades sobre distribuciones muéstrales y estimación

Universidad Nacional Abierta y a Distancia UNAD

permiten recolectar, organizar, calcular, analizar y formular conclusiones, encontrando las

principales características de una variable en grupo de individuos o de cualquier situación que

En el presente trabajo abordaremos contenidos asociados con la estadística inferencial

muestra. El muestreo es uno de los principales aspectos a considerar en la prueba de hipótesis.

A continuación, se relacionan conceptos que van desde la medida de tendencia central a

cada uno de los conceptos expuestos.

Estudiar conceptos básicos y propiedades de la estadística inferencial, para poder

resolución de situaciones del contexto real.

1. Consultar propiedades de las diferentes distribuciones muéstrales.

2. Reconocer propiedades y características de las diferentes distribuciones muéstrales.

3. Resolver ejercicios donde intervengan media, mediana y moda.

1.1. Distribución de muestreo, distribución normal y distribución de probabilidad

Teoría Del Muestreo

Uno de los propósitos de la estadística inferencial es estimar las características

poblacionales desconocidas, Mirar la información obtenida de una muestra, de una población. El

Se seguirán ciertos procedimientos de selección para asegurar de que las muestras

reflejen observaciones a la población de la que proceden

observa. Una muestra es un subconjunto de observaciones seleccionadas de una población.

Errores en el Muestreo Errores en el Muestreo Cuando se utilizan valores muéstrales

generales de errores: El error muestral y El error no muestral.

El error muestral se refiere a la variación natural existente entre muestras tomadas de la

pueden clasificarse como errores muéstrales y se denominan errores no muéstrales. El sesgo de

sistemática inherente a un método de muestreo que da estimaciones de un parámetro que son, en

suprimirse, o minimizarse, usando la aleatorización.

La aleatorización se refiere a cualquier proceso de selección de una n muestra de la

procedimientos aleatorios se llama muestra aleatoria muestra aleatoria.

Los tipos más comunes de técnicas de muestreo aleatorios son:

 El muestreo aleatorio simple.

 El muestreo por conglomerados

tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

acercarse al parámetro de la población.

también denominada error típico.

 Si el tamaño de la muestra es lo suficientemente grande las distribuciones muestrales son

normales y en esto se basarán todos los resultados que se encuentren.

1.2. Desviación típica

Conocida como desviación estándar y representada de manera abreviada por la letra

en algunos textos traducidos del inglés).

Es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto

La desviación estándar de una variable aleatoria, población estadística, conjunto de datos

o distribución de probabilidad es la raíz cuadrada de su varianza. Es algebráicamente más simple,

los datos a partir de los que se calcula.

La desviación estándar se usa comúnmente para medir la fiabilidad de las conclusiones

estadísticas. Como el margen de error en los datos de los sondeos de opinión.

La desviación estándar se denomina "error estándar" de la estimación o "error estándar de

y se calculase la media para cada muestra.

La desviación estándar de una población y el error estándar de una estadística obtenida a

(relacionados por la inversa de la raíz cuadrada del número de observaciones).

alternativamente, del producto de la desviación estándar de la población y la inversa de la raíz

cuadrada del tamaño de la muestra, que es lo mismo) y es por lo general, aproximadamente el

desviación estándar de la muestra o desviación estándar muestral, puede referirse a la cantidad

de la desviación estándar de toda la población).

1.3.1. Distribución normal

(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más

profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más

comúnmente, como la "campana de Gauss". La distribución de una variable normal está

completamente determinada por dos parámetros, su media y su desviación estándar, denotadas

Imagen 1. Campana de Gauss

Imagen 1. Campana de Gauss Tomada de: https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png

Formula de la Distribución Normal

 Muchas variables continuas en el mundo de los negocios tienen distribuciones que se

asemejan estrechamente a la distribución normal.