Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Paso 3 - Grupo - 551112 - 7
Paso 3 - Grupo - 551112 - 7
Autores
GRUPO
551112_7
Tutor(a)
María Camila González
Inferencia estadística
INTRODUCCIÓN
involucrando los términos de variabilidad estadística, correspondiente en cada caso que permitan
su adecuada interpretación, para ello los integrantes del grupo consultan la definición,
propiedades, cuando o para qué se utilizan las palabras claves de la temática, y realizan los cinco
Para una adecuada consulta de los términos debemos tener claro, que el objetivo de la inferencia
“Un estimador es una regla, a menudo expresada como una fórmula, que indica cómo calcular el
valor de una estimación con base en las mediciones contenidas en una muestra.” (Wackerly,
ESTIMACIÓN
Los fenómenos que se observan sometidos al azar no suelen ser constantes, por lo que
será necesario que junto a una medida que indique el valor alrededor del cual se agrupan los
datos, se disponga de una medida que haga referencia a la variabilidad que refleje dicha
fluctuación. En este sentido pueden examinarse varias características, siendo las más
comunes: la tendencia central de los datos, la dispersión o variación con respecto a este
centro, los datos que ocupan ciertas posiciones, la simetría de los datos y la forma en la que
Según información recopilada por Zap (2012): “Un parámetro estadístico es un número que se
obtiene a partir de los datos de una distribución estadística, sirven para sintetizar la información
dada por una tabla o por una gráfica., existen tres tipos: de centralización, de posición y de
dispersión”
Los parámetros estadísticos se clasifican según la información que resumen. Los dos tipos más
parámetros estadísticos son aquellos de forma y escala. Estos parámetros son más utilizados en
distribuciones como la Beta, Pareto o Weibull —por lo tanto, no las describiremos ya que nos
Estos parámetros nos indican alrededor de qué valor (centro) se distribuyen los datos.
Algunas medidas de tendencia central son (al dar clic en el enlace podrás ver una descripción
detallada de cada parámetro):
Media aritmética:
La mediana es el valor que separa la mitad superior de la muestra y la inferior. En otras palabras,
divide los datos en dos partes iguales.
Moda:
La moda es el valor que más se repite en una muestra. Es decir, es el valor más frecuente.
(Superprof, s.f.)
estudio de una muestra de una población se quiere generalizar las conclusiones al total de
la misma. (…) Existen dos tipos de estimaciones para parámetros; puntuales y por
intervalo. Una estimación puntual es un único valor estadístico y se usa para estimar un
la población.
“Un estimador es una regla, a menudo expresada como una fórmula, que indica cómo
calcular el valor de una estimación con base en las mediciones contenidas en una
La estimación puntual consiste en tomar un solo punto o un solo número como resultado de
que la altura promedio de todas las estudiantes de la UNAD se estima en 1,63 metros.
La estimación real es aquella en la que se usa una formula estadística establecida como un
estimador del parámetro escogido, por ejemplo, se puede usar la fórmula de la desviación
s=
√ ∑ (x i− x́ )2
i=1
n−1
“la estimación real se logra con el uso de un estimador del parámetro objetivo.”
El estimador del parámetro objetivo, es una formula estadística que realiza una estimación
objetivo es la desviación.
La Media poblacional
t ∝ ∗s
poblacional está centrado en la media muestral; siendo sus límites, superior e inferior, x´± 2
√n
Student con n−1 grados de libertad. En la práctica si n es moderadamente grande el valor crítico
t ∝ es igual a 1,64 para un intervalo del 90% de confianza, 1,96 para el 95%, o 2,58 para el 99%.
2
desviación estándar.
- Varianza muestral: s2
- Varianza poblacional: σ 2
Desviación Estándar, Primero, debemos comprender con claridad que la desviación estándar
mide la variación entre los valores. Los valores cercanos producirán una desviación estándar
pequeña, mientras que los valores muy dispersos producirán una desviación estándar más grande.
Una herramienta rudimentaria pero sencilla para comprender la desviación estándar es la regla
práctica del intervalo, que se basa en el principio de que, para muchos conjuntos de datos, la
vasta mayoría (tanto como el 95%) de los valores muestrales se ubican dentro de dos
establecer, a partir de un estadístico, una cierta región en donde, con un nivel de certeza
esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un
estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la esperanza
del estimador sea igual al valor del parámetro que se desea estimar.
El estimador puntual de un parámetro es una fórmula que permite observar en una muestra
E ( θ^ ) =θ
A partir de la formula anterior se puede calcular el sesgo del estimador, esto es cuando
B ( θ^ )=E ( θ^ )−θ
Ahora según Wackerly, Mendenhall, & Scheaffer (2009), el Error cuadrático medio de
2
MSE ( θ^ )=E [ ( θ−θ)
^ ]
Que calcula el valor esperado del cuadrado de la diferencia del estimador y el valor del
parámetro estimado.
esperanza (o valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es
deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser
El error estándar de la media (llamado en inglés "standard error of the mean" (SEM))
cuantifica4 las oscilaciones de la media muestral (media obtenida en los datos) alrededor de
S
muestra (suponiendo independencia estadística de los valores en la muestra): S E X́ =
√n
donde
estándar de la población).
Teoremas de esperanza:
Los teoremas de esperanza se refieren a las propiedades del valor esperado, recuérdese
E(x)=∑_(j=1)^m▒x_j P(x_j)
Ahora según Wackerly, Mendenhall, & Scheaffer (2009), los teoremas de esperanza son
los siguientes:
E(x+c)=E(x)+E(c)=E(x)+c
E(x+y)=E(x)+E(y)
E(cx)=cE(x)
E(ax+by)=aE(x)+bE(y)
El error, es una unidad de medida que está en las mismas unidades de medida de la
variable.
11
un parámetro, más estrecho deberá ser el intervalo de confianza y, por tanto, menor el
Si la variación debida al error (representada por CME) es pequeña, significa que el error
regresión (la recta), representado por CMR; por el contrario, si la estimación es pobre,
CME (variación debida al error) debe ser grande en comparación con CMR.
Se debe trabajar con una población, una muestra: los n elementos observados; y una
n
n n−∑ x 1
θ ∑ x 1 ( 1−θ ) 1
es conocer el valor θ.
1
En estadística, se llama intervalo de confianza a un par o varios pares de números entre los
cuales se estima que estará cierto valor desconocido con un determinado nivel de confianza.
Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una
aleatorio o nivel de significación, esto es, el número de intervalos sobre 100 que no contienen
el valor1.
El intervalo de confianza está determinado por dos valores dentro de los cuales afirmamos
que está el verdadero parámetro con cierta probabilidad. Son unos límites o margen de
variabilidad que damos al valor estimado, para poder afirmar, bajo un criterio de
probabilidad, que el verdadero valor no los rebasará. Es una expresión del tipo
estimado con una determinada certeza o nivel de confianza. Dada una familia de
puede alcanzar el valor 1−αy que en caso contrario la probabilidad del primer miembro es el
valor más próximo a 1−αpor exceso que sea posible, con el fin de no aumentar innecesariamente
13
permite acotar un par o varios pares de valores, (uno superior y otro inferior) dentro de los cuales
Propiedades
utilizado para calcular el valor muestral, este se acercará más o menos al verdadero
parámetro poblacional.
probabilidad que existe de que el valor poblacional esté fuera de nuestro intervalo.
El límite de confianza se utiliza para dar una estimación puntual del parámetro poblacional, Nos
EL COEFICIENTE DE CONFIANZA
Coeficiente de confianza (p) se designa mediante 1 − α, y se suele tomar en tanto por ciento.
se utiliza para saber en qué porcentaje de casos nuestra estimación acierta con la realidad
Bajo las suposiciones anteriores, es posible construir un intervalo de confianza asintótico y con
donde los valores de zα/2 se calculan a partir de la distribución N (0, 1) de forma que P(|Z| > zα/2)
= α.
Ejemplo
Dada una m.a.s. de tamaño n de una población uniforme(0 , θ), para determinar un intervalo de
grado de confianza1 -α para θ , se puede emplear el estadístico suficiente T =x(n) , cuya función
de distribución es
0 si t ≤ 0
{( )
f ( t /θ )= t
θ
n
si 0≤ t ≤ θ
1 si t ≥ θ
16
Con a 1 ∈ [ 0 , α ] de donde
Gráficamente, véase la Figura 4.2.4, las funciones son rectas que pasan por el origen; si se
igualan
−1
n
θ(¿ T ( x 1 , … x n))= X (n )(1−( α−a 1)) ¿
17
−1
n
θ(T (x 1 ,… x n ))= X (n ) a 1
−1 −1
(
En definitiva X (n ) ( 1−( α −a1 ) ) n
, X (n ) a 1 n
) en un intervalo para
θ de grado de confianza 1−a .
−1
IC 1−a ( θ )=( x ( n) , X (n ) a n )
T n −θ
{
P −z a <
2
<z Iθ
σ n ( θ ) a2 } 1−a
α
con z α tal que Ф ( z α ) = 1 - donde Ф es la función de distribución de la v.a. N (0 , 1) . Si la
2 2 2
relación anterior puede invertirse, se podrá utilizar para determinar un intervalo de confianza
para θ. Nótese que si la ecuación de verosimilitud tiene una única raíz θ^n puede tomarse T n=θ^n la
18
1 ^ .s.θ
sucesión consistente de raices y σ^n ( θ ) = que, sí es una función continua, como θn c → ,
√1
¿ (θ)
Ejemplo
1
P {|X − y|<k √ θ Iθ } ≥ ,
k2
Permite obtener
1
P {|X −θ|< k √θ Iθ } ≥ 1− ,
k2
−1
Así si se hace 1 =1−α y se aproxima θ por x́ se obtiene el intervalo de confianza
k2
aproximado para θ
C 1−a ( θ ) ¿
Según Wackerly, Mendenhall, & Scheaffer (2009) el método del pivote es un método que
sirve para encontrar intervalos de confianza, determinando una cantidad que actué como
1. Que sea una función continua de las medidas muestrales y el parámetro desconocido.
desconocido.
19
A partir de la información del peso de los estudiantes de la UNAD, se tiene que la media
hipótesis:
H 0= x́ ≠ μ
H 1=x́=μ
^Z = x́−μ =−3,6363
σ /√n
1. Se toma una muestra aleatoria de ocho casas en la ciudad de Londres, los precios de
venta de estas casas son (en miles de libras):
92 83 112 127 109 96 102 90
20
Media
X́ =
∑ fi
n
92+ 166+336+508+545+576+ 714+720
X́ =
8
X́ =101.37
varianza
2
S=
∑ X 2i. F i − X́ 2
N
92+332+1008+2032+2725+3456+ 4977+5760
S2 = −(101.37)2
811
20382
S2 = −10275.87
811
S2=10250.74
Desviación típica
21
∑ X 2i . F i − X́ 2
S=
√ N
S= √ 10250.74
S=101.25
79 73 68 77 86 71 69
95% para la velocidad media de los automóviles que circulan por dicho tramo
Solución
Datos
n=7
x́=¿ 74.7
s2=40.9
Media
x́=
∑x
n
22
Varianza
2 ∑ ( x−x )2
s=
n−1
b. Suponiendo que la distribución es normal, hallar un intervalo de confianza del 95% para la
Solución
Z α =Z ± 0,025=±1,96
±
2
s2=40.9
s= √ 40.9=6.4
23
Entonces tenemos
σ =6.4
n=7
x́=¿ 74.7
Ahora la función pivotal para una población con distribución normal es:
x́−μ 74,7−μ
Z= =
σ / √ n 6,4 / √ 7
74.7−μ
Z=
6.4/2.64
2,1−μ
(
Así que P (−1,96 ≤ Z ≤ 1,96 )=P −1,96 ≤
0,45/5 )
≤1,96 =0,95.
Se tiene que:
(
P −1,96 ≤
6,4
) (
≤1,96 =P −1,96
2,64
≤ 74,7−μ ≤ 1,96
2,64 )
2,64
6,4 6,4
(
¿ P −1,96
2,64
−74,7 ≤−μ ≤ 1,96
2,64 )
−74,7 = 0,95
6,4 6,4
(
¿ P 1,96
2,64
+74,7 ≥ μ ≥−1,96
2,64 )
+74,7 =0,95
El intervalo de confianza del 95% para la velocidad media de los automóviles que circulan
para la admisión a la maestría a Matemáticas sigue una distribución normal con desviación típica
de 0,45. Se toma una muestra aleatoria de 25 solicitudes y se obtiene una media muestral de
Solución:
σ =0,45
n=25
x́=2,1
Z α =Z ± 0,025=±1,96
±
2
x́−μ 2,1−μ
Ahora la función pivotal para una población con distribución normal es: Z= = .
σ / √ n 0,45/5
25
2,1−μ
(
Así que P (−1,96 ≤ Z ≤ 1,96 )=P −1,96 ≤
0,45/5 )
≤1,96 =0,95.
Y considerando lo siguiente:
“Si Y es cualquier variable aleatoria, c > 0 es una constante y P(a ≤ Y ≤b)=.7; entonces
P(a+ d ≤ Y +d ≤ b+d )=.7. Esto es, la probabilidad del evento (a ≤ Y ≤b) no resulta
afectada por un cambio de escala o una traslación de Y.” (Wackerly, Mendenhall, &
Se tiene que:
Así el intervalo de confianza del 95% para la media poblacional es: ( 2,2764 ≥ μ ≥1,9236 )
Z α =Z ± 0,005=±2,575
±
2
x́−μ 2,1−μ
Ahora la función pivotal para una población con distribución normal es: Z= = .
σ / √ n 0,45/5
Así que
Así el intervalo de confianza del 99% para la media poblacional es: ( 2,33175 ≥ μ ≥ 1,86824 )
50 casos. Con un nivel de confianza del 92%, estime el porcentaje de efectividad del
proporción está dado por p=x /n, donde x es el número de éxitos en n pruebas.
Datos:
n=64
x=50
p=x /n=50/64=0,78125=78,125 %
q=1− p=1−0,78125=0,21875=21,875 %
1−∝=0,92
∝=1−0,92=0,08
z α (0,92)=1,75
µ=np=(64)(0,78125)=50
p(1− p)
p ± zα
√ n
50
Para la proporción muestral p= =0,78125 , elintervalo de confianza es :
64
0,78125 ( 1−0,78125 )
0,78125 ±1,75∗
√ 64
→ 0,78125± 0,09043
0,78125+0,09043=0,87168
0,78125−0,09043=0,69082
R/: Se puede afirmar que el tratamiento será efectivo entre el 69,082% y el 87,168% de los
casos, con un margen de error del 8%, puesto que el nivel de confianza es del 92%.
e infinita, sabemos que los límites del intervalo confidencial de estimación de la media
t ∝ ∗s ' t ∝ ∗s'
n−1 , n−1 ,
2 2
x́− , x́ + =(1,28; 18,72)
√n √n
Utilizamos la las Tablas de la t de Student para obtener el valor:
t ∝ =t 0,05 =2,178792
n−1 , 12 ,
2 2
t ∝ ∗s'
n−1 ,
2 2,178792∗s '
x́ + =8,72+ =18,72
√n √ 13
2,178792∗s'
=10
√13
10 √ 13
s' = =16,548
2,178792
29
Referencias bibliográficas
Abreu, J. (2012). Hipótesis, método & diseño de investigación (hypothesis, method & research
design). Daena: International Journal of Good Conscience, 7(2), 187-197. Recuperado de
http://www.spentamexico.org/v7-n2/7(2)187-197.pdf
Alvarado, J. (2008).Fundamento de inferencial estadística. Bogotá. Editorial Pontifica
Universitaria Javeriana. Recuperado de: https://books.google.com/books?
isbn=9587160940
Canavos, G., Meyer, P., Spiegel, M., & Mendenhall, S. (1988). Probabilidad y estadística.
Aplicaciones y métodos. Recuperado de https://gsosa61.files.wordpress.com/2008/03/10-
canavos-g-probabilidad-y-estadistica-aplicaciones-y-metodos.pdf
Esperanza matemática. (s.f.). En Wikipedia. Recuperado el 4 de marzo de 2020 de
https://es.wikipedia.org/wiki/Esperanza_matem%C3%A1tica
EStadistica (s.f.) Medidas de variación. Recuperado de
http://sgpwe.izt.uam.mx/files/users/uami/lrm/Estadistica/Extractos/Triola_medidas_dispe
rsion.pdf
Gómez, M. (2005). Inferencia estadística. Editorial Ediciones Díaz de Santos. Recuperado de
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?
docID=10156663&p00=inferencia+estadistica
Sáez, A. (2010). Métodos Estadísticos con R y R Commander, Universidad de Jaen,. Recuperado
de https://cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf
Sánchez, J. (2017). Introducción a la Inferencia. Recuperado de
http://hdl.handle.net/10596/10539
Superprof (s.f.) Parámetros estadísticos descriptivos Recuperado de
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/parametros-
estadisticos.html
UB (s.f.) Media poblacional. Recuperado de http://www.ub.edu/aplica_infor/spss/cap4-2.htm
Wackerly, D., Mendenhall, W., & Scheaffer, R. (2009). Wackerly, D.D. and Mendenhall, W. and
Scheaffer, R.L. Estadística Matemática Con Aplicaciones, Séptima Edición, Cengage
Learning. Obtenido de https://docs.google.com/viewer?
30
a=v&pid=sites&srcid=Y2llbmNpYXMudW5hbS5teHxtLWVzdGFkaXN0aWNhMXkyf
Gd4OjQyZDI5ZDE1ZjE2MjhhNzg
Wikipedia (s.f.) Estimador. Recuperado de https://es.wikipedia.org/wiki/Estimador#Sesgo
Wikipedia, Intervalo de confianza, recuperado de
https://es.wikipedia.org/wiki/Intervalo_de_confianza
Zap, M. (2012) Definición de parámetro estadístico. Recuperado de
https://es.scribd.com/doc/81214981/Definicion-de-parametro-estadistico