Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CATEDRA: ESTADISTICA II
SECCION: 304A1
AUTORES:
La estadística ha estado presente desde hace siglos atrás con las antiguas civilizaciones, su uso ha
sido necesario en primeras instancias para resolver casos de la vida diaria por llamarlo de alguna
manera, luego sería empleada con fines a mayor escala como trabajos investigativos o estudios, y
ha adquirido relevancia, ya que por medio de ella se puede procesar una extensa información, lo
cual se puede llevar a cabo de forma más sencilla sin pasar a ser algo tedioso.
Tanto así es su importancia que ha dejado de ser solo una parte de las matemáticas y se ha
convertido en una ciencia empleada en diferentes campos, pues han tomado sus métodos para
aplicarlos a sus aéreas independientemente de la que sea, como por ejemplo: la psicología, la
medicina, la contaduría, administración, entre otras.
La significación de la estadística es posibles gracias a que los métodos que la acompañan son
reconocidos por su gran confiabilidad y validez, son totalmente apropiados para manejar
información.
Es por ello, que el siguiente trabajo monográfico planteara los diversos conceptos sobre nivel de
confianza, media y varianza de una población; incluyendo aportes ejemplificados para manejar
adecuadamente la estimaciones y los cálculos pertinentes de los conceptos antes mencionados.
Además, teniendo en cuenta que nos encontramos en una época en donde lo tecnológico tiene gran
influencia en la vida diaria de cada persona, la estadística también ha hecho uso de lo
computacional, para hacer mucho más sencillo el trabajo de procesar tanta información, donde
podemos hacer uso de distintos sistemas (ejemplo el Windows), junto con los programas que
ofrece, entre ellos: Microsoft Word, Power Point, Excel, entre otros, realizando diversos trabajos
estadísticos, ya que nos facilita cálculos, así como la construcción de tablas y gráficos, necesarios
en la estadística. También tenemos a nuestro alcance el internet que nos permite encontrar
información desde cualquier parte del mundo.
DESARROLLO DE LOS CONTENIDOS
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la
población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea
horizontal contienen el valor de la media de la población. El intervalo de confianza rojo que está
completamente por debajo de la línea horizontal no lo contiene. Un nivel de confianza de 95%
indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza
que incluirán el parámetro de población.
Para estimar la media poblacional por medio de intervalos de confianza, será necesario recordar
que el Teorema Central del Límite nos daba información de cómo se hallaban distribuidas las
medias muestrales: "normalmente" con una media igual a la de la población original (que es la
que ahora tratamos de conocer) y desviación típica:
Ejemplo:
Supongamos que hemos analizado la muestra ya nombrada de media Km., y que sabemos
que la desv. Típica de la población es de 0,4 km, y que nos planteamos estimar la media de todo
el instituto, con un nivel de confianza del 95%. El proceso para realizar la estimación es el
siguiente:
Sabemos por el T.C.L. que las medias muestrales se distribuyen según
( - E, + E)
1) Estimación puntual
μ1 − μ2 = x̅1 − x̅2
2) Estimación intervalica
Ejemplo:
El banco del Estado de Rio desea estimar la diferencia entre las medias de los saldos de las tarjetas
de crédito de dos de sus sucursales. Una muestra independiente de tarjetahabitantes generaron los
resultados que aparecen en la siguiente tabla. Determine un intervalo de confianza de 99% para la
diferencia entre las medias de los saldos.
Sucursal 1:
n1 = 32
x̅1 = $ 500
δ1 = $ 150
Sucursal 2:
n2 = 36
x̅2 = $ 375
δ2 = $ 130
(150)2 (130)2
̂ μ2 = P (500 − 375) ± 1.65 √
μ1 − +
32 36
μ1 −
̂ μ2 = 125 ± 1.65 ∗ 34.24
μ1 −
̂ μ2 = 125 ± 56.5
68.5 < μ1 −
̂ μ2 < 181.5
Interpretación:
El intervalo de confianza de 99% para la diferencia entre las medias de los saldos oscila entre 68.5
y 181.5.
Ejemplo:
Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que
las de los que aprueban inglés?
Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una
reacción adversa que el de los usuarios del fármaco B que también presentan una
reacción de ese tipo?
Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales?
Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la
máquina A a los que genera la máquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal
para tamaños de muestra grande (n1p1 5, n1q1 5, n2p2 5 y n2q2 5). Entonces p1 y p2 tienen
distribuciones muestrales aproximadamente normales, así que su diferencia p1-p2 también tiene
una distribución muestral aproximadamente normal.
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5
objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada
máquina:
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
a. p (p2-p1 0.10) =?
Otra manera de hacer este ejercicio es poner P1-P2:
b. p(p1-p2
0.15)=?
1) Estimación puntual:
σ2 = δ2
̂
2) Estimación intervalica:
(n − 1)δ2 (n − 1)δ2
P( 2 ̂2 < − 2
<σ )=1−α
x(n−1,1−α) x(n−1,1−α)
2 2
Ejemplo
n = 20
δ2 = 0.0015
−α = 0.10
2
P (x19 < a) = 0.05 a = 23.68
2
P (x19 < b) = 0.95 b = 10.117
(21−1)0.00153 (21−1)0.00153
P( ̂2 < −
<σ )= 1−α
23.68 10.117
̂2 < 0.0289)
(0.0123 < σ
El procedimiento estadístico usual para comparar dos varianzas de población σ12 y σ22 hace una
inferencia acerca del cociente o razón σ12 /σ22 . Esto se hace porque la distribución de
muestreo del estimador de σ12 /σ22 es bien conocido cuando las muestras se seleccionan de
forma aleatoria e independiente de dos poblaciones normales. Con estos supuestos, un
X2 / V
intervalo de confianza para σ12 /σ22 se basa en la estadística del pivote: F = X12 / V1 donde
2 2
X12 y X22 son variables aleatorias ji cuadrada con V1 = (n1 − 1) y V2 = (n2 − 1) grados de
(n−1)s2
libertad, respectivamente. Si sustituimos: X 2 = σ2
(n1 −1)s2
1 /(n −1)
1
X21 / V1 σ21 s21 ⁄σ21 s21 σ22
F= = (n2 −1)s2
= = 2 ∗
X22 / V2 2 /(n −1) s22 ⁄σ22 s2 σ21
2
σ22
A continuación se muestra una parte de las tablas de distribución F con V1 = (n1 − 1) grados de
libertad del numerador y V2 = (n2 − 1) grados de libertad del denominador. Una distribución F
puede ser simétrica alrededor de su media, segada a la izquierda o segada a la derecha; su forma
exacta depende de los grados de libertad asociados a s12 y s22 , es decir (n1 − 1) y (n2 − 1). A fin
de establecer límites de confianza superiores e inferiores para σ12 /σ22 , debemos ser capaces de
encontrar valores tabulados de F que correspondan a las áreas de cola de la distribución. Los
valores F de cola superior se pueden encontrar en tablas para = 0.10, 0.05, 0.025 y 0.01. Las
columnas de las tablas, corresponden a distintos grados de libertad de la varianza de muestra del
numerador, s12 en la estadística de pivote, en tanto que las filas corresponden a los grados de
libertad del numerador s22 . Por ejemplo, para un intervalo de confianza del 90%( es decir /2 =
5% o 0.05), con V1 = 7 grados de libertad del numerador, y V1 = 9 grados de libertad del
denominador: V.05 = 3.29.
Así pues = 0.05 es el área de cola a la derecha de 3.29 Los valores de cola inferior de la
distribución F no se dan en las tablas, sin embargo puede demostrarse.
Ejemplo:
La tasa de decesos por cáncer en ciudades con agua Fluorizada y No Fluorizada se
muestran a continuación (una muestra de las 10 ciudades más grandes de cada grupo).
Establezca un intervalo de confianza del 95% para la razón de las varianzas de los
incrementos en las tasas de decesos en los dos grupos de ciudades. Con base en el
intervalo, ¿hay indicios de que se satisfaga el supuesto de varianzas iguales necesario para
comprobar el posible vínculo entre el contenido de Fluoruro del agua potable y el cáncer.
Boston = 1.7358
Seattle = 0.4923
Cincinnati = 4.0155
Atlanta = -1.1744
Columbus = 1.7451
Newark = -0.5676
Portland = 2.4471
Solución:
Utilizando cualquier herramienta disponible calculamos las varianzas, en este caso se puede
utilizar la calculadora para la desviación estándar y elevarla al cuadrado.
Así:
S12 = 2.7526
S22 = 2.4293
V1 = (10 − 1) = 9 g. l ; y V2 = (10 − 1) = 9 g. l
Para 1 – α = 95%, el valor de α/2 = 0.025 y necesitamos obtener F.025(V1 ,V2 ) y F.025(V2 ,V1 ) ,
entonces: F.025(9,9) = 4.03 y F.025(9,9) = 4.03 (quedan igual por ser muestras del mismo
tamaño).
“Si, ya que en el intervalo se encuentra el valor, lo que significa que ambas varianzas son
iguales, y por lo tanto, no hay diferencia en la dos poblaciones, es decir, en los decesos por
cáncer existe un 95% de probabilidad de que no se deba al agua fluorizada”.
CONCLUSIONES
Dentro de una planificación ambiental los datos estadísticos y los cálculos de media y varianza juegan
un papel muy importante, pues nos van a determinar en primera medida valores de suma relevancia y
nos garantizara la eficiencia. Este trabajo permite desarrollar la estipulación y análisis de resultados
pues mediante la información planteada se fija como trabajar con casos reales teóricos y asignarle
datos numéricos o cuantificarlos. Llevar un buen registro de datos estadísticos nos permite conocer de
mejor manera el problema, cuando nosotros conocemos la realidad de nuestras áreas afectadas; es más
fácil dar soluciones.
Los diferentes conceptos estudiados nos permiten prever eventos que puedan ocurrir, teniendo en
cuenta lo que ha sucedido anteriormente (datos históricos). Una de las técnicas más utilizadas dentro
de la estadística es la medición de parámetros. Lo cual nos permite centrar el problema y plantear
puntos de referencia. Para desarrollar un buen proyecto siempre es necesario conocer las bases
estadísticas del lugar donde vayamos a trabajar. Conocer la teoría nos ayuda a enfocar soluciones y
conocer la realidad nos ayuda a contextualizar y a diferenciar soluciones.