Está en la página 1de 17

REPUBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD PRIVADA “JOSE ANTONIO PAEZ”

CATEDRA: ESTADISTICA II

MEDIA Y VARIANZA DE UNA POBLACION

SECCION: 304A1

PROFESOR (A): CARMELO PARRA

AUTORES:

 LINAREZ, KARLA C. I: 26.035.090


 ROJAS, ADNIEL C. I: 26.661.193
 TAMAYO, WILKENIA C. I: 26.699.220
 VELEZ, LUIS C. I: 24.423.489

SAN DIEGO, OCTUBRE DE 2019


INTRODUCCION

La estadística ha estado presente desde hace siglos atrás con las antiguas civilizaciones, su uso ha
sido necesario en primeras instancias para resolver casos de la vida diaria por llamarlo de alguna
manera, luego sería empleada con fines a mayor escala como trabajos investigativos o estudios, y
ha adquirido relevancia, ya que por medio de ella se puede procesar una extensa información, lo
cual se puede llevar a cabo de forma más sencilla sin pasar a ser algo tedioso.

Tanto así es su importancia que ha dejado de ser solo una parte de las matemáticas y se ha
convertido en una ciencia empleada en diferentes campos, pues han tomado sus métodos para
aplicarlos a sus aéreas independientemente de la que sea, como por ejemplo: la psicología, la
medicina, la contaduría, administración, entre otras.

La significación de la estadística es posibles gracias a que los métodos que la acompañan son
reconocidos por su gran confiabilidad y validez, son totalmente apropiados para manejar
información.
Es por ello, que el siguiente trabajo monográfico planteara los diversos conceptos sobre nivel de
confianza, media y varianza de una población; incluyendo aportes ejemplificados para manejar
adecuadamente la estimaciones y los cálculos pertinentes de los conceptos antes mencionados.

Además, teniendo en cuenta que nos encontramos en una época en donde lo tecnológico tiene gran
influencia en la vida diaria de cada persona, la estadística también ha hecho uso de lo
computacional, para hacer mucho más sencillo el trabajo de procesar tanta información, donde
podemos hacer uso de distintos sistemas (ejemplo el Windows), junto con los programas que
ofrece, entre ellos: Microsoft Word, Power Point, Excel, entre otros, realizando diversos trabajos
estadísticos, ya que nos facilita cálculos, así como la construcción de tablas y gráficos, necesarios
en la estadística. También tenemos a nuestro alcance el internet que nos permite encontrar
información desde cualquier parte del mundo.
DESARROLLO DE LOS CONTENIDOS

1-. Nivel de confianza:

El nivel de confianza representa el porcentaje de intervalos que incluirían el parámetro de


población si usted tomara muestras de la misma población una y otra vez. Por lo general, un
nivel de confianza de 95% funciona adecuadamente. Esto indica que si usted recogió cien
muestras y creó cien intervalos de confianza de 95%, cabría esperar que aproximadamente 95%
de los intervalos incluyeran el parámetro de población, tal como la media de la población, como
se muestra en la siguiente figura.

En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la
población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea
horizontal contienen el valor de la media de la población. El intervalo de confianza rojo que está
completamente por debajo de la línea horizontal no lo contiene. Un nivel de confianza de 95%
indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza
que incluirán el parámetro de población.

2-. Estimación media de una población:

Para estimar la media poblacional por medio de intervalos de confianza, será necesario recordar
que el Teorema Central del Límite nos daba información de cómo se hallaban distribuidas las
medias muestrales: "normalmente" con una media igual a la de la población original (que es la
que ahora tratamos de conocer) y desviación típica:
Ejemplo:

Supongamos que hemos analizado la muestra ya nombrada de media Km., y que sabemos
que la desv. Típica de la población es de 0,4 km, y que nos planteamos estimar la media de todo
el instituto, con un nivel de confianza del 95%. El proceso para realizar la estimación es el
siguiente:
Sabemos por el T.C.L. que las medias muestrales se distribuyen según

La siguiente figura nos ilustrará:

Hallamos el valor k de forma que p(-k<Z<k)=0,95, o lo que es lo mismo p(Z<k)=0,975.


Consultando nuestra tabla de la distribución normal, encontraremos que k=1.96.
Este valor nos dice que la medias muestrales se encuentran en un 95% de los casos como
máximo a 1.96 desviaciones típicas de la media buscada, es decir, nuestra media , en un
95% de los casos, dista de la media poblacional menos de 1,96.
0,063=0,124 km.
Si tomamos un intervalo con centro en dicha media muestral, y radio 0,124, en un 95% de los
casos la media buscada estará dentro del intervalo.
Encontramos por tanto que a un nivel de confianza del 95%, la media poblacional es de 3 km.
con un error máximo de
O lo que es lo mismo, existe una probabilidad del 95%, de que la media buscada se encuentre en
el intervalo de confianza (3-0,124, 3+0,124) = (2,976, 3,124).
Así pues en general para un proceso de estimación de la media, el intervalo de confianza será:

( - E, + E)

Siendo la media de la muestra, y el error de estimación.

3-. Estimación de la diferencia entre las medias de dos poblaciones:

1) Estimación puntual

μ1 − μ2 = x̅1 − x̅2

2) Estimación intervalica

Cuando σ12 , σ22 son conocidos y n2 ≥ 30.

σ12 σ22 σ12 σ22


P (x̅1 − x̅2 ) − Za √ + < μ1 −
̂ μ2 + Z a √ + =1−α
2 n1 n2 2 n1 n2

Ejemplo:

El banco del Estado de Rio desea estimar la diferencia entre las medias de los saldos de las tarjetas
de crédito de dos de sus sucursales. Una muestra independiente de tarjetahabitantes generaron los
resultados que aparecen en la siguiente tabla. Determine un intervalo de confianza de 99% para la
diferencia entre las medias de los saldos.

Sucursal 1:

n1 = 32

x̅1 = $ 500

δ1 = $ 150
Sucursal 2:

n2 = 36

x̅2 = $ 375

δ2 = $ 130

(150)2 (130)2
̂ μ2 = P (500 − 375) ± 1.65 √
μ1 − +
32 36

μ1 −
̂ μ2 = 125 ± 1.65 ∗ 34.24

μ1 −
̂ μ2 = 125 ± 56.5

68.5 < μ1 −
̂ μ2 < 181.5

Interpretación:

El intervalo de confianza de 99% para la diferencia entre las medias de los saldos oscila entre 68.5
y 181.5.

4-. Estimación de la proporción de una población:

Si en una población, una determinada característica se presenta en una proporción p, la


proporción p’, de individuos con dicha característica en las muestras de tamaño n, se distribuirán
según:
Intervalo de confianza para una proporción

El error máximo de estimación es:

Ejemplo:

En una fábrica de componentes electrónicos, la proporción de componentes finales defectuosos


era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se
analizó una muestra aleatoria de 500 componentes, encontrándose que 90 de ellos eran
defectuosos. ¿Qué nivel de confianza debe adoptarse para aceptar que el rendimiento no ha
sufrido variaciones?

p = 0.2 q = 1 - p =0.8 p'= 90/ 500 = 0.18

E = 0.2 - 0.18 = 0.02


P (zα/2 > 1.12) = 1 − P (zα/2 ≤ 1.12) = 1 − 0.8686 = 0.1314

0.8686 - 0.1314 = 0.737

Nivel de confianza: 73.72%

5-. Estimación de la diferencia entre las proporciones de dos poblaciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse


utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos:

 Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que
las de los que aprueban inglés?
 Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una
reacción adversa que el de los usuarios del fármaco B que también presentan una
reacción de ese tipo?
 Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales?
 Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la
máquina A a los que genera la máquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal
para tamaños de muestra grande (n1p1 5, n1q1 5, n2p2 5 y n2q2 5). Entonces p1 y p2 tienen
distribuciones muestrales aproximadamente normales, así que su diferencia p1-p2 también tiene
una distribución muestral aproximadamente normal.

Cuando se estudió a la distribución muestral de proporciones se comprobó que y que

, por lo que no es difícil deducir que y que

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de


proporciones es:
Ejemplo:

Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5
objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada
máquina:

a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2


rebase a la máquina 1 en por lo menos 0.10?
b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1
rebase a la máquina 2 en por lo menos 0.15?

Solución:

Datos:

P1 = 3/6 = 0.5

P2 = 2/5 = 0.4

n1 = 120 objetos

n2 = 120 objetos

a. p (p2-p1 0.10) =?
Otra manera de hacer este ejercicio es poner P1-P2:

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de


por lo menos 10% a favor de la máquina 2 es de 0.0011.

b. p(p1-p2

0.15)=?

La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo


menos 15% a favor de la máquina 1 es de 0.2357.
6-. Estimación de la varianza de una población

1) Estimación puntual:

σ2 = δ2
̂

2) Estimación intervalica:

Cuando σ12 , σ22 son conocidos y n2 ≥ 30.

(n − 1)δ2 (n − 1)δ2
P( 2 ̂2 < − 2
<σ )=1−α
x(n−1,1−α) x(n−1,1−α)
2 2

Ejemplo

Un fabricante de detergente liquido está interesado en la uniformidad de la maquina utilizada


para llenar las botellas. De manera específica, es deseable que la desviación estándar del
proceso de llenado sea menor que 0.5 onzas de líquido. De otro modo, existiría un porcentaje
mayor del deseable de botellas con un contenido menor de detergente. Supóngase que la
distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra
aleatoria de 20 botellas, se obtiene una varianza muestral de 0.00153 (onzas de fluido)². Calcule
un intervalo de confianza de 90% para la desviación estándar.

n = 20

δ2 = 0.0015

−α = 0.10
2
P (x19 < a) = 0.05 a = 23.68

2
P (x19 < b) = 0.95 b = 10.117

(21−1)0.00153 (21−1)0.00153
P( ̂2 < −
<σ )= 1−α
23.68 10.117

̂2 < 0.0289)
(0.0123 < σ

7-. Estimación de la razón de la varianza de dos poblaciones

El procedimiento estadístico usual para comparar dos varianzas de población σ12 y σ22 hace una
inferencia acerca del cociente o razón σ12 /σ22 . Esto se hace porque la distribución de
muestreo del estimador de σ12 /σ22 es bien conocido cuando las muestras se seleccionan de
forma aleatoria e independiente de dos poblaciones normales. Con estos supuestos, un
X2 / V
intervalo de confianza para σ12 /σ22 se basa en la estadística del pivote: F = X12 / V1 donde
2 2

X12 y X22 son variables aleatorias ji cuadrada con V1 = (n1 − 1) y V2 = (n2 − 1) grados de
(n−1)s2
libertad, respectivamente. Si sustituimos: X 2 = σ2

(n1 −1)s2
1 /(n −1)
1
X21 / V1 σ21 s21 ⁄σ21 s21 σ22
F= = (n2 −1)s2
= = 2 ∗
X22 / V2 2 /(n −1) s22 ⁄σ22 s2 σ21
2
σ22

A continuación se muestra una parte de las tablas de distribución F con V1 = (n1 − 1) grados de
libertad del numerador y V2 = (n2 − 1) grados de libertad del denominador. Una distribución F
puede ser simétrica alrededor de su media, segada a la izquierda o segada a la derecha; su forma
exacta depende de los grados de libertad asociados a s12 y s22 , es decir (n1 − 1) y (n2 − 1). A fin
de establecer límites de confianza superiores e inferiores para σ12 /σ22 , debemos ser capaces de
encontrar valores tabulados de F que correspondan a las áreas de cola de la distribución. Los
valores F de cola superior se pueden encontrar en tablas para  = 0.10, 0.05, 0.025 y 0.01. Las
columnas de las tablas, corresponden a distintos grados de libertad de la varianza de muestra del
numerador, s12 en la estadística de pivote, en tanto que las filas corresponden a los grados de
libertad del numerador s22 . Por ejemplo, para un intervalo de confianza del 90%( es decir /2 =
5% o 0.05), con V1 = 7 grados de libertad del numerador, y V1 = 9 grados de libertad del
denominador: V.05 = 3.29.

Así pues  = 0.05 es el área de cola a la derecha de 3.29 Los valores de cola inferior de la
distribución F no se dan en las tablas, sin embargo puede demostrarse.

Ejemplo:
La tasa de decesos por cáncer en ciudades con agua Fluorizada y No Fluorizada se
muestran a continuación (una muestra de las 10 ciudades más grandes de cada grupo).
Establezca un intervalo de confianza del 95% para la razón de las varianzas de los
incrementos en las tasas de decesos en los dos grupos de ciudades. Con base en el
intervalo, ¿hay indicios de que se satisfaga el supuesto de varianzas iguales necesario para
comprobar el posible vínculo entre el contenido de Fluoruro del agua potable y el cáncer.

Fluorizada (Incremento anual en la tasa de decesos por cáncer)


Chicago = 1.064
Filadelfia = 1.4118
Baltimore = 2.1115
Cleveland = 1.9401
Washington = 3.8772
Milwaukee = -0.4561
San Luis = 4.8359
San Francisco = 1.8875
Pittsburg = 4.4964
Buffalo = 1.4045
No Fluorizada (Incremento anual en la tasa de decesos por cáncer)
Los Ángeles = 0.8875

Boston = 1.7358

Nueva Orleans = 1.0165

Seattle = 0.4923

Cincinnati = 4.0155

Atlanta = -1.1744

Kansas City = 2.8132

Columbus = 1.7451

Newark = -0.5676

Portland = 2.4471

Solución:

Utilizando cualquier herramienta disponible calculamos las varianzas, en este caso se puede
utilizar la calculadora para la desviación estándar y elevarla al cuadrado.

Así:

S12 = 2.7526

S22 = 2.4293

V1 = (10 − 1) = 9 g. l ; y V2 = (10 − 1) = 9 g. l

Para 1 – α = 95%, el valor de α/2 = 0.025 y necesitamos obtener F.025(V1 ,V2 ) y F.025(V2 ,V1 ) ,
entonces: F.025(9,9) = 4.03 y F.025(9,9) = 4.03 (quedan igual por ser muestras del mismo
tamaño).

2.7526 1 σ12 2.7526


∗ ≤ 2≤ ∗ 4.03
2.4293 4.03 σ2 2.4293
σ12
0.2811 ≤ 2 ≤ 4.57
σ2

“Si, ya que en el intervalo se encuentra el valor, lo que significa que ambas varianzas son
iguales, y por lo tanto, no hay diferencia en la dos poblaciones, es decir, en los decesos por
cáncer existe un 95% de probabilidad de que no se deba al agua fluorizada”.
CONCLUSIONES

La Estadística responde a la actividad planificadora de la sociedad. Con la constante evolución en el


mundo aparecen nuevos problemas. La Estadística es un instrumento para identificar causas e
impactos que las diferentes problemáticas generan en la sociedad. La estadística es el conjunto de
diversos métodos matemáticos que tienen como objetivo obtener, presentar y analizar datos (ya sean
números o cualidades). Los conceptos estudiados nos permiten realizar estudios reales, con
poblaciones exactas; lo cual nos ayuda a mejorar nuestros proyectos.

Dentro de una planificación ambiental los datos estadísticos y los cálculos de media y varianza juegan
un papel muy importante, pues nos van a determinar en primera medida valores de suma relevancia y
nos garantizara la eficiencia. Este trabajo permite desarrollar la estipulación y análisis de resultados
pues mediante la información planteada se fija como trabajar con casos reales teóricos y asignarle
datos numéricos o cuantificarlos. Llevar un buen registro de datos estadísticos nos permite conocer de
mejor manera el problema, cuando nosotros conocemos la realidad de nuestras áreas afectadas; es más
fácil dar soluciones.

Los diferentes conceptos estudiados nos permiten prever eventos que puedan ocurrir, teniendo en
cuenta lo que ha sucedido anteriormente (datos históricos). Una de las técnicas más utilizadas dentro
de la estadística es la medición de parámetros. Lo cual nos permite centrar el problema y plantear
puntos de referencia. Para desarrollar un buen proyecto siempre es necesario conocer las bases
estadísticas del lugar donde vayamos a trabajar. Conocer la teoría nos ayuda a enfocar soluciones y
conocer la realidad nos ayuda a contextualizar y a diferenciar soluciones.

También podría gustarte