Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SEMANA N° 012
Pág.
1. INTRODUCCIÓN.................................................................................................................................... 3
3. dESARROLLO ........................................................................................................................................ 4
4. ACTIVIDADES Y EVALUACIÓN....................................................................................................... 13
Actividad Nº 1 ............................................................................................................................................ 13
5. REFERENCIAS BIBLIOGRÁFICAS.................................................................................................... 16
La estadística es la ciencia que trata de la recopilar, organizar, presentar, analizar e interpretación los
datos de una población o muestra, por ello1. De esta manera, la estadística proporciona las herramientas para
el uso y manejo de los datos, reconoce y clasifica las características en estudio, diseña técnicas que ayudan a
la construcción de tablas de frecuencias y elabora una imagen que sea capaz de mostrar gráficamente unos
resultados2. En esta sesión de aprendizaje se tiene como objetivo, que los estudiantes apliquen las técnicas que
le permitan elaborar las tablas de distribución de frecuencias y los gráficos correspondientes a la variable en
estudio.
Los Objetivos Educacionales de la Carrera Profesional han sido formulados considerando las
expectativas de los constituyentes y grupos de interés, con el objeto de brindar a los estudiantes una destacada
formación que les permita desarrollar una práctica profesional fructífera y gratificante en un entorno altamente
competitivo.
- Formar profesionales del más alto nivel científico, tecnológico y humanístico para que sean líderes y
referentes en su respectiva disciplina contribuyendo al desarrollo nacional.
- Formar profesionales competentes para desempeñarse con responsabilidad, eficiencia y eficacia en
funciones asistenciales en todos los niveles de atención en salud.
- Promover a través de las acciones de nuestros profesionales la investigación en el campo de la salud e
incentivar la participación conjunta, intradisciplinaria e interdisciplinaria que colaboren en la solución
de las interrogantes científicas y respondan a las necesidades humanísticas, sociales y culturales de la
sociedad.
- Formar profesionales que se desempeñen dentro del marco del ejercicio público y privado, asumiendo
la responsabilidad de actualizar y perfeccionar sus fundamentos científicos y tecnológicos.
- Formar profesionales emprendedores en gestión, innovadores en la toma de decisiones de las
disciplinas que competen a su profesión, comprometidos con su entorno y con responsabilidad social.
La estadística tiene como finalidad inferir algo sobre una población con base en una muestra
aleatoria tomada de la población sobre la cual deseamos hacer la inferencia. La Población tiene
constantes desconocidas que la caracterizan, sobre estas constantes se hace la inferencia. La inferencia
consiste en estimar y probar hipótesis sobre estas constantes desconocidas.
a) Parámetro. Es una constante, generalmente desconocida, que caracteriza a una población. Por
ejemplo, , la media de la población. Si consideramos la población de estudiantes de la USS y
conociéramos que la edad promedio ( ) de todos los estudiantes es 20 años diríamos que esta
población se caracteriza por ser una población joven.
b) Estimador. Es aquel que se calcula con los datos de la muestra (es una función de la muestra).
Como ejemplo señalaremos a la media de la muestra ( X ) la cual se calcula con los datos de la muestra
cómo sigue
x 1 x 2 ... x n
X
n
POBLACION
Media de la población
Varianza de la población
2
Desviación estándar de la población Parámetros
Proporción de la población
p
MUESTRA
X Media de la muestra
Varianza de la muestra
S2
Desviación estándar de la muestra Estimadores
S Proporción de la muestra
p̂
d) Estimador por intervalo. Llamado también intervalo de confianza es aquel que estima al
parámetro mediante un intervalo con un coeficiente de confianza (1- ).
e) Hipótesis. Es una afirmación sobre algo la cual puede ser falsa o verdadera.
Ejemplo. Mañana lloverá.
f) Hipótesis estadística. Es una afirmación sobre uno o varios parámetros de una o varias
poblaciones.
Ejemplo. =20, la edad media de todos los alumnos de la USS es 20 años.
g) Hipótesis nula. Es una afirmación sobre uno o varios parámetros que incluye la igualdad. se
designa con Ho.
Ejemplo. Ho = Los datos de la muestra provienen de una distribución normal.
k) Puntos críticos. Son valores tabulares que delimitan la región de rechazo (RR) y la de no
rechazo (RA).
Teorema 1
Si n 30, entonces:
p̂q̂ p̂q̂
p̂ - Z , p̂ Z .
2
n 2
n
Donde:
x
p̂ , q̂ =1- p̂ , n es el tamaño de la muestra y Z α es un valor en la tabla de Z o distribución
n 2
normal estándar de tal manera que a su derecha esta una probabilidad .
2
Ejemplo 1.
En un estudio sobre desocupación en el Municipio de T se tomó una muestra aleatoria de 200 personas
en edad laboral del Municipio de T de las cuales 26 contestaron que no tienen trabajo.
a) Estimar puntualmente a p, la proporción de desocupados en el Municipio de T.
b) Encontrar un 95% intervalo de confianza para p, Es decir estimar p con un coeficiente de
confianza del 95%.
c) Interpretar el estimador puntual y el estimador por intervalo.
Solución
Puesto que n=200 es mayor que 30 y el número de éxitos es x=26
p̂q̂ p̂q̂
p̂ - Z , p̂ Z .
2
n 2
n
Donde:
estándar de tal manera que a su derecha esta una probabilidad .
2
Para encontrar Z α , primero debemos calcular usando la siguiente formula.
2
0.05
Entonces 0.025 y Z α se encuentra en la tabla de la normal estándar ubicando en el cuerpo
2 2 2
valor de Z α con un decimal en la primera columna y el segundo decimal en la primera hilera como
2
1.9 0.025
p̂q̂ (0.13)(0.87)
LS p̂ Z 0.13 1.96 0.13 0.05 0.18
2
n 200
Entonces un 95% intervalo de confianza para p es [0.08, 0.18]. Es decir se estima que la proporción
poblacional esta entre 0.08 y 0.18.
c) Interpretación.
Si usamos un estimador puntual para estimar p, se concluye que el porcentaje de desocupación en el
Municipio de T es alrededor del 13% y si usamos un estimador por intervalo para estimar p se
concluye que el porcentaje de desocupación en el Municipio de T esta entre el 8% y el 18% dicha
conclusión se hace con un confianza de confianza del95%.o con un error del 5%.
II. Estimación de la media de una población,
Existen muchos casos sobre estimación puntual y por intervalo para la media de una población,
tales como combinaciones de que la población o variable en estudio tiene distribución normal o
distribución diferente de la normal, del tamaño de muestra pequeño o grande y con la varianza de la
población conocida o desconocida.
En este tema trataremos un solo caso para estimar la media de la población considerando que la
población o variable en estudio tiene distribución normal con varianza 2 desconocida que es el caso
más frecuente y en nuestra opinión es el único caso que se encuentra en la realidad (aplicaciones) en
el sentido de que la varianza de la población es desconocida. Si se tienen tamaños de muestras grandes
los casos donde las variables en estudio no tienen distribución normal para estimar la media de una
población se pueden usar las mismas fórmulas que presentaremos luego puesto que el teorema central
del límite nos dice que si se toma una muestra aleatoria de cualquier distribución y el tamaño de
muestra es grande la media de la muestra tiene distribución aproximadamente normal que es el
requerimiento o suposición para estimar la media de una población.
En seguida se presenta el resultado y un ejemplo para estimar la media de la población.
manera que a su derecha esta una probabilidad de
2
Ejemplo 2
En un estudio para estimar el salario promedio mensual de los profesores del departamento de
Lambayeque se tomó una muestra aleatoria de tres profesores a los cuales se les registro su salario
mensual en soles. Se conoce que variable salario tiene distribución normal. Los datos de la muestra
se dan a continuación
1200 800 1000
a) Estimar en forma puntual a .
b) Estimar a mediante un intervalo de confianza del 95%.
c) Interpretar a los dos estimadores obtenidos.
Como los dos requerimientos se cumplen: la variable en estudio tiene distribución normal y la
varianza 2 es desconocida, usaremos el teorema 2 para encontrar los estimadores de .
a) El mejor estimador puntual para es X
n
x
1200 800 100 3000
i
X i 1
1000.
n 3 3
Entonces un estimador puntual para es X =1000.
S S
X - t n -1, , Xt . Donde:
2 n n -1,
2 n
X =1000,
n=3,
0.05
0.025 y
2 2
n-1=2 grados de libertad, en la primera hilera la probabilidad 0.025 y finalmente se detecta el
2
valor t α en la intersección de estos dos valores como se indica en la tabla siguiente:
n 1,
2
0.025
2
n-1=2 4.303
S 200
LI X t ε 1000 4.303 * 1000 496 .88 503 .12.
n 1, n 3
2
S 200
LS X t 1000 4.303 *ε 1000 496 .88 1496 .88.
n n 1, 3
2
c) Interpretación
Si se usa un estimador puntual, se concluye que el salario promedio mensual de todos los profesores
del departamento de Lambayeque es de 1000 soles, sin embargo si se usa un estimador por intervalo
para el salario promedio, se estima que el salario promedio mensual de todos los profesores del
departamento de Lambayeque esta entre 503 soles y 1496.88 soles.
Para determinar un tamaño de muestra es necesario identificar los siguientes componentes o elementos:
1) La varianza (σ2): corresponde al grado de variabilidad que presentan las unidades de la población.
Mientras más grande sea σ2 mayor será el tamaño de la muestra. El valor de σ 2x supuestamente conocido, de
lo contrario se debe estimar a través de una investigación preliminar. En el caso de σ2p = PQ, sucede algo
similar, pero se tiene la costumbre de tomar P= 0,50 con lo cual se obtiene el máximo valor posible de n.
2) Nivel de confianza: Tiene relación directa con el tamaño de la muestra, por lo tanto se dirá que a mayor
nivel de confianza más grande debe ser el tamaño de la muestra. Los valores de Z se obtienen mediante el uso
de tablas como se ha venido haciendo. El nivel de significación es fijado por el investigador, de acuerdo a su
experiencia.
3) Precisión de la estimación: Corresponde al margen de error que el investigador fija de acuerdo con el
conocimiento que tenga acerca del parámetro que piensa estimar. Se le conoce como error de muestreo (E).
Las fórmulas para el cálculo del tamaño de muestra son los siguientes:
TAMAÑO DE Cuando se conoce “N” Cuando NO se conoce
MUESTRA “N”
𝑁 ∗ 𝑍2 ∗ 𝜎2 𝑍2 ∗ 𝜎2
𝑛= 𝑛=
Para la media (𝑁 − 1) ∗ 𝐸 2 + 𝑍 2 ∗ 𝜎 2 𝐸2
𝑁 ∗ 𝑍2 ∗ 𝑃 ∗ 𝑄 𝑍2 ∗ 𝑃 ∗ 𝑄
𝑛= 𝑛=
Para la proporción (𝑁 − 1) ∗ 𝐸2 + 𝑍 2 ∗ 𝑃 ∗ 𝑄 𝐸2
Donde:
n: Tamaño de muestra
Z: Nivel de confianza Nivel de Valor de
E: Margen de error confianza “Z”
𝜎 2 : Varianza poblacional 90% 1,65
𝜎: Desviación estándar de la población 95% 1,96
P: Proporción de la población que tiene la 99% 2,58
característica de interés
Q: 1- P
N: Tamaño de la población
Ejemplo. 1:
El auditor de un banco desea estimar la proporción de estados, de cuenta bancarias mensuales para los
depositantes del banco que tendrán errores de varias clases, y especifica un coeficiente de confianza del 99%
y un error máximo de 4%.
(a)Determinar el tamaño de la muestra si no se dispone de información sobre la proporción verdadera de los
estados de cuenta mensuales que tienen errores.
(b)Determinar el tamaño de la muestra, si el auditor, por su experiencia, cree que la verdadera proporción de
estados de cuenta con errores es 0.15.
Solución B:
𝑍2 ∗ 𝑃 ∗ 𝑄
Z99% = 2,58 𝑛=
E = 4% = 0,04 𝐸2
P = 0,15 2,582 ∗ 0,15 ∗ 0,85
𝑛=
Q = 1-0,15 = 0,85 0,042
𝑛 = 530
Ejemplo. 2:
Se pretende realizar una investigación para conocer el tiempo de estudio semanal dado en horas, de los
estudiantes de la Universidad Señor de Sipán. Si un estudio previo determinó que la varianza fue de 0,32
horas. ¿Qué tamaño de muestra sería conveniente para la investigación? Considerando un nivel de
confianza del 95% y un error tolerable de 0,05 horas.
Solución :
𝑍2 ∗ 𝜎2
𝑛=
Z95% = 1,96 𝐸2
1,962 ∗ 0,32
E = 0,05 𝑛=
0,052
σ2 = 0,32
𝑛 = 492
Actividad Nº 1
PROBLEMAS PROPUESTOS
2. En un estudio realizado por Waall Street Journal, se tomó una muestra aleatoria de 900
personas que están suscritas en Wall Street Journal, de estas 900 personas el 40% indicaron que
terminaron al menos dos años en una Universidad.
a) Encuentre un 95% intervalo de confianza para la proporción de suscritores de Wall Street
Journal que terminaron al menos dos años de estudios universitarios.
b) Interprete lo que encontró en el inciso a).
3. Un gerente compro 10000 baterías para la empresa en la cual trabaja. El gerente toma una
muestra aleatoria de 300 baterías de las 10000 compradas las cuales fueron examinadas resultando
42 baterías defectuosas.
Encuentre un 95% intervalo de confianza para la proporción de baterías defectuosas en tota la
población de baterías compradas.
5. Un ingeniero civil está probando la resistencia de compresión del concreto. Prueba 120
muestras de las cuales 115 tienen resistencia mayor a 2250 psi.
a) Encuentre un 97% intervalo de confianza para la proporción de muestras que tienen resistencia
mayor a 2250 psi.
6. Un agricultor afirma que él puede determinar si una semilla de papaya es macho con solo
palpar la semilla. Para probar tal afirmación se tomaron 1000 semillas al azar para que examine el
agricultor y determine si es semilla de papayo macho, posteriormente se sembraron las semillas y se
determinó realmente si eran semillas de papayo macho. Finalmente al hacer el cotejo se encontró
que el agricultor de detecto el sexo de 6 semillas correctamente.
a) Encontrar un estimador puntual para la proporción de semillas detectadas correctamente por
el agricultor con respecto al sexo.
b) Encontrar un 95% intervalo de confianza para la proporción de semillas detectadas
correctamente por el agricultor con respecto al sexo. ¿Cuál es su opinión con respecto a la
afirmación del agricultor?
10. Se analizó una marca particular de margarina dietética para determinar el nivel de ácido
graso polinsaturado (en porcentaje).Una muestra de 6 paquetes al azar dio como resultado los
siguientes datos:
16.8 17.2 17.4 16.9 16.5 17.1
Se conoce que el nivel de ácido graso polinsaturado tiene distribución normal.
a) Encontrar un estimador puntual para .
PROBLEMAS PROPUESTOS
1. De una población N=10000 personas nos proponemos obtener una muestra, para
estimar el ingreso promedio por persona. Se quiere que la estimación muestra, no se aparte
en más de $5000 del promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La
desviación típica es de $30000 ¿Cuál es el tamaño de muestra óptimo?
3. ¿Qué tamaña deberá tener una muestra para estimar dentro del 3% la proporción de
mujeres casadas que van periódicamente a consulta ginecológica, en una población de 5000
mujeres y una seguridad del 95%?
5. En cierta residencial se espera que el 60% de las familias tengan vehículo propio. Se
desea hacer una investigación para estimar la proporción de familias propietarias de
vehículos, con un error del 3% y un coeficiente de confianza del 90%. a) Determine el
tamaño de muestra b) ¿Qué sucedería si P=0,5?
6. Una oficina de investigaciones sobre salud considera que el 20% de las personas
adultas de una región, padecen cierta enfermedad parasitaria. ¿Cuántas personas tendrán que
8. Entre los estudiantes de cierta universidad privada, se desea tomar una muestra para
estimar la proporción de alumnos que utilizan la biblioteca. El error debe conservarse en un
4% con una confianza del 96%. ¿Cuál es el tamaño de la muestra, si la universidad tiene
3200 alumnos matriculados?
10. A partir de una muestra de 200 observaciones se encontró que, en una remesa había
20 acumuladores defectuosos. Utilizando un nivel de confianza del 99%. Calcule el error de
muestreo.
5. REFERENCIAS BIBLIOGRÁFICAS
Córdova, M. Estadística Descriptiva e Inferencial. 5ª ed. Lima – Perú: Moshera S.R.L.; 2009
García C. Estadística y Probabilidad para ingenieros. 4ª ed. Lima: Macro Empresa, 2012
Milton S. Estadística para Biología y Ciencias de la Salud. 3ª ed. España: McGraw-Hill; 2009
Walpole R y Myers R. Probabilidad y estadística. 4ª Ed. México: Mc Graw Hill Interamericana; 1989.
Murray R. Spiegel. Estadística teoría y problemas resueltos. 5ª Ed. México: McGraw; 2009.