Está en la página 1de 23

Facultad de Ciencias Médicas

Cátedra de Epidemiología

TRABAJO PRÁCTICO 6: NOCIONES DE ESTADÍSTICA

MATERIAL ELABORADO POR EL CUERPO DOCENTE DE LA CÁTEDRA

NIVEL CONFIANZA Z DE LA DISTRIBUCIÓN NORMAL


90% 1.64
95% 1.96
99% 2.57
99.9% 3.29

1
NOCIONES DE ESTADISTICA
Fernanda Arrondo, Santiago Barragán, Graciela Etchegoyen
OBJETIVOS DEL TRABAJO PRÁCTICO
1. Comprender los conceptos básicos de la estadística descriptiva.
2. Describir, calcular, interpretar y aplicar las medidas de tendencia central y de
dispersión en una serie de datos.
3. Conocer los conceptos básicos para la selección de técnicas de muestreo.
4. Estimar a partir de los datos de una muestra, los parámetros poblacionales,
incorporando el concepto de intervalo de confianza.
5. Interpretar el concepto de resultado estadísticamente significativo

BIBLIOGRAFÍA OBLIGATORIA PARA EL DESARROLLO DEL TP


 Bonita R., Beaglehole R. y Kjellstrom T. Epidemiologia Básica. Segunda Edición.
Organización Panamericana de la Salud. Washington DC. 2008. Capítulo 4:
Bioestadística Básica: conceptos y métodos. Pag.: 81-91. EN DIGITAL Entorno
 Pita Fernández, S. Estadística descriptiva de los datos EN DIGITAL Entorno
 Pineda EB, Alvarado EL de, Canales FH de. Metodología de la Investigación. Manual
para el desarrollo de personal de salud. 2° edición. Serie Paltex N°35. OPS. OMS. Año
1994. Unidad VI.4: Universo y muestra. EN DIGITAL Entorno
 Argimon Pallás JM; Jiménez Villa Joseph. Métodos de investigación Clínica y
epidemiológica. Tercera edición. Editorial Elsevier. Madrid. España. 2004. Cap. 27:
Papel de la estadística. Pag. 249-261
 Argimon Pallás JM; Jiménez Villa Joseph. Métodos de investigación Clínica y
epidemiológica. Tercera edición. Editorial Elsevier. Madrid. España. 2004. Cap. 16:
Muestreo. Pag. 151-157
 Robledo Martín Juana. Población de estudio y muestreo en la investigación
epidemiológica Nure Investigación. Vol 10. Noviembre 2004. EN DIGITAL Entorno
 Robledo Martín Juana. Diseños de muestreos probabilísticos. Nure Investigación. Vol
11. Diciembre de 2004. EN DIGITAL Entorno
 Robledo Martín Juana. Diseño de muestreos. Nure Investigación. Vol 12. Febrero 2005.
EN DIGITAL Entorno

2
CONOCIMIENTOS PREVIOS NECESARIOS CORRESPONDIENTES AL EJE
ANTROPOLÓGICO DE LA CARRERA CS. SOCIALES Y MEDICINA

❑ Método Hipotético Deductivo

❑ Las etapas de la Investigación. Planificación y Ejecución

❑ Hipótesis. Tipos. Requisitos para su formulación

❑ Tipos de variables

----------------------------------------------------------------------------------

GUÍA PARA CONSOLIDAR CONOCIMIENTOS PREVIOS

1. Defina hipótesis nula.

2. ¿Cuál o cuáles de las escalas de medición de las variables establece un orden jerárquico
de sus valores?
3. ¿Qué actividades de investigación se realizan en la etapa de ejecución de un proyecto?

--------------------------------------------------------------------------------------------------

3
EJERCICIO 1:
Un grupo de investigadores de la Facultad de Ciencias Médicas de la UNLP, decide realizar un
estudio descriptivo para identificar las enfermedades prevalentes en la población luego de la
inundación del 2 de abril de 2013 en la ciudad de La Plata.
a) Qué fuentes de información se podrían utilizar para obtener los datos necesarios en el
estudio? Mencione una fuente primaria y una secundaria.
b) Suponiendo que se decida realizar una encuesta a la población afectada y considerando el
siguiente mapa. Qué tipo de muestreo realizaría para que esté representada la población de
todas las zonas inundadas?

c) Teniendo en cuenta los datos de las siguientes tablas, y suponiendo que el tamaño de la
muestra (n) se calculó en 1000 personas. Calcule cuántas deberán ser de cada zona afectada si
se utiliza como técnica de muestreo el estratificado proporcional al tamaño de la población.
Zonas afectadas % población sobre Zonas afectadas % población sobre
total población afectada total población afectada
Barrio Norte 7 Los Hornos 14
Tribunales 5 Ringuelet 13
La Loma 10 Tolosa 15
La Cumbre 8 Villa Elvira 11
Barrio Aeropuerto 9 Villa Alva 8

d) A 15 días de la inundación, se habían suministrado 21.000 dosis de vacunas (antigripal y


antitetánica, antihepatitis A y triple bacteriana) según la siguiente distribución diaria. Calcular el
promedio diario de dosis y su desvío estándar. Además calcular mediana, moda, valor máximo,
valor mínimo y cuartilos
Día Cantidad de dosis Día Cantidad de dosis
1 300 9 2000
2 350 10 2500
3 350 11 3500
4 400 12 5000
5 450 13 2000

4
6 500 14 1000
7 700 15 450

8 1500 Total 21000

e) Teniendo en cuenta que la frecuencia de vacunación diaria corresponde al siguiente gráfico,


analice las posibles causas de este comportamiento

f) Se desea analizar si otras acciones ante la catástrofe tuvieron un comportamiento semejante


al de la vacunación. Para ello se presenta la distribución diaria de agua embotellada según la
siguiente tabla. Realizar los cálculos que considere conveniente para poder determinar cuál
acción (vacunación o distribución de agua) tuvo mayor dispersión o variabilidad
Día Cantidad de litros Día Cantidad de litros
1 150000 9 150000
2 165000 10 130000
3 165000 11 120000
4 165000 12 100000
5 165000 13 90000
6 165000 14 80000
7 170000 15 50000

8 160000 Total 2025000

g) Teniendo en cuenta que la frecuencia de distribución de agua diaria corresponde al siguiente


gráfico, analice las posibles causas de este comportamiento, teniendo en cuenta lo concluido en
el ítem e y f.

5
EJERCICIO 2:
Suponiendo que el mismo grupo de investigadores de la Facultad de Ciencias Médicas de la
UNLP y con el objetivo de investigación: identificar las enfermedades prevalentes en la
población luego de la inundación del 2 de abril de 2013 en la ciudad de La Plata, según nivel
alcanzado por el agua (punto de corte: 1 metro). El tamaño de la muestra (n) sigue siendo
1000 personas, que se seleccionarán de 10 centros de evacuados de las zonas afectadas
a. Qué técnica de muestreo utilizaría?
b. Identificar las unidades de muestreo
c. Identificar las técnicas de muestreo que se podrían aplicar en cada etapa
d. Mencione que información necesitaría antes de realizar el muestreo

EJERCICIO 3:
Lea nuevamente el EJERCICIO 2 Suponga ahora que en las zonas afectadas no hay centros de
evacuados, ya que justamente por su afectación, se tuvo que trasladar a los damnificados a
centros de evacuados ubicados en las zonas no afectadas. La idea de los investigadores es
concurrir a los centros de evacuados de la ciudad y entrevistar a quienes se ofrezcan
voluntariamente hasta obtener 1000 encuestas (tamaño de la muestra (n)).
a. Qué tipo de muestreo estarían realizando?
b. Con esta metodología se asegura entrevistar a personas con diferentes niveles de agua
en sus hogares (punto de corte: 1 metro)?
c. Para medir este sesgo de selección, que variable deberían los investigadores incluir en
la encuesta?

EJERCICIO 4

De la encuesta realizada a las 50 personas damnificadas del barrio Tribunales se obtuvieron los
siguientes datos de la variable edad

6
-Media: 40
-Mediana: 42
-Moda: 41
- desvío estándar: 10

También se obtuvo el dato de que el 50% de los encuestados no recibieron la vacuna contra la
hepatitis A.
a. Entre qué valores se encuentra la edad del 68,27% de los encuestados? Y del 95,45%?
b. Qué forma adquiere esta distribución?
c. Entre qué valores se encontrará la edad media de la población de referencia con un
95% de confianza? Y con un 99% de confianza? (parámetro poblacional)
d. Por qué no se puede asegurar que la media de la muestra coincide con la media
poblacional?
e. De qué depende la amplitud del intervalo de confianza? Analizar teniendo en cuenta su
fórmula
f. Cuál es la prevalencia de personas no vacunadas en la muestra realizada en el barrio
Tribunales?
g. Cuál es la prevalencia de personas no vacunadas en la población del barrio Tribunales
con un grado de confianza del 90%

EJERCICIO 5

Se estudiaron 1000 damnificados por la inundación del 2 de abril de 2013 en la ciudad de La


Plata. El grupo de enfermedades respiratorias fue el de mayor frecuencia relativa (43%). Este
porcentaje fue mayor en los damnificados con mayor nivel del agua en sus hogares
comparados con los damnificados con menor nivel de agua (70.8% vs 25.6%, p= 0.0004).
a. Qué significa p= 0.0004?
b. Esta diferencia de proporciones es estadísticamente significativa?
c. Mencione un mecanismo para disminuir la p y obtener resultados estadísticamente
significativos?
d. Qué agrega al análisis de significación estadística (p) el cálculo del intervalo de
confianza?

7
AUTOEVALUACIÓN (respuestas al final de los ejercicios)

EJERCICIO 1: muestreo
En una población estudiada, hay 2000 mujeres y 8000 hombres. Si queremos seleccionar una
muestra de 250 individuos en dicha población.
a. Qué tipo de muestreo utilizaría?
b. ¿Cuántos deberán ser mujeres para que la muestra sea considerada representativa?

EJERCICIO 2: muestreo

Suponiendo que la población de mujeres es de 500 y la de hombres 8000, y que el tamaño de


la muestra sigue siendo de 250 individuos, el resultado por muestreo estratificado proporcional
al tamaño de cada estrato en la población sería el siguiente:
TOTAL= 8500
Proporción Mujeres= 0.06
Proporción hombres= 0.94
TOTAL MUESTRA: 250
MUJERES: 250 * 0.06= 15
HOMBRES: 250 * 0.94= 235

Con la utilización de este tipo de muestreo, la cantidad de mujeres (15) es tan pequeña que
probablemente no se puedan sacar conclusiones sobre ellas.
a. Qué alternativa se puede aplicar en estos casos?
b. Qué consideraciones se deberán tener al analizar los resultados?

EJERCICIO 3: muestreo

Siguiendo con el caso anterior, suponiendo que se decide obtener una muestra donde el 50%
son mujeres y el 50% son hombres y analizar la prevalencia de fumadores con los siguientes
resultados por estrato:
Prevalencia mujeres fumadoras: 30%
Prevalencia en hombres fumadores: 60%
a. Sería correcto concluir que el 45 % (= 30%+60%/2) de la población es fumadora?
b. Cuál es la prevalencia de fumadores en la población total?

EJERCICIO 4: muestreo
Si los siguientes grupos de edad se encuentran en la población en las proporciones indicadas.
¿Cuántos individuos de cada grupo deben ser incluidos en una muestra de 2500 personas para
que la muestra sea representativa?

8
Grupo de Proporción
edad
(12-18) 0,1300
(19-25) 0,3400
(26-32) 0,2400
(33-39) 0,1800
Más de 39 0,1100

EJERCICIO 5: muestreo
Se desea conocer la prevalencia de mujeres jefas de hogar en la localidad de Zampallo, de
12450 habitantes, según nivel socio económico.
a. Qué técnicas de muestreo utilizaría? Justifique
b. Identificar las unidades de muestreo
c. Identificar las técnicas de muestreo que se podrían aplicar en cada etapa

EJERCICIO 6: muestreo
Se realizó un estudio descriptivo para investigar la prevalencia de enfermedades de transmisión
sexual y de embarazo adolescente en el Municipio de La Plata, en el cual viven
aproximadamente 30.000 individuos de este grupo etario. Para ello se realizaron entrevistas a
150 estudiantes de colegios secundarios de la ciudad. Se tomaron 2 instituciones estatales (85
individuos) y 1 privada (65 individuos). Las entrevistas fueron administradas a individuos que
asistían voluntariamente al gabinete de psicopedagogía obteniéndose así a un total de 70
individuos de las escuelas públicas y 55 de las privadas que ya habían iniciado las actividades
sexuales.
a. ¿Qué consideraciones puede realizar sobre la muestra utilizada?
b. Qué tipo de muestreo sería conveniente en este caso?
c. Mencione por lo menos 10 variables personales que podrían considerarse en este
estudio.

EJERCICIO 7: medidas en la muestra (estadísticos)

En una muestra de niños de 3 años de edad sus pesos de fueron los siguientes:

13, 14, 14, 15, 16, 16, 16, 17, 17, 18 y 20

a. Determine: el n de la muestra

9
b. Determine la media y la desviación estándar de la muestra
c. Determine la mediana de la muestra
d. Determine la moda
e. Mencione qué valores se encuentran en el cuartilo inferior (primer cuartil) de la muestra
f. Mencione qué valores se encuentran en el cuartilo superior de la muestra
g. ¿Entre qué valores se encuentra el peso del 68% de los niños de la muestra?
h. Qué forma adquiere esta distribución?

EJERCICIO 8 parámetros poblacionales: IC media. (Variable cuantitativa)

Considerando la media y desvío estándar muestrales obtenidos en el ejercicio anterior y


suponiendo que el tamaño de la muestra haya sido de 50 individuos:
a. Entre qué valores se encontrará la media de la población de referencia con un 95% de
confianza? (parámetro poblacional)
b. Por qué no se puede asegurar que la media de la muestra coincide con la media
poblacional?
c. De qué depende la amplitud del intervalo de confianza? Analizar teniendo en cuenta su
fórmula

EJERCICIO 9 parámetros poblacionales. IC Media (variable cuantitativa)

Una muestra aleatoria de 36 cigarrillos de una marca determinada dio un contenido promedio
de nicotina de 3 miligramos. Suponga que el contenido de nicotina de estos cigarrillos sigue una
distribución normal con una desviación estándar de 1 miligramo.
a. Obtenga e interprete un intervalo de confianza del 95% para el verdadero contenido
promedio de nicotina en estos cigarrillos.
b. El fabricante garantiza que el contenido promedio de nicotina es de 2,9 miligramos,
¿qué puede decirse de acuerdo con el intervalo hallado?

EJERCICIO 10 parámetros poblacionales. IC proporción (variable cualitativa)

En una muestra de 60 mujeres embarazadas, se determinó que el 25% de ellas no se


realizaban controles de embarazo en tiempo y forma.
a. Cuál es la prevalencia de mujeres embarazadas que no se realizan controles de
embarazo en tiempo y forma en la muestra
b. Cuál es la prevalencia de mujeres embarazadas que no se realizan controles de
embarazo en tiempo y forma en la población. con un grado de confianza del 90%
c. Puede asegurar con un 90% de confianza que la prevalencia de mujeres embarazadas
que no se realizan controles de embarazo en tiempo y forma en la población es
10
exactamente la calculada en el ítem anterior?

EJERCICIO 11:

Durante una epidemia de gripe, los tiempos de espera en cierto centro de salud fueron más
largos de lo habitual. La siguiente tabla resume la distribución de los tiempos de espera para
una muestra de 60 pacientes que visitaron el centro de salud durante este periodo:
Tiempo de Espera Nº de
(horas) Pacientes
1 16
2 25
3 8
4 7
5 4
60

a. Estime el tiempo medio de espera de los pacientes y la variabilidad del mismo.


b. Un nuevo paciente que llega al centro de salud plantea que él esperará para ser
atendido si la mitad de los pacientes es atendido como máximo en 2 horas. ¿Esperará
el paciente? ¿Por qué?
c. Calcule el valor del tiempo de mayor frecuencia para ser atendido un paciente.
d. El centro de salud ha decidido que al 25% de los pacientes que más tardan en ser
atendidos, los remitirá a una consulta adicional que ha habilitado. ¿Cuánto tiempo tiene
que esperar como mínimo un paciente para ser enviado a esta consulta especial?
e. Estime la media de la población a partir de los resultados de la muestra, con una
confianza del 90%
f. Estime la media de la población a partir de los resultados de la muestra, con una
confianza del 95%

EJERCICIO 12:

En los cuatro diagramas de barras tienes los resultados de diferentes grupos en una asignatura
(las notas van de cero a diez).

a. ¿En cuáles se diferencian poco la media y la mediana?


b. ¿Cuál es la clase que está mejor representada por su media?.
11
c. En una de ellas la media es 3.5 y la mediana es 3, ¿de cuál se trata?
d. ¿En qué curso es la mediana mayor que la media?

EJERCICIO 13:

Se ha hecho un mismo examen en dos cursos, A y B, de 40 alumnos cada uno. Las notas
medias (de 0 a 10) y las desviaciones estándares son: A = 6 ± 1; B= 6 ± 3.
¿En qué clase habrá más notas comprendidas entre 5 y 7?

EJERCICIO 14:

Las notas de un profesor de Clínica tienen una media de 7 y una desviación estándar de 3.
Otro profesor tiene una media de 6 y una desviación estándar 0.9.
a. Si deseas aprobar, ¿qué profesor elegirías? Justificar
b. ¿y si necesitas sacar nota? Justificar
c. ¿Siempre se aprueba con el último profesor?

EJERCICIO 15:

Se desea conocer la prevalencia de fumadores en el personal de un hospital público según


ocupación.
Población: personal de un hospital público (N): 1176 (Profesionales: 407, técnicos: 296,
administrativos: 148, mantenimiento: 325)
Unidad de análisis: cada uno de los individuos que conforman el personal de un hospital
público.
Atributo o característica: ocupación
Categorías del atributo: profesionales, técnicos, administrativos, mantenimiento
Tamaño muestral (n) determinado: 298
a. Cómo se deberían seleccionar las 298 personas de la muestra?

EJERCICIO 16:

A partir de las siguientes series de peso de mujeres embarazadas:

Serie 1 Serie 2
peso peso
60 Kg. 60 kg
62 Kg. 68 Kg.
63 Kg. 68 Kg.
64 Kg. 68 Kg.
65 Kg. 69 Kg.
66 Kg. 58 Kg.
12
66 Kg. 51 Kg.
67 Kg. 66 Kg.
67 Kg. 72 Kg.
68 Kg. 65 Kg.
69 Kg. 70 Kg.
a. Determine en cada serie las medidas de tendencia central y de dispersión
b. En qué unidad de medida se expresarán estas medidas?
c. Cual serie tiene mayor dispersión o variabilidad?
d. En este caso, para conocer qué serie tiene mayor dispersión, es necesario calcular el
coeficiente de variación? Por qué?

EJERCICIO 17

Siguiendo con el caso anterior, a las embarazadas de ambas series se las midió obteniendo los
siguientes datos:
Serie 1 Serie 2
altura altura
164 cm 165
175 158
166 169
152 170
167 158
159 154
162 162
166 167
160 171
157 166
162 175

a. Compare la variabilidad o dispersión de las variables peso y altura y exprese sus


conclusiones.

EJERCICIO 18. IC diferencia de dos proporciones

En un estudio se compararon dos grupos de pacientes con diarrea. La distribución en cada


grupo (asignación) se realizó al azar. A un grupo se les administró el fármaco A, y a otro el
fármaco B. Los investigadores definieron previamente, que se recomendaría la utilización del
fármaco B, siempre y cuando la diferencia en la eficacia del tratamiento sea mayor a un 30% y
estadísticamente significativa.

13
1. Analice las siguientes situaciones:
Situación Diferencia en la IC 95% (*) Es Qué pasa Interpretación
N° eficacia del estadísticame con la
tratamiento nte eficacia del
observada en significativa? tratamiento?
la muestra
1 20% -2% a + 25%

2 20% -2% a + 40%

3 15% +5% a +15%

4 30% +10% a +45%

5 30% +30% a +45%

(*) Para calcular el IC, se utilizó la fórmula: diferencia de dos proporciones

EJERCICIO 19

La Diabetes mellitus (DM) es una compleja alteración del metabolismo de la Glucosa que se
expresa en el laboratorio, por valores de glucemia por encima de lo normal. Su alta prevalencia
(5 % de la población Argentina según varias investigaciones) obliga a seguir realizando estudios
sobre esta patología. Es por ello, que en la ciudad de Aguas Dulces de 124.000 habitantes, se
realizó un estudio, con una muestra de 5.000 personas no diabéticas a las que se les midió la
glucemia en ayunas. Se obtuvieron los datos que se presentan en el cuadro 1
Cuadro 1. Valores de Glucemia
Valor de glucemia en mg/dl N° de individuos
< 60 121
60 804
70 997
80 1154
90 1001
100 798
>100 125

a. La media obtenida en este estudio fue de 80 mg/dl mientras que la desviación estándar
fue de 10 mg/dl. Para cualquier parámetro biológico se considera a la normalidad (por
convención) a los valores en los que se encuentra el 95% de la población. ¿Entre que
valores se encuentran los valores “normales” de glucemia?
b. De lo anterior surge que existe un 5 % de personas con valores "no normales" de
glucemia. Calcule el número de individuos de este estudio que tienen valores
anormalmente altos de glucemia. ¿Cómo los denominaría?
c. Entre qué valores se encontrará el promedio de la población? Calcule para un nivel de

14
confianza del 95%.
d. Y si la muestra, en vez de 5000 personas fuera de 500 personas, entre qué valores se
encontraría el promedio de la población? Calcule para un nivel de confianza del 95%.
Qué diferencias se observan en el EEM (error estándar de la media) y en el intervalo de
confianza donde se ubica el promedio de la población?

Observe los siguientes gráficos que expresan los valores de glucemia de un paciente Diabético
a lo largo del tiempo (cuadro 2 y 3). Este paciente en particular comenzó a realizar un
tratamiento para la DM en la semana 2 (cuadro 3).

Cuadro 2. Glucemia - tiempo 1.

Cuadro 3. Glucemia – tiempo 2

e. Ambos gráficos expresan la variación de la glucemia según la variable tiempo. Pero son
variaciones ocasionadas por factores diferentes. Identifíquelos y explique.

15
RESULTADOS DE LA AUTOEVALUACIÓN:

EJERCICIO 1:
a- Muestreo estratificado, cada estrato de la muestra proporcional al tamaño de cada grupo en
la población.
b.-
TOTAL= 10000
Proporción Mujeres= 0.2
Proporción hombres= 0.8
TOTAL MUESTRA: 250
MUJERES: 250 * 0.2= 50
HOMBRES: 250 * 0.8= 200

EJERCICIO 2:
a. Muestreo estratificado no proporcional al tamaño de cada estrato. Se decide
arbitrariamente la cantidad de cada grupo
b. Otorgarle un peso al resultado de cada grupo en función de su proporción en la
población.

EJERCICIO 3:
a. NO, no es correcto
b. Media ponderada: 30* 0.06 + 60* 0.94= 58.2 %

EJERCICIO 4:

Grupo de edad Cantidad de personas por estrato incluidas en la muestra


(12-18) 325
(19-25) 850
(26-32) 600
(33-39) 450
Más de 39 275
2500

16
EJERCICIO 5:

a. muestreo en múltiples etapas


b y c.-
Unidades de muestreo Técnica de muestreo
Barrios de Zampallo Muestreo estratificado según nivel
socioeconómico
Manzanas de cada barrio seleccionado Muestreo aleatorio simple
hogares Muestreo aleatorio simple o también muestreo
sistemático

EJERCICIO 6:

a. El N es muy pequeño. No se define cómo se seleccionan las escuelas. Para seleccionar a los
alumnos se utilizó muestreo NO probabilístico en vez de probabilístico. Está tomada de un
grupo inadecuado: adolescentes escolarizados cuando muchos de los adolescentes
especialmente los que sufren ETS y embarazo no lo están.
b.- muestreo en etapas múltiples.
c.- Edad. Sexo. Institución a la que asiste (pública o privada). Barrio donde vive. Edad de inicio
sexual. Número de parejas simultáneas. Uso de Anticonceptivos. Uso de Preservativos. Ingreso
de la familia. Antecedentes de ETS. Antecedentes de Embarazo adolescente. Presencia de
Educación sexual. Edad de la madre cuando nació el entrevistado. Etc.

EJERCICIO 7:

a. Tamaño muestra: 11
b. media: 16, Desvío estándar: 2
c. Mediana: 16
d. Moda: 16
e. Valores del cuartilo inferior (primer cuartil): igual o menor que 14.5
f. Valores del cuartilo superior: igual o mayor a 17
g. Media ± 1 desvío estándar= 16± 2= 14-18
h. simétrica, media=mediana= moda

EJERCICIO 8:

a.-Para variables cuantitativas (como peso)


EEM (error estándar de la media)= desvío estándar / raíz ² del tamaño muestra
EEM= 2 / raiz ² de 50
EEM= 2/ 7.07

17
EEM= 0.28

IC95%= Media muestra ± (Zά *EEM) ά= 0.05


IC95%= 16± 1.96* 0.28
IC95%= 16 ± 0.55=
Media poblacional: está entre 16.55 y 15.45

tamaño muestra 50
raiz tamaño muestra 7,07
media muestra 16
DE muestra 2
z0,05 1,96
EEM 0,28
IC95 16,55
15,45

b. porque si se hubiera estudiado una muestra diferente se hubiera obtenido un resultado


distinto, entonces se utiliza una medida de precisión de la estimación que es el IC. Siempre que
se realizan inferencias poblacionales a partir de estadísticos muestrales, los resultados deben
expresarse como IC y no solo como estimaciones puntuales, para poder valorar la precisión de
la estimación
c. Si aumenta n, disminuye EMM, disminuye IC y aumenta la precisión de la estimación
La amplitud del IC depende también del grado de confianza elegido, si aumenta el grado de
confianza, aumenta el IC.

EJERCICIO 9:

a. se tiene una certeza del 95% de que el verdadero contenido promedio de nicotina se halla
entre 2,67 y 3,33 miligramos
tamaño muestra 36
raíz tamaño muestra 6
media muestra 3
DE muestra 1
Z0.05 1,96
EEM 0,17
IC95 3,33
2,67

b. Como 2,9 se encuentra en el intervalo hallado no podemos descartarlo como valor posible
del parámetro
18
EJERCICIO 10:

a. 25%
b. EEP (error estándar de la proporción)= raíz cuadrada ((p*(1-p))/n))
IC90%= proporción ± (Zά *EEP) ά= 0.10
p 0,25
z0,1 1,64
1-p 0,75
n 60
p*(1-p)/n 0,003
EEP 0,056
IC90 0,342
0,158

La prevalencia en la población puede tomar valores incluidos en el intervalo de 15% a 34% con
un nivel de confianza del 90%

c.- El cálculo del IC asume que se ha estudiado una muestra aleatoria y representativa de la
población de referencia, pero en realidad pueden existir otras fuentes de error no debidas al
azar (errores sistemáticos o sesgos). De esta forma el error en la estimación, puede ser
mayor que el sugerido por la amplitud del intervalo

EJERCICIO 11:

a. media: 2.3 horas - desvío: 1.18 horas


b. mediana: 2 horas. Esperará, ya que la mediana es 2, o sea la mitad de los pacientes esperan
como máximo 2 horas
c. Moda: 2 horas
d. Cuartil 3: 3 horas. El paciente deberá esperar 3 o + horas para ser enviado a consulta
especial
eyf
tamaño muestra 60 tamaño muestra 60
raíz tamaño muestra 7,75 raíz tamaño muestra 7,75
media muestra 2,3 media muestra 2,3
DE muestra 1,18 DE muestra 1,18
z0,10 1,64 z0,05 1,96
EEM 0,15 EEM 0,15
IC90 2,55 IC95 2,60
2,05 2,00

19
La media poblacional se encuentra entre 2.05 – 2.55 con un nivel de confianza del 90%
La media poblacional se encuentra entre 2.00 – 2.60 con un nivel de confianza del 95%
Cuanto más nivel o grado de confianza se demanda, mayor es la amplitud del intervalo.

EJERCICIO 12:

a. A+ C (nos damos cuenta por la simetría de su forma)


b. A porque tiene menos variabilidad
c. D media>mediana>moda: asimétrica cola a la derecha
d. B Media<mediana<modo: asimétrica cola a la izquierda

EJERCICIO 13:

En la clase A. el 95% de la población tendrá notas entre 5 y 7, Es más homogénea

EJERCICIO 14:

profesor A profesor B
media 7 media 6
desvío 3 desvío 0,9
media ± 1 desvío 10 4 media ± 1 desvío 6,9 5,1
media ± 2 desvíos 13 1 media ± 2 desvíos 7,8 4,2
a. profesor B
b. profesor A
c. Siempre aprueba el 95,45 % de los alumnos

EJERCICIO 15:

a.

población proporción muestra


P 407 0,35 103
T 296 0,25 75
A 148 0,13 38
M 325 0,28 82
TOTAL 1176 298

20
EJERCICIO 16:

a.
Serie 1 Serie 2
media 65,18 65,00
desvío estándar 2,71 6,23
modo 66 y 67 68
mediana 66 68
CV (desvío/media) 4.16% 9.58%
b. en Kg.
c. la serie 2, tiene mayor desvío estándar y mayor CV. La serie 1 es más simétrica y
homogénea
d. No, no es necesario calcular el CV, ya que las dos series tienen la misma media y están
expresadas en las mismas unidades de medida. La información sobre qué serie tiene mayor
dispersión se obtiene por el desvío estándar

EJERCICIO 17:

a.

Serie 1 Serie 2
altura altura
Media 162,73 cm. 165,00 cm.
desvío 6,02 cm. 6,40 cm.
estándar
CV 3,70% 3,88%

Para poder responder esta pregunta si o si deben calcular el coeficiente de variación, ya


que deben comparar el comportamiento de diferentes variables con diferentes unidades de
medida: esto sólo es posible utilizando una medida relativa de dispersión (CV)
Conclusión: en ambas series la variable peso tiene mayor variabilidad que la variable altura

21
EJERCICIO 18:

Situación Diferencia en la IC 95% (*) Es Qué pasa Interpretación


N° eficacia del estadísticame con la
tratamiento nte eficacia del
observada en significativa? tratamiento?
la muestra
1 20% -2% a + 25% No, porque El valor Negativo
es probable 30%, no
que la está incluido
diferencia sea en el
0 intervalo
2 20% -2% a + 40% No, porque El valor No concluyente
es probable 30%, está
que la incluido en el
diferencia sea intervalo
0
3 15% +5% a +15% Si, la El valor No importante
diferencia no 30%, no
puede ser 0 está incluido
en el
intervalo
4 30% +10% a +45% Si, la El valor NO concluyente,
diferencia no 30%, está ya que el límite
puede ser 0 incluido en el inferior del
intervalo intervalo es
10% <30%
5 30% +30% a +45% Si, la El valor importante
diferencia no 30%, está
puede ser 0 incluido en el
intervalo
Cuando pasa por 0, se está avalando la hipótesis nula: no existe diferencia en la eficacia de
ambos tratamientos

EJERCICIO 19:

a. El 95 % de la población es igual a la Media + /- 2 DE es decir que el valor que se considera


como glucemia normal es de entre 60 y 100 mg/dl.

b. Los pacientes con valores “no normales” como en toda variable biológica, son el 5 % que
queda por fuera de la Media +/- 2 DE.
2,5 % con glucemias menores a 60 (121 individuos) y 2,5 % con glucemias mayores a 100
(caso 125 individuos).
Estos últimos no son diabéticos (ya que se evaluó a pacientes NO DIABÉTICOS), sino personas
normales con valores anormalmente altos o "falsos positivos" para DBT.

22
c.

EEM (error estándar de la media)= desvío estándar / raíz ² del tamaño muestra
IC95%= Media muestra ± (Zά *EEM) ά= 0.05

tamaño muestra 5000


raiz tamaño muestra 70,71
media muestra 80
DE muestra 10
z0,05 1,96
EEM 0,141
IC95 80,28
79,72

d.

tamaño muestra 5000 500


raiz tamaño muestra 70,71 22,36
media muestra 80 80
DE muestra 10 10
z0,05 1,96 1,96
EEM 0,141 0,447
IC95 80,28 80,88
79,72 79,12
El EEM aumenta al disminuir el tamaño de la muestra
La amplitud del intervalo de confianza se incrementa

e. El cuadro 2 es la simple variación diaria de la glucemia que obedece a los períodos


periprandiales. SI bien la DB se pierde la regulación normal de la secreción de la insulina en
respuesta a la glucosa puede observarse que la glucosa aumenta luego de los horarios de
comida y que disminuye en los períodos de ayuno. El cuadro 3 muestra una progresiva
reducción del promedio de la glucemia a lo largo de las semanas, variación que se debe al
tratamiento instaurado.

23

También podría gustarte