Está en la página 1de 41

Análisis Estadístico

Unidad III

Lic. Figueroa Natalia

AGUILARES - 2022
Lic. Figueroa Natalia
OBJETIVOS:

 Conocer aspectos básicos del método


epidemiológico.
 Identificar los diferentes tipos de variables.
 Aplicar e interpretar la información resultante de la
estadística descriptiva.

Lic. Figueroa Natalia


ANTE LA GRAN CANTIDAD DE INFORMACIÓN

Debemos saber discernir entre:

Cuál es la información que necesitamos

Si el estudio tiene real validez

Saber interpretar correctamente la metodología


estadística.
ANALISIS ESTADÍSTICO
El análisis estadístico se divide en tres grandes tipos:

 Univariado
 Bivariado
 Multivariado
ANÁLISIS UNIVARIADO
 Univariado
Se describen las características de una variable por vez
 También se le conoce como Estadística Descriptiva

TABLA Nº 1 FRECUENCIA DE TBC PULMONAR POR ÓRGANO AFECTADO

TIPOS DE TBC Nº PORCENTAJE PORCENTAJE


ACUMULADO

PULMONAR 67 58.27% 58.27%

RENAL 12 10.43% 68.69%

MENÍNGEA 20 17.39% 86.08%

GENITAL 16 13.91% 100%

TOTAL 115 100%


ANÁLISIS BIVARIADO
 Se investiga la influencia de la variable Independiente, por vez, con respecto a la
variable Dependiente

• Variable Independiente Factor de Riesgo: Beber


Agua no potable
• Variable Dependiente Enfermedad: Cólera

Enfermo

+ -
A
g
u + 20 40

a
- 97 59
Variable Independiente Factor de
Riesgo: —
Peso al Nacer
variable dependiente Enfermedad:
•hipertensión sistólica
ANÁLISIS MULTIVARIADO

Se investiga la influencia de dos o más Variables Independientes,


junto o no a una o más variables asociadas (covariables o
cofactores) sobre una o más Variables Dependientes

TABLA 2 CONTROL PRENATAL, PARIDAD, EDAD MATERNA


Linearized
PS Coef. Std. Err. t P>|t| [95% Conf. Interval]

CPci .1713693 .0199854 8.57 0.000 .1321539 .2105846


CPci2 -.0067207 .0012622 -5.32 0.000 -.0091973 -.004244
told_comp .1378946 .0559186 2.47 0.014 .0281713 .2476179
multiple 1.173797 .2535498 4.63 0.000 .6762824 1.671311
labor_prol .2370946 .0512 4.63 0.000 .1366301 .3375591
n_hijos -.1109933 .0171813 -6.46 0.000 -.1447065 -.0772801
edad_nacHV -.0914881 .0236497 -3.87 0.000 -.1378934 -.0450829
edadnac_2 .0020827 .0004262 4.89 0.000 .0012465 .0029189
educ .055531 .0074086 7.50 0.000 .0409939 .0700682
agri -.3392816 .0696039 -4.87 0.000 -.4758581 -.2027051
decision_p -.139124 .0516724 -2.69 0.007 -.2405154 -.0377326
NSE .2683731 .0302954 8.86 0.000 .2089275 .3278187
_ISREGION_3 -.5599627 .0885707 -6.32 0.000 -.7337559 -.3861695
_ISREGION_4 -.3908881 .1310198 -2.98 0.003 -.6479745 -.1338016
_ISREGION_5 -.430737 .0963304 -4.47 0.000 -.6197562 -.2417179
_EESS_pob .066815 .025233 2.65 0.008 .017303 .116327
prob_perso~f -.0940079 .0499524 -1.88 0.060 -.1920242 .0040085
uso_ACmode~ .2520376 .056576 4.45 0.000 .1410243 .3630508
o
_cons -.2162597 .3206778 -0.67 0.500 -.8454924 .412973
SIGNIFICADO ESTADÍSTICO

 La lectura de una OR, un RR es idéntica y basta

 con aplicar las palabras “veces más” o “por cada 1”

EJEMPLO

 Por ejemplo si una droga con respecto al placebo produce una OR de 1,3,
significa que la droga es 1,3 veces mejor que el placebo.

 Si se tratara de un estudio sobre el riesgo de un evento sobre otro, el RR


indicaría que el riesgo de eventos terminales que se podrían esperar de la droga
durante el tiempo de seguimiento es 1.3 veces más alta que el placebo.
EJEMPLO
En un estudio de casos y controles se quiere determinar si el consumo de fibra es o no un
factor de protección para el cáncer de colon
 1 Calcule un estimador del riesgo asociado a la variable independiente consumo de
fibra.
 2. ¿Qué significa este resultado?
OR = (92x140)/(160x108) = 0.75 o
CASOS CONTROLES 75%

GRUPO DE 92 160 OR menor de 1 significa que el


EXPUESTOS consumo de fibra es un factor de
protección
NO EXPUESTOS 108 140

200 300
El cálculo del odds ratio a partir de los datos
de frecuencia de una tabla 2 x 2 es muy
sencillo:

a b OR= a x d
bxc
c d
El riesgo relativo de aparición del suceso del grupo A frente al grupo B se calcula como:

Grupo Grupo a__


A B RR= ( a+ c )
Suceso a b b
(b+d)
No c d
suceso
INTERPRETACION DEL ODDS
VALOR ODDS Intervalo de Tipo de
Intervalo de
RATIO confianza asociacion
confianza inferior
superior

1 No evidencia de
asociación
Significativa,
Mayor de 1 >1 >1
riesgo
Mayor de 1 <1 >1 No significativa
Significativa,
Menor de 1 < de 1 < de 1
protección
Menor de 1 < de 1 > de 1 No significativa
ANALISIS DE DATOS CUANTITATIVOS
ESTADISTICA

Distribución
De Frecuencias

1. DESCRIPTIVA Medidas de Media


Tendencia central Mediana
Moda

Medidas de • Rango
Variabilidad • Desviación estándar
• Varianza
Gráficas

Puntuaciones Z
UNIVERSIDAD NACIONAL
DE TUCUMAN

- 5 m a la
izquierda!!!

Cómo cazan los


bioestadísticos + 5 m a la
derecha!!!

Promedio: = 0
Lo cacé !!!!
Moda Es el valor
Rango Min-Max: 18 - 40 de la variable que
más se repite =
38

18 24 26 28 30 35 35 38 38 38 40

Mediana Es el valor
que ocupa la
posición central = 35

Promedio o media Es la media aritmética o promedio aritmético


350/11 = 31,8
MEDIA O MEDIA ARITMÉTICA
Tiene en cuenta todos los n elementos de la muestra.
• Se suman todos los n valores de la muestra y se divide por la cantidad total de
valores n de la muestra.

18 24 26 28 30 35 35 38 38 38 40 350/11 = 31,8

Media - Robustez

La media aritmética no es una medida robusta, ya que está influida por valores
extremos.
No es recomendable usar la media como medida central en las distribuciones
muy asimétricas
23 18
20 18
30 18
25 20
35 20
36 23
27 23
Media: 25
25
25 25
32 Mediana: 25
18 25
26 Moda: 26
32 27
18 30
33 31
20 32
31 32
25 33
23 35
35 35
18 36
Desviación: 1
Desviación: 3
Desviación: 4

0 1 2 3 4 5 6 7
Media: 4

Observación Desviación Desviación 2

0 0 -4= -4 16
5 5 -4= 1 1
7 7 -4= 3 9
Promedio = 4 Suma = 0 Suma = 26

La varianza muestral está definida como la Desviación estándar


suma de las desviaciones al cuadrado
divididas por el tamaño muestral menos 1 √13 = 3,6
26 /2 = 13
Desviación: 1
Desviación: 3
Desviación: 4 SD = 3,6
Var = 13

0 1 2 3 4 5 6 7
Media: 4

La desviación estándar es un promedio de las desviaciones individuales


de cada observación con respecto a la media de una distribución. Mide
cuan lejos se encuentran los datos de la media muestral
La varianza muestral puede pensarse como “promedio” de las distancias a la
media al cuadrado.

La varianza y la desviación estándar no son medidas de variabilidad


distintas, debido a que la última no puede determinarse a menos que
se conozca la primera.
Regla del Desvío estándar
( Distribuciones Simétricas )

Para los datos que tienen una distribución tipo


campana:

Aproximadamente 95 % de los valores de los datos


estarán entre dos desviaciones estándar de la media
Yo peso
60 Kg…

Yo
también!!!
Conceptos básicos y Teoría de Probabilidad
•Es la parte de las matemáticas que se encarga del
estudio de los fenómenos o experimentos aleatorios.

Experimento aleatorio: cuando se repite bajo las


mismas condiciones iniciales, el resultado que se
obtiene no siempre es el mismo.
Muestra
•Se puede definir como una parte de una población.
•El Universo es el total y la muestra es subconjunto (s1,
s2, s3, s4) de ese Universo.
Estadística Inferencial
Requiere que la muestra sea representativa
para generalizar las conclusiones obtenidas.

Para esto hay diversas técnicas de obtención


o selección de muestras (muestreo).

Permite extrapolar
los datos de la
muestra a la
población general
Muestreo probabilístico

Utiliza un método aleatorio para asegurar que cada


unidad de la población tenga una probabilidad
específica de ser seleccionada

Aleatorio simple
Sistemático
Conglomerados
Estratificado
Muestreo no probabilístico
No hay modo de asegurar que cada unidad de la población
tenga una probabilidad específica de ser seleccionada.

Muestreo a criterio- intencional.


Por conveniencia.
Casos consecutivos.
A
Objetivo: Conocer la cobertura social que
poseen los alumnos universitarios de la provincia
de Tucumán.

Población para obtener la


muestra
= personas con SS
= personas con Otras OS
= personas sin cobertura social
ALEATORIO SIMPLE

Opción: 1

Opción: 2

Opción: 3

= personas con SS
= personas con Otras OS
= personas sin cobertura social
Aleatorio simple.
Sistemático
•Numerar todos los elementos de la población, pero en lugar de
extraer n números aleatorios sólo se extrae uno.
•Se parte de ese número aleatorio que llamamos i, elegido al azar, y
los elementos que integran la muestra son los que ocupa los lugares
i, i+k, i+2k, i+3k,…
•Siendo k el resultado de dividir el tamaño de la población entre
el tamaño de la muestra: k= N/n.
•Es decir se toman los individuos de k en k.
Sistemático
Ej: tenemos 100 alumnos y queremos extraer una muestra de 25 alumnos:

1º establecer el intervalo de selección:

100 = 4
25

2º sortear el número o el elemento de arranque, tomando aleatoriamente un número


entre el 1 y el 4. Ej: 2

3º a partir de él obtenemos los restantes elementos de la muestra. 2, 6, 10, 14,…, 96.


Sistemático
Estratificado

Consiste en dividir la población en subgrupos de acuerdo a ciertas


características definidas por el investigador o quien hace el análisis; y luego
extraer una muestra aleatoria de cada uno de los estratos.

1 2
3
3 4

2 3 2 3
1
4 5

1 2 3 1 5
4 5 6 = personas con SS
= personas con Otras OS
= personas sin cobertura social
Conglomerado
Considera la población, considerando agrupamientos
“naturales”, y se extrae una muestra de cada uno de los
conglomerados.
Capital

Lules

= personas con SS
= persons con Otras OS Yerba Buena
= personas sin cobertura
Estratificado Conglomerados
Muestreo no probabilístico

VENTAJAS DESVENTAJAS

• Es un método práctico para los • El investigador necesita pensar


investigadores que en posibles sesgos.
implementan encuestas. • Es importante tener una
muestra que represente de
• Obtener respuestas más rápido
cerca a la población.
y más rentable.
• Los investigadores deben tener
• Comúnmente los participantes cuidado con los participantes
están motivados para que puedan distorsionar los
responder rápidamente en datos.
comparación con las personas
que se seleccionan al azar.
Graciassss….

También podría gustarte