Está en la página 1de 41

MÓDULO 3

Análisis de datos

Curso-Taller:
“Estrategias para el Fortalecimiento de la
Investigación en Salud”
09:00 09:30 Registro
Tipos de estadística y proceso estadístico
09:30 10:00
10:00 10:30 Conceptos básicos
10:30 11:00 Tipos de variables
11:00 11:30 Receso
11:30 12:00 Ejercicio: Conceptos básicos
12:00 12:30 Ejercicio: Tipos de variables
12:30 13:00 Exploración inicial de datos
13:00 13:30 Gráficos en estadística descriptiva
13:30 14:00 Preguntas y respuestas
Qué es la estadística?
• Es la ciencia que se ocupa de los métodos y
procedimientos para recoger, clasificar,
resumir, hallar regularidades y analizar los
datos, siempre y cuando la variabilidad e
incertidumbre sean una causa intrínseca de los
mismos; así como de realizar inferencias a
partir de ellos con la finalidad de ayudar a la
toma de decisiones y en su caso formular
predicciones.
Clasificación
Clasificación

• Estadística Descriptiva: Conjunto de


técnicas y métodos que son usados para
recolectar, organizar y presentar en forma
de tablas y gráficas información
numérica. Se incluyen aquí el cálculo de
medidas estadísticas de centralidad y
variabilidad
Clasificación

• Estadística Inferencial: Conjunto de


técnicas y métodos que son usados
para sacar conclusiones generales
acerca de una población usando datos
de una muestra tomada de ella.
Proceso estadístico
1. Planteamiento del problema/hipótesis

– Los fumadores tienen más ausencias


laborales que los no fumadores
• (¿Mayor tiempo, número?)
Proceso estadístico
2. Decisión: qué datos se recogerán

– Sujetos de estudio (muestra)


• Fumadores y no fumadores en edad laboral
• Criterios de inclusión/exclusión
– Cualidades/características de los sujetos (variables)
• Ausencias
• Tiempo de cada ausencia
• Sexo, edad, sector laboral, otros
Proceso estadístico
3. Recogida de datos

– Forma/instrumentos de recolección
Proceso estadístico
4. Exploración/descripción de los datos

– Porcentaje de fumadores y no fumadores


– Media de edad, otras medidas de frecuencia
– Tiempo medio de ausencia entre fumadores y no
fumadores (estadísticos)
– Graficos descriptivos, etc
Proceso estadístico
5. Inferencia

– Los fumadores tienen una media de ausencia


laboral de al menos 10 días al año más que los no
fumadores

– Cuantificar la confianza de la inferencia (intervalo


de confianza y significación del contraste o valor
p)
Conceptos básicos
• POBLACIÓN:

Conjunto de observaciones o datos obtenidos de


una medición, conteo o cualidad de ciertos
caracteres de los mismos

– Es el conjunto de todas las medidas que nos interesa estudiar:


• Preferencias electorales de cada votante en México
• Personas con cáncer de pulmón en México
Conceptos básicos
• POBLACIÓN:

• Finita: El número de elementos de una población tiene un valor definido. Ejemplos:


• Población de Cuernavaca
• Enfermos de Cáncer de Pulmón
• Días en el año 2005
• Infinita: El número total de elementos de la población no está definida (al menos en
la práctica).
• Tiradas sucesivas de una moneda
• Cruces de automóviles en el entronque de dos carreteras
• Días
Conceptos básicos

• MUESTRA:

– Es el conjunto de todas las medidas que se


observan (es un subconjunto de la población).

• Preferencias electorales de 1000 votantes en una


encuesta
• Personas con cáncer de pulmón atendidas en el
Instituto Nacional de Cancerología en Julio del
2012
¿Por qué hablamos de incertidumbre en las conclusiones?
Por que existen MUCHAS muestras posibles ¡pero nosotros
sólo observamos UNA!
Conceptos básicos

• CENSO: estudio de todos los elementos


de una población

• UNIDAD ELEMENTAL: todo elemento


que esta afectado por la característica que
se desea estudiar
Conceptos básicos
UNIDAD ELEMENTAL: Las unidades de análisis son los elementos
que conforman la población de estudio. Su definición varía de
acuerdo al contexto del estudio. Por ejemplo:

• Estudio sobre la prevalencia de diabetes mellitus en pobladores de


Cuernavaca, Unidad de Análisis: Individuos.

• Estudio sobre la proporción de hogares en Cuernavaca que cuentan


con refrigerador, Unidad de Análisis: Hogares.

• Estudio sobre las concentraciones de partículas en el aire de


diversas Zonas Metropolitanas de México, Unidad de Análisis:
Ciudades.
• Se desea hacer un estudio sobre el
ingreso familiar en el distrito federal

Identifique: población, posible muestra,


característica en estudio y unidad
elemental
Conceptos básicos

• OBSERVACIÓN: dato o registro


realizado, producto de la apreciación de
una característica en una unidad
elemental
Conceptos básicos
• Se ha hecho un estudio para determinar la preferencia
sobre una forma de presentación de un analgésico por
parte de los pacientes del hospital de enfermedades
crónicas. Entre 50 pacientes entrevistados 25 dijeron
que preferían la vía oral.

– ¿Cuál es la muestra?
– ¿Cuál es la población?
– ¿Cuál es la proporción dentro de la muestra de los
pacientes que prefieren la vía oral?
Conceptos básicos
• VARIABLES: son las características que se
desea apreciar de los elementos de la población

• PARÁMETRO: función de todas las


observaciones de una población (resume la
información contenida en las observaciones que
comprenden a una población por lo que su valor
es único y generalmente desconocido y por lo
tanto debe ser estimado)
Conceptos básicos
• ESTIMADOR O ESTADÍSTICO: es una
función de los valores muestrales que no
depende de parámetro alguno. Se caracterizan
por que pueden tomar valores diferentes de
muestra a muestra

Es imposible conocer con 100% de certeza cual es el


verdadero efecto…pero lo podemos estimar usando
métodos estadísticos
Variables: tipos
Variables: tipos

• VARIABLES CUALITATIVAS: cualidad o


atributo que clasifica a cada individuo en una
de varias categorías

– Dicotómicas o binarias: hombre/mujer,


enfermo/sano, fumador/no fumador

– Policotómicas: Color de ojos, grupo sanguíneo,


profesión
Las variables con dos categorías se llaman
dicotómicas. Cuando se codifican como 0 o 1 se
les suele llamar variables “dummy”.
Variables: tipos

• VARIABLES CUANTITATIVAS: pueden medirse,


cuantificarse o expresarse numéricamente

– Continuas: si admiten tomar cualquier valor dentro de un


rango numérico determinado con uno o varios decimales
(peso, talla, edad)

– Discretas: Son aquellas que no admiten todos los valores


intermedios en un rango. Suelen tomar valores enteros
(número de hijos, abortos, partos, hermanos)
Variables: tipos
• Según la escala de medida:

– NOMINALES: forma de observar o medir en la


que los datos se ajustan por categorías que no
mantienen una relación u orden (sexo, grupo
sanguíneo, presencia o ausencia de una
enfermedad)

– ORDINALES: existe cierto orden, grado o


jerarquía (grado de disnea, dolor, intensidad de un
hábito, tipo de fumador)
Variables: tipos
• VARIABLE INDEPENDIENTE (X)
– Controlada por el investigador
– Información disponible
– Variable predictiva
– Exposición
– Posible causa
– Factor

• VARIABLE DEPENDIENTE (Y)


– Respuesta que no se controla
– Información que se desea conseguir
– Variable desenlace
– Resultado
– Posible efecto
– Consecuencia
Variables: tipos
•La variable dependiente es el evento estudiado y se
espera que éste cambie cuando cambia a su vez la variable
independiente. También llamada variable “resultado”, LHS
(left hand side), endógena, de respuesta, etc.. El efecto se
mide en la variable dependiente.

•Las variables independientes representan las causas.


También llamadas variables explicativas, determinantes,
exógenas, RHS, predictoras, exposiciones, o simplemente
covariables.
Variables dependientes e
independientes

Religión/
creencias
Uso de
condón

Programa
(campaña
educativa)
Observaciones, variables, datos…
Variables

# de Edad Sexo Glucosa


participante en
ayunas Datos
(mg/dL)
1 23 Hombre 78
2 56 Mujer 182
3 54 Mujer 101
Observaciones
. . . .
. . . .
n Edadn Sexon Glucosan
Exploración de variables
Exploración de variables
Exploración de variables
• Parte de la estadística descriptiva incluye el
resumen y presentación de datos

– Tablas
– Graficas
• Barras
• Pastel
• Histograma
• Otros
Hemoglobina, edad materna y peso al nacer en una
muestra de niños de 2 años de edad
Hemoglobina, edad materna y peso al nacer en una
muestra de niños de 2 años de edad

.4
Desviación
Variable Media Estándar
Hemoglobina (g/dL) 11.78 1.35

.3
Edad materna (años) 25.71 5.20

Density
Peso al nacer (Kg) 3.12 0.44

.2
Tabla I. Estadísticas descriptivas de la población de estudio.

.1
0
4 6 8 10 12 14
Hemoglobina (g/dL)
5

Figura I. Distribución de hemoglobina (g/dL) en la población de


4

estudio.
Peso al nacer (kg)
3
2

Figura II. Distribución del peso al nacer en la población de


estudio.
1

También podría gustarte