Está en la página 1de 38

BIOESTADÍSTICA

Alex Soto Poblete


Estadístico
Muestreo
Recolección de la datos

Si queremos conocer una población, por qué


no tomar una muestra de toda la población?
¿Por qué no hacer un censo?
Población o universo
Es el conjunto de elementos, individuos o entes sujetos a
estudio y de los cuales queremos obtener un resultado.
El tamaño se denota N.

Muestra
Subconjunto de la población que se estudia para
determinar estimar el resultado de la población.
Población (N)

Elementos o
unidades de
análisis
Población (N)

Elementos o
unidades de
Muestra (n) análisis
Marco Muestral

Lista, mapa o fuente de donde pueden extraerse

todas las unidades de muestreo o unidades de

análisis en la población, y de donde se tomarán

los sujetos objeto del estudio.


Muestra aleatoria

Es aquella que se obtiene de tal manera que


cada posible observación disponible en la
población, tiene la misma probabilidad de ser
seleccionada.
Tamaño muestral

Es le número de elementos u observaciones que


tomamos. Se denota por n.
Unidad

Es un objeto individual que nos sirve como


fuente para la realización de nuestra
investigación. Recibe diferentes denominaciones:
observación, elemento, individuo, unidad
experimental, caso, objeto, unidad muestral, etc.
Variable

Característica del individuo que puede tomar


distintos valores. Cuando medimos algo
representamos por un modelo aquello que
medimos. Por ejemplo, la estatura de una
persona: asignamos un número a cada persona.
Dato

Son los distintos estados en los que se puede


encontrar una característica de un individuo.
Estos pueden ser cualitativos (hombre, mujer) o
cuantitativos (161 cm).
Inferencia Estadística

Es el proceso de sacar conclusiones de la


población en estudio basado en la información
obtenida de la muestra de esa población
Población

Conclusiones
Muestra
Las observaciones de una muestra aleatoria se
usan para calcular ciertas características de
ésta, denominadas estimadores o estadísticos.
Los estadísticos se usan como base para
hacer inferencias acerca de ciertas
características de la población, que reciben el
nombre de parámetros.
Parámetro es una medida numérica que se
calcularía usando todas las unidades de
población.
Estadístico es una medida numérica que se
calcula de las unidades de la muestra.
Ejemplo

En Chile el 5,3% de la población tiene sangre factor Rh(-).


En una muestra aleatoria de 400 sujetos de esa población
se encuentra que un 8,8% tiene factor Rh(-).

a) ¿Cuál es el valor del parámetro?

P=5,3% =0,053

b) ¿Cuál es el valor del estadístico?

P=8,8% =0,088
Datos Resultados

Basura Basura
Base de Datos

Organización básica de la información obtenida


para realizar una investigación. La estructura es
rectangular compuesta n filas y p columnas.
columnas
Individuo A1 A2 … Aj … Ap
1 x11 . .
2 . .
. . .
Filas

i … xij … xip
. . .
n … xnj xnp
Diccionario de Bases de Datos

Incluye la información pertinente para


comprender adecuadamente lo que significará
en adelante cada número de la base de datos.
Ejemplo:
Variable Códigos Nombre
1) Número de identificación ID
1: Mujer
2) Sexo SEXO
2: Hombre
3) Edad (años cumplidos) EDAD
4) Peso (en kg. aproximado) PESO
5) Número de cigarrillos fumados al día NUMCIG
0: Ninguno
1: Poco
6) Interés en dejar de fumar INTERES
2: Regular
3: Mucho
Ejemplo:

ID SEXO EDAD PESO NUMCIG INTERES


1 1 23 68 2 1
2 2 22 74 10 0
3 2 23 58 1 0
4 1 20 80 15 3
Calidad de los datos

La calidad de la decisión que se va a tomar


depende de la calidad de los datos.
Una información de buena calidad debe ser
VÁLIDA, es decir debe REFLEJAR LA
VERDAD.

Una medida tiene validez si es indicativa del


estado que se pretende medir.

Ej: Las respuestas obtenidas mediante


entrevistas verbales en algunas sociedades
pueden no ser indicativas de las prácticas
locales respecto del aborto.
Error es la diferencia entre la medida asignada
a un objeto y su valor verdadero.
Fuentes de error en la planificación

– Falta de definiciones precisas.

– Heterogeneidad en las condiciones en que se realiza


la observación o los procedimientos de medición.
Ej: si se desea clasificar un grupo de enfermos por diagnóstico, debe definirse qué
síntomas, signos y resultados de exámenes se considerarán propios de cada
enfermedad. Además se deberá definir qué se entenderá por determinado síntoma
o signo.

Cuanto más exhaustivas sean las definiciones, tanto más precisos serán
los datos obtenidos.
Fuentes de error en el muestreo
 Sesgo es un error sistemático. Ej: Balanza mal calibrada.

 Un método de muestreo se dice sesgado si los resultados que


produce difieren sistemáticamente de los verdaderos de una
población

 Una muestra por conveniencia es una muestra que consiste


en unidades de la población que son fáciles de obtener.

 Una muestra de voluntarios es una muestra que consiste de


unidades de la población que eligen responder.

 Las muestras por conveniencia y de voluntarios son


generalmente sesgadas
 Sesgo de selección se produce cuando el procedimiento de
muestreo tiende sistemáticamente a incluir o excluir algún tipo
de unidad de la población.

 Sesgo de falta de respuesta es la distorsión que se provoca


cuando gran parte de la muestra seleccionada no responde o se
niega a responder, y estas personas tienden a ser diferentes de
los que responden.

 Sesgo por tipo de pregunta es la distorsión que afecta a la


respuesta que se provoca ya sea por la forma de hacer una
pregunta o por la forma de preguntarla por parte del
entrevistador.
Tipos de Muestreo

 Muestreo aleatorio simple


 Muestreo aleatorio estratificado
 Muestreo sistemático
 Muestreo por conglomerados
 Muestreo multietápico
Muestreo Aleatorio Simple (m.a.s.)

 Método para seleccionar n unidades de las N


unidades de la población, de tal manera que cada
muestra posible de tamaño n tiene la misma
probabilidad de ser seleccionada (n < N).

 Muestras de distinto tamaño pueden tener


diferentes probabilidades de ser seleccionadas.
Para obtener la muestra con este procedimiento, las
unidades en la población son previamente
numeradas en forma correlativa de 1 a N. A
continuación se extraen n números aleatorios entre 1
y N a partir de una tabla de números aleatorios, o
con otro procedimiento que asegure igual
probabilidad de selección para cada unidad.
N
n
 Una tabla de números aleatorios es una lista de
dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 y tiene las siguientes
propiedades:
- Cualquier dígito en cualquier posición de la tabla
tiene la misma probabilidad de ser:
0, 1, 2, 3, 4, 5, 6,7 ,8 ,9.
- Los dígitos en posiciones diferentes son
independientes, en el sentido de que el
conocimiento de algunos números de la tabla no
da información acerca de otros números de la
tabla.
Seleccionando una m.a.s.
Suponga que tenemos N=50 unidades en la población y
necesitamos una muestra aleatoria simple de tamaño n.

PASO1: Asigne ETIQUETAS: Dé a cada unidad en la población un


número, etiqueta o identificación. Todas las etiquetas deben tener el
mismo número de dígitos. Como tenemos 50 unidades y 50 tiene
dos dígitos, todas las unidades tienen que tener dos dígitos
Seleccionando una m.a.s.

PASO2: Use la TABLA: Empezando en un lugar escogido al azar


lea grupos de dígitos (dependiendo del número de dígitos en las
etiquetas) de izquierda a derecha, continuando con la línea
siguiente cuando se acabe la línea que está leyendo. Si el grupo de
dígitos corresponde a una de las etiquetas, ese número identifica a
una de las unidades que será seleccionada. Si el grupo de dígitos
no corresponde a una de las etiquetas o si ya fue seleccionado, se
salta al grupo siguiente, hasta llegar a obtener la muestra n.
Ejemplo
Seleccione una muestra aleatoria simple de tamaño n=7
de esta población de 15 estudiantes. Donde cada
estudiante se representa por un rectángulo y cada
cuadrado del rectángulo representa un lunar en la
espalda.
Dadas N=15 unidades en la población, debemos elegir
una muestra aleatoria simple de tamaño n=7.

PASO1: Asigne ETIQUETAS: Dé a cada unidad en la


población un número, etiqueta o identificación. Todas las
etiquetas deben tener el mismo número de dígitos. Como
tenemos 15 unidades y 15 tiene dos dígitos, todas las
unidades tienen que tener dos dígitos.
PASO2: Use la TABLA: Empezando en un lugar escogido al azar
lea grupos de dígitos (dependiendo del número de dígitos en las
etiquetas) de izquierda a derecha, continuando con la línea
siguiente cuando se acabe la línea que está leyendo. Si el grupo de
dígitos corresponde a una de las etiquetas, ese número identifica a
una de las unidades que será seleccionada. Si el grupo de dígitos
no corresponde a una de las etiquetas o si ya fue seleccionado, se
salta al grupo siguiente.
Para ejemplo suponga que el lugar de partida escogido al azar fue
la Fila 8, columna 2:

La muestra seleccionada serán los cuadrados cuyas etiquetas son:


01; 07; 14, 04, 08, 10 y 12
Muestra: 1, 7, 14, 4, 8, 10, 12

Datos (Nº lunares): 1, 12, 4, 1, 5, 1, 8

Estadístico: (1 + 12 + 4 +1 + 5 + 1 + 8)/7=4,57

Parámetro=3,67
Pensemos
 ¿Parece simple seleccionar una muestra aleatoria simple?

 ¿Es siempre posible?

 ¿Cuándo es difícil?

 ¿Cómo será numerar las unidades si el tamaño de la


población fuera 78? ó 292? ó 4000?

 ¿Será simple usar la tabla, la calculadora o el computador?

El muestreo aleatorio simple es objetivo o insesgado,


pero tiene la desventaja que necesitamos tener una
lista completa de la población y eso no siempre es
posible.

También podría gustarte