Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Es de las áreas de la estadística que trata principalmente con las ciencias biológicas y las
disciplinas relacionada con la medicina y la salud.
VARIABLE
Es una propiedad que puede variar y cuya variación es susceptible de medirse y describe
una característica que puede variar de un sujeto a otro , se aplica a un grupo de personas
u objetos, los cuales pueden adquirir diversos valores respecto de ella.
Tipos de variables:
Variable cualitativa
Son aquellas que representan una cualidad o atributo que clasifica a cada caso.
Ejemplos: sexo (varón o hembra); color de os ojos (azul, negro, marrón...).
Variable cuantitativa
ESCALAS DE MEDICIÓN
Una escala de medición es el conjunto de los posibles valores que una cierta variable puede
tomar. Es un continuo de valores ordenados correlativamente, que admite un punto inicial
y otro final.
Las escalas o niveles de medición se utilizan para medir variables o atributos. Por lo
general, se distinguen cuatro escalas o niveles de medición: nominal, ordinal, intervalos y
razón. Las dos primeras (nominal y ordinal) se conocen como escalas categóricas, y las
dos últimas (intervalo y razón) como escalas numéricas. Las escalas categóricas se usan
comúnmente para variables cualitativas, mientras que las numéricas son adecuadas para
la medición de variables cuantitativas.
Ejemplos:
Ejemplos:
ESCALA DE INTERVALOS: Son más refinadas puesto que además del orden o
jerarquía entre categorías, las etiquetas o números consecutivos establecen
intervalos iguales en la medición. La medición en una escala de intervalos se basa
en suponer que puede conocerse exactamente la diferencia entre los objetos
medidos según esta escala. El inicio de la escala (0) es arbitrario convencional.
Ejemplos:
Lapsos de tiempo transcurridos entre 1995-1999 y 2000-2004.
Escalas de los test psicológicos.
Temperatura del cuerpo humano.
CUADRO DE VARIABLES
VARIABLES TIPO ESCALA INTERPRETACIÓN
Servicio Cualitativo Nominal No existe ningún orden o
hospitalario. (nominal) categoría solo
nombraríamos los servicios
que existen como
medicina, pediatría.
Agentes causantes Cualitativo Nominal No hay una jerarquización
de alergia: físicas o (nominal) entre agentes físicos o
químicas. químicos.
Tipo de parto. Cualitativo Nominal Pues solo se nombra para
(nominal) diferenciar uno del otro si
es eutócico o distócico.
Temperatura del Cuantitativo Intervalo Porque la temperatura
polo Ártico. (continua ) puede tomar valores
inferiores al 0 C°, lo que no
indica ausencia de valor.
Células sexuales. Cualitativo Nominal Porque no existe un orden
(nominal) entre óvulo y
espermatozoide.
Peso de niños al Cuantitativo Razón Porque no existe el cero
nacer. (continua ) arbitrario respecto al peso,
no tiene valor alguno.
PH de la orina. Cuantitativo Intervalo El pH de la orina de la
(continua) persona se puede
encontrar en un intervalo
de 0 -14 que puede ser de
ácido hasta alcalino sin
embargo los niveles
normales son desde 4.5 a
8.0.
Valor en glucosa en Cuantitativo Razón Porque no existirá un
sangre de 20 niños. (continua) persona de no tenga
glucosa en sangre.
Nivel de Cualitativo Ordinal Porque se puede
conocimiento de un (ordinal ) jerarquizar como: nivel alto,
niño. nivel intermedio y bajo.
Colesterol en sangre Cuantitativo Razón Los niveles de colesterol
de una persona. (continua) en sangre no pueden ser
menor a cero.
Grado de Cualitativo Ordinal Se puede establecer un
desnutrición. (Ordinal) orden: leve, moderado,
grave.
Nivel de pobreza. Cualitativo Ordinal Porque existe una
(ordinal) jerarquización: alto, medio,
bajo.
Velocidad de felinos. Cuantitativo Razón Porque el cero significaría
(discreta) ausencia de velocidad, no
tiene valor alguno.
Ejemplo:
Niveles de LDL – colesterol en pacientes del Hospital Regional Honorio Delgado
Espinoza 2016.
68 22 36 12 16 23
63 23 42 32 24 19
42 24 28 49 69 46
26 25 31 38 47 30
30 44 28 42 23 43
36 65 25 27 22 49
28 43 45 31 43 12
32 25 12 50 27 10
79 74 57 38 49 45
27 51 51 21 26 55
n = muestra
N = población
2) Ordenamiento
d) Intervalo de clase
𝑅 70
I.C =
𝐾
= 7
=10
e) Construir en cuadro D.F.
CUADRO N°1 D.F. PARA NIVELES DE LDL EN PACIENTES DEL HOSPITAL REGIONAL "HONORIO DELGADO ESPINOZA".
INTERVALO DE LIMITES DE
K CLASE INTERVALOS REAL Xi Fa Fr F% Fa ACUMULADA Fr ACUMULADA F% ACUMULADA
1 10 – 19 9.5 - 19,5 14. 5 6 0.1 10 6 0.1 10
2 20 – 29 19.5 - 29,5 24.5 19 0.3167 31.67 25 0.4167 41.67
3 30 – 39 29.5 - 39,5 34.5 10 0.1667 16.67 35 0.5834 58.34
4 40 – 49 39.5 - 49,5 44.5 14 0.2333 23.33 49 0.8167 81.67
5 50 – 59 49.5 - 59,5 54.5 5 0.0833 8.33 54 0.9 90
6 60 – 69 59.5 - 69,5 64.5 4 0.0667 6.67 58 0.9667 96.67
7 70 - 79 69.5 - 79,5 74.5 2 0.0333 3.33 60 1 100
60 1 100
𝐿𝑖 + 𝐿𝑠
Xi =
2
Fa: FRECUENCIA ABSOLUTA (CONTEO DE DATOS)
Fr: FRECUENCIA RELATIVA
𝑭𝒊
Fr:
𝒏
20 19
18
16
14
14
12
10
10
8
6
6 5
4
4
2
2
0
14. 5 24.5 34.5 44.5 54.5 64.5 74.5
INTERPRETACIÓN:
25
23.33
20
16.67
15
10 10
8.33
6.67
5
3.33
0
14. 5 24.5 34.5 44.5 54.5 64.5 74.5
INTERPRETACIÓN:
60 60
58
54
50 49
40
35
30
25
20
10
6
0
14. 5 24.5 34.5 44.5 54.5 64.5 74.5
Interpretación:
Más de la mitad de pacientes que es 35, tiene niveles de colesterol entre 14.5 a 34.5
mg/dl.
• El total de paciente 60 del hospital regional “Honorio Delgado Espinoza” el niveles de
colesterol están entre 14.5 a 74.5 mg/dl.
PROCESO DE DATOS PARA VARIABLES CUALITATIVAS
EJEMPLO :
OPERACIONALIZACION DE VARIABLES
VARIABLE INDICADOR TIPO ESCALA
sexo femenino cualitativo nominal
masculino
F F F F
F F F
M F M
F M F
F F F
M F F
M F F
M M F
F M F
F F F
F M M
25
20
15
10
0
Masculino Femenino
29%
71%
Masculino Femenino
ESTADÍSTICA DESCRIPTIVA
Estadísticos muéstrales
2. MEDIDA DE POSICIÓN:
Quartiles.
Deciles.
Porcentiles.
3. MEDIDA DE DISPERSIÓN:
Rango.
Varianza.
Desviación estadística.
∑ 𝑋𝑖 𝑓𝑖
Me =
𝑛
EJEMPLO:
Datos no acumulados
Datos agrupados
Número de costillas en Raymondi Arequipensis.
n = 6 cactus.
ESTADÍSTICA DE MUESTREO
Ẋ = Σ Xi / n
Ẋ = 37 / 6 Xi = Valor de la variable.
n = Numero de muestras.
Ẋ = 6,17 ≈ 6
a) Parámetros Poblacionales.
µ = Σ Xi /
N
Xi = Valor de la variable.
µ = 10.86 / 7 N = Numero poblacional.
Mediana:
IC Xi Fi Xi Fi
Ẋ = Σ Xi Fi / Σ Fi
10 – 19 14,5 6 87
Ẋ = 2200 / 60
20 – 29 24,5 19 465,5
30 – 39 34,5 10 345 Ẋ = 36,67 Media
40 – 49 44,5 14 623
50 – 59 54,5 5 272,5
60 – 69 64,5 4 258
70 – 79 74,5 2 149 Xi = Valor
central.
POBLACIÓN:
(Una población panmíctica es uno donde todos los individuos son socios potenciales. Esto supone
que no hay restricciones de apareamiento, ni genéticas ni de comportamiento , a la población, y
que por lo tanto toda la recombinación es posible- que pueden cruzarse entre sí)
MUESTRA:
Muestra: “Es una parte representativa de la población que es seleccionada para ser estudiada, ya
que la población es demasiado grande para ser estudiada en su totalidad” Allen Webster.
Parámetro: Son las medidas o características descriptivas inherentes a las poblaciones. Los
salarios promedio de todos los empleados de una empresa, puede ser un ejemplo de
parámetro.
Estadístico o Estadígrafo: Son las medidas descriptivas inherentes a una muestra, las cuales
pueden usarse como estimación del parámetro. Como ejemplo podría tomarse los salarios
promedio de una muestra de los empleados de la empresa.
MUESTREO:
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos
de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la
población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es
determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias
sobre dicha población.
TIPOS DE MUESTREO:
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de
muestreo no probabilísticos.
MUESTREO ALEATORIO SIMPLE
MUESTREO
MUESTREO ALEATORIO POR CONGLOMERADOS
PROBABILÍSTICO
MUESTREO DISCRECIONAL
I. MUESTREO PROBABILÍSTICO
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad
de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por
tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos
los siguientes tipos:
A) MUESTREO ALEATORIO
SIMPLE
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.
𝟐𝟓𝟎
𝑷 = 𝟏𝟓𝟎𝟎 = 0.25 ------------ 25%
*Sorteo
*Tabla de números aleatorios
Ejemplo:
Estudio de casos de cáncer en cuello uterino en pacientes del H.R.H.D.E año
2000 a 2010
P: Historias Clínicas pacientes atendidos por el servicio de
cáncer del H.R.H.D.E.
N=2000
H.C
L =500
Caja =300
Conserva =20
Muestreo
n=10
V.I= conservas
Lote= 3 dígitos
Caja= 3 dígitos
Conserva= 2 dígitos
B) MUESTREO ALEATORIO
SISTEMÁTICO
Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en
lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que
es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado
de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que
empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de
muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los
miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una
muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos
mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o
sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.
2, 6, 10, 14, 8.
Escogemos al azar un número i entre 1 y k (utilizando los números aleatorios, sacar una bola de un
bombo, etc.).
La muestra será el elemento i y los elementos i+k, i+2k, etc.. Es decir, el elemento k y los
elementos a intervalos fijos k hasta conseguir los n sujetos:
Suponemos que queremos saber la opinión sobre un profesor de una clase de 60 personas. Dichas
personas están ordenadas por orden alfabético en la lista de alumnos de clase. Para realizar la
encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12. El intervalo fijo entre sujetos
es:
Ahora elegimos al azar un número entre 1 y k=5. Suponemos que nos sale i=2. La muestra
resultado mediante el muestreo sistemático será:
C) MUESTREO ALEATORIO
ESTRATIFICADO
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y
suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna
característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el
sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que
todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato
funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o
el estratificado para elegir los elementos concretos que formarán parte de la muestra. En
ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la población. (Tamaño geográfico, sexos, edades,...).
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la
desviación.
Entre estrato y estrato
debe existir la máxima
Heterogeneidad; Pero
dentro de cada Estrato
debe haber la máxima
Homogeneidad.
En cada estrato se toman n1, n2,…, nk elementos para la muestra, de manera que se toman en
total n individuos, es decir:
Se tomará una muestra que sea representativa del conjunto de la población. El número de
individuos que se eligen de cada estrato se puede decidir mediante diversos criterios:
Elección simple: se toman el mismo número de sujetos de cada uno de los k estratos. De
cada estrato se seleccionarían n/k individuos. Este criterio no es recomendable cuando los
estratos tienen diferente número de individuos.
Elección proporcional al tamaño del estrato: el tamaño de la muestra en cada grupo es
proporcional a los elementos de dicho grupo. En cada estrato se tomarán ni elementos,
calculados mediante la fórmula:
Por ejemplo, suponemos que estamos haciendo un estudio de la vista de la población de una
ciudad. Suponemos que el 30% de la población lleva gafas y el 70% no. Mediante este método se
escogería el 30% de la muestra de personas que lleven gafas y el 70% de los que no.
Por ejemplo, supongamos que hacen una encuesta para las elecciones en EEUU y se sabe que el
candidato demócrata tiene mayor influencia en las mujeres que el candidato republicano. La
muestra de la encuesta debería estratificarse en hombres y mujeres, puesto que sabemos que
la variable género influye en la votación.
En las encuestas conocemos datos como la edad, sexo, nivel socioeconómico. Conviene que la
muestre tenga una composición proporcional a los individuos de cada estrato.
Se utiliza el muestreo estratificado cuando los grupos o estratos son muy homogéneos
internamente y diferentes entre ellos. Si los grupos son muy heterogéneos y no existen muchas
diferencias entre ellos, es recomendable utilizar el muestreo por conglomerados.
Una vez seleccionados los conglomerados, el estudio se simplifica puesto que hay menos
individuos en el análisis. El investigador debe elegir si estudiar a todos los sujetos de los
conglomerados seleccionados o seleccionar una muestra mediante el método de muestreo
aleatorio simple o muestreo sistemático.
Supongamos que el Ministerio de Sanidad quiere hacer en su país para ver si un tratamiento ayuda
a prevenir el cáncer de colon. Si en los datos históricos se observa que la incidencia y
comportamiento del cáncer es parecido en todas las comunidades, podríamos dividir el país en
comunidades y seleccionar algunas. Mediante el muestreo por conglomerados se reducen
notablemente los individuos a estudiar, lo que implica reducir los costes económicos.
Entre conglomerado y
conglomerado debe existir
máxima Homogeneidad.
Dentro de cada conglomerado
debe existir la máxima
Heterogeneidad
CUANDO UTILIZARLO
Se utiliza el muestreo por conglomerados cuando los grupos son muy hetereogéneos y no existen
muchas diferencias entre conglomerados. Se utiliza el muestreo estratificado cuando los grupos o
estratos son muy homogéneos internamente y diferentes entre ellos.
El inconveniente de este método es que se puede suponer una heterogeneidad que no existe.
Supongamos que se realiza una encuesta de opinión en diferentes comunidades por las reformas en
educación realizadas por el gobierno en el último mes. Se podría deducir que no existirá diferencias
significativas en la opinión de las diferentes regiones, pero resulta que en las comunidades más ricas
pueden tener una opinión muy diferente a las pobres.
En este muestreo se procede por etapas. Cuando son dos, recibe el nombre de bietápico y si son
más de dos etapas se le considera polietápico En cada una de ellas salvo en las ultima, la unidad de
muestreo no coincide con la unidad que proporciona la información. Es decir, se definen unas
unidades primarias, por ejemplo, ciudades y entre ellas se elige una muestra. Los conglomerados
que resultan de la primera división se les denomina unidades primarias. Las unidades secundarias,
de menor entidad, por ejemplo, manzanas de las ciudades elegidas y así se obtiene una muestra
aleatoria entre ellas.
Tiene la ventaja de que no es necesario confeccionar la lista de todas las familias de todo el país,
si no únicamente la de las ciudades, en primer lugar; la de las manzanas solo en las ciudades
elegidas y, por ultimo las viviendas de las manzanas que forman parte de la muestra. Además,
tiene la ventaja de concentrar geográficamente las encuestas. El principal inconveniente es que
incrementa los errores, pues en cada etapa se obtiene una muestra con su correspondiente error.
Una muestra con dos etapas está sujeta a dos errores muéstrales y una muestra de cinco etapas
tendría cinco errores muéstrales. Otra cuestión que se plantea es cómo repartir el tamaño de la
muestra en las etapas, por ejemplo para una muestra de 1.000familias se podrían elegir, entre las
probabilidades, 100 ciudades con10 entrevistas en cada una, o bien 10 ciudades con 100
entrevistasen cada una.
Se dice que es de dos etapas, ya que se obtiene primer una muestra aleatoria de conglomerados y,
luego en una segunda etapa, una muestra aleatoria de los elemento de cada conglomerado que
han sido seleccionados Este método facilita la elaboración del marco en la primera etapa y luego
el de la segunda, siendo al final más económico que el obtenido mediante el muestreo aleatorio
estratificado.
EJEMPLO: Supongamos que una firma tiene 110 fábricas distribuidas por todo el territorio
nacional y desea estimar el tiempo y numero de máquinas que duraron paralizadas ya sea por el
mantenimiento o por daño, durante un trimestre. Por tiempo y distancia se diseña una
investigación aplicando el muestreo por conglomerados en dos etapas, para ello se procede a
realizar una muestra de 12 fábricas década una de ellas. El problema se puede presentar de dos
maneras
•Conociendo el total de las máquinas para las 110 fábricas, por ejemplo 5.500 máquinas.
C E
Ejemplo:
Efectos de sustratos entre producción de tomate
Sustratos Orgánicos Producción de tomate Ganancia del producto
MUESTREO POR
CUOTAS
MUESTREO INTENCIONAL O DE
CONVENIENCIA
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión
en la muestra de grupos supuestamente
BOLA DE NIEVE típicos. Es muy frecuente su utilización en
sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los individuos de la
población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a
los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos).
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir
una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
MUESTREO
DISCRECIONAL
A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al
estudio.
TAMAÑO DE MUESTRA
En estadística el tamaño de la muestra es el número de sujetos que componen la muestra extraída
de una población, necesarios para que los datos obtenidos sean representativos de la población.
Ejemplo:
Un investigador en parasitología está interesado en la incidencia de paracitos por oxiurosis en
niños menores de 5 años de los colegios nacionales del pueblo joven Ciudad de Dios durante su
indagación encuentra en las estadísticas del INI que los niños de 5 años en ese pueblo joven es de
9500 así mismo en la búsqueda de la revisión bibliográfica encuentra que en estudios de años
anteriores en lugares similares al que él va a realizar su estudio la probabilidad de ocurrencia de la
oxiurosis es del 0.40 o 40%. Cuál es el tamaño de muestra que debe considerar para tener una
confiabilidad del 95% y un error permisible del 4%.
Ref. Bibliográfica
P Muestra Piloto
Asumo
= 95% = 0.05 = 1.96
E = 4%
N = 9500 – Muestra piloto (n=100)