Está en la página 1de 33

ORGANIZACION DE DATOS

BIOESTADISTICA
MUESTREO ALETAORIO SIMPLE

• MUESTREO → extraer una muestra n representativa de una


población N. La muestra no es arbitraria, debe ser calculada.

• ALEATORIO → al azar ; todos los integrantes de la población


tienen la misma posibilidad de ser escogidos.

• SIMPLE → método sencillo


MUESTREO ALEATORIO SIMPLE

Arroja datos desordenados

Hay que organizarlos para obtener información

¿ Cómo se organizan los datos?

La forma mas común de organizar los datos es a través de las llamadas tablas ò
distribuciones de frecuencias
Una distribución de frecuencias es una representación estructurada,
en forma de tabla, de toda la información que se ha recogido sobre la
variable que se estudia.
Una tabla de frecuencias tiene básicamente cinco columnas

• Variable

•Frecuencia absoluta(Fabs)

TABLA DE FRECUENCIAS •Frecuencia absoluta acumulada(Fabs-ac)

•Frecuencia relativa (Frel%)

•Frecuencia relativa acumulada(Frel-ac%)


• EJEMPLO: Elabora una tabla de frecuencias a partir de las 25
temperaturas máximas registradas en un año en Bogotá.
17 18 15 16 19
20 16 18 17 18
19 17 15 16 19
16 20 18 17 16
20 15 19 18 20

Paso 1: realizar un arreglo ordenado, es decir, organizar los datos de menor


a mayor.
15 15 15 16 16
16 16 16 17 17
17 17 18 18 18
18 18 19 19 19
19 20 20 20 20
PASO 2: Se identifica la variable, que se acostumbra a representar con
la letra X. Colocamos los valores que asume la variable en una primera
columna.
X = Variable = temperatura (C°)
T (°C) Fabs Fabs-ac Frel (%) Frel-ac(%)
15
16
17
18
19
20

Arreglo ordenado
PASO 3 : Al lado se ubica otra columna con la frecuencia absoluta (Fabs) que
se puede definir como el número de veces que se repite cada valor que
asume la variable.
f1 + f2 + f3 +… + fn = n

La suma de las frecuencias absolutas es igual al número total de datos(n)

T (°C) Fabs Fabs-ac Frel (%) Frel-ac(%)

15 3
16 5
17 4
18 5
19 4
20 4

Arreglo ordenado
PASO 4: hallamos la Fabs-ac, que es la suma de las frecuencias absolutas desde la primera fila
hasta la fila deseada.

T (° C) Fabs Fabs-ac Frel(%) Frel-ac(%)


15 3 3
16 5 8
17 4 12
18 5 17
19 4 21
20 4 25

n
El ultimo valor de la Fabs-ac debe coincidir con el numero total de datos
PASO 5: Otra columna paralela a las anteriores es la llamada frecuencia relativa(Frel), que
es el cociente entre la frecuencia absoluta de un determinado valor y el número total de
datos. Frel =
Eso no da como resultado un decimal, por ejemplo 0,23, que al multiplicarlo por 100 nos
queda expresado como 23%. Así obtenemos la Frecuencia relativa porcentual

Entonces Frel(%) = x 100 … %


La suma de las frecuencias relativas es igual a 1 o al 100%.

Para el primer dato: T(° C) Fabs Fabs-ac Frel Frel (%) Frel – ac(%)
15 3 3 0,12 12
Frel = = = 0,12
16 5 8
17 4 12
De tal manera que la Frel(%) será: 18 5 17
19 4 21
20 4 25
Frel(%) = x 100 = x 100 = 12%
La columna correspondiente a Frel la obviaremos T (° C) Fabs Fabs-ac Frel(%) Frel-ac(%)
y solo colocaremos la Frel(%), de tal manera que
nuestra tabla tendrá solo 5 columnas. 15 3 3 12

16 5 8 20
Para el segundo dato (16) 17 4 12 16
Frel(%) = x 100 = 20,0 % 18 5 17 20

19 4 21 16
Para el tercer dato (17)
Frel(%) = x 100 = 16,0 % 20 4 25 16

Tenemos que hacer ese procedimiento 6 veces pero notamos que en este ejemplo, siempre
se va a repetir la división = 4 = K (constante imaginaria).
De tal forma que podemos hallar todas las Frel(%) de la siguiente forma:
→ Frel(%) = K ∙ Fabs K=
PASO 6: La última columna que se levanta en una distribución de frecuencias
es la referida a la frecuencia relativa acumulada(Frel-ac(%)) que es la suma de
todos los valores inferiores o iguales de la Frel(%)
Se puede definir la Frel-ac(%) como el cociente entre la frecuencia acumulada
de un determinado dato y el número total de datos. Se suele expresar en
porcentajes (%).
Frel-ac (%) = x 100 … %

T (° C) Fabs Fabs-ac Frel(%) Frel-ac(%)

15 3 3 12 12
16 5 8 20 32
17 4 12 16 48
18 5 17 20 68
19 4 21 16 84
20 4 25 16 100
Al comienzo teníamos una impresión vaga de
T (° C) Fabs Fabs-ac Frel(%) Frel-ac(%)
los datos. Pero ahora ya organizados si podemos
obtener información precisa de ellos. 15 3 3 12 12
Por ejemplo: 16 5 8 20 32
17 4 12 16 48
1. ¿ Cuántos días estuvo la temperatura
18 5 17 20 68
entre 16°C y 17°C ?
19 4 21 16 84
20 4 25 16 100
2. ¿ Qué porcentaje de días estuvo la temperatura
Entre 17°C y 19°C ?

3. ¿ Cuál es la principal conclusión de esta tabla?


Si los valores que toma la variable son muy diversos y cada uno de ellos se
repite muy pocas veces, entonces obtenemos una tabla de frecuencias muy
extensa que aportaría muy poco valor a efectos de síntesis.
En la tabla de la derecha la variable
toma 26 valores diferentes

¿ Qué hacemos entonces?


Pues tenemos que resumir esta tabla

¿ Cómo ?
Con los llamados intervalos de clase
DATOS AGRUPADOS → INTERVALOS DE CLASE
Un intervalo de clase se simboliza como una pareja
ordenada ( x – y ), donde:
X = limite inferior del intervalo
Y = limite superior del intervalo

Amplitud = lim. sup – lim. inf


Condiciones para construcción de intervalos:
1. Amplitud → constante en todos los intervalos
2. Numero de intervalos : de 6 a 12
3. Un valor de la variable no puede estar en
dos intervalos.
4. Se puede comenzar con un valor menor al menor
valor de los datos
5. Se puede terminar con un valor mayor al máximo valor de los datos.
DATOS AGRUPADOS → INTERVALOS DE CLASE
Nuestra distribución de frecuencias quedaría así:
NUMERO DE HORAS QUE TRABAJAN POR SEMANA 50 MEDICOS DEL PAIS

HORAS Fabs Fabs - ac Frel(%) Frel - ac (%)


(5 – 15) 4 4 8 8
(16 – 26) 8 12 16 24
(27 – 37) 22 34 44 68
(38 – 48) 13 47 26 94
(49 – 59) 3 50 6 100
Aunque esta distribución está bien construida, es
deseable que en alguno de los limites de todos
Los intervalos aparezca un múltiplo de 5 ò de 10
¡ Que los intervalos sean estéticos!
DATOS AGRUPADOS → INTERVALOS DE CLASE
Una distribución mas «elegante» seria la siguiente:
HORAS Fabs Fabs - ac Frel(%) Frel - ac (%)
(1 – 10) 3 3 6 6
(11 – 20) 4 7 8 14
(21 – 30) 10 17 20 34
(31 – 40) 24 41 48 82
(41 – 50) 8 49 16 98
(51 – 60) 1 50 2 100
O también la siguiente

HORAS Fabs Fabs-ac Frel(%) Frel-ac(%)


(0 – 9) 1 1 2 2
(10 –19) 4 5 8 10
(20 –29) 10 15 20 30
(30 -39) 22 37 44 74
(40 -49) 10 47 20 94
(50 -59) 3 50 6 100
DATOS AGRUPADOS → INTERVALOS DE CLASE
NUMERO DE HORAS QUE TRABAJAN POR SEMANA 50 MEDICOS DEL PAIS

HORAS Fabs Fabs - ac Frel(%) Frel - ac (%)


(1 – 10) 3 3 6 6
(11 – 20) 4 7 8 14
(21 – 30) 10 17 20 34
(31 – 40) 24 41 48 82
(41 – 50) 8 49 16 98
(51 – 60) 1 50 2 100
Es mucho más sencillo obtener información de
esta nueva tabla, aunque seguramente se perdió
Información.
¿Cuántos médicos trabajan de 11 a 30 horas?

¿Qué % de médicos trabajan de 21 a 50 horas?

¿ Cuántos médicos trabajan de 31 a 45 horas?


• EJERCICIO: Las edades indicadas a continuación
corresponden a 25 pacientes atendidos en la sala
de urgencias de un hospital un viernes por la
noche. Construya con esos datos una distribución
de frecuencias en forma de intervalos de clase.
35- 32- 21- 43- 39
36- 12- 54- 45- 37
45- 23- 64- 10- 34
36- 45- 55- 44- 55
22- 38- 35- 56- 45
 
El primer paso es organizar lo datos en orden ascendente
Edades de 25 pacientes que van a urgencias viernes por la noche
10 12 21 22 23
32 34 35 35 36
36 37 38 39 43
O también
44 la 45
siguiente45 45 45
54 55 55 56 64
Podemos organizarlos en intervalos como sigue

EDAD Fabs Fabs-ac Frel(%) Frel-ac(%)

(10 – 19) 2 2 8 8
(20 –29) 3 5 12 20
(30 –39) 9 14 36 56
(40 -49) 6 20 24 80
(50 -59) 4 24 16 96
(60 -69) 1 25 4 100
EDAD Fabs Fabs-ac Frel(%) Frel-ac(%)
(10 – 19) 2 2 8 8
(20 –29) 3 5 12 20
(30 –39) 9 14 36 56
(40 -49) 6 20 24 80
(50 -59) 4 24 16 96
(60 -69) 1 25 4 100
De acuerdo a esta tabla , responder los siguientes interrogantes
1. ¿ cuántos pacientes tenían de 10 a 29 años?

2. ¿ cuántos tenían de 20 a 37 años?

3. ¿Qué porcentaje de pacientes tenían entre 30 y 59 años?

4. ¿Cuál es la principal conclusión de esta tabla?


REPRESENTACION GRAFICA DE LOS DATOS
Muchas veces las graficas han sido empleadas para engañar a las
personas. Por ejemplo, si se manipulan astutamente los ejes de
coordenadas vertical y horizontal de una grafica es posible dar la
impresión que se desee.
La siguientes figuras ilustran dos falsa aplicaciones de las técnicas de
representación grafica.
¿ como evitar esta manipulación de presentación grafica de los datos?

REGLA DE LOS TRES CUARTOS


Para las representaciones gráficas de las distribuciones de frecuencias,
la mayoría de estadísticos están de acuerdo con una convención
conocida como «regla de los tres cuartos de altura» que se expresa de
la siguiente manera.
« en la presentación grafica de las frecuencias, el eje vertical debe
hacerse de tal modo que la altura del punto máximo(que representa el
resultado asociado con la frecuencia mas alta) se aproximadamente
igual a tres cuartos de la longitud del eje horizontal»
DIAGRAMA DE BARRAS
• Es el método grafico más empleado para representar datos en escalas
nominales y ordinales.
• También es útil para representar datos cuantitativos discretos.
• Barras separadas.
• En el eje x se representan los valores de la variables(intervalos)
• En el eje Y se grafican las Fabs o las Frel(%)
Representemos en un diagrama de barras la
siguiente distribución
HISTOGRAMA
•Ideal para variables cuantitativas continuas
•Barras juntas
•En el eje X de grafican los valores que asume la variable(intervalos)
•En el eje Y se grafican los valores de la Fabs o la Frel(%)

Como necesitamos que las barras nos queden juntas entonces debemos modificar nuestros intervalos. Lo que

normalmente se hace es con el mismo numero que termina un intervalo comienza el siguiente. Se especifica a

cual intervalo pertenece el dato utilizando la siguiente nomenclatura

•Intervalo abierto → ( ) → no pertenece

•Intervalo cerrado → [ ] → si pertenece


HISTOGRAMA
Tenemos este conjunto de datos ya ordenados

Nuestros intervalos para el histograma quedarían así

Edades de 25 pacientes que van a urgencias un viernes por la


noche
Edades Fabs Fabs -ac Frel(%) Frel-ac(%)
[10-20) 2 2 8 8
[20-30) 3 5 12 20
[30-40) 9 14 36 56
[40-50) 6 20 24 80
[50-60) 4 24 16 96
[60-70) 1 25 4 100
HISTOGRAMA

Edades de 25 pacientes que van a urgencias un viernes por la


noche

Edades Fabs Fabs -ac Frel(%) Frel-ac(%)

[10-20) 2 2 8 8

[20-30) 3 5 12 20

[30-40) 9 14 36 56

[40-50) 6 20 24 80

[50-60) 4 24 16 96

[60-70) 1 25 4 100
POLIGONO DE FRECUENCIAS

HISTOGRAMA POLIGONO DE FRECUENCIAS


DIAGRAMA CIRCULAR

•También se le llama diagrama de sectores.


•A cada intervalo, según su frecuencia,
le corresponde una sección circular.
•A mayor frecuencia un pedazo mas grande
de la «torta»
•Ideal cuando variable toma pocos valores
Se hallan las zonas circulares mediante la
siguiente premisa:

100 % de los datos 360°


DIAGRAMA CIRCULAR
Hagamos un diagrama circular de acuerdo a los siguientes datos
20 est. de medicina
50 est. de enfermería
30 est. de nutrición

Hallamos los ángulos correspondientes


Para los 20 est. De medicina Para los 50 est de enfermeria
100 est 360° X = = 180°
20 est X
Despejamos X
X∙ 100 est = 20 est ∙360° Para los 30 est de Nutrición

X = = = 72° X = = 108°
DIAGRAMA CIRCULAR

Tenemos entonces

Medicina = 72°

Enfermería = 180°

Nutrición = 108°
DIAGRAMA CIRCULAR

Y también podemos hacerlos por %


En este caso la regla de 3 se plantearía así:
100% 360°
Tanto % X
Pero inicialmente tenemos que hallar esos %
% de Medicina = = 0,2 = 20%
100% 360°
20% X

100 % ∙ X = 360° ∙ 20% y nos queda que X = = = 72°


Asi se hace para cada % y obtenemos los ángulos respectivos
DESPLIEGUE DE TALLO Y HOJAS

DATOS ORIGINALES

TALLO HOJAS
DESPLIEGUE DE TALLO Y HOJAS 1 0-2
2 1–2-3
3 2 – 4 – 5 – 5 – 6 – 6 – 7- 8 - 9
4 3–4–5–5–5-5
5 4–5–5-6
6 4

También podría gustarte