Está en la página 1de 42

Tema

2 ORGANIZACIÓN
TABULAR DE
DATOS
OBJETIVOS

Al finalizar el tema , el participante será capaz de:

1. Organizar datos a través de una clasificación ordenada


de datos.
2. Organizar datos a través de un diagrama tallo-hojas.
3. Elaborar una tabla de distribución de frecuencias
para datos univariados
4. Elaborar una tabla de distribución de frecuencias para
datos bivariados.
CONTENIDO

1. Clasificación ordenada de datos


2. Diagrama de tallos y hoja
3. Tabla de distribución de frecuencias
A) Tablas simples
a) para datos cualitativos
b) para datos cuantitativos
B) Tablas cruzadas
Ejemplo
Los niveles altos de colesterol en suero, han
sido por mucho tiempo asociados con el
incremento del riesgo de enfermedades
cardiovasculares. Se han efectuado numerosos
estudios en un esfuerzo por lograr una mayor
comprensión de la naturaleza de esta
asociación. Se muestra a continuación las
concentraciones de colesterol en suero que
fueron recolectadas a una población de 480
individuos aparentemente sanos. ¿A qué
conclusión llega?
231 199 209 236 259 248 183 269 212 194 191 260 197 265 261 238

159 227 245 214 275 186 234 262 230 212 163 220 202 221 223 243

203 180 292 198 201 174 223 186 200 192 236 186 188 234 230 170

304 197 216 214 189 138 269 197 222 202 213 163 241 218 242 197

248 228 154 218 243 192 191 243 230 248 231 262 177 207 276 230

238 189 212 200 179 249 225 223 289 280 235 220 194 205 206 194

209 233 222 223 267 212 263 159 243 230 253 192 200 232 222 227

193 195 259 186 229 184 215 254 233 229 263 163 212 271 216 230

225 252 218 265 218 155 222 173 228 214 266 172 203 262 213 249

244 177 242 180 241 261 221 222 189 204 229 212 192 257 248 243

190 166 216 197 250 224 257 220 255 241 245 212 225 201 209 155

192 249 216 250 248 187 222 195 247 161 188 229 194 174 184 215

209 250 180 228 196 254 208 265 234 219 203 230 232 212 236 191

161 258 252 169 249 231 170 233 161 189 191 209 229 246 274 215

206 218 234 248 222 175 202 154 249 189 171 263 238 177 261 265

224 249 252 220 199 239 221 221 221 232 218 239 205 196 211 221

276 251 189 286 258 227 236 167 184 245 243 218 173 220 231 196

196 200 221 217 270 261 248 254 232 231 219 225 265 222 226 208

219 189 226 292 192 172 186 264 211 240 237 156 228 241 171 223

185 199 188 263 208 199 259 272 202 214 201 231 210 223 210 209

239 203 212 295 202 195 218 218 253 239 272 216 221 208 225 175

239 191 214 215 227 221 208 224 208 181 187 179 234 262 216 221

152 180 193 244 184 183 226 266 242 220 266 269 223 198 204 179

209 215 222 196 228 195 160 261 177 232 224 203 265 238 247 225

169 172 187 199 245 183 171 246 187 222 278 212 250 174 220 188

223 241 200 193 226 243 206 142 277 244 210 258 207 267 254 136
Al observar este conjunto de datos, quisiéramos
identificar las principales propiedades que definen a
este conjunto.

Pero, no se puede obtener alguna conclusión


válida, pues los datos tal como se presentan no
nos permiten afirmar algo sobre ellos.

Para lograr identificar las principales medidas y


propiedades de este conjunto de datos, tenemos
previamente que organizarlos.
Su organización tabular puede realizarse bajo tres
formas:
- Clasificación ordenada de datos.
- Diagrama de tallos y hojas
- Tablas de distribución de frecuencias.
Ordenando los datos de manera ascendente,
tenemos: Considérese los datos que siguen:

¿Cuáles son las principales propiedades que se


observa en este conjunto de datos?
Las principales propiedades que se observan
en este conjunto de datos son:
 El número de datos es de 35.
 La menor observación es de 33,1 cms.
 La mayor observación es de 36,5 cms.
 El rango de los valores observados es de 3,5 cms.
=(36,5 – 33,1)+ 0,1 cms.
Son muy poco frecuentes los datos mayor a 36
cms.
Mientras mayor sea el número de observaciones
presentes en una serie de datos, mas laborioso es
realizar la clasificación ordenada de los datos.
2.1 Diagrama de tallo y hojas
Un diagrama de tallo y hojas consiste en una serie de
hileras horizontales de números. El número utilizado
para designar una hilera es un tallo, el resto de
números de la hilera se denominan hojas.

Esta técnica funciona bien, cuando el conjunto de


datos no tiene una gran dispersión
Se pueden considerar el siguiente proceso:

Elija algunos números adecuados que puedan


servir de tallo. Se requieren como mínimo 5
tallos. Los tallos elegidos generalmente son el
primer o los dos primeros dígitos de los datos.
Nombre las hileras mediante los tallos elegidos.
Organice gráficamente los datos registrando el
dígito, siguiendo el tallo.
Trazar una curva a lo largo de la parte superior
del diagrama.
Determinar las principales características.
Ejemplo:
Con los datos del problema anterior construir un
diagrama tallos-hojas.

Dato menor: 33,1 Dato mayor: 36,5


Tallos posibles: 33, 34, 35 y 36
Sólo existen 4 tallos, debiendo ser el mínimo 5
tallos, entonces los tallos propuestos se desdoblan,
de la siguiente manera:
33 (del 33,0 al 33,4)
33 (del 33,5 al 33,9)
34 (del 34,0 al 34,4)
34 (del 34,5 al 34,9)
35 (del 35,0 al 35,4)
35 (del 35,5 al 35,9)
36 (del 36,0 al 36,4)
36 (del 36,5 al 36,9)

Luego clasificamos los datos en función al valor del


decimal.
33 1 4

33 7 7 9 8 6

34 2 2 2 3 2 2 1 3 0 25 datos

34 6 6 8 7 6 7 5 5 9

35 2 2 1 1 3

35 6 8
10 datos
36 0 1

36 5

Finalmente, se traza una línea por el borde, a fin de


delimitar la forma de la distribución.
¿Qué características se observan?.
Las principales propiedades de los datos :
Son 35 casos.
La menor observación es de 33,1 cms.
La mayor observación es de 36,5 cms.
El rango de los valores observados es de 3.5 cms.
(36,5 – 33,1 + 0.1 cms.)
Son muy poco frecuentes los casos mayores a 36
cms (3 casos) y menores a 33,5 cms (2 casos).
La distribución de datos está sesgada a la derecha
(sesgo positivo), es decir, hay una mayor
concentración de datos a la izquierda.
Ejercicio
Se realiza un estudio para ayudar a comprender el
efecto de fumar en los patrones de sueño. La
variable es el tiempo que tarda en quedarse dormido.
La muestras de fumadores y no fumadores producen
estas observaciones :
FUMADORES NO FUMADORES

17,2 19,7 18,1 15,1 18,3 17,6 15,1 20,5 17,7 21,3 16,0 24,8
16,2 19,9 19,8 23,6 24,9 20,1 16,8 21,2 18,1 22,1 15,9 25,2
19,8 22,9 20,0 24,1 25,0 21,4 22,8 22,4 19,4 25,2 18,3 25,0
21,2 18,9 22,1 20,6 23,3 20,2 25,8 24,1 15,0 24,1 21,6 16,3
21,1 16,9 23,0 20,1 17,5 21,3 24,3 25,7 15,2 18,0 23,8 17,9
21,8 22,1 21,0 20,5 20,4 20,7 23,2 25,1 16,1 17,2 24,9 19,9
19,5 18,8 19,2 22,4 19,3 17,4 15,7 15,3 19,9 23,1 23,0 15,1
Construya un diagrama tallo-hoja para cada uno
de estos conjuntos de datos. Utilice los valores
enteros del 15 al 25 (inclusive) como tallos.

¿Se sorprendería si alguien le dijera que no existe


diferencia en la distribución de esta variable en los
dos grupos?. Explique.
2.2 La tabla de frecuencias
2.2.1 Elementos
Consiste en una presentación resumida
de la información usando tablas o
cuadros.
Ejemplo
NIVEL DE OPINIÓN
TOTAL
Desfavorabl
INSTRUCCIÓN Favorable e

Analfabeta
Para datos
Primaria
Secundaria
categóricos
Superior
TOTAL

EDAD N° de pacientes Tasa porcentual :%

(en años) (fi) (hi)

39 - 46
47 - 54
Para datos 55 - 62
cuantitativos 63 - 70
71 - 78
Total
El cuerpo: Está conformado por
espacios y constituyen intersecciones
de filas y columnas, que a veces se
denominan celdas, y donde se anotan
las frecuencias absolutas y relativas
obtenidas en la tabulación, incluyendo
totales y subtotales.
Por ejemplo

NIVEL OPINIÓN
TOTAL
EDUCATIVO Favorable Desfavorable

Analfabeta 8 2 10
Primaria 15 5 20
Secundaria 23 7 30
Superior 12 3 15
TOTAL 58 17 75
Notas aclaratorias: Están constituidas
por toda aquella información adicional
que es necesaria para describir e
interpretar adecuadamente el contenido
de la tabla o cuadro. Es muy importante
cuando se trata de datos proveniente de
fuente secundaria. Es un aspecto ético
precisar de donde provienen los datos, a
la vez que nos liberamos de la
responsabilidad de responder por su
calidad. Se escribe con letra más
pequeña.
2.2.2 Tipos
Pueden ser simples o cruzadas
A) Tablas simples
1. Se utilizan para presentar una sola variable.
2. Pueden representar datos cualitativos o
cuantitativos.
3. Presentan por lo menos dos columnas:
categoría o clase y el número de datos o
frecuencia de clase.
4. Puede incluirse una columna de tasa
porcentual.
Para datos cualitativos se siguen los pasos
siguientes:

(1º) Identificar diferentes categorías.


(2º) Realizar un conteo.
(3º) Elaborar la tabla: titulo, cuerpo y fuente.
Ejemplo

Con la finalidad de mejorar la calidad del servicio de


bienestar en la UNHEVAL, se ha formulado la
siguiente pregunta a 45 ingresados que han iniciado
clases durante una semana: “¿Cómo califica la
calidad de la infraestructura de la Facultad de
Ingeniería Industrial y Sistemas de la UNHEVAL?:
muy buena, buena, aceptable, mala o muy mala”
Los datos recolectados se presentan a continuación:
Muy bueno Aceptable Aceptable Muy bueno Bueno
Bueno Bueno Muy malo Bueno Bueno
Aceptable Bueno Aceptable Malo Muy bueno
Malo Aceptable Muy malo Aceptable Malo
Aceptable Muy bueno Bueno Bueno Aceptable
Bueno Malo Aceptable Muy malo Bueno
Malo Bueno Malo Bueno Aceptable
Bueno Bueno Muy malo Muy bueno Malo
Aceptable Bueno Aceptable Malo Bueno
Primero, se identifican las categorías:

Muy bueno
Bueno
Aceptable
Malo
Muy malo
Segundo, se realiza el conteo de las frecuencias:

Muy bueno /////


Bueno ///// ///// ///// /
Aceptable ///// ///// //
Malo ///// ///
Muy malo ////
Tercero, se presenta la tabla, considerando el
título y la fuente.
Cuadro 1: Infraestructura FIIyS-UNHEVAL

Fuente: Encuesta a los Estudiantes, Abril 2014


Para datos cuantitativos se sigue el procedimiento
siguiente:

(1º) Se calcula el rango:(mayor - menor) + 1

(2º) Se determina el número de clases, que mejor


representa a los datos (entre 4 y 20). Se realiza un
tanteo.

(3º) Se determina el tamaño o amplitud de clase.

(4º) Se elige el limite inferior de la primera clase.


(5º) Se establecen los límites inferiores de las
siguientes clases.

(6º) Se establecen los limites superiores de cada una


de las clases.

(7º) Se realiza un conteo, a fin de determinar


cuantos datos se incluyen en cada clase.

(8º) Se elabora la tabla: titulo, cuerpo y fuente.


Ejemplo
Cuadro 2: Ventas diarias en la Farmacia
durante el mes de junio (en soles)
Ventas Tasa
(en soles) Dias porcentual
(%)
menos de 5000 3 10,00
5000 - 8999 7 23,33
9000 - 12999 10 33,33
13000 - 16999 8 26,67
17000 - 20999 2 6,67
Total 30 100,00

Fuente: Registro de Ventas


Ejercicio
Los siguientes datos de refieren a la estatura (en
metros) de 50 estudiantes que hacen uso del comedor
universitario UNHEVAL. Construya una tabla de
distribución de frecuencias.

1,68 1,72 1,70 1,67 1,76 1,82 1,59 1,66 1,82


1,70 1,66 1,70 1,68 1,65 1,74 1,80 1,57 1,64
1,80 1,68 1,72 1,74 1,72 1,69 1,78 1,84 1,61
1,69 1,84 1,74 1,73 1,75 1,75 1,72 1,81 1,87
1,64 1,70 1,86 1,74 1,75 1,77 1,76 1,72 1,81
1,87 1,64 1,72 1,87 1,77
La tabla de distribución de frecuencias completa,
tiene la siguiente estructura
CLASE Marca de Frecuencia Frecuencia Frec. Absoluta Frec. Relativa
Li Ls Clase: Xi absoluta: fi relativa: hi Acumulada: Fi Acumulada: Hi

Li limite inferior
Ls limite superior

fXi i Marca de laabsoluta


frecuencia clase i de la clase i.
hi frecuencia relativa de la clase i.
Fi frecuencia absoluta acumulada hasta la clase i.
Hi frecuencia relativa acumulada hasta la clase i.
Practica calificada
Complete la siguiente tabla que corresponde
al peso de 60 estudiantes de la UNHEVAL
2015.
PESO
fi Fi hi Hi
(en kilos)
48,0 – 52,9 6

53,0 – 57,9 0,30

58,0 – 62,9

63,0 – 67,9 0,25

68,0 – 72,9 9

Total
Ejercicio

La siguiente información se refiere al peso (en Kg.) de 60


personas. Elabore una tabla de distribución de
frecuencias.
k=6 LI1=35 LS5=64 F2=20 h3=0,213
H4=0,799 f6 = 5 f1=4
Complete la siguiente tabla de distribución de
frecuencias:
PESO
fi Xi Fi hi Hi
(en libras
128,6 - 135,4 2
135,5 - 142,3 7
142,4 - 149,2 10
149,3 - 156,1 8
156,2 - 163,0 3
Total
n   f  30
f
Fi  fant  fact f ant --> frecuencia anterior
hi 
n
H i  h ant  h act f act --> frecuencia actual
h i  1.000
Resumamos algunos conceptos

Una distribución de frecuencias (fi) es un


conjunto de puntuaciones ordenadas en sus
respectivas clases.
Las frecuencias relativas (hi) son tasas
porcentuales de casos en cada clase.
La frecuencia acumulada (Fi o Hi) son las
frecuencias que se van acumulando en cada clase,
desde la más baja hasta la mas alta.
La marca de clase (Xi) es el punto medio de una
clase
B)Tablas cruzadas

1. Sirven para representar dos o más variables


cualitativas.
2. En cada celda se puede incluir la frecuencia
absoluta y relativa (por fila, columna y total).
Ejemplo

Cuadro 4: Enfermedad por sexo

Fuente: Historia Clínica, julio 2002.


Tienes derecho a
tener un mal día,
pero no debes
permitir que se
convierta en
costumbre.

También podría gustarte