Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En todas las situaciones del quehacer humano se genera continuamente información cada hora del día, la cual no
podemos conocerla al detalle por cuestiones de tiempo (dados nuestros propios compromisos). Es preciso, entonces,
resumir la información de todo un colectivo de manera que podamos hacernos una idea acerca de un acontecimiento
o evento histórico; esto se logra mediante la caracterización de variables.
2. Caracterización de variables estadísticas.
La caracterización de variables es el proceso que permite tomar los datos en bruto, a partir de una selección
planificada en una población, y procesarlos de modo que se puedan leer rápidamente mientras ingerimos algún
alimento o disponemos de una pausa en nuestras actividades productivas.
¿Por qué se llama a este proceso caracterización de variables? En el diccionario se encuentra caracterizar como
“establecer las particularidades o los atributos de algo o de alguien, de modo que se distinga claramente de los
demás”. Este término se relaciona con el término característica, que significa “cualidad o circunstancia que es propia
o peculiar de una persona o una cosa, y por la cual se define o se distingue de otras de sus misma especia”.
Caracterizar un conjunto de datos implica entonces presentar la información que identifica a un fenómeno o suceso.
Un carácter estadístico es una propiedad que permite clasificar a los individuos de una población. Puede ser:
Cualitativo si no se puede medir, como el deporte que práctica, su opinión sobre un tema, la ocupación a la
que se dedica, etc.
Cuantitativo si se puede medir, como la estatura, la cantidad de años estudiando en el colegio, el peso, etc.
Los caracteres estadísticos pueden tomar distintos valores. Una variable estadística es el conjunto de todos los
posibles valores que toma el carácter cuantitativo, y puede ser discreta o continua:
Variable discreta: solo toma valores aislados que se expresan mediante números enteros. Por ejemplo: el
número de hijos.
Página 1 de 11
Variable continua: toma todos los posibles valores dentro de un intervalo de manera continua. Por ejemplo:
la estatura y el peso de una persona.
Página 2 de 11
3.1. Caracterización de una única variable cualitativa. Para presentar la información de una sola variable cualitativa,
el proceso inicia con un conteo, del cual se obtienen las frecuencias absolutas y resultan las tablas de frecuencias;
a partir de la información de ellas, se pueden elaborar medios más visuales como el diagrama de barras, el
pictograma, el diagrama circular, y los diagramas de puntos y líneas.
3.1.1. Tabla de distribución de frecuencias. Su punto de partida es el conteo, operación donde se agrupan los
elementos comunes de la muestra y se cuentan uno a uno según sus características comunes. Como
resultado, se obtiene la frecuencia absoluta de cada franja. Luego se divide cada frecuencia absoluta entre el
total de los datos y se obtiene la frecuencia relativa; al sumarle a la frecuencia absoluta de una clase la de las
anteriores se llega a la frecuencia acumulada.
Página 3 de 11
3.2. Caracterización de dos variables cualitativas. Cuando tenemos dos variables cualitativas al mismo tiempo
(ejemplo, ser hombre y fumador), se necesita usar tablas en las cuales se cruza la información que relaciona
dichas variables.
3.2.1. Tabla cruzada o de contingencia: es una matriz en la cual se cruza la información de dos variables
cualitativas. Las filas corresponden a las categorías de una variable y las columnas a las categorías de la otra
variable.
Ejemplo: El rector de un colegio le preguntó a 75 de sus estudiantes sobre el tipo de transporte que usan para llegar
al colegio. Las opciones de respuesta son: motocarro, moto y caminando. Además, al contestar las preguntas se debía
marcar si el encuestado era hombre o mujer. Los resultados se muestran en la tabla. Analiza la tabla cruzada. Elabora
la tabla de frecuencias con porcentajes y la gráfica de barras.
4.1. Diagrama de tallo y hojas: es una representación gráfica en la cual los datos se clasifican de acuerdo con la
expresión decimal de cada uno de ellos. En este diagrama es fácil mostrar, en forma simultánea, el orden y la
forma de un conjunto de datos.
Para construir un diagrama de tallo y hojas, primero se ordenan los dígitos principales de cada dato a la izquierda de
una línea vertical; esta columna se llama tallo. A la derecha de esta línea se registra el ultimo digito para cada dato,
conforma se revisan las observaciones en el orden que se registraron; esta columna se llama hoja.
Ejemplo: El departamento de psicología del colegio ha implementado un programa de buen uso del tiempo libre para
los estudiantes. Para ello, construyó un gimnasio donde los estudiantes se pueden ejercitar en horario extraclase.
Luego de unos meses de que el gimnasio inicia su funcionamiento, se reporta el número de veces que cada estudiante
ha asistido a dicha práctica. Los resultados para 50 estudiantes se presentan a continuación.
21 15 08 13 23 14 05 15 11 15 15 15 18 07 21 14 22
Página 5 de 11
11 07 22 14 08 14 14 11 09 12 29 16 11 19 19 15 06
12 14 18 18 31 12 25 11 19 13 18 15 15 19 22 16
Segundo, se determinan los tallos que, para esta caso, serían los dígitos de la cifras de la decena en cada número;
para los números de un solo digito se usará el cero. Tallos: 0, 1, 2 y 3.
Finalmente se organiza el diagrama poniendo los tallos en la columna de la izquierda y las hojas en la columna de la
derecha, así:
4.2. Tabla de distribución de frecuencias: es un resumen de los datos, los cuales se presentan agrupados en
categorías y discriminando diferentes aspectos de esta agrupación.
La tabla de distribución de frecuencias está formada por siete columnas en las cuales se incluyen: intervalos de clase,
marca de clase xi, frecuencia absoluta f, frecuencia relativa fr, frecuencia acumulada F, frecuencia relativa acumulada
Fr y porcentaje %.
Para construir una tabla de distribución de frecuencias se deben tener en cuenta tres aspectos fundamentales:
R=31−5=26
Segundo: se halla el número de intervalos. Formalmente se calcula mediante la formula c=1+3,3 log 10 n, donde n
2
es el número de datos. Una buena aproximación de esta fórmula es c= √ n . Para el caso,
c= √2 50=7 , 07 ≈ 7 (Se aproxima a 7)
Tercero, se establece el ancho de cada intervalo. Se divide el rango entre el número de intervalos
R 26
a= = =3,71≈ 4 (Se aproxima a 4)
c 7
Cuarto, se determinan los límites inferiores de cada intervalo. Al dato menor se le suma el ancho de intervalo hasta
que el número de intervalos sea 7:
5+4 = 9+4 = 13+4 = 17+4 = 21+4 = 25+4 = 29
Quinto: se determinan los límites superiores de cada intervalo. Corresponden al límite inferior del siguiente
intervalo menos una unidad. Se suma de nuevo el ancho de intervalo hasta obtener los siete límites superiores.
9-1=8; 8+4 = 12+4 = 16+4 = 20+4 = 24+4 = 28+4 = 32
Sexto: se calculan las marcas de clase. Se suman los límites inferior y superior y se divide el resultado entre 2.
Página 6 de 11
5+8 13
= =6,5;
2 2
9+12 21 13+16 29 17+ 20 37 21+24 45 25+28 53 29+ 32 61
= =10,5 ; = =14,5 ; = =18,5; = =22,5 ; = =26,5 y = =3
2 2 2 2 2 2 2 2 2 2 2 2
Séptimo: se efectúa el conteo para ubicar los datos dentro de cada intervalo y establecer la frecuencia absoluta respectiva. Los
resultados del conteo se muestran abajo.
Intervalo Xi f fR F FR %
5-8 6,5 6 6/50 6 6/50 12
9 - 12 10,5 9 9/50 15 15/50 18
13 - 16 14,5 18 18/5 33 33/50 36
0
17 - 20 18,5 8 8/50 41 41/50 16
21 - 24 22,5 6 6/50 47 47/50 12
25 - 28 26,5 1 1/50 48 48/50 2
29 - 32 30,5 2 2/50 50 50/50 4
Total: 50 50/5 100
0
A partir de la información, se puede concluir que:
4.3. Grafica de puntos: Es uno de los resúmenes gráficos más sencillos de presentar un conjunto de datos. Para
realizar este diagrama, primero se dibuja un eje horizontal en el que se muestra el intervalo de los valores para
los datos. Luego, se representa el valor de cada dato con un punto colocado sobre dicho eje. Finalmente, se
observa el diagrama para extraer conclusiones de él. A continuación se muestra el diagrama correspondiente al
ejemplo del gimnasio
Así, los 8 puntos ubicados sobre el 15 indican que hay 8 observaciones de valor 15.
4.4. Histograma: es un resumen grafico que se organiza a partir de la tabla de distribución de frecuencias.
Para trazar un histograma se realiza lo siguiente:
10
5
Página 7 de 11
0
6.5 10.5 14.5 18.5 22.5 26.5 30.5
El histograma anterior se hizo teniendo en cuenta las frecuencias absolutas; a continuación, se presenta los
histograma en el cual las barras representan la frecuencia relativa (izquierda) y porcentajes (derecha):
Notese que la ojiva es una curva creciente porque se elabora a partir de las frecuencias acumuladas absolutas o
relativas.
5. Conclusiones.
La caracterización de variables es una importante y necesaria actividad para intentar comprender lo que sucede
alrededor nuestro cada día; aunque lo ideal sería complementar las frías tablas y graficas estadísticas con el
testimonio puntual de las personas que están inmersas en las situaciones estudiadas para determinar cómo ese
hecho “remoto” nos afecta, ello no siempre es posible. Luego, lo importante es saber establecer la forma más
apropiada para organizar y presentar la información de tal modo que un receptor pueda interpretarla y tomar sus
propias decisiones y curso de acción a seguir. En la próxima guía complementaremos estas descripciones con las
medidas de tendencia central y de dispersión.
Ejercicios propuestos.
1. Determina cuatro opciones de respuesta para cada una de las siguientes variables cualitativas. (razonamiento)
Página 8 de 11
a. Calidad en el servicio de una entidad bancaria.
b. Tipos de salsas para acompañar las carnes rojas.
c. Deportes extremos que se practican en Colombia.
d. Nivel educativo de un aspirante a un cargo administrativo en una empresa.
e. Líneas de negocio de una fábrica de productos alimenticios a base de maíz.
2. Caracteriza las variables planteadas en cada base de datos. Presenta tres conclusiones teniendo en cuenta dicha
caracterización
El gerente de un banco ha detectado que, en el último mes, ha bajado el número de clientes. Por esto, realiza una
encuesta a 90 clientes en una de sus sucursales y les pregunta cuál es el aspecto en que el banco debe mejorar.
Las respuestas son las siguientes.
Atención Atención Horarios Servicios Atención Atención Atención Servicio Horarios Servicio
Cajeros Atención Servicio Horarios Atención Horarios Atención Servicio Atención Cajeros
Horarios Cajeros Cajeros Horarios Atención Cajeros Atención Servicio Atención Servicio
Servicio Horarios Cajeros Atención Cajeros Atención Servicios Servicio Atención Cajeros
Atención Horarios Cajeros Atención Horarios Atención Horarios Atención Horarios Atención
Atención Horarios Cajeros Atención Horarios Cajeros Horarios Atención Cajeros Atención
Atención Horarios Atención Servicio Atención Cajeros Servicio Atención Servicio Atención
Servicio Horarios Atención Cajeros Atención Cajeros Atención Servicio Horarios Horarios
Horarios Cajeros Atención Cajeros Atención Servicio Atención Horarios Atención Servicio
8. El alcalde de la ciudad está considerando la posibilidad de implementar un peaje de ingreso. Sus asesores han
llegado a la conclusión que existen dos ubicaciones posibles y favorables para ello. El alcalde decide medir el
número de automóviles que ingresan a la ciudad por cada uno de los dos puntos durante los últimos 15 días. Los
resultados se muestran a continuación:
Punto 1 430 460 501 423 455 473 450 481 442 429 439 414 475 452 474
Punto 2 406 153 491 505 467 421 556 470 348 472 479 403 278 440 234
a. Construye una tabla de frecuencias para cada uno de los puntos usando
intervalos de 49 unidades de ancho e iniciando en 401. Escribe algunas
conclusiones.
b. Compara las dos tablas y escribe algunas conclusiones al respecto.
c. Elabora los histogramas que se generan a partir de las dos tablas.
d. Elabora las ojivas correspondientes.
10. En un estudio relacionado con los niveles de satisfacción en el trabajo se aplicó una serie de pruebas a 50
individuos. Se obtuvieron los siguientes datos:
a. Elabora un diagrama de tallo y hojas para la situación.
87 73 65 46 76 69 92 84 67 61 b. Con base en el diagrama de tallo y hojas, elabora la tabla
77 76 58 88 71 78 92 46 70 64 de distribución de frecuencias para la situación.
59 85 74 69 41 97 53 76 50 50 c. Elabora un histograma que represente la situación.
43 78 90 47 61 67 75 81 89 74 d. Escribe algunas conclusiones a partir de la gráfica.
80 87 84 64 81 75 83 70 60 70
Página 10 de 11
11. En un gimnasio se va a implementar un programa de acondicionamiento físico. Para proporcionar el mejor tipo
de entrenamiento se preguntó a algunos de los clientes que asisten en el horario matutino por su tiempo de
entrenamiento (medido en minutos). Los resultados se ven reflejados en las siguientes gráficas.
12. Según las últimas encuestas, los cuatro programas más vistos en los canales de televisión en la franja de las 7:00
pm a las 8:00 pm son: Desafío, Noticias 1, La Voz y Crónicas. Se presentan los datos de la encuesta:
13. Se preguntó a un grupo de deportistas de alto rendimiento por la bebida hidratante que consumen después de
un entrenamiento. Los resultados se clasificaron teniendo en cuenta el género, así:
a. Elabora la tabla marginal asociada a la variable género y escribe
Hombre Mujer algunas conclusiones a partir de ella.
Agua 24 34 b. Elabora la tabla marginal relacionada en la variable tipo de
Bebida energizante 35 22 bebida. Escribe algunas conclusiones con base en ella.
Suero oral 12 9 c. Elabora un diagrama de barras que describa claramente los
Jugo 0 3 resultados presentados en la tabla marginal de porcentajes.
14. A continuación se presentan los datos de los salarios de 50 presidentes de mercadeo de diferentes empresas del
sector de alimentos congelados. Los datos están dados en miles de dólares.
145 95 148 112 132 140 162 118 170 144 Elabora, en tu cuaderno, la ojiva para esta
145 127 148 165 138 173 113 104 141 142 situación y escribe algunas conclusiones sobre la
116 178 123 141 138 127 143 134 136 137 variable estudiada.
155 93 102 154 142 134 165 123 124 124
138 160 157 138 131 114 135 151 138 157
Página 11 de 11