Está en la página 1de 60

1.

Presentación tabular y gráfica de datos

Cristian Gómez Herazo


Facultad de Ciencias Básicas y Biomédicas

Universidad Simón Bolı́var

1. Presentación tabular y gráfica de datos 1 / 60


Unidad 1. Presentación tabular y gráfica de datos.
Conceptos básicos, ¿qué es la estadı́stica?, tipos de estadı́stica, variables, tipo de
variables, niveles de medición, población, muestra, muestreo, tipo de muestra,
análisis de datos cualitativos, tablas de frecuencia para datos cualitativos, gráficos
para datos cualitativos, análisis de datos cuantitativos, gráfico de puntos, gráfico
de tallo y hoja, tabla de frecuencia datos cuantitativos e histograma

Motivación
En la actualidad la Estadı́stica es probablemente una de las
disciplinas cientı́ficas más utilizada y estudiada en todos los
campos del conocimiento humano.
¿Para que sirve la estadı́stica ?... Considere las siguientes
preguntas:
ˆ ¿La aspirina reduce el riesgo de ataque al corazón?
(Medicina)
ˆ ¿Los programas de viajero frecuente, aumentan las ventas
de boleto de avión? (Negocio)

1. Presentación tabular y gráfica de datos 2 / 60


ˆ ¿Los aditivos en la gasolina mejoran la calidad de ésta?
(Quı́mica y mecánica)
ˆ ¿El tipo de suelo influye el la calidad de un cultivo?
(Agronomı́a)
ˆ ¿Cierto anuncio de un determinado producto aumenta la
venta? (Publicidad)
ˆ ¿Hay menos manatı́es en Puerto Rico hoy que hace 10
años? (Biologı́a)
Sorprendentemente, una persona que investiga cualquiera de
estas preguntas bien podrı́a terminar usando el mismo método
estadı́stico para responderlas. (Se llama prueba t para una
muestra)

1. Presentación tabular y gráfica de datos 3 / 60


La estadı́stica es esencial para los profesionales:
ˆ Proporciona un tipo de conocimientos y competencias
que favorecen el pensamiento analı́tico y crı́tico
ˆ Interpretar la literatura cientı́fica (notas de prensa,
artı́culos en revistas especializadas, informes de
investigación, etc.)
ˆ Diseñar y realizar investigaciones.
ˆ Evaluar la eficacia instrumentos de medición.
ˆ Tomar decisiones basadas en pruebas.
ˆ Comunicarse de manera efectiva con otros profesionales y
con el público en general.

1. Presentación tabular y gráfica de datos 4 / 60


Figura: Ejemplo-interpretación literatura.

1. Presentación tabular y gráfica de datos 5 / 60


Conceptos básicos

1. Presentación tabular y gráfica de datos 6 / 60


Estadı́stica. (Como disciplina)
La estadı́stica es la disciplina encargada de recopilar, organizar,
resumir y analizar datos con el fin de obtener conclusiones o
responder preguntas, respaldadas por una medida de confianza
en dichas conclusiones.
Vamos a dividir esta definición en cuatro partes.
1. Las estadı́sticas involucran la recopilación de información.
2. Organización y el resumen de la información
3. La información se analiza para sacar conclusiones o
responder preguntas especı́ficas
4. Los resultados deben informarse utilizando alguna medida
que represente cuán convencidos estamos de que nuestras
conclusiones reflejan la realidad.
Nota: Como sustantivo, el término estadı́stica refiere a datos numéricos,
tales como promedios, medianas, porcentajes e ı́ndices que caracterizar
un objeto de estudio o de referencia.
1. Presentación tabular y gráfica de datos 7 / 60
Tı́picamente, la estadistica se dividen en dos ramas:

1. Presentación tabular y gráfica de datos 8 / 60


Ejemplo
Determina cuál de los siguientes enunciados es descriptivo en
naturaleza y cuál es inferencial.
ˆ Todas las lobinas (pez) de 9 pulgadas tiene un promedio
de tres años.
ˆ De las lobinas usadas en la muestra elaborar la Guı́a de
pesca en agua dulce, la edad promedio de las lobinas de 9
pulgadas era de tres años
ˆ De los adolescentes encuestados en mayo y junio de 2022,
89 % tienen teléfono celular.
ˆ En mayo/junio de 2022, el 11 % de todos los adolescentes
no tenı́a teléfono celular.

1. Presentación tabular y gráfica de datos 9 / 60


Población y muestra

La población es el conjunto TOTAL de individuos, objetos o


medidas que poseen algunas caracterı́sticas comunes
observable en un lugar o tiempo determinado y de interés para
determinado estudio.
Ejemplos
Estamos interesados en conocer la edad promedio de
todos los habitantes del paı́s.
Una compañı́a está consideranda en vender un nuevo
producto en Barranquilla, pero antes quieren saber,
¿cuántas personas en Barranquilla podrı́an estar
interesadas en comprarlo?
Todos los huracanes en el océano Atlántico.

1. Presentación tabular y gráfica de datos 10 / 60


Caracterı́sticas de una Población

Homogeneidad
Población
Caracterı́sticas similares

Tiempo
Periodo de tiempo donde
se ubicarı́a la población

Espacio
Lugar geográfico

Cantidad
Tamaño de la
población N
Muestra. La muestra es un subconjunto de la población.
Debe ser una copia fiel, lo más representativa de la población.
Si dicho subconjunto se selecciona de manera totalmente
aleatoria, entonces se llama muestra aleatoria. Por regla
general, cuando hablamos de ”muestra”, nos referimos a una
muestra aleatoria.

*Los datos muestrales deben reunirse de una forma adecuada,


como a través de un proceso de selección aleatoria.
*Si los datos muestrales no se reúnen de forma apropiada,
resultarán tan inútiles que ninguna cantidad de tortura
estadı́stica podrá salvarlos.

1. Presentación tabular y gráfica de datos 12 / 60


Ejemplos
Cada año, la Oficina del Censo de EE.UU. publica el
Informe de Población Actual basado en una encuesta de
50, 000 hogares. El objetivo de este informe es conocer las
caracterı́sticas demográficas de todos los hogares dentro
de los Estados Unidos, como los ingresos.
ˆ Un gerente de control de calidad selecciona
aleatoriamente 50 botellas de Coca-Cola que se llenaron
el 15 de octubre para evaluar la calibración de la máquina
de llenado.
ˆ Una muestra de sangre para pruebas de laboratorio.

1. Presentación tabular y gráfica de datos 13 / 60


Parámetro: Es un valor numérico asociado a una población.
El valor del parámetro es constante y por lo general es
desconocido.
Ejemplos
1 Si tuviéramos las edades de todos los habitantes del paı́s,
podrı́amos calcular la media, y serı́a un parámetro.
2 La velocidad máxima media del viento del huracán más
fuerte en cualquier año. Este es un número que nadie
sabe o puede saber, incluso teóricamente.
3 El porcentaje o proporción de todas las personas de una
ciudad que comprarı́an X producto.

1. Presentación tabular y gráfica de datos 14 / 60


Estadı́stico: Es un valor que se calcula en base a los datos
que se toman en la muestra y el cual es usado para estimar el
valor del parámetro. El valor del estadı́stico es conocido y varı́a
con la muestra tomada.
Ejemplos
1 Un estudio de 6076 adultos en baños públicos (en
Atlanta, Chicago, Nueva York y San Francisco) encontró
que el 23 % no se lavaba las manos antes de salir. Fuente:
American Society of Microbiology and the Soap and
Detergent Association.
2 El porcentaje de personas que votarán por X candidato
según la reciente encuesta.

1. Presentación tabular y gráfica de datos 15 / 60


Métodos de muestreo
ˆ Muestreo aleatorio simple (MAS). Se selecciona la
muestra de tal forma que todos los elementos de la
población o marco muestral, tiene la misma probabilidad
de ser elegido. Tiene como ventaja la representatividad de
la población. En teorı́a, lo único que puede poner en
peligro su representatividad es la suerte. Una de las
desventajas más evidentes del muestreo aleatorio simple
es la necesidad de una lista completa de todos los
miembros de la población.
ˆ Muestreo sistemático. En el muestreo aleatorio
sistemático, el investigador primero escoge aleatoriamente
la primera pieza o sujeto de la población. A continuación,
el investigador seleccionará a cada enésimo sujeto de la
lista.

1. Presentación tabular y gráfica de datos 16 / 60


Métodos de muestreo
ˆ Muestreo estratificado. El investigador divide a toda la
población en diferentes subgrupos o estratos. Luego,
selecciona aleatoriamente a los sujetos finales de los
diferentes estratos en forma proporcional.

Figura: Los estratos más comunes utilizados en el muestreo


aleatorio estratificado son la edad, el género, el nivel
socioeconómico, la religión, la nacionalidad y el nivel de estudios
1. Presentación tabular y gráfica de datos 17 / 60
Métodos de muestreo

ˆ Muestreo por conglomerado. Se obtiene al estratificar


la población o marco muestral y después seleccionar
algunos o todos los ı́tems de algunos estratos, mas no de
todos. El conglomerado más utilizado en la investigación
es un conglomerado geográfico
ˆ Muestreo por conveniencia. Se realiza muestreo por
conveniencia cuando los individuos se obtienen fácilmente
y su escogencia no se basa en la aleatoriedad. Los
estudios que usan este muestreo generalmente tiene
resultados sospechosos, aunque a menudo un investigador
supondrá que tal muestra de conveniencia representa en
forma aproximada una muestra aleatoria.

1. Presentación tabular y gráfica de datos 18 / 60


1. Presentación tabular y gráfica de datos 19 / 60
1. Presentación tabular y gráfica de datos 20 / 60
Ejercicio:
1. Suponga que estamos investigando sobre el porcentaje de
alumnos que trabajan de una población de 20 alumnos de la
Universidad.

a. Elija una muestra aleatoria simple de tamaño n=6 de esta


población.
b. Elija una muestra sistemática de tamaño n=6.
1. Presentación tabular y gráfica de datos 21 / 60
2. A un distribuidor de alimentos minorista en una gran área
metropolitana le gustarı́a poner a prueba la demanda para
un nuevo producto alimenticio. Él distribuye alimentos a
través de cinco grandes cadenas de supermercados. El
distribuidor de alimentos selecciona una muestra de
tiendas ubicadas en áreas donde considera que los
compradores son receptivos a probar los nuevos
productos. ¿Qué tipo de muestreo representa esto?
3. Una muestra aleatoria podrı́a ser muy difı́cil de obtener.
¿Por qué?
4. ¿Por qué la muestra aleatoria es tan importante en
estadı́stica?
5. El directorio telefónico puede no ser un marco muestral
representativo. Explica por qué.

1. Presentación tabular y gráfica de datos 22 / 60


Variable, dato y observación

Una variable es una caracterı́stica de los elementos u objetos


que se estudian. Y los datos son los valores que se obtienen
para cada variable. Al conjunto de las mediciones obtenidas
para un determinado elemento u objeto se le llama
observación.

1. Presentación tabular y gráfica de datos 23 / 60


1. Presentación tabular y gráfica de datos 24 / 60
Sesgo: Se presenta cuando los resultados de la muestra no
son representativos de la población, sesgo es cualquier
diferencia sistemática entre la población y la muestra.
Se consideran 3 tipos de sesgos:
ˆ Sesgo en muestra: El sesgo de muestreo significa que la
técnica utilizada para obtener los individuos de la muestra
tiende a favorecer a una parte de la población sobre otra.
Se previene realizando un muestreo aleatorio.
ˆ Sesgo en respuestas: El sesgo en respuestas existe
cuando las respuestas en una encuesta no reflejan los
verdaderos sentimientos del encuestado. Se previene
haciendo preguntas imparciales o equilibradas, elaborando
preguntas claras, evitando preguntas vagas.
ˆ Sesgo por falta de respuesta: El sesgo por falta de
respuesta existe cuando los individuos seleccionados para
formar parte de la muestra no responden a la encuesta.
Se previene intentando contactar nuevamente al
individuo, ofrecer recompensas.
1. Presentación tabular y gráfica de datos 25 / 60
Ejemplos:
1 Supón que se está interesado en el peso promedio del
curso, se decide tomar sólo las mujeres como la muestra.
Evidentemente esta muestra estará sesgada (Sesgo de
muestreo). ¿Por qué?.
2 Supongamos que usted está realizando una encuesta
sobre los hábitos de sueño de los estudiantes. De una lista
de estudiantes registrados, obtienes una muestra aleatoria
simple de 150 estudiantes. Una pregunta de la encuesta
es ¿Cuánto duermes?
(Sesgo en respuesta)

1. Presentación tabular y gráfica de datos 26 / 60


3 Un editor de libros de texto desea determinar qué
porcentaje de profesores universitarios requieren o
recomiendan que sus alumnos compren paquetes de libros
de texto con materiales complementarios, como guı́as de
estudio, medios digitales y herramientas en lı́nea. El editor
envı́a encuestas por correo electrónico a una muestra
aleatoria de 320 miembros de la facultad que se han
registrado en su sitio web y han aceptado recibir
solicitudes. El editor informa que el 80 % de los profesores
universitarios requieren o recomiendan que sus estudiantes
adquieran algún tipo de paquete de libros de texto.
(Sesgo por falta de respuesta)

1. Presentación tabular y gráfica de datos 27 / 60


Variables cuantitativas y cualitativas

Variable cualitativa, categórica o atributo. Variable que


describe o jerarquiza un elemento de la población.
a. Variable nominal. Variable cualitativa que caracteriza
(describe o nombra ) un elemento de la población (las
operaciones aritméticas no son significativas )
b. Variable ordinal. Variable cualitativa que incorpora una
posición ordenada o clasificación.

1. Presentación tabular y gráfica de datos 28 / 60


Variable cuantitativa o numérica. Variable que cuantifica
un elemento de la población. En variables de este tipo, la
aritmética tiene sentido (sumar, multiplicar, etc.)
a. Variable discreta. Son los que resultan de hacer conteos y
por lo general son número enteros.(Puntos aislados)
b. Variable continua. Son los que resultan de hacer
mediciones y pueden asumir cualquier valor de la recta
real. (todo un intervalo)
NOTA: No toda variable que “contiene” números es
cualitativa. Muchas veces se emplean números: 1,2,3,... como
etiquetas y denotan caracterı́sticas.

1. Presentación tabular y gráfica de datos 29 / 60


Ejemplos. Tipos de variables.
ˆ Estatura (Cuantitativa continua)
ˆ Grupo del curso (Cualitativa nominal)
ˆ Número de hermanos (Cuantitativa discreta )
ˆ Color favorito (Cualitativa nominal)
ˆ Calificaciones en un curso: A, B, C, D, F (Cualitativa
ordinal)
ˆ Edad (Cuantitativa ?)
ˆ Presión arterial: bajo-normal-alto (Cualitativa ordinal)
ˆ Número de automóviles que transitan la vı́a al mar
durante un año

1. Presentación tabular y gráfica de datos 30 / 60


Ejercicio: Clasifica las variables de la base de datos:

1. Presentación tabular y gráfica de datos 31 / 60


Presentación de datos
cualitativos

1. Presentación tabular y gráfica de datos 32 / 60


Descripción de variables cualitativas (tabla de
frecuencias, gráfico circular, gráfico de barras)

1. Presentación tabular y gráfica de datos 33 / 60


Método textual

Este método de presentación de la información consiste en el


empleo de palabras y cifras combinadas en un texto, para
informar los datos obtenidos.
Ejemplo:
Datos obtenidos de una tienda de electrónica durante el mes
de enero:
Televisor LED: $600, $550, $620, $630, $590, $320,
$330, $290,$600,$600
Smartphone: $300, $310, $320, $330, $290
Laptop: $800, $850, $820, $830, $790, $830, $790

1. Presentación tabular y gráfica de datos 34 / 60


Método tabular
Este método de presentación de la información consiste en
presentar los datos por medio de una tabla o cuadro. En esta,
se debe colocar al principio un tı́tulo identificatorio que en
forma clara, breve y completa, explique el contenido de la
tabla.
Ejemplo:

Cuadro: Tabla de distribución de frecuencias con frecuencia relativa

Intervalo de clase Frecuencia Frecuencia relativa


10 - 19 5 0.125
20 - 29 8 0.2
30 - 39 12 0.3
40 - 49 10 0.25
50 - 59 6 0.15

1. Presentación tabular y gráfica de datos 35 / 60


Método gráfico
Este método de presentación de la información es el más
simple para el lector porque puede captar el panorama general,
o la tendencia de los datos, de un solo vistazo. Es mucho más
fácil de comprender que una tabla o un texto..
Ejemplo:
D
A 10 %
30 %
40 %
20 % C

B
Figura: Diagrama circular

1. Presentación tabular y gráfica de datos 36 / 60


Organizar datos cualitativos en tablas

Los datos cualitativos (o categóricos) proporcionan medidas


que clasifican o categorizan. Cuando se resumen datos
cualitativos es común usar una distribución de frecuencias.
Se le llama distribución de frecuencias a la agrupación de
datos en categorı́as mutuamente excluyentes que indican el
número de observaciones en cada categorı́a. Se organizan los
categorı́as con sus respectivos conteos en una tabla.

1. Presentación tabular y gráfica de datos 37 / 60


Muchas veces estamos interesados en la frecuencia relativa.
La frecuencia relativa es la proporción (o porcentaje) de
observaciones dentro de un categorı́a y se encuentra usando la
fórmula
frecuencia de la categoria
Frecuencia relativa =
suma de todas las observaciones
En las variables ordinales es útil emplear la frecuencia
acumulada y corresponde a la suma de la frecuencia para
dicha clase y las frecuencias anteriores a ella. Tambien se tiene
la frecuencia relativa acumulada: se calcula dividiendo la
frecuencia de dicha clase entre el total de observaciones

1. Presentación tabular y gráfica de datos 38 / 60


Ejemplos:
Supongamos que se lleva a cabo una encuesta en una
universidad para determinar las preferencias de los estudiantes
en cuanto a su deporte favorito. Se recopilan los siguientes
datos de 30 estudiantes:
Fútbol, Baloncesto, Voleibol, Natación, Tenis, Fútbol,
Natación, Voleibol, Baloncesto, Fútbol, Fútbol, Tenis,
Baloncesto, Voleibol, Natación, Fútbol, Baloncesto,
Voleibol, Natación, Tenis, Fútbol, Fútbol, Fútbol,
Baloncesto, Natación, Fútbol, Baloncesto, Voleibol,
Tenis, Fútbol.
Construye una tabla de distribución de frecuencias y frecuencia
relativa. para mostrar las preferencias deportivas de los
estudiantes. Construye dos afirmaciones en base a las
frecuencias.

1. Presentación tabular y gráfica de datos 39 / 60


1. Presentación tabular y gráfica de datos 40 / 60
Se llevó a cabo un estudio sobre la efectividad de diferentes
medicamentos en el tratamiento de una enfermedad especı́fica.
Los investigadores clasificaron la efectividad de los
medicamentos en cuatro categorı́as ordinales: ’Muy Efectivo’,
’Efectivo’, ’Moderadamente Efectivo’ y ’No Efectivo’. Se
registraron los siguientes datos para 20 pacientes:
Muy Efectivo, Efectivo, Moderadamente Efectivo, No Efectivo,
Muy Efectivo, Efectivo, Moderadamente Efectivo, Muy
Efectivo, Efectivo, No Efectivo, Moderadamente Efectivo,
Moderadamente Efectivo, Muy Efectivo, Efectivo,
Moderadamente Efectivo, Moderadamente Efectivo, No
Efectivo, Moderadamente Efectivo, Muy Efectivo, Efectivo.
Construye una tabla de distribución de frecuencias que
muestre la cantidad de pacientes en cada categorı́a de
efectividad, y también incluye una columna para la frecuencia
relativa, acumulada y relativa acumulada.

1. Presentación tabular y gráfica de datos 41 / 60


Diagrama Circular

Introducción
El gráfico de diagrama circular, también conocido como
gráfico de pastel, es una herramienta visual utilizada para
representar la distribución de frecuencias de datos cualitativos.

Caracterı́sticas
Muestran la cantidad de datos que pertenecen a cada
categorı́a como una parte proporcional al cı́rculo.
Utiliza sectores circulares para representar cada categorı́a.
La suma de todas las categorı́as forma un cı́rculo
completo (100 %).
Es fácil de entender y de interpretar.

1. Presentación tabular y gráfica de datos 42 / 60


Ejercicio:
1. ¿Cuál es el porcentaje aproximado de individuos con
sangre tipo A? Suponiendo que la gráfica circular se base
en una muestra de 500 personas, ¿aproximadamente
cuántas de ellas tienen sangre tipo A?

1. Presentación tabular y gráfica de datos 43 / 60


Diagrama de barras

Los diagramas de barras son representaciones gráficas de las


tablas de distribuciones. Un gráfico de barras se construye
etiquetando cada categorı́a de datos en un eje la frecuencia o
frecuencia relativa de la categorı́a en el otro eje. Rectángulos
de igual ancho se dibujan para cada categorı́a. La altura de
cada rectángulo representa la frecuencia de la categorı́a o la
frecuencia relativa.

1. Presentación tabular y gráfica de datos 44 / 60


1. Presentación tabular y gráfica de datos 45 / 60
¿ Qué es mejor, tablas, diagramas de barras, diagramas
circulares?
ˆ Cantidad de categorı́as (entre más categorı́as tenga una
variable no se recomiendan gráficas circulares
ˆ Necesidad de orden ( debido a la naturaleza del diagrama
circular no es posible establecer un orden de las
frecuencias, pero sı́ con el diagrama de barras)
ˆ Comparación (al comparar valores especı́ficos dentro de
una misma variable se prefiere el diagrama de barras, los
gráficos circulares son útiles para comparar las partes con
el todo)
ˆ Totalidad de categorı́as ( No se puede hacer un diagrama
circular si todas las categorı́as de la variable no se toman
en consideración, sı́ con un diagrama de barras)

1. Presentación tabular y gráfica de datos 46 / 60


1. Presentación tabular y gráfica de datos 47 / 60
1. Presentación tabular y gráfica de datos 48 / 60
Las gráficas como las de barras y las circulares en ocasiones
sirven para exagerar o disfrazar la verdadera naturaleza de los
datos.

1. Presentación tabular y gráfica de datos 49 / 60


Lección importante: para interpretar una gráfica de manera
correcta, debemos analizar la información numérica dada en
ella, para no engañarnos por su forma general

1. Presentación tabular y gráfica de datos 50 / 60


Presentación de datos
cuantitativos

1. Presentación tabular y gráfica de datos 51 / 60


Antes de analizar datos, es crucial entender que cada número
representa una observación de una variable aleatoria. Si los
datos son de toda la población, no hay incertidumbre; pero si
son de una muestra, necesitamos métodos estadı́sticos. Para
variables cuantitativas discretas o continuas, primero
necesitamos comprender su distribución: dónde se centran los
valores y si siguen algún patrón. Utilizaremos herramientas de
análisis exploratorio de datos (EDA) para esto.

1. Presentación tabular y gráfica de datos 52 / 60


Diagrama de Tallo y Hojas
Técnica de Observación de la Distribución
El diagrama de tallo y hojas es una técnica eficaz para
observar la distribución de datos.
Es fácil de diseñar y se puede crear rápidamente.
¿Qué es?
Consiste en representar los datos de forma fiel,
agrupándolos para visualizar la forma de la distribución y
mantener su individualidad.
Se compone de filas horizontales de números.
El número principal de cada fila es el tallo, mientras que
los demás números son las hojas.
Ejemplo
Para los números 3.1, 3.2, 3.7 y 3.5, el tallo de cada
número es 3.
Las hojas proporcionan información secundaria, como la
cifra decimal, para distinguir entre los números ’treses’.
1. Presentación tabular y gráfica de datos 53 / 60
Construcción del Diagrama de Tallo y Hojas

1 Elija al menos 5 tallos que sean los primeros o los dos


primeros dı́gitos de los números del conjunto de datos.
2 Etiquete las filas con los tallos elegidos.
3 Grafique los datos colocando el siguiente dı́gito después
del tallo como hoja del tallo correspondiente.
4 Gire el diagrama para observar la distribución:
¿Los datos se agrupan cerca de ciertos tallos o se
distribuyen uniformemente?
¿Los datos se estrechan hacia algún extremo?
¿La forma del diagrama se asemeja a una campana, es
plana o simétrica?

1. Presentación tabular y gráfica de datos 54 / 60


Ejemplo:
Considere estas observaciones sobre la variable aleatoria X,
magnitud de un terremoto en California según su medición en
la escala de Richter:

Construya un diagrama de tallo y hoja.

1. Presentación tabular y gráfica de datos 55 / 60


Ejercicio:

1. Presentación tabular y gráfica de datos 56 / 60


Tabla de frecuencias para datos cuantitativos

Cuando un conjunto de datos consiste en una gran cantidad


de diferentes valores de datos discretos o cuando un conjunto
de datos consiste en datos continuos, debemos agrupar datos
en clases mediante el uso de intervalos numéricos.
Clases: Las clases son categorı́as en las que se agrupan los
datos
Aquı́ surgen varias preguntas. ¿ Cuántas clases uso?, ¿ Cuál
deben ser los lı́mites de las clases? ¿Qué tan ancho son las
clases?. No existe una respuesta estandar que se aplique para
todos los datos. Pero si debemos considerar:

1. Presentación tabular y gráfica de datos 57 / 60


ˆ Se sugiere entre 5 a 20 clases. Existen muchas fórmulas
para establecer el número de clases a emplear, una muy
conocida es la fórmula de Sturges: m = 1 + 3.3log (n)
donde n es el total de datos. Redondear m hacia arriba.
ˆ El lı́mite inferior de la primera clase debe ser un poco más
pequeño que el menor dato.
ˆ El ancho de la clase o amplitud se aproxima por

mayor dato − menor dato


ancho de clase =
# de clases
Es posible redondear la amplitud al número natural
inmediatamente superior
ˆ Las clases no se deben solapar
ˆ Las frecuencias de las clases son el conteo de números
que pertenecen a dicha clase

1. Presentación tabular y gráfica de datos 58 / 60


Mucha gente manifiesta reacciones de alergia sistémica a las
picaduras de insectos. Estas reacciones varı́an de paciente a
paciente, no sólo en cuanto a gravedad, sino también en el
tiempo transcurrido hasta que se inicia la reacción. Los datos
siguientes repre sentan este ’tiempo de inicio hasta la reacción’
en 40 pacientes que experimentaron una reacción sistémica a
la picadura de abeja.

1. Presentación tabular y gráfica de datos 59 / 60


1. Presentación tabular y gráfica de datos 60 / 60

También podría gustarte