Está en la página 1de 3

Víctor Valentín Santos García 2017-1195.

Distribución de frecuencias para datos agrupados.

Es el proceso por medio del cual los datos son agrupados en categorías, que cuentan a su vez
con la propiedad de excluirse mutuamente, a fin de que se pueda observar de forma clara el
número que existe en cada clase de datos, los cuales han sido clasificados con esa clara
intención.

Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases
para así realizar un mejor análisis e interpretación de ellos. 
 
• Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos, se
debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando la
cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan las
frecuencias relativas y acumuladas, si es pertinente.
 
• Si no se conocen los intervalos, se pueden determinar de la siguiente manera: (recuerda que
los intervalos de clase se emplean si las variables toman un número grande de valores o
la variable es continua).
 
- Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se  determina
el rango. 
 
 - Se divide el rango en la cantidad de intervalos que se desea tener,(por lo general se
determinan 5 intervalos de lo contrario es ideal que sea un número impar por ejemplo 5, 7, 9)
obteniéndose así la amplitud o tamaño  de cada intervalo. 
 
 - Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer
intervalo, se suma a este valor la amplitud para obtener el extremo superior  y así
sucesivamente.
 
• Otra forma de calcular la cantidad de intervalos es aplicando los siguientes metodos:
 
Método Sturges:  k =  1 +  3,332 log n  
 
donde:
k= número de clases
n= tamaño muestral

Método Empírico: este método depende del criterio del evaluador de los datos, por lo tanto es
arbitrario. Dice lo siguiente.
 
         5 ≥ k  ≥ 20
Organización de datos en tallo y hojas.

El diagrama de tallo y hojas es un semigráfico que permite presentar la distribución de una


variable cuantitativa. Consiste en separar cada dato en el último dígito (que se denomina hoja)
y las cifras delanteras restantes (que forman el tallo).

Es especialmente útil para conjuntos de datos de tamaño medio (entre 20 y 50 elementos) y


que sus datos no se agrupan alrededor de un único tallo. Con él podemos hacernos la idea de
qué distribución tienen los datos, la asimetría, etc.

El nombre de tallo y hojas hace referencia a la ramificación de una planta, siendo los dígitos
delanteros marcan el tallo donde se encuentra el número y el dígito final la hoja.

Este diagrama se utilizaba más en los años 80 y 90, cuando los ordenadores no dibujaban
gráficos aunque si que escribían dígitos.

Para construir el diagrama de tallo y hojas, debemos seguir los siguientes pasos:

1- Ordenar los datos.

2- Redondear los números (en el caso de que no lo estén) hasta tengan las cifran que
queramos. Por ejemplo, si tenemos el número 3,62856 y queremos que tenga 2 dígitos la parte
decimal, lo redondeamos a 3,63.

3- Dibujar una tabla con dos columnas, la primera columna para el tallo y la segunda para las
hojas. Disponer todos los tallos en la primera columna en orden descendente. Cada tallo solo se
escribe una vez.

4- Registrar en la segunda columna todas las hojas, en orden creciente, junto al tallo
correspondiente.
Medidas de tendencia central.

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de


datos. Las medidas estadísticas pretenden "resumir" la información de la "muestra" para poder
tener así un mejor conocimiento de la población. (Ellas permiten analizar los datos en torno a
un valor central). Entre éstas están la media aritmética, la moda y la mediana.

Media Aritmética.

Es el promedio o medición de tendencia central de uso más común. Se calcula sumando todas
las observaciones de una serie de datos y luego dividiendo el total entre el número de
elementos involucrados.

La Moda.

Es el valor de una serie de datos que aparece con más frecuencia. Se obtiene fácilmente de una
clasificación ordenada. A diferencia de la media aritmética, la moda no se ve afectada por la
ocurrencia de los valores extremos. 

La Mediana.

Es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las
observaciones serán menores y la otra mitad serán mayores. La mediana no se ve afectada por
ninguna observación extrema de una serie de datos. Por tanto, siempre que esté presente una
observación extrema es apropiado usar la mediana en vez de la media para describir una serie
de datos.

Fórmula: n+1/2.

También podría gustarte