Está en la página 1de 11

Colegio Montano portal los Álamos

Curso: Estadística
Elaborado por: Beatriz Estrada y Alejandra Gracia
Grado: 5to. Bachillerato

ESTADÍSTICA DESCRIPTIVA

I. Elaboración de tablas estadísticas

Características importantes de los datos

 Centro: Valor promedio o representativo que indica la localización de la mitad


del conjunto de los datos.

 Variación: Medida de la cantidad en que los valores de los datos varían entre
sí.

 Distribución: La naturaleza o forma de la distribución de los datos (como en


forma de campana, uniforme o sesgada).

 Valores extremos: Valores muéstrales que están muy alejados de la vasta


mayoría de los demás valores de la muestra.

 Tiempo: Características cambiantes de los datos a través del tiempo.


Distribuciones de frecuencias

TABLA 1 TABLA 2

 Distribución de frecuencias (o tabla de frecuencias): Es una lista de


valores de datos (ya sea de manera individual o por grupos de intervalos),
junto con sus frecuencias (o conteos) correspondientes.

 Límites de clase inferiores: son las cifras más pequeñas que pueden
pertenecer a las diferentes clases. (Los límites de clase inferiores de la tabla
2 son 21, 31, 41, 51, 61 y 71).
 Límites de clase superiores: son las cifras más grandes que pueden
pertenecer a las diferentes clases. (Los límites de clase superiores de la tabla
2 son 30, 40, 50, 60, 70 y 80).

 Fronteras de clase: son las cifras que se utilizan para separar las clases,
pero sin los espacios creados por los límites de clase. En la figura 1 se
muestran los espacios creados por los límites de clases de la tabla 2. En la
figura 1 se percibe con facilidad que los valores 30.5, 40.5, . . . , 70.5 están
en el centro de esos espacios ( al limite superior se le suma 0.5 y así
sucesivamente), y a tales cifras se les conoce como fronteras de clase. Las
dos fronteras de clase desconocidas (que en la figura 1 se indican con signos
de interrogación) se identifican fácilmente al seguir el patrón establecido por
las otras fronteras de clase de 30.5, 40.5, . . . , 70.5. La frontera de clase
inferior es 20.5, y la frontera de clase superior es 80.5. Por lo tanto, la lista
completa de las fronteras de clase es 20.5, 30.5, 40.5, 50.5, 60.5, 70.5 y 80.5.
Las fronteras de clase son muy útiles en la elaboración de la gráfica llamada
histograma.

 Marcas de clase (Xi): son los puntos medios de las clases. (Las marcas de
clase de la tabla 2 son 25.5, 35.5, 45.5, 55.5, 65.5 y 75.5). Las marcas de
clase se calculan sumando el límite de clase inferior con el límite de clase
superior, y dividiendo la suma entre 2.

 Anchura de clase: es la diferencia entre dos límites de clase inferiores


consecutivos o dos fronteras de clase inferiores consecutivas. (La anchura
de clase de los datos de la tabla 2 es 10).

Procedimiento para construir una distribución de frecuencias

Las distribuciones de frecuencias se construyen por las siguientes razones:


1. Es posible resumir conjuntos grandes de datos,
2. Se logra cierta comprensión sobre la naturaleza de los datos, y
3. Se tiene una base para construir gráficas importantes (como los histogramas,
que se estudiarán en la siguiente sección). Muchos usos de la tecnología nos
permiten obtener distribuciones de frecuencias de manera automática, sin
necesidad de tener que hacerlas manualmente; no obstante, a continuación se
presenta el procedimiento básico:

1. Decida el número de clases que desea, el cual debe estar entre 5 y 20. El número
que elija puede verse afectado por la comodidad de usar cifras enteras.
2. Calcule Redondee este resultado para obtener un número más adecuado.
(Generalmente se redondea hacia arriba). Es probable que necesite cambiar el
número de clases, pero la prioridad debe ser utilizar valores que sean fáciles de
comprender.

3. Punto de partida: Comience por elegir un número para el límite inferior de la


primera clase. Elija el valor del dato más bajo o un valor conveniente que sea un
poco más pequeño.

4. Usando el límite inferior de la primera clase y la anchura de clase, proceda a


listar los demás límites de clase inferiores. (Sume la anchura de clase al punto
de partida para obtener el segundo límite de clase inferior. Después sume la
anchura de clase al segundo límite de clase inferior para obtener el tercero, y así
sucesivamente).

5. Anote los límites inferiores de clase en una columna vertical y luego proceda a
anotar los límites superiores de clase, que son fáciles de identificar.

6. Ponga una marca en la clase adecuada para cada dato. Utilice las marcas para
obtener la frecuencia total de cada clase.

EJEMPLO Use las edades de las mejores actrices de la tabla1 y siga el


procedimiento anterior para construir la distribución de frecuencias Suponga que
desea incluir 6 clases.
SOLUCIÓN

Paso 1: Comience seleccionando 6 clases.

Paso 2: Calcule la anchura de clase. En el siguiente cálculo, 9.833 se redondea a


10, ya que es un número más conveniente.

Paso 3: Elegimos un punto de partida de 21, que es el valor más bajo de la lista y
un número conveniente, ya que 21-30 se convierte en la primera clase.

Paso 4: Sume la anchura de clase 10 al punto de partida 21 para determinar que el


segundo límite inferior de clase es igual a 31. Continúe y sume la anchura de clase
10 para obtener los límites inferiores de clase restantes de 41, 51, 61 y 71.
Paso 5: Liste los límites de clase inferiores de forma vertical, como se muestra al
margen. Con esta lista podemos identificar con facilidad los límites de clases
superiores correspondientes, que son 30, 40, 50, 60, 70 y 80.

Paso 6: Después de identificar los límites inferiores y superiores de cada clase,


proceda a trabajar con el conjunto de datos asignando una marca a cada valor. Una
vez completadas las marcas, súmelas para obtener las frecuencias que se
presentan en la tabla de distribución de frecuencias.
 Distribución de frecuencias relativas: incluye los mismos límites de clase
que una distribución de frecuencias, pero utiliza las frecuencias relativas en
vez de las frecuencias reales. La suma de las frecuencias relativas debe dar
100%.

 Frecuencia acumulativa de una clase: es la suma de las frecuencias para


esa clase y todas las clases anteriores. La tabla siguiente presenta la
distribución de frecuencias acumulativas basada en la distribución de
frecuencias de la tabla 2. Con el uso de las frecuencias originales de 28, 30,
12, 2, 2 y 2, sumamos 28 + 30 para obtener la segunda frecuencia
acumulativa de 58; luego, sumamos 28 + 30 + 12 = 70 para obtener la tercera,
y así sucesivamente.
Pensamiento crítico: Interpretación de las distribuciones de frecuencias

La transformación de datos en bruto en una distribución de frecuencias suele ser un


medio para un llegar a un gran fin. Un objetivo importante consiste en identificar la
naturaleza de la distribución, y las distribuciones “normales” son extremadamente
importantes para el estudio de la estadística.

Una característica fundamental de una distribución normal es que, cuando se


grafica, el resultado tiene forma de “campana”; y al inicio las frecuencias son bajas,
luego se incrementan hasta un punto máximo y luego disminuyen.

Distribución normal

1. Al inicio las frecuencias son bajas, después se incrementan hasta un punto


máximo y luego disminuyen.

2. La distribución debe ser aproximadamente simétrica, y las frecuencias tienen


que distribuirse de manera uniforme a ambos lados de la frecuencia máxima.
(Las frecuencias de 1, 5, 50, 25, 20, 15, 10, 5, 3, 2, 1 no se distribuyen de
forma simétrica alrededor de la puntuación máxima de 50, ni satisfacen los
requisitos de simetría).

Ejemplo: Como se ve en la siguiente tabla, la distribución de las frecuencias es de


forma normal.
Ejemplo: ¿Cómo se midió la frecuencia cardiaca?. Se tomó el pulso de 40 adultos
varones seleccionados aleatoriamente. La tabla presenta los últimos dígitos de
estos datos. Si la tasa de pulsaciones se mide contando el número de latidos
cardiacos por minuto, esperamos que los últimos dígitos tengan frecuencias muy
similares. Sin embargo, observe que la distribución de frecuencias muestra que
todos los últimos dígitos son números pares; no hay números impares, lo cual
sugiere que las tasas de pulsaciones no se contaron durante un minuto. Tal vez se
contaron durante 30 segundos y después se duplicaron los resultados.
Ejemplo: ¿Qué nos indica un hueco? La tabla es una tabla de frecuencias de los
pesos (en gramos) de monedas de un centavo elegidas al azar. Un examen de las
frecuencias revela un gran hueco entre las monedas de un centavo más ligeras y
las más pesadas. Esto sugiere que tenemos dos poblaciones diferentes. En una
investigación posterior, se descubre que las monedas de un centavo hechas antes
de 1983 tenían un 97% de cobre y un 3% de zinc; mientras que las monedas de un
centavo acuñadas después de 1983 tienen un 3% de cobre y un 97% de zinc, lo
cual explicaría el gran hueco entre las monedas de un centavo más ligeras y las
más pesadas.

NOTA: El ejemplo anterior sugiere que la presencia de huecos puede revelar el


hecho de que tenemos datos que provienen de dos o más poblaciones diferentes.
Sin embargo, lo opuesto no es verdad, ya que los datos de diferentes poblaciones
no necesariamente revelan huecos al construir histogramas.

Ejemplo: La tabla siguiente incluye las edades de actrices y actores en el momento


en que ganaron el premio Óscar de la Academia. La tabla muestra las frecuencias
relativas de los dos géneros. Al comparar estas frecuencias relativas, parece que
las actrices tienden a ser más jóvenes que los actores. Por ejemplo, observe la
primera clase, que indica que el 37% de las actrices se encuentra en la categoría
más joven, en comparación con sólo el 4% de los actores.

También podría gustarte