Está en la página 1de 86

DESCRIPCIÓN DE LOS

CONJUNTOS DE DATOS
Dr. Rafael Maradiaga
TOMA DE DATOS

La toma de datos es la obtención de una colección


de los mismos que no han sido ordenados
numéricamente.
Ejemplo

El conjunto de alturas de 100 estudiantes, sacados de una lista


alfabética de una universidad.
www.themegallery.com
TOMA DE DATOS
Entre la herramientas estadísticas que resultan
de particular utilidad para organizar los datos se
incluyen:

 Tablas de frecuencias que colocan los todos los datos en clases


especificas.

 Diversos gráficos que pueden proporcionar una representación


visual de los datos.

 Tablas de contingencia y diagramas de “tallo y hoja”, los cuales


www.themegallery.com

también permiten la presentación de un conjunto de datos de


manera concisa y discernible.
ORDENAMIENTO
ORDENAMIENTO

Es colocar los datos numéricos tomados, en


orden creciente o decreciente de acuerdo a su
magnitud.
La diferencia entre el mayor y el menor de los
números se llama recorrido o rango de los datos.
www.themegallery.com
ORDENAMIENTO
Ejemplo:

Si la altura mayor de los 100 estudiantes es 74


pulgadas y la menor es de 60 pulgadas, el rango
es de:

74 – 60 = 14 PULGADAS
www.themegallery.com
DISTRIBUCION DE
FRECUENCIA
DISTRIBUCION DE FRECUENCIA

La información estadística puede constar de un


gran número de observaciones y, mientras
mayor sea el número, mayor puede ser la
conveniencia y necesidad de presentarla en
forma resumida, la cual puede omitir algunos
detalles, pero en cambio puede revelar la
naturaleza general de la información.
www.themegallery.com
DISTRIBUCION DE FRECUENCIA

Cuando se dispone de gran número de datos, es


útil distribuirlos en clases o categorias y
determinar el número de individuos
pertenecientes a cada clase, que es la
frecuencia de clase.
www.themegallery.com
DISTRIBUCION DE FRECUENCIA
Un ordenamiento tabular de los datos en clases,
reunidas las clases y con frecuencias
correspondientes a cada una, se conoce como
una distribución de frecuencias o tabla de
frecuencias.

Una distribución de frecuencias (o tabla de


frecuencias) ordenará los datos si estos se
dividen en clases y se registrará el número de
www.themegallery.com

observaciones en cada clase.


Alturas de 100 estudiantes en la Universidad

ALTURA (Pulg.) Número de Estudiantes

60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 - 74 8
TOTAL 100
www.themegallery.com

La primera clase o categoría, por ejemplo, comprende las alturas de


60 a 62 pulgadas y vienen indicadas por el símbolo 60 – 62.
DISTRIBUCION DE FRECUENCIA

Puesto que 5 estudiantes tienen una altura


perteneciente a esta clase, correspondiente
frecuencia de clase es 5.

Los datos ordenados y resumidos como en la


distribución de frecuencia anterior, se suelen
llamar datos agrupados.
www.themegallery.com
DISTRIBUCION DE FRECUENCIA

Aunque con el proceso de agrupamiento


generalmente se pierden parte del detalle
original de los datos, tiene la importante ventaja
de presentarlos todos en un sencillo cuadro que
facilita el hallazgo de las relaciones que pueda
haber entre ellos, puestas así de manifiesto.
www.themegallery.com
NÚMERO DE CLASES
NÚMERO DE CLASES

En una tabla de frecuencias el número de clases


es algo arbitrario.

En general una tabla debería estar entre 5 a 20


clases.

Muy pocas no revelarían ningún detalle sobre los


datos y demasiadas clases seria confuso como la
www.themegallery.com

lista de datos originales.


NÚMERO DE CLASES

Se puede seguir una regla simple para aproximar


el número de clases a utilizar, C, es:

2C ≥n
www.themegallery.com
INTERVALOS DE CLASE
INTERVALO DE CLASES
TABLA DE FRECUENCIA

Para la construcción original de una tabla de


frecuencias, el intervalo de clase puede
determinarse como:

IC = Valor más grande – Valor más pequeño


número deseado de clases
www.themegallery.com
INTERVALOS DE CLASE

Un símbolo que define una clase, tal como 60 –


62 de la tabla anterior, se conoce con intervalo
de clase

Los números extremos, 60 y 62, son los limites


de clase

El número menor 60 es el limite inferior de la


clase y el mayor 62 es el limite superior.
www.themegallery.com
INTERVALOS DE CLASE

Los términos clase e intervalo de clase se


utilizan a menudo indistintamente, aunque el
intervalo de clase es realmente un símbolo para
la clase.

Un intervalo de clase que, al menos


teóricamente, no tiene limite superior o inferior,
se conoce como intervalo de clase abierto.
www.themegallery.com
INTERVALOS DE CLASE

Por ejemplo, el referirse a la edad de grupos de


individuos el intervalo de clase, mayores de 65
años es un intervalo de clase abierto.
www.themegallery.com
LIMITES REALES DE CLASES
LIMITES REALES DE CLASE
Si las alturas se registran con aproximación de
pulgadas, el intervalos de clase 60 – 62
teóricamente incluye todas la medidas desde
59.5000…a 62.5000…pulgadas.
www.themegallery.com
LIMITES REALES DE CLASE

Estos números, representados brevemente por


los números exactos 59.5 y 62.5 se conocen
como limites reales de clase o limites verdaderos
de clase El menor de ellos, 59.5 es el limite real
inferior y el mayor de ellos, 62.5 es limite real
superior.
www.themegallery.com
LIMITES REALES DE CLASE

Prácticamente, los limites reales de clase se


obtienen sumando al limite superior de un
intervalo de clase el limite inferior del intervalo de
clase contiguo superior y dividiendo por 2.
www.themegallery.com
LIMITES REALES DE CLASE

A veces, los limites reales de clase se utilizan


para simbolizar las clases

Por ejemplo: tomemos la tabla anterior


www.themegallery.com
Limites de clase
Alturas de 100 estudiantes en la Universidad

ALTURA Número
(Pulgadas) de Estudiantes
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
www.themegallery.com

72 - 74 8
TOTAL 100
LIMITES REALES DE CLASE

Las diferentes clases de la primera columna


podrán iniciarse por:

59.5 – 62.5
62.5 – 65.5
.
.
www.themegallery.com
LIMITES REALES DE CLASE

Sin embargo, con tal notación aparece una


ambigüedad, pues los límites reales de clase no
coincidirían con las observaciones reales.
www.themegallery.com
LIMITES REALES DE CLASE

Así si una observación fuese 62.5 no seria posible


discernir si pertenece al intervalo de clase (59.5 -
62.5) o al (62.5 - 65.5)
www.themegallery.com
TAMAÑO O ANCHURA DE UN
INTERVALO DE CLASE
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE

El tamaño o anchura de un intervalo de clase es


la diferencia entre los limites reales de clase que
lo forman y se conoce como anchura de clase,
tamaño de clase o longitud de clase.
www.themegallery.com
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE

Si todos los intervalos de clase de una


distribución de frecuencias tienen igual anchura,
esta anchura común representa por “C”
www.themegallery.com
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE

En tal caso, “C” es igual a la diferencia entre dos


sucesivos limites de clase inferiores o superiores
www.themegallery.com
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE

POR EJEMPLO:

EL INTERVALO DE CLASE ES
C = 62.5 – 59.5 = 65.5 – 62.5 = 3
www.themegallery.com
MARCA DE CLASE
MARCA DE CLASE

La marca de clase es el punto medio del intervalo


de clase y se obtiene sumando los limites inferior
y superior de la clase y dividiendo por 2.
www.themegallery.com
MARCA DE CLASE

Así la marca de clase se llama también punto


medio de la clase

Así todas las alturas en el intervalo de clase 60 – 62


pulgadas se consideran como de 61 pulgadas.
www.themegallery.com
REGLAS GENERALES PARA
FORMAR LAS DISTRIBUCIONES
DE FRECUENCIA
REGLAS

1. Determinar el mayor y el menor entre los


datos registrados y así encontrar el rango.
(Diferencia entre el mayor y el menor de los datos)
www.themegallery.com
REGLAS
2. Dividir el rango en un número conveniente de
intervalos de clase del mismo tamaño.
El número de intervalos de clase se toma generalmente entre
5 y 20 dependiendo de los datos.

Los intervalos de clase se eligen también en forma que las


marcas de clase o puntos medios coincidan con datos
realmente observados.

Eso tiende a reducir el llamado error de agrupamiento, en los


www.themegallery.com

análisis matemáticos posteriores.

Sin embargo, los limites reales de clase muchas veces no


coincidirán con los datos observados.
REGLAS

3. Determinar el número de observaciones que


cae dentro de cada intervalo de clase, es
decir, encontrar las frecuencias de clase.

Lo mejor para esto es utilizar una hoja de conteo


www.themegallery.com
HISTOGRAMÁS
Y
POLIGONOS DE FRECUENCIAS
HISTOGRAMÁS Y POLIGONOS DE FRECUENCIA

1.Un histograma de frecuencias consiste en una


serie de rectángulos que tienen

(a) sus bases sobre el eje horizontal (el eje x) con


centros en las marcas de clase y longitud igual al
tamaño de los intervalos de clase.

(b) superficie proporcionales a las frecuencias de clase.


www.themegallery.com
HISTOGRAMÁS Y POLIGONOS DE FRECUENCIA

2. Polígono de frecuencias es un grafico de línea


trazado sobre las marcas de clase, pueden
obtenerse uniendo los puntos medios de los
techos de los rectángulos en el histograma.
www.themegallery.com
HISTOGRAMÁS Y POLIGONOS DE FRECUENCIA

FRECUENCIA
número DE ESTUDIANTES

40

30

20
www.themegallery.com

10

58 61 64 67 70 73 76
ALTURAS
DISTRIBUCION DE
FRECUENCIAS RELATIVA
DISTRIBUCION DE FRECUENCIA
La frecuencia relativa de una clase es la
frecuencia de la clase dividida por el total de
frecuencias de todas las clases y se expresa
generalmente como porcentaje.

Si las frecuencias en la anterior tabla de


frecuencias se sustituyen por las
correspondientes frecuencias relativas, la tabla
resultante se llama:
www.themegallery.com
DISTRIBUCION DE FRECUENCIA

 distribución de frecuencias relativas,


 distribución porcentual o
 tabla de frecuencias relativas
www.themegallery.com
DISTRIBUCION DE FRECUENCIAS
ACUMULADAS. OJIVAS
DISTRIBUCION DE FRECUENCIA
ACUMULADAS
La frecuencia total de todos los valores menores
que el limite real superior de clase de un intervalo
de clase dado se conoce como frecuencia
acumulada hasta ese intervalo de clase inclusive.
www.themegallery.com
DISTRIBUCION DE FRECUENCIA ACUMULADAS

Una tabla que represente las frecuencias


acumuladas se llama distribución de:
www.themegallery.com
DISTRIBUCION DE FRECUENCIA ACUMULADAS

 Frecuencias acumuladas,
 Tabla de frecuencias acumuladas o;
 Brevemente distribución acumulada.
www.themegallery.com
Alturas de 100 estudiantes en la Universidad

ALTURA número
(Pulgadas) de Estudiantes
Menor que 59.5 0
Menor que 62.5 5
Menor que 65.5 23
Menor que 68.5 65
Menor que 71.5 92
www.themegallery.com

Menor que 74.5 100


TOTAL 100
Histogramas y polígonos de frecuencia
FRECUENCIA

100
NÚMERO DE ESTUDIANTES

80

60

40
www.themegallery.com

20

59.5 62.5 65.5 68.5 71.5 74.5


ALTURAS
DISTRIBUCION DE FRECUENCIA ACUMULADAS

Un grafico que muestre las frecuencias


acumuladas menores que cualquier limite real
superior de clase trazado sobre los limites reales
superiores de clase se llama polígono de
frecuencias acumuladas u ojiva
www.themegallery.com
DISTRIBUCION DE FRECUENCIA ACUMULADAS

En algunos casos es preferible considerar una


distribución de frecuencias acumuladas de todos
los valores mayores o iguales al limite real
inferior de clase de cada intervalo de clase.
www.themegallery.com
DISTRIBUCION DE FRECUENCIA ACUMULADAS

En este caso consideremos las alturas de 59.5


pulgadas o más, 62.5 pulgadas o más, esta a
veces se llama distribución acumulada o más
mientras que la considerada anteriormente es la
distribución acumulada menor que.
www.themegallery.com
DISTRIBUCION DE FRECUENCIA ACUMULADAS

Las correspondientes ojivas se llaman “ o más” y


“menor que”.
www.themegallery.com
DISTRIBUCION DE FRECUENCIA ACUMULADAS

Siempre que nos refiramos a distribuciones


acumuladas u ojivas sin especificar, se entenderá
que son del tipo “menor que”
www.themegallery.com
DISTRIBUCION DE FRECUENCIAS
RELATIVAS ACUMULADAS. Ojivas
porcentulaes
DISTRIBUCION DE FRECUENCIA RELATIVAS ACUMULADAS.
OJIVAS PORCENTUALES

La frecuencia relativa acumulada o frecuencia


porcentual acumulada es la frecuencia
acumulada dividida por la frecuencia total.
www.themegallery.com
CURVAS DE FRECUENCIA.
OJIVAS SUAVIZADAS
CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

El conjunto de datos puede considerarse


normalmente como perteneciente a una muestra
extraída de una población grande
www.themegallery.com
CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

A causa de las muchas observaciones que


podemos realizar en la población es posible
teóricamente (para datos continuos) elegir los
intervalos de clase muy pequeños y todavía
tener un número adecuado de observaciones
dentro de la clase.
www.themegallery.com
CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

Así se tiene que el polígono de frecuencias o el


de frecuencias relativas para una población
grande puede estar formado por muchos
pequeños segmentos rectos que aproximan el
conjunto a una curva, las curvas de este tipo
pueden llamarse curvas de frecuencia o curvas
de frecuencia relativa, respectivamente.
www.themegallery.com
CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

Es razonable esperar que tales curvas teóricas


provengan de la aproximación a suavizar los
polígonos de frecuencias o de los polígonos de
frecuencias relativas de la muestra, la
aproximación es tanto más exacta conforme
aumenta el tamaño de la muestra.
www.themegallery.com

Por esta razón una curva se conoce como un


polígono de frecuencias suavizado.
CURVAS DE FRECUENCIAS.
OJIVAS SUAVIZADAS

normalmente es más sencillo suavizar una ojiva


que un polígono de frecuencias.
www.themegallery.com
TIPOS DE CURVAS DE
FRECUENCIA SUAVIZADAS
TIPOS DE CURVAS DE FRECUENCIAS

Las curvas de frecuencias presentan


determinadas formas características que les
distinguen:
www.themegallery.com
TIPOS DE CURVAS DE FRECUENCIAS.

a) las curvas de frecuencias simétricas o bien formadas se


características por el hecho de que las observaciones
que equidistan del máximo central tienen la misma
frecuencia.

b) en las curvas de frecuencias moderadamente


asimetricas o sesgadas la cola de la curva a un lado
del máximo central es mayor que al otro lado.

c) si la cola mayor se presenta a la derecha de la curva


www.themegallery.com

se dice que esta sesgada a la derecha o que tiene


sesgo positivo, mientras que si ocurre lo contrario se
dice que la curva esta sesgada a la izquierda o que
tiene un sesgo negativo.
TIPOS DE CURVAS DE FRECUENCIAS.

d) en las curvas en forma de “j” o de “j invertida”, el


máximo se presenta en un extremo.

e) las curvas de frecuencias en forma de “u” tienen un


máximo en ambos extremos.
f) una curva de frecuencias bimodal tiene dos
máximos.

g) una curva de frecuencias multimodal tiene más de


dos máximos
www.themegallery.com
PROBLEMÁS
PROBLEMA 1.

Sean los números 17, 45, 38, 27, 6, 48, 11, 57,
34, 22:

a) colocarlos en orden creciente y decreciente.


b) determinar el rango.
www.themegallery.com
PROBLEMA 2.

La puntuación final en la clase de matemática de


80 estudiantes en la universidad se registran en
la siguiente tabla:
www.themegallery.com
PROBLEMA 2.
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
www.themegallery.com

65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
PROBLEMA 2.
con relación a esta tabla, encontrar:
(a) la puntuación más alta,
(b) la puntuación más baja,
(c) el rango.
(d) las puntuaciones de los cinco estudiantes de mayor puntuación.
(e) las puntuaciones de los cinco estudiantes de menor puntuación.
(f) la puntuación del decimo estudiante de mayor puntuación.
(g) cuantos estudiantes obtuvieron puntuación de 75 o mayor.
(h) cuantos estudiantes obtuvieron puntuación menor de 85.
(i) que porcentaje de estudiantes obtuvo una puntuación mayor
www.themegallery.com

que 65 pero no mayor que 85.


(h) que puntuaciones no tienen ningún estudiante.
PROBLEMA 3.

En la siguiente tabla se muestra una distribución


de frecuencias de salarios semanales en dólares
de 65 empleados de la compañía M&M:
www.themegallery.com
PROBLEMA 3.
SALARIOS número
(dólares) de Empleados
50.00 – 59.00 8
60.00 – 69.00 10
70.00 – 79.00 16
80.00 – 89.00 14
90.00 – 99.00 10
www.themegallery.com

100.00 – 109.00 5
110.00 – 119.00 2
PROBLEMA 3.
determinar:

(a) el limite inferior de la sexta clase,


(b) el limite superior de la cuarta clase
(c) la marca de clase (o punto medio) de la tercera
clase.
(d) los limites reales de la quinta clase.
www.themegallery.com
PROBLEMA 3.
determinar:
(e) tamaño del quinto intervalo de clase,
(f) frecuencia de la tercera clase
(g) frecuencia relativa de la tercera clase.
(h) intervalo de clase que tiene mayor frecuencia.
www.themegallery.com
PROBLEMA 3.
Determinar:

 porcentaje de empleados con salarios


menores a $80.00 por semana.
 porcentaje de empleados con menos de
$100.00 pero con $60.00 semanales al
menos.
www.themegallery.com
PROBLEMA 3.

5
intervalo de clase marca de clase Frecuencia
IC MC = X i f f * Xi Xi - X / Xi - X / f */ X i - X /
49.5 50 - 54 54.5 52 1 52 -23.375 23.375 23.375
54.5 55 - 59 59.5 57 2 114 -18.375 18.375 36.75
59.5 60 - 64 64.5 62 11 682 -13.375 13.375 147.125
64.5 65 - 69 69.5 67 10 670 -8.375 8.375 83.75
69.5 70 - 74 74.5 72 12 864 -3.375 3.375 40.5
74.5 75 - 79 79.5 77 21 1617 1.625 1.625 34.125
79.5 80 - 84 84.5 82 6 492 6.625 6.625 39.75
84.5 85 - 89 89.5 87 9 783 11.625 11.625 104.625
www.themegallery.com

89.5 90 - 94 94.5 92 4 368 16.625 16.625 66.5


94.5 95 - 99 99.5 97 4 388 21.625 21.625 86.5
80 6030 663

Media = X 75.375 Desviacio Es 8.2875

Coefiente de variación 0.10995025


PROBLEMA 4.
Si las marcas de clase en una distribución de
frecuencias de pesos de estudiantes son:
128, 137, 146, 155, 164, 173 y 182 libras, hallar:
www.themegallery.com
PROBLEMA 4

(a) el tamaño de intervalo de clase.


(b) los limites reales de clase,
(c) los limites de clase, suponiendo los pesos
medidos con aproximación de unidad de
libra.
(d) representar gráficamente los resultados.
www.themegallery.com
www.themegallery.com

También podría gustarte