Está en la página 1de 6

Universidad Nacional de Ingeniería

Instituto de Estudios Superiores


UNI-IES

ASIGNATURA: ESTADISTICA I
UNIDAD I: ESTADÍSTICA DESCRIPTIVA

OBJETIVOS PARTICULARES.
- Analizar los resultados obtenidos de un conjunto de datos, utilizando las medidas
descriptivas.
- Utilizar la estadística descriptiva como herramienta de obtención de información
en la muestra, utilizando las fórmulas correspondientes.
- Demostrar ética y responsabilidad en la presentación de resultados obtenidos con
las medidas descriptivas, usando paquetes estadísticos.

CONTENIDOS
1.1. Introducción. Importancia. Rama de la estadística.
1.2. Recopilación y presentación de datos. Tablas de frecuencia.
1.3. Gráficos: Diagrama de tallo y hojas, histograma, diagrama de barra, ojiva,
diagrama de pastel.
1.4. Medidas de tendencia central para datos agrupados y no agrupados. Media,
mediana, moda, media cuadrática
1.5. Medidas de dispersión: Rango, varianza, desviación estándar, coeficiente de
dispersión.
1.6. Otras medidas: Percentiles, cuartiles, deciles, coeficiente de asimetría,
coeficiente de curtosis.

Recopilado por: Lic. Ana Gabriela Moreno Ulloa.


Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Estadística Descriptiva

1.1. Recopilación y presentación de datos agrupados.


1.2. Tablas de frecuencia.
1.3. Gráficos: Diagrama de tallo y hojas, histograma, diagrama de
barra, ojiva, diagrama de pastel.

Hasta ahora se ha estudiado la tabla de frecuencias para datos discretos, pero que pasa
cuando los datos son continuos y se necesitan ubicar dentro de un intervalo. Para esto se
debe de estudiar el agrupamiento en intervalos de clases.

AGRUPAMIENTO EN INTERVALOS DE CLASE


Cuando el número de valores distintos que toma la variable estadística es demasiado grande
o la variable es continua no es útil elaborar una tabla de frecuencias como la vista
anteriormente. En estos casos se realiza un agrupamiento de los datos en intervalos y se hace
un recuento del número de observaciones que caen dentro de cada uno de ellos. Dichos
intervalos se denominan intervalos de clase, y al valor de la variable en el centro de cada
intervalo se le llama marca de clase. De esta forma se sustituye cada medida por la marca de
clase del intervalo a que corresponda. A la diferencia entre el extremo superior e inferior de
cada intervalo se le llama amplitud del intervalo. [7]

Normalmente se trabajará con intervalos de amplitud constante. La tabla de frecuencias


resultante es similar a la vista anteriormente. En el caso de una distribución en k intervalos
ésta sería: [7]

Recopilado por: Lic. Ana Gabriela Moreno Ulloa.


Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

El realizar el estudio mediante el agrupamiento en intervalos de clase simplifica el trabajo,


pero también supone una pérdida de información, ya que no se tiene en cuenta cómo se
distribuyen los datos dentro de cada intervalo. Para que dicha pérdida sea mínima es
necesario elegir con cuidado los intervalos. Aunque no existen ningunas reglas estrictas para
la elección de los intervalos, los pasos a seguir son:

1. Determinar el recorrido, o rango, de los datos. Esto es, la diferencia entre el mayor y el
menor de los valores que toma la variable. [7]

2. Decidir el número k de intervalos de clase en que se van a agrupar los datos. Dicho número
se debe situar normalmente entre 5 y 20, dependiendo del caso. En general el número será
más grande cuanto más dato tenga la muestra. Una regla que a veces se sigue es elegir k como
el entero más próximo a √ N, donde N es el número total de medidas. [7]

3. Dividir el recorrido entre el número de intervalos para determinar la amplitud (constante)


de cada intervalo. Dicha amplitud no es necesario que sea exactamente el resultado de esa
división, sino que normalmente se puede redondear hacia un número algo mayor. [7]

4. Determinar los extremos de los intervalos de clase. Evidentemente el extremo superior


de cada intervalo ha de coincidir con el extremo inferior del siguiente. Es importante que
ninguna observación coincida con alguno de los extremos, para evitar así una ambigüedad
en la clasificación de este dato. Una forma de conseguir esto es asignar a los extremos de los
intervalos una cifra decimal más que las medidas de la muestra. [7]

Por ejemplo, si la variable estadística toma valores enteros: 10, 11, 12, ..., los intervalos se
podrían elegir: 9.5 − 11.5, 11.5 − 13.5, ....

5. Calcular las marcas de clase de cada intervalo como el valor medio entre los límites inferior
y superior de cada intervalo de clase. Otra consideración a tomar en cuenta a la hora de elegir
los intervalos es intentar que las marcas de clase coincidan con medidas de la muestra,
disminuyéndose así la pérdida de información debida al agrupamiento. Una vez
determinados los intervalos se debe hacer un recuento cuidadoso del número de
observaciones que caen dentro de cada intervalo, para construir así la tabla de frecuencias.
[7]

Ejemplo:
En la tabla siguiente se listan los datos medidos por James Short en 1763 sobre la paralaje
del Sol en segundos de arco. La paralaje es el ángulo subtendido por la Tierra vista desde el
Sol. Se midió observando tránsitos de Venus desde diferentes posiciones y permitió la

Recopilado por: Lic. Ana Gabriela Moreno Ulloa.


Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

primera medida de la distancia Tierra-Sol, que es la unidad básica de la escala de distancias


en el Sistema Solar (la unidad astronómica). [7]

Solución:

1. Recorrido: máximo−mínimo= 10.80 − 7.47 = 3.33.


2. Número de intervalos: k = √21 = 4.53 ⇒ k = 5.
Como se redondea por exceso, la amplitud del intervalo multiplicada por el número de
intervalos será mayor que el recorrido y no tendremos problemas en los extremos. [7]
3. Amplitud del intervalo: 3.33/5=0.666 ⇒ 0.7.
4. Extremos de los intervalos. Para evitar coincidencias se toma un decimal más. [7]
El primer extremo se toma algo menor que el valor mínimo, pero calculándolo de forma que
el último extremo sea algo mayor que el valor máximo. [7]
Si tomamos a1 = 7.405 se verifica que es < 7.47 (mínimo), y el último extremo será
7.405+5×0.7 = 10.905 que resulta ser > 10.80 (máximo). Ahora ya podemos calcular los
extremos para cada intervalo de clase y las marcas de clase correspondientes. [7]
5. Recuento y construcción de la tabla. [7]

Recopilado por: Lic. Ana Gabriela Moreno Ulloa.


Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

REPRESENTACIONES GRÁFICAS
Después de construir la tabla de frecuencias correspondiente es conveniente la
representación gráfica de la distribución de los datos en un diagrama. Estas
representaciones gráficas permiten una visualización rápida de la información recogida.
Veamos los diferentes tipos de diagramas. [7]
La representación gráfica más usada para datos agrupados es el histograma de frecuencias
absolutas o relativas (ver Figura 2.1). [7]
Un histograma es un conjunto de rectángulos adyacentes, cada uno de los cuales representa
un intervalo de clase. La base de cada rectángulo es proporcional a la amplitud del intervalo.
Es decir, el centro de la base de cada rectángulo ha de corresponder a una marca de clase. La
altura se suele determinar para que el área de cada rectángulo sea igual a la frecuencia de la
marca de clase correspondiente. Por tanto, la altura de cada rectángulo se puede calcular
como el cociente entre la frecuencia (absoluta o relativa) y la amplitud del intervalo. En el
caso de que la amplitud de los intervalos sea constante, la representación es equivalente a
usar como altura la frecuencia de cada marca de clase, siendo este método más sencillo para
dibujar rápidamente un histograma. [7]
Al igual que en las variables no agrupadas, otro tipo de representación es el polígono de
frecuencias. Este se obtiene uniendo por líneas rectas los puntos medios de cada segmento
superior de los rectángulos en el histograma. Ver Figura 2.4. [7]
El polígono de frecuencias acumuladas sirve para representar las frecuencias acumuladas
de datos agrupados por intervalos. En abscisas se representan los diferentes intervalos de
clase. Sobre el extremo superior de cada intervalo se levanta una línea vertical de altura la
frecuencia (absoluta o relativa) acumulada de ese intervalo. A continuación, se unen por
segmentos rectos los extremos de las líneas anteriores. El polígono parte de una altura cero
para el extremo inferior del primer intervalo. Evidentemente, la altura que se alcanza al final
del polígono es N, para frecuencias absolutas,
o 1, para frecuencias relativas. [7]
Mediante la interpolación en el polígono de
frecuencias acumuladas (o leyendo sobre la
escala de ordenadas) puede determinarse el
número de observaciones mayores o
menores que un valor dado, o incluso el
número de datos comprendidos entre dos

Recopilado por: Lic. Ana Gabriela Moreno Ulloa.


Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

valores (restando las frecuencias acumuladas correspondientes), incluso aunque esos


valores no sean marcas de clase. [7]

Bibliografía.

[1] - Mayers, Walpole. (1999). Probabilidad y Estadística para ingenieros. México. Sexta
edición. Editorial Prentice Hall.
[2]- Richard I. Levin. (2004). Estadística para administración y economía. Séptima edición.
[3]- William Navidi. (2006). Estadística para ingenieros y científicos. primera edición en
español por McGRAW-HILL/INTERAMERICANA EDITORES, S.A. DE C.V.
[4]- Montgomery, Douglas C. y Runger, Georg C. (1996). Probabilidad y Estadística aplicadas
a la ingeniería. México. Primera edición. Editorial, McGraw Hill.
[5] - Scheaffer, Richard L. y McClave, James T. (1993). Probabilidad y Estadística para
Ingeniería. México. Editorial Iberoamérica
[6]- Anderson Sweeney y Williams. Estadística para administración y economía.
[7] Gorgas G; Cardiel N; Zamorano J. (2011). Estadística básica para estudiantes de ciencias.

Recopilado por: Lic. Ana Gabriela Moreno Ulloa.

También podría gustarte