Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CULTURAL
UNIVERSITARIO
Estadística Descriptiva
UNIDAD 1
UNIDAD II
Organización, Presentación de los Datos
Variables Cualitativas:
a) Presentación Tabular: Frecuencias simples y acumuladas
b) Frecuencias absolutas y relativas: proporciones, porcentajes, razones y tazas.
El término “visualización de la
información”, se refiere a la forma o
manera de representar la información,
con el objetivo de facilitar la comprensión
y que sea visible e inteligible en el menor
tiempo posible.
Cuando se representa la información se
obtiene de un repositorio de datos
(Archivos o bases de datos), y se
presenta en pantalla en forma
organizada.
Representación tabular.
Una representación de información de
forma tabular, se considera:
Ordenar filas y columnas la
información obtenida en una
investigación de mercado o de algún
cuestionario aplicado.
Tabular es un mecanismo de
ordenamiento de datos por tablas que
facilita la interpretación o toma de
decisiones sobre un problema
especifico. Esta tabulación se hará de
acuerdo a criterios gerenciales de
interés.
¿Qué es tabular?
Hacer recopilaciones numéricas bien
estructuradas y fáciles de interpretar para
sintetizar los datos.
Expresar valores, magnitudes u otros datos
por medio de tablas. Es una ordenación de
datos, los cuales se representan en una
tabla en donde se colocan las variables de
acuerdo a intervalos por medio de los
cuales se analizan los datos.
Estructura
Una tabla consta de varias partes, las principales son las siguientes:
Título: Es la parte más importante del cuadro y sirve para describir todo él contenido de este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada
columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en
la tabla o cuadro y que no han sido explicados en otras partes.
1.-De los 800 alumnos de un colegio, han ido de viaje 600.
Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los datos obtenidos en la investigación
de campo, para ello se concentran en tablas de frecuencia y éstas pueden ser:
a) Absoluta.
b) Relativa.
c) Acumulada.
Con el análisis de las frecuencias podemos determinar la tendencia de la variable en estudio que como ya se dijo, ésta
puede ser nominal, ordinal o cuantitativa y sus respectivas escalas de medición: nominal, ordinal o por intervalos,
respectivamente.
Frecuencia absoluta: La frecuencia absoluta de una variable estadística es el número de veces que aparece en la
muestra dicho valor de la variable, la representaremos por ni
Frecuencia relativa: La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al
aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una
medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente
entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi
Frecuencia absoluta acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la
variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de
esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido
en la muestra un valor menor o igual que el de la variable y lo representaremos por Ni.
Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la
frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fi
Porcentaje Acumulado: Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la
frecuencia relativa acumulada por 100.
Ejemplo
Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Física.
3, 35, 30, 37, 27, 31, 41, 20, 16, 26, 45, 37, 9, 41, 28, 21, 31, 35, 10, 26, 11, 34, 36, 12, 22, 17, 33, 43, 19, 48, 38,
25, 36, 32, 38, 28, 30, 36, 39, 40.
Construir la tabla de frecuencias
Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla.
Frecuencia Frecuencia %
Frecuencia Frecuencia
Intervalo (i) Peso (Kg) % Absoluta Relativa Acumulad
absoluta Relativa
Acumulada Acumulada o
Intervalo de ni fi pi Ni Fi Pi
la clase
1 [50, 60) 8
2 [60, 70) 10
3 [70, 80) 16
4 [80,90) 14
5 [90, 100) 10
6 [100, 110) 5
7 [110, 120) 2
∑= ∑=
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30,
30, 31, 30, 31, 34, 33, 33, 29, 29.
xi ni
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
Presentación Gráfica:
Histograma. Polígono de frecuencias Ojiva. Gráficos de frecuencias
acumuladas.
Tipos de gráficas
La ojiva apropiada para información que presente frecuencias mayores que el dato que se está comparando
tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores,
tendrá una pendiente positiva.
Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la
misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayores que y
las ojivas menores que.
Calcular e interpretar la Ojiva porcentual con la siguiente información:
Estatura de los 40 estudiantes de la carrera de Ing. Industrial del CCU
Intervalo ni Ni Pi
117-126 2
126-135 3
135-144 10
144-153 13
153-162 6
162-171 4
171-180 2
∑=
Polígonos
Es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia.
Estos histogramas emplean columnas verticales para reflejar frecuencias: el polígono de
frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.
Este se caracteriza porque utiliza siempre lo que son columnas de tipo vertical y porque nunca
debe haber espacios entre lo que son unas y otras.
Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias distribuciones
distintas o la clasificación cruzada de una variable cuantitativa continua con una cualitativa o
cuantitativa discreta en el mismo dibujo
Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se desarrollan
mediante la marca de clase que tiene coincidencia con el punto medio de las distintas
columnas del histograma. En el momento de la representación de todas las frecuencias que
forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias
acumuladas que posibilita la diagramación del polígono correspondiente.
En el eje X (horizontal), deben indicarse los meses del año (enero, febrero, marzo, abril,
etc.). En el eje Y (vertical), en cambio, se registran las temperaturas más altas promedio
de cada mes (28º, 26º, 22º…). El polígono de frecuencia se creará al unir, mediante un
segmento, las diversas temperaturas más elevadas promedio.