Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Zamalloa Cornejo
ESTADÍSTICA DESCRIPTIVA
INTRODUCCION
Iniciamos esta unidad con la definición de algunos conceptos elementales y básicos,
y sin embargo pilares, para una comprensión intuitiva y real de lo que es la estadística.
Pretendemos introducir al estudiante en los primeros pasos para realizar un trabajo de
investigación y sobre el uso y manejo de datos numéricos: distinguir y clasificar las
características en estudio, enseñarle a organizar y tabular las medidas obtenidas mediante la
construcción de cuadros y por último los métodos para elaborar una imagen que sea capaz
de mostrar gráficamente los resultados.
DEFINICION DE ESTADISTICA
Como establece M.G. Kendall, definir en que consiste o qué es la Estadística ha sido
una materia que ha dividido a lo largo de la historia a los propios estadísticos. Desde
Quetelet que la consideraba la reina de las ciencias hasta autores que la definen como una
técnica más, al servicio de otras ramas del conocimiento. La característica común ha sido la
multiplicidad de definiciones que se han escrito sobre estadística. W.F. Willcox, en 1935,
reúne 115 definiciones y aporta una más para sustituirlas, sin lograrlo. El número de
definiciones de estadística ha seguido aumentando.
La estadística es la rama de las matemáticas que describe los fenómenos donde no
hay un componente absoluto, es decir es discreta, y sus modelos son estocásticos. La
estadística ayuda a todas las demás ciencias a generar modelos matemáticos "generales"
donde se haya considerado el componente aleatorio.
Es una disciplina de estudio relacionada con la recopilación, organización y resumen
de datos y la obtención de inferencias a partir de esos datos.
La Estadística es una disciplina científica que se dedica a la recopilación,
descripción, análisis e interpretación de datos y, por ello, constituye la metodología
científica que permite transformar datos en información. Esto la hace especialmente
atractiva, ya que en cualquier sociedad desarrollada existe una inmensa variedad de
problemas cuya solución sólo es posible mediante la utilización de técnicas estadísticas.
En una forma práctica, la estadística proporciona los métodos científicos para la
recopilación, organización, resumen, representación y análisis de datos o hechos, que se
1
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
presten a una evaluación numérica; tales como: fenómenos sociales, económicos, políticos,
culturales, etc.
Estadística descriptiva:
Describe, analiza y representa un grupo de datos utilizando métodos numéricos,
tabulares y/o gráficos que resumen y presentan la información contenida en ellos. Se puede
definir como aquel método que contiene la recolección, organización, presentación y
resumen de una serie de datos. El análisis que se realiza se limita en sí mismo a los datos
recolectados y no se puede realiza inferencia alguna o generalizaciones alguna, acerca de la
población de donde provienen esos datos estadísticos; es decir a partir de una muestra de
datos (recogida según una técnica concreta), es la descripción de las características más
importantes, entendiendo como características, aquellas cantidades que nos proporcionen
información sobre el tema de interés del cual hacemos el estudio.
Estadística inferencial:
Es aquella rama de la estadística que apoyándose en el cálculo de probabilidades y a
partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de la
estadística que hace posible la estimación de una característica de una población o la toma
de una decisión referente a una población, fundamentándose sólo en los resultados de la
muestra.
2
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Muestra:
Conjunto de elementos que forman parte de población. La muestra representa a esta
población.
También se puede definir como el subconjunto de la población a la cual se le efectúa
la medición con el fin de estudiar las propiedades del conjunto del cual es obtenida. Existen
diversos métodos para calcular el tamaño de la muestra y también para tomar los elementos
que la conforman, la muestra debe ser representativa de la población y sus elementos
escogidos al azar para asegurar la objetividad de la investigación.
Se llama muestreo al procedimiento científico que se utiliza para la obtención de
muestras estadísticamente significativas de una población que permitirá estimar los
parámetros poblacionales con un grado de confianza fijado previamente.
3
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
VARIABLE
Es la característica de la población que interesa al investigador y se está midiendo.
Existen dos categorías o tipo de variables:
o Variable discreta, aquella que entre dos valores próximos no puede tomar
ningún valor. Ejemplos: el número de hijos de una familia, el de obreros de
una fabrica, el de alumnos de la universidad, etc.
4
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
La variable se denota por las mayúsculas de letras finales del alfabeto castellano X,
Y, Z. A su vez cada una de estas variables puede tomar distintos valores y se denota por las
letras minúsculas x, y, z, etc. o colocando un subíndice en las letras minúsculas, que indica
orden.
Ejemplo:
X: Sexo
x1=masculino
x2= femenino
Y: Edad
y1=44
y2=49
PARÁMETRO Y ESTADÍGRAFO
Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos
de poblaciones, o de sus muestras, diferenciándose entre ellas las que se refieren a las
mismas poblaciones y a las muestras.
5
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
o PARÁMETRO – Es una medida resumen que se obtiene a base de los datos de una
población es decir que cuantifica una característica de esa población. Nos referimos a
las funciones, tales como las medias, desviaciones típicas, momentos, coeficientes de
correlación, etc. Los parámetros son cantidades, las cuales son constantes para
distribuciones en particular, pero pueden tomar diferentes valores para diferentes
miembros de familias de distribuciones del mismo tipo. Los más comunes son:
media poblacional
2 varianza poblacional
p proporción poblacional
X media muestral
S 2 varianza muestral
p̂ proporción muestral
Antes de obtener datos, hay incertidumbre en cuanto a que valor resulta de cualquier
estadística particular, por lo tanto, un estadístico es una variable aleatoria y estará denotada
por una letra mayúscula; una minúscula se emplea para representar el valor calculado u
observado de la estadística para toda la población, entonces se le considera como un
parámetro.
6
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
estadística como un procedimiento mediante el cuál se estiman los parámetros, por ejemplo
una media muestral es un estadígrafo que estima la media de la población, que es un
parámetro.
Para el planeamiento de una investigación, por norma general, se siguen las siguientes
etapas:
➢ Planteamiento del problema.
➢ Fijación de los objetivos.
➢ Formulación de la hipótesis.
➢ Definición de la unidad de observación y de la unidad de medida.
➢ Establecer la metodología: Diseño, determinar la población, muestra, técnicas
instrumentos etc.
➢ La recolección.
➢ Crítica, clasificación y ordenación.
➢ Tabulación.
➢ Presentación.
7
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
➢ Análisis.
➢ Publicación.
8
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
REVISIÓN DE LA LITERATURA
Se ausculta y se dispone qué estudios e investigaciones se han realizado sobre el
asunto o problema a investigar. Pueden considerarse estudios e investigaciones relacionadas,
o sea, no necesariamente tienen que ser tan similares como la investigación que se propone.
Deben de disponerse en orden cronológico comenzando con las menos recientes y
terminar con las actuales. También hay que considerar, si hay tres preguntas de
investigación, presentar los estudios según el orden de las preguntas. Puede también
presentarse los estudios según las variables de la investigación propuesta.
METODOLOGÍA
Diseño: Mediante la presentación de un flujograma se ilustra las partes o componentes de la
investigación demostrando así mismo el procedimiento de cómo se va a llevar a cabo la
investigación.
9
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Instrumentos: Debe describir los instrumentos o medios de cómo va a recoger los datos para
la investigación. Ya sea pruebas, cuestionarios o listas de cotejo, etc., debe de describirlos
indicando su magnitud en números de reactivos… indicar cuánto tiempo toma en
contestarse…
Los instrumentos van a estar determinados según las preguntas de investigación propuestas
en la primera parte.
Debe de procurar por la validez y la confiabilidad de los instrumentos e informarla.
Análisis estadístico: Indicar que tipo de estadísticas se va a calcular y qué análisis se va
llevar a cabo. Esto dependerá según las preguntas de investigación establecidas en la primera
parte de la propuesta.
LA RECOLECCIÓN
Una de las etapas más importantes de la investigación es la recolección de la
información, la cual ha de partir, a menos que se tenga experiencia con muestras análogas,
de una o varias muestras piloto en las cuales se pondrán a prueba los cuestionarios y se
obtendrá una aproximación de la variabilidad de la población, con el fin de calcular el
tamaño exacto de la muestra que conduzca a una estimación de los parámetros con la
precisión establecida. El establecimiento de las fuentes y cauces de información, así como la
cantidad y complejidad de las preguntas, de acuerdo con los objetivos de la investigación
son decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos
financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica, el
grado de desarrollo, la ausencia de técnica, etc. Es, entonces, descubrir dónde está la
información y cómo y a qué "costo" se puede conseguir; es determinar si la encuesta se debe
aplicar por teléfono, por correo, o si se necesitan agentes directos que recojan la
información; establecer su número óptimo y preparar su entrenamiento adecuado.
10
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
11
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
PUBLICACIÓN
Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros
estudiosos del mismo problema a quienes se les puede aportar información, conocimientos y
otros puntos de vista acerca de él.
La encuesta.- Se diferencia del censo en que la encuesta se aplica solo a una muestra de la
población u objeto de estudio.
12
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
13
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
VALIDEZ
La validez, no debe ser una característica propia del test, sino de las generalizaciones
y usos específicos de las medidas que el instrumento proporciona (Prieto y otros, 2010). Lo
cual quiere decir que, más que el test en sí mismo, lo que se somete a validación son las
posibles inferencias que se vayan a realizar a partir de los resultados obtenidos.
“La validez y confiabilidad son: “constructos” inherentes a la investigación, desde la
perspectiva positivista, con el fin de otorgarle a los instrumentos y a la información
recabada, exactitud y consistencia necesarias para efectuar las generalizaciones de los
hallazgos, derivadas del análisis de las variables en estudio” (Hidalgo, 2005).
Es el grado en que el instrumento mide aquello que afirma medir y existen cuatro
tipos de validez de un instrumento:
a. Validez de apariencia
b. Validez de constructo
c. Validez de contenido
d. Validez de criterio
a. Validez de apariencia:
Se refiere a la aceptabilidad social. Jueces que dicen si el instrumento en aspecto
mide las cualidades deseadas. Los ítems indican lo que queremos medir (Valoración por
expertos o Jueces).
b. Validez de constructo
Constructo es una idea
El instrumento refleja la teoría del fenómeno o del concepto que mide.
14
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Las medidas que resultan de las respuestas del cuestionario pueden ser consideradas y
usadas como medición del fenómeno que queremos medir
No hay patrón de oro con el cual comparar el nuevo instrumento, las preguntas de la
prueba son homogéneas y por lo tanto miden un solo aspecto
Puede ser calculada por diversos métodos como el análisis factorial y la matriz
multirasgo-multimétodo.
c. Validez de contenido:
• Evaluado por un grupo de expertos o Jueces
• Instrumento refleja un dominio específico de contenido de lo que se mide. Debe contener a
todos los ítems del dominio de contenido de las variables a medir.
• Se debe utilizar un cuestionario con preguntas que posteriormente se llevan a una matriz, a
la que se le dará un puntaje.
d. Validez de criterio:
Correlación de la escala con otra prueba que mida lo mismo, idealmente con el patrón de
oro (no siempre existe) que se ha usado rutinariamente y es aceptado.
Dos tipos: validez concurrente y validez predictiva. La validez concurrente
Comparar las puntuaciones de la prueba con otros indicadores paralelos o criterios
externos.
Correlación entre el nuevo instrumento y una escala que ya ha sido probada (patrón de
oro) para medir una característica.
CONFIABILIDAD
• Capacidad de la escala para proveer los mismos resultados en mediciones sucesivas,
bajo las mismas características.
• La constancia o estabilidad de los resultados que proporciona un instrumento de
medida (Bisquerra, 1987)
• Diferentes mediciones de un suceso estable en las mismas condiciones deben dar los
mismos resultados.
• Llamado también precisión o reproducibilidad.
15
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
• Nivel en que los diferentes ítems o preguntas de una escala están relacionados entre
sí. Esta homogeneidad entre los ítems nos indica el grado de acuerdo entre los
mismos.
Se evalúan tres aspectos:
a. Consistencia interna
b. Test Retest
c. Interevaluador
a. Consistencia interna:
Preguntas o ítems que miden un mismo aspecto debe estar fuertemente correlacionados
comparados con las preguntas o ítems que miden otro aspecto. Correlación muy alto dice
que las dos preguntas están evaluando el mismo aspecto y con uno de los dos es suficiente
para medirlo. Se puede medir utilizando el Alfa de Cronbach.
b. Confiabilidad Test-Retest:
Mide la estabilidad del instrumento a lo largo del tiempo. Hacer mediciones repetidas a los
pacientes. Se recomienda entre 15 días y un mes. Las medidas utilizadas son los coeficientes
de correlación de Pearson y el coeficiente de correlación intraclase (el más recomendable) –
Coeficiente de Correlación de Pearson: no es útil cuando hay más de dos observadores y no
mide el grado de acuerdo – Coeficiente de correlación intraclase: mide el acuerdo
(concordancia) entre los diferentes evaluadores. Una correlación del 70% indicaría una
fiabilidad aceptable.
c. Confiabilidad Interevaluador:
Mide que tan similares son los puntajes asignados por diferentes evaluadores a un mismo
fenómeno; para el caso en que los evaluadores entrevistan a las personas. – Para valores
continuos (cuantitativos) coeficiente de correlación intraclase. – Para valores categóricos
(cualitativos) Índice de Kappa y el porcentaje de acuerdo.
16
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Título: Debe ser completo, claro y conciso, es decir, debe reflejar claramente en qué consiste
el contenido y con qué criterios se clasificaron los elementos a que se hace referencia,
ubicándolo además en tiempo y lugar. Para ser completo, el título debe responder a las
preguntas qué, cómo, dónde y cuándo.
Cuadro o cuerpo de la tabla: Esta constituido por un grupo de casillas o celdas formadas por
el entrecruzamiento de filas y columnas. La primera fila se reserva para indicar a qué se
refieren los datos subyacentes y que unidad de medida se utilizó. En la primera columna se
reflejan las diferentes clases según la escala de clasificación empleada.
17
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Notas explicativas o aclaratorias: Se utilizan cuando se desea aclarar algo, por lo general del
título o del cuerpo de la tabla, la significación estadística o alguna breve nota aclaratoria del
contenido, que puede indicarse mediante símbolos colocados como exponentes.
Las tablas estadísticas suelen clasificarse según el número de variables que representan en:
Deben ser autoexplicativas, o sea, que se expliquen por sí mismas, por lo que se debe evitar
presentar demasiada información en ellas en aras de ganar claridad. En general, como forma
de presentación se utilizan cuadros uni y bidimensionales, reservándose el uso de los
multidimensionales para fines de trabajo.
18
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
19
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
GRÁFICO
La forma gráfica constituye un complemento importante para la presentación de los
resultados ya que permite incrementar la información científica que se trata de transmitir.
Son representaciones visuales que emplean símbolos, barras, polígonos y sectores, de los
datos contenidos en tablas o cuadros. La utilidad de los gráficos es doble, ya que pueden
servir no sólo como sustituto a las tablas o cuadros, sino que también constituyen por sí
mismos una poderosa herramienta para el análisis de los datos, siendo en ocasiones el medio
más efectivo y fácil no sólo para describir y resumir la información, sino también para
analizarla
El gráfico, al igual que las tablas, debe ser auto explicativo, sencillo y de fácil
comprensión.
Las partes del gráfico son:
• Número de orden.
• Título
• Cuerpo o gráfico propiamente dicho
• Leyenda
El número de orden y el título deben cumplir los mismos requisitos señalados
anteriormente para la tabla o cuadro estadístico.
El cuerpo o gráfico propiamente dicho, varía en su configuración en dependencia del
tipo de dato que se representa, pero siempre debe indicar claramente las coordenadas, las
escalas y las unidades de medida, reservando el eje de las abscisas (eje X) para la variable y
el eje de las ordenadas (eje Y) para la frecuencias.
La leyenda permite identificar claramente los diferentes elementos del cuerpo del
gráfico.
Existen varios tipos de gráficos, o representaciones gráficas, utilizándose cada uno de
ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen
al presentar la información, mencionaremos algunas consideraciones que conviene tomar en
cuenta al momento de realizar cualquier gráfica a fin de que la información sea transmitida
de la manera más eficaz posible y sin distorsiones:
El eje que represente a las frecuencias de las observaciones (comúnmente el vertical
o de las ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones
20
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
erróneas al comparar la altura, longitud o posición de las columnas, barras o líneas que
representan las frecuencias.
Las gráficas más comúnmente usadas en estadística descriptiva son: gráfico de
barras, gráfico de línea, gráfica circular (o "de pastel")
GRÁFICO DE BARRAS
Un gráfico de barras, también conocido como gráfico de columnas, es un diagrama con
barras rectangulares de longitudes proporcional al de los valores que representan. Los
gráficos de barras son usados para comparar dos o más valores. Existen dos principales
clases de gráficos de barras:
➢ Barra simple: se emplean para graficar hechos únicos
➢ Barras compuestas: es muy recomendable para comprar una serie estadística con
otra, para ello emplea barras simples se distinto color o tramado en un mismo plano
cartesiano, una al lado de la otra
21
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
GRÁFICO DE LINEAS
Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe
cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional, la
evolución del peso o estatura de una persona a través del tiempo, el desempeño académico
de un estudiante a lo largo de su instrucción escolar, las variaciones presentadas en la
medición realizada en algún experimento cada segundo o minuto) se pueden utilizar las
gráficas de líneas, que consisten en una serie de puntos trazados en las intersecciones de las
marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas:
22
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos
individuos a lo largo de cinco observaciones anuales.
GRÁFICOS DE SECTORES
Cuando los datos representan partes de un total y se desea ver la importancia de cada
parte en relación a las otras o al total, se utiliza este tipo de diagrama.
El gráfico de sectores, gráfico circular, o, como es tradicionalmente llamado gráfico
de pastel es un diagrama circular donde los valores de cada categoría estadística
representada son proporcionales a las respectivas medidas de los ángulos (1% en el gráfico
de sector equivale a 3,6º). Es decir, es el resultado de dividir un círculo en sectores circulares
de ángulos proporcionales a las frecuencias absolutas (Nº) de cada valor de la variable. Para
calcular los grados de cada sector se divide la frecuencia entre el número de datos y se
multiplica por 360.
Gráfico Nº 3
23
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
DISTRIBUCIÓN DE FRECUENCIAS
INTRODUCCIÓN
Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de
tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente
DEFINICIONES
Uno de los primeros pasos que se realiza en cualquier estudio estadístico es la
tabulación de resultados, es decir, recoger la información de la muestra resumida en una
tabla en la que a cada valor de la variable se le asocian determinados números que
representan el número de veces que ha aparecido, su proporción con respecto a otros valores
de la variable, etc. Estos números se denominan frecuencias.
la forma: y 'i −1 − y 'i ) donde y 'i −1 es el límite inferior y y 'i es el límite superior del
intervalo.
24
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
conceptos:
n
i =1
i = n1 + n2 + ..........+ nk = n
n
i =1
i = n ; 0 ni n i = 1, 2, ......., k
Nk = n
25
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Ni
Hi = ; Hk = 1
n
yi ni Ni hi Hi
y1 n1 N1 h1 H1
y2 n2 N2 h2 H2
yk nk Nk hk Hk
Ejemplo 1
En un banco se registró el número de solicitudes de préstamos para casas otorgados durante
cincuenta días. Los datos son los siguientes
0 2 1 2 2 0 1 2 1 3 2 3 2
2 2 1 2 4 2 0 3 3 3 0 2 1
4 3 1 3 2 3 3 3 4 2 2 4 2
3 3 2 3 3 2 2 4 2 2 3
Elaborar una tabla de distribución de frecuencias.
26
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Solución
yi ni Ni hi Hi
0 4 4 0,08 0,08
1 6 10 0,12 0,20
2 20 30 0,40 0,60
3 15 45 0,30 0,90
4 5 50 0,10 1
y 'i−1 − y 'i ) y sus puntos medios yi marcas de clase (valor que nos representa la información
27
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Por otro lado, tenemos la amplitud de cada intervalo, que puede ser constante o
variable. Si procuramos que todas las clases tengan la misma amplitud y los límites de cada
clase sean números redondos (múltiplos p. ej. de 5) conseguiremos simplificar mucho los
cálculos (siempre y cuando no se pierda demasiada información con estas consideraciones).
Debemos observar un hecho importante, se entiende que cuando hacemos una
agrupación en intervalos de clase, para nosotros solamente cuenta el número de
observaciones que caen dentro de cada uno de los intervalos y no la colocación en su
interior, es decir, suponemos que la distribución de estos valores en el intervalo es
homogénea, en esto radica la pérdida de información que supone agrupar los datos de las
observaciones.
y 'i−1 − y 'i ) yi ni Ni hi Hi
y '0 − y '1 ) y1 n1 N1 h1 H1
y '1 − y '2 ) y2 n2 N2 h2 H2
y 'k −1 − y 'k ) yk nk Nk hk Hk
MAS DEFINICIONES
➢ RANGO (R): Es el intervalo en que se distribuyen los datos y se determina
restándole el mayor valor observado el menor valor observado:
R = XMax - XMin
➢ AMPLITUD DE CLASE: Para una distribución de frecuencias que tiene clases del
mismo tamaño, la amplitud de clase se obtiene restando el límite inferior de una
28
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
➢ MARCA DE CLASE (punto medio): punto que divide a la clase en dos partes
iguales. Es el promedio entre los límites superior e inferior de la clase.
y 'i −1 + y 'i
yi =
2
La marca de clase no es más que una forma abreviada de representar un intervalo
mediante uno de sus puntos. Por ello hemos tomado como representante, el punto
medio del mismo. Esto está plenamente justificado, si recordamos que cuando se
mide una variable continua como el peso, la cantidad con cierto número de decimales
que expresa esta medición, no es el valor exacto de la variable, sino una medida que
contiene cierto margen de error, y por tanto representa a todo un intervalo del cual
ella es el centro.
1.- No existe ninguna ley que defina cómo obtener el número de intervalos de clase, pero la
experiencia recomienda que no sea menor que 5 ni mayor que 20. Por lo tanto la amplitud de
29
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Ejemplo 2
En el siguiente conjunto de datos, se presenta los ingresos anuales expresados en miles
de soles de 50 trabajadores 3, 8, 4, 14, 8, 6, 7, 9,13, 8, 10, 9, 7, 11, 10, 8, 5, 9, 6, 2, 13, 6, 3,
7, 6, 9, 12, 4, 7, 12, 8, 8, 9, 15, 8, 9, 10, 8, 5, 8, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
Construir una distribución de frecuencias de estos pesos.
Solución
R 13
R = XMax - XMin = 15 - 2 = 13 C= = = 1,857 2
k 7
y 'i−1 − y 'i ) yi ni Ni hi Hi
2 - 4 3 3 3 0,06 0,06
4 - 6 5 7 10 0,14 0,20
6 - 8 7 12 22 0,24 0,44
8 - 10 9 17 39 0,34 0,78
10 - 12 11 5 44 0,10 0,88
12 - 14 13 4 48 0,08 0,96
14 - 16 15 2 50 0,04 1
50 1
GRÁFICOS
1. HISTOGRAMA
El histograma es la representación gráfica en el plano coordenado de las características
concentradas en la tabla de la distribución de una variable cuantitativa continua, que
representa frecuencias mediante el volumen de las áreas. Un histograma consiste en un
conjunto de rectángulos con:
(a) En el eje de las abscisas (horizontal) se representan las clases con centros en las marcas
de clase y longitudes iguales a los tamaños de los intervalos de clase.
(b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas o relativas.
30
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
En el caso de un histograma para intervalos desiguales sólo se señalizan los valores sobre el
eje horizontal, el eje vertical no tiene sentido porque las frecuencias corresponden al área de
cada rectángulo.
31
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Histograma 4 parece faltarle una parte y por ello se le llama censurado o sesgado (en este
caso, a la izquierda). No representa una variabilidad natural y por tanto hay que sospechar
que se han eliminado algunos valores. Igual ocurre con las curvas de frecuencias poco
asimétricas o sesgadas a la izquierda o de asimetría negativa.
32
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
2. POLÍGONOS DE FRECUENCIA
El polígono de frecuencias es una representación gráfica de la distribución de
frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo
mediante segmentos los centros de las bases superiores de los rectángulos del histograma (es
decir, los puntos de las marcas de clase).
33
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
34
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
DISTRIBUCION UNIDIMENSIONAL
INTRODUCCION
En este capítulo consideraremos datos correspondientes a un solo carácter, el cual,
como antes dijimos llamaremos variable estadística. Todo análisis estadístico se inicia con
una primera fase descriptiva de los datos, ésta tiene por objeto sintetizar la información
mediante el cálculo de medidas estadísticas o medidas resumen que hacen referencia al
análisis de una sola variable (análisis unidimensional).
35
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
MEDIA ARITMÉTICA
x i
x1 + x2 + ....... + xn
X = i =1
=
n n
Ejemplo
Una muestra de cinco ejecutivos recibió la siguiente cantidad en bonos el año pasado:
$14000, $15000, $17000, $16000 y $15000. Encuentre el promedio en bonos para los cinco
ejecutivos.
Solución
Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es:
n
x i
14000 + 15000 + 17000 + 16000 + 15000
X = i =1
= = 15400
n 5
➢ Media para datos agrupados - Si los datos vienen agrupados en una tabla de
k
n y i i
n1 y1 + n2 y2 + ....... + nk yk
frecuencias, la expresión de la media es: Y = i =1
=
n n
Ejemplo
36
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
1. Una muestra de diez cines en una gran área metropolitana dio el número total de
películas educativas exhibidas la semana anterior. Calcule la media de las películas
proyectadas.
xi ni ni y i
0 1 0
1 2 2
2 4 8
3 2 6
4 1 4
total 10 20
n
ni yi
20
i =1
Y = = = 2
n 10
y 'i−1 − y 'i ) yi ni ni yi
2 - 4 3 3 9
4 - 6 5 7 35
6 - 8 7 12 84
8 - 10 9 17 153
10 - 12 11 5 55
12 - 14 13 4 52
14 - 16 15 2 30
50 418
Solución:
n
ni yi
418
i =1
Y = = = 8,36
n 50
37
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
m n X j j
de las n = nj es X =
j =1
m
.
j =1
n j =1
j
w i xi
Xp = i =1
m
w
i =1
i
Ejemplo
Las notas finales de un estudiante en tres asignaturas cuyos créditos son 3, 4 y 5 fueron 16,
18 y 20 respectivamente y el promedio ponderado fue:
3 (16 ) + 4 (18 ) + 5 ( 20 )
Xp = = 18,33
3+ 4+5
38
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
7. M cX = c M X
8. M aX b = a M X b
10. La media aritmética de los valores de una variable no varía si todas las frecuencias de su
distribución se multiplican o dividen por un mismo número.
MEDIANA
La mediana, a diferencia de la media no busca el valor central del recorrido de la
variable según la cantidad de observaciones, sino que busca determinar el valor que tiene
aquella observación que divide la cantidad de observaciones en dos mitades iguales. Por lo
tanto, es necesario atender a la ordenación de los datos, y debido a ello, este cálculo depende
de la posición relativa de los valores obtenidos. Es necesario, antes que nada, ordenar los
datos de menor a mayor (o viceversa).
Ejemplo
Calcule la mediana para la edad de una muestra de cinco estudiantes: 21, 25, 19, 20 y 22.
Solución:
Al ordenar los datos de manera ascendente y es n impar quedan:
19, 20, 21, 22, 25
entonces la mediana es 21.
M e = X n +1
2
n +1 5 +1
Primero calcular la posición = =3
2 2
Entonces:
M e = X 3 = 21
39
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Ejemplo
1.- Los siguientes datos son los puntajes obtenidos por ocho estudiantes: 11,3; 11,2;
11,5;11,2; 11,2; 11,4; 11,5; 11,4. Calcular la mediana.
Solución:
Ordenando los datos de menor a mayor valor:
11,1; 11,2; 11,2; 11,2; 11,3; 11,4; 11,4; 11,5 puntos
se observa que en la parte central de los datos no hay dato alguno por lo que la mediana se
determina con el promedio de los datos subrayados, entonces:
X4 + X5
Me =
2
11, 2 + 11,3
Me = = 11, 25
2
2.- Una muestra de diez cines en una gran área metropolitana dio el número total de
películas educativas exhibidas la semana anterior. Calcule la mediana de las películas
proyectadas.
xi ni Ni
0 1 1
1 2 3
2 4 7 Posición
3 2 9
4 1 10
total 10
Solución:
Xn + Xn
+1
Como n es par: M e = 2 2
2
40
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
PROPIEDADES DE LA MEDIANA
1. La mediana es única para cada conjunto de datos.
2. No se ve afectada por valores muy grandes o muy pequeños, y por lo tanto es una medida
valiosa de tendencia central cuando ocurren.
3. Puede obtenerse para datos de nivel de razón, de intervalo y ordinal. Puede calcularse
para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se
encuentra en una de estas clases.
41
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Ejemplo
En la siguiente tabla de distribución de frecuencias se tiene el salario mensual de 50
trabahjadores. Calcular la mediana del salario.
y 'i−1 − y 'i ) yi ni Ni
2 - 4 3 3 3
4 - 6 5 7 10
Clase 6 - 8 7 12 22
8 - 10 9 17 39 Posición
mediana 10 - 12 11 5 44
12 - 14 13 4 48
14 - 16 15 2 50
50
Solución
n 50
Ubicar la clase mediana dada por la posición = = 25
2 2
Luego reconocer el límite inferior que corresponde a la clase mediana: yi−1 = 8
n
− Ni −1
M e = yi−1 + C
2 = 8 + 2 ( 25 − 22 ) = 8,35
( Ni − Ni −1 ) ( 39 − 22 )
MODA
La moda se define como aquel valor o valores que más se repiten o que tienen mayor
frecuencia entre los datos que se han obtenido en una muestra, la muestra de una población
nos genera la distribución de los datos una vez que estos se han graficado y en esta gráfica es
posible observar la moda o modas de la misma, es por esto que una distribución de datos
puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos
modas) o polimodal (tiene más de dos modas).
42
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
1
M 0 = yi−1 + c donde: 1 = ni − ni −1 2 = ni − ni +1
1 + 2
Ejemplo
1. Las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75,
81, 87.
Solución
La calificación 81 es la que más ocurre, la que más se repite por lo tanto la calificación
modal es 81, M 0 = 81
2. Una muestra de diez cines en una gran área metropolitana dio el número total de
películas exhibidas la semana anterior. Calcule la moda de las películas proyectadas.
xi ni
0 1
1 2
2 4 Frecuencia mayor
3 2
4 1
total 10
Solución:
Como el número de películas que tiene mayor frecuencia es 2, entonces:
M0 = 2
3. En la siguiente tabla de distribución de frecuencias se tiene el salario mensual de 50
especialistas del sector educación. Calcular la moda del salario.
43
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
y 'i−1 − y 'i ) yi ni
2 - 4 3 3
4 - 6 5 7
6 - 8 7 12
Clase modal 8 - 10 9 17
10 - 12 11 5
12 - 14 13 4
14 - 16 15 2
50
Solución
Establecer la clase modal ubicando la posición en la frecuencia mayor
1 = ni − ni−1 = 17 − 12 = 5 2 = ni − ni +1 = 17 − 5 = 12
1 5
M 0 = yi−1 + c = 8 + 2 = 8,59
1 + 2 5 + 12
44
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
FRACTILES
CUARTIL
La mediana, como vimos separa en dos mitades el conjunto ordenado de
observaciones. Podemos aún dividir cada mitad en dos de tal manera que resulten cuatro
partes iguales. Cada una de esas divisiones se conoce como Cuartil y lo simbolizaremos
mediante la letra Q agregando un subíndice según a cuál de los cuatro cuartiles nos estemos
refiriendo.
45
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
- Se llama primer cuartil Q1 a la mediana de la mitad que contiene los datos más pequeños.
Este cuartil, corresponde al menor valor que supera – o que deja por debajo de él- a la cuarta
parte de los datos.
- Se llama segundo cuartil Q2 a la mediana.
- Se llama tercer cuartil Q3 a la mediana de la mitad formada por las observaciones más
grandes. El tercer cuartil es el menor valor que supera – o que deja por debajo de él- a las
tres cuartas partes de las observaciones.
46
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Ejemplo
1. Dada la siguiente distribución en el número de hijos de cien familias, calcular sus
cuartiles.
yi 0 1 2 3 4 5
ni 14 10 15 26 20 15 n=100
Ni 14 24 39 65 85 100
Solución:
Xn + Xn
+ 1 X 25 + X 26 2+2
1. Primer cuartil: Q1 = 4 4
= = =2
2 2 2
X2n + X 2n
+ 1 X 50 + X 51 3+3
2. Segundo cuartil: Q2 = 4 4
= = =3
2 2 2
X3n + X 3n
+ 1 X 75 + X 76 3+3
3. Tercer cuartil: Q3 = 4 4
= = =3
2 2 2
y 'i−1 − y 'i ) ni Ni
2 - 4 3 3
4 - 6 7 10
6 - 8 12 22
8 - 10 17 39
10 - 12 5 44
12 - 14 4 48
14 - 16 2 50
50
47
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Solución
jn
− Ni −1
Q j = yi' −1 + C
4
( Ni − Ni −1 )
Q2 = 8 + 2
( 25 − 22 ) = 8,35
( 39 − 22 )
DECIL
Divide al conjunto de observaciones ordenadas en diez partes iguales
Primer caso - Variable discreta y n impar
Dj = X n + 1 para j = 1, 2, …., 9
x j
10
PERCENTIL
Divide al conjunto de observaciones ordenadas en 100 partes iguales
Primer caso - Variable discreta y n impar
Pj = X n + 1 para j = 1, 2, …., 99
x j
100
48
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
MEDIA GEOMÉTRICA
Es la raíz enésima del producto de los valores de los elementos de la muestra, es
usada cuando los valores de los datos de la muestra son positivos y no son lineales, es decir
que su valor depende de varios factores a la vez.
➢ Media geométrica para datos no agrupados - Se determina de la siguiente forma
1 k
M g = x1.x2 ....xn
n o M g = antlog( log xi )
n i=1
Ejemplo
1. Las siguientes temperaturas han sido tomadas de un proceso químico: 13,4; 12,8; 11,9 y
13,6 °C. Determine la temperatura promedio de este proceso.
Solución:
2. Calcular la media de las tasas de interés de tres bonos que son 5%, 7% y 4%.
Solución:
La media geométrica es: M g = n x1.x2 ....xn = 3 (7 )(5)(4) = 5.192 %
49
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
El promedio de las tasas de cambio de la producción durante los tres últimos años es de la
media geométrica:
Donde:
P0 es el valor al inicio del periodo.
Ejemplo
El número total de mujeres que acuden a los bancos a pedir préstamo a nivel nacional
aumentó de 75500 en 2012 a 83500 en 2021. Calcular el número de mujeres que acudirán a
los bancos por un préstamo a nivel nacional que habrá en el año 2032.
Solución
Pf 835000
t=n −1 = 9 − 1 = 0, 01 1% de crecimiento anual
P0 755000
Pf = P0 ( t + 1) = 835000 ( 0, 01 + 1) = 931583, 07
n 11
50
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
MEDIA ARMÓNICA
Ejemplo:
Determine la media armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09
Solución:
5
H= =
1 / 3.1 + 1 / 2.8 + 1 / 2.84 + 1 / 3.05 + 1 / 3.09
5 5
= = = 2.9703
0.3226 + 0.3571 + 0.3521 + 0.3279 + 0.3236 1.6833
Si se compran varios tipos de productos con distintas cantidades de unidades de cada tipo,
pero gastando en ellos igual cantidad de dinero, el precio promedio por unidad es igual a la
media armónica de los precios por unidad de cada tipo de producto.
Ejemplo
1. Una familia realiza un viaje en automóvil a una ciudad y cubre los primeros 100 km a 60
km/h, los siguientes 100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular la
velocidad media.
3
MH = = 69, 041
1 1 1
+ +
60 70 80
51
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
2. Una empresa de transporte gasta S/400 en latas de aceite que cuestan S/10 la docena;
S/500 en latas que cuestan S/12,5 la docena; S/600 más en latas que cuestas S/20 la docena y
S/300 en otras que cuestan S/25 la docena. Calcule el costo promedio por docena de las latas
de aceite.
400 + 500 + 600 + 300
MH = = 14, 75
400 500 600 300
+ + +
10 12,5 20 25
MEDIDAS DE DISPERSION
52
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
mismos, hay dispersión en los datos. La magnitud de la dispersión puede ser pequeña,
cuando los valores, aunque diferentes, están próximos entre sí y si los valores están
ampliamente separados, la dispersión es mayor.
Las medidas de dispersión o variabilidad más conocidas son:
Rango o recorrido
Varianza y Desviación estándar
Coeficiente de variación
RANGO
Una manera de medir la variación en un conjunto de valores es calculando el rango.
El rango es la más sencilla y directa de las medidas de dispersión (Runyon & Haber, 1992) y
a la vez la menos confiable (Sánchez, 1992). Se trata simplemente de la distancia entre el
valor menor y el valor mayor en un conjunto de observaciones. El hecho de que sólo tome
en consideración dos valores, hace que la medida sea muy pobre. Nótese que, si hay un
valor extremo en la distribución, se tendrá la impresión de que la dispersión es grande
cuando, en realidad, si hiciéramos caso omiso de esa calificación, podríamos encontrar que
dicha distribución es, por el contrario, una distribución "compacta". El rango o recorrido
refleja únicamente las dos calificaciones extremas de la distribución (Runyon & Haber,
1992), es decir, solamente dos puntuaciones exactas de un grupo son las que los determina,
ignorando así, todas las demás puntuaciones.
El rango no puede darnos una idea precisa con respecto a la dispersión y en el mejor
de los casos, debe considerarse sólo como un índice preliminar o muy aproximado (Levin,
1977). Puede expresarse de la siguiente manera:
R = XMax - XMin
Xmax = valor máximo de los datos observados
Xmin = valor mínimo de los datos observados
53
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
desviación estándar permite una interpretación precisa de las calificaciones dentro de una
distribución (Runyon & Haber, 1992). Si todos los sujetos son iguales en una característica
(por ejemplo, índice académico), entonces el resultado será igual a cero. Por el contrario, si
aumentan las diferencias, aumentará el índice, alejándose más y más del punto cero. La
varianza se define como las desviaciones cuadradas medias respecto a la media.
VARIANZA
La varianza también está definida como el promedio de las diferencias elevadas al
cuadrado entre cada valor que se tiene en la muestra (xi) y la media aritmética X .
(x − X )
i
2
1 k 2
- Varianza para datos no agrupados: S 2 = = xi − nX 2
n −1 n − 1 i =1
k
ni ( yi − Y )2
1 k 2
ni yi − nY
i =1
- Varianza para datos agrupados: S2 = = 2
n −1 n − 1 i =1
m m
(ni − 1)Si2 + ni ( X i − X )2
- Varianza para submuestras: S2 = i =1 i =1
n −1
Ejemplo:
1. Los siguientes datos son los gastos por refrigerio de una muestra de trabajadores 14.2,
12.1, 15.6, 18.1, 14.3, determine su varianza.
Solución:
Lo primero que hay que calcular es la media aritmética de la muestra como ya se ha hecho
anteriormente.
− 14.2 + 12.1 + 15.6 + 18.1 + 14.3 74.3
x= = = 14.86mg
5 5
2 2 2
( 14.2 − 14.86 ) + ( 12.1 − 14.86 ) + .... + ( 14.3 − 14.86 )
s2 = =
5 −1
0.4356 + 7.6176 + 0.5476 + 10.4976 + 0.3136 19.412 2
s2 = = = 4.853mg
4 4
54
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
Desviación estándar
Es la desviación o diferencia promedio que existe entre cada valor de la muestra y la media
aritmética de la muestra. Y se obtiene a partir de la varianza, sacándole raíz cuadrada.
S = S2
Ejemplo
En la siguiente tabla de distribución de frecuencias. Calcular la varianza de la de la longitud
total
Solución
2 - 4 3 3 27
4 - 6 5 7 175
6 - 8 7 12 588
8 - 10 9 17 1377
10 - 12 11 5 605
12 - 14 13 4 676
14 - 16 15 2 450
50 3898
k
ni ( yi − Y )2
1 k 2
S2 = i =1
n −1
= ni yi − nY =
n − 1 i =1
2 1
( )
3898 − 8,362 = 78,12 soles 2
49
Desviación estándar
Es la desviación o diferencia promedio que existe entre cada valor de la muestra y la media
aritmética de la muestra. Y se obtiene a partir de la varianza, sacándole raíz cuadrada.
S = S2
55
Estadística Económica I Mgt. Rina M. Zamalloa Cornejo
COEFICIENTE DE VARIACIÓN
Otra medida de dispersión que se suele utilizar es el coeficiente de variación (CV).
Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación típica
muestral por la media y multiplicando el cociente por 100.
S
CV = x 100%
X
Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o
más grupos o comparar dispersiones a escalas distintas pues es una medida invariante ante
cambios de escala. Sirve para comparar variables que están a distintas escalas pero que están
correlacionadas estadísticamente y sustantivamente con un factor en común. Es decir, ambas
variables tienen una relación causal con ese factor.
Es importante que todos los valores sean positivos y su media por tanto un valor
positivo. A mayor valor de C.V. mayor heterogeneidad de los valores de la variable; y a
menor C.V., mayor homogeneidad en los valores de la variable.
56