Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Zamalloa Cornejo
INTRODUCCION
Iniciamos este capítulo con la definición de algunos conceptos elementales y
básicos, y sin embargo pilares, para una comprensión intuitiva y real de lo que es la
estadística. Pretendemos introducir al estudiante en los primeros pasos sobre el uso y
manejo de datos numéricos: distinguir y clasificar las características en estudio, enseñarle a
organizar y tabular las medidas obtenidas mediante la construcción de tablas de frecuencia
y por último los métodos para elaborar una imagen que sea capaz de mostrar gráficamente
unos resultados.
DEFINICION DE ESTADISTICA
Como establece M.G. Kendall, definir en que consiste o qué es la Estadística ha
sido una materia que ha dividido a lo largo de la historia a los propios estadísticos. Desde
Quetelet que la consideraba la reina de las ciencias hasta autores que la definen como una
técnica más, al servicio de otras ramas del conocimiento. La característica común ha sido
la multiplicidad de definiciones que se han escrito sobre estadística. W.F. Willcox, en
1935, reúne 115 definiciones y aporta una más para sustituirlas, sin lograrlo. El número de
definiciones de estadística ha seguido aumentando.
La estadística es la rama de las matemáticas que describe los fenómenos donde no
hay un componente absoluto, es decir es discreta, y sus modelos son estocásticos. La
estadística ayuda a todas las demás ciencias a generar modelos matemáticos "generales"
donde se haya considerado el componente aleatorio.
Es una disciplina de estudio relacionada con la recopilación, organización y
resumen de datos y la obtención de inferencias a partir de esos datos.
La Estadística es una disciplina científica que se dedica a la recopilación,
descripción, análisis e interpretación de datos y, por ello, constituye la metodología
científica que permite transformar datos en información. Esto la hace especialmente
atractiva, ya que en cualquier sociedad desarrollada existe una inmensa variedad de
problemas cuya solución sólo es posible mediante la utilización de técnicas estadísticas.
En una forma práctica, la estadística proporciona los métodos científicos para la
recopilación, organización, resumen, representación y análisis de datos o hechos, que se
1
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
presten a una evaluación numérica; tales como: fenómenos sociales, económicos, políticos,
culturales, etc.
Estadística descriptiva:
Describe, analiza y representa un grupo de datos utilizando métodos numéricos,
tabulares y/o gráficos que resumen y presentan la información contenida en ellos. Se puede
definir como aquel método que contiene la recolección, organización, presentación y
resumen de una serie de datos. El análisis que se realiza se limita en sí mismo a los datos
recolectados y no se puede realiza inferencia alguna o generalizaciones alguna, acerca de la
población de donde provienen esos datos estadísticos; es decir a partir de una muestra de
datos (recogida según una técnica concreta), es la descripción de las características más
importantes, entendiendo como características, aquellas cantidades que nos proporcionen
información sobre el tema de interés del cual hacemos el estudio.
Estadística inferencial:
Es aquella rama de la estadística que apoyándose en el cálculo de probabilidades y
a partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de
la estadística que hace posible la estimación de una característica de una población o la
toma de una decisión referente a una población, fundamentándose sólo en los resultados de
la muestra.
2
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Muestra:
Conjunto de elementos que forman parte de población. La muestra representa a esta
población.
También se puede definir como el subconjunto de la población a la cual se le
efectúa la medición con el fin de estudiar las propiedades del conjunto del cual es obtenida.
Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los
elementos que la conforman, la muestra debe ser representativa de la población y sus
elementos escogidos al azar para asegurar la objetividad de la investigación.
Se llama muestreo al procedimiento científico que se utiliza para la obtención de
muestras estadísticamente significativas de una población que permitirá estimar los
parámetros poblacionales con un grado de confianza fijado previamente.
Se llama muestreo al procedimiento científico que se utiliza para la obtención de
muestras estadísticamente significativas de una población que permitirá estimar los
parámetros poblacionales con un grado de confianza fijado previamente.
3
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
VARIABLE
Es la característica de la población que interesa al investigador y se está midiendo.
Existen dos categorías o tipo de variables:
4
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
o Variable discreta, aquella que entre dos valores próximos no puede tomar
ningún valor. Ejemplos: el número de hijos de una familia, el de obreros de
una fabrica, el de alumnos de la universidad, etc.
La variable se denota por las mayúsculas de letras finales del alfabeto castellano X, Y, Z.
A su vez cada una de estas variables puede tomar distintos valores y se denota por las
letras minúsculas x, y, z, etc. o colocando un subíndice en las letras minúsculas, que indica
orden.
Ejemplos.
En una fábrica se quiere realizar un estudio sobre la duración de los focos para lo cual se
procedió de la siguiente manera, se seleccionaron al azar el 5% de los focos producidos
cada día durante una semana, posteriormente se iluminaron todos y se procedió a anotar la
duración de cada uno, después se promediaron los tiempos para hallar el tiempo promedio
de vida de todo el lote.
PARÁMETRO Y ESTADÍGRAFO
Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos
de poblaciones, o de sus muestras, diferenciándose entre ellas las que se refieren a las
mismas poblaciones y a las muestras.
o PARÁMETRO – Es una medida resumen que se obtiene a base de los datos de una
población es decir que cuantifica una característica de esa población. Nos referimos
a las funciones, tales como las medias, desviaciones típicas, momentos, coeficientes
de correlación, etc. Los parámetros son cantidades, las cuales son constantes para
5
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
media poblacional
2 varianza poblacional
p proporción poblacional
X media muestral
S 2 varianza muestral
p̂ proporción muestral
6
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica y
teórica del problema.
FIJACIÓN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dónde
queremos llegar; en otras palabras, debemos fijar cuales son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y
debe, además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así
como entre los objetivos generales y los específicos.
REVISIÓN DE LA LITERATURA
Se ausculta y se dispone qué estudios e investigaciones se han realizado sobre el asunto o
problema a investigar. Pueden considerarse estudios e investigaciones relacionadas, o sea,
no necesariamente tienen que ser tan similares como la investigación que se propone.
Deben de disponerse en orden cronológico comenzando con las menos recientes y terminar
con las actuales. También hay que considerar, si hay tres preguntas de investigación,
presentar los estudios según el orden de las preguntas. Puede también presentarse los
estudios según las variables de la investigación propuesta.
8
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
METODOLOGÍA
Diseño: Mediante la presentación de un flujograma se ilustra las partes o componentes de
la investigación demostrando así mismo el procedimiento de cómo se va a llevar a cabo la
investigación.
Instrumentos: Debe describir los instrumentos o medios de cómo va a recoger los datos
para la investigación. Ya sea pruebas, cuestionarios o listas de cotejo, etc., debe de
describirlos indicando su magnitud en números de reactivos… indicar cuánto tiempo toma
en contestarse…
Los instrumentos van a estar determinados según las preguntas de investigación propuestas
en la primera parte.
Debe de procurar por la validez y la confiabilidad de los instrumentos e informarla.
Análisis estadístico: Indicar que tipo de estadísticas se va a calcular y qué análisis se va
llevar a cabo. Esto dependerá según las preguntas de investigación establecidas en la
primera parte de la propuesta.
9
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
LA RECOLECCIÓN
Una de las etapas más importantes de la investigación es la recolección de la información,
la cual ha de partir, a menos que se tenga experiencia con muestras análogas, de una o
varias muestras piloto en las cuales se pondrán a prueba los cuestionarios y se obtendrá una
aproximación de la variabilidad de la población, con el fin de calcular el tamaño exacto de
la muestra que conduzca a una estimación de los parámetros con la precisión establecida.
El establecimiento de las fuentes y cauces de información, así como la cantidad y
complejidad de las preguntas, de acuerdo con los objetivos de la investigación son
decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos
financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica, el
grado de desarrollo, la ausencia de técnica, etc. Es, entonces, descubrir dónde está la
información y cómo y a qué "costo" se puede conseguir; es determinar si la encuesta se
debe aplicar por teléfono, por correo, o si se necesitan agentes directos que recojan la
información; establecer su número óptimo y preparar su entrenamiento adecuado.
PRESENTACIÓN DE LA INFORMACION
Una vez recolectados los datos es necesario organizarlos, clasificarlos y resumirlos
adecuadamente, de manera tal que posibilite un mejor análisis de la información obtenida.
Un recurso muy útil para este fin lo constituye las medidas resumen.
Se presentan los hallazgos según el orden que fueron formuladas las preguntas, las
hipótesis, objetivos de la investigación. Se presentan los datos estadísticos, por medio de
10
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
tablas y/o gráficas en la forma más objetiva posible o medidas cuantitativas resumen. No
debe hacerse ningún juicio o comentario. Sólo se presentan los datos y hechos con sus
estadísticas correspondientes.
Una información estadística adquiere más claridad cuando se presenta en la forma
adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado
con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un
informe con tablas y gráficos redundantes que, antes que claridad, crean confusión.
Además, la elección de determinada tabla o gráfico para mostrar los resultados, debe
hacerse no sólo en función de las variables que relaciona, sino del lector a quien va
dirigido el informe
PUBLICACIÓN
Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos
del mismo problema a quienes se les puede aportar información, conocimientos y otros
puntos de vista acerca de él.
11
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
La encuesta. - Se diferencia del censo en que la encuesta se aplica solo a una muestra de la
población u objeto de estudio.
12
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Título: Debe ser completo, claro y conciso, es decir, debe reflejar claramente en qué
consiste el contenido y con qué criterios se clasificaron los elementos a que se hace
referencia, ubicándolo además en tiempo y lugar. Para ser completo, el título debe
responder a las preguntas qué, cómo, dónde y cuándo.
Cuadro o cuerpo de la tabla: Esta constituido por un grupo de casillas o celdas formadas
por el entrecruzamiento de filas y columnas. La primera fila se reserva para indicar a qué
se refieren los datos subyacentes y que unidad de medida se utilizó. En la primera columna
se reflejan las diferentes clases según la escala de clasificación empleada.
13
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Las tablas estadísticas suelen clasificarse según el número de variables que representan en:
Deben ser autoexplicativas, o sea, que se expliquen por sí mismas, por lo que se debe
evitar presentar demasiada información en ellas en aras de ganar claridad. En general,
como forma de presentación se utilizan cuadros uni y bidimensionales, reservándose el uso
de los multidimensionales para fines de trabajo.
14
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
TABLA SIMPLE
Tabla Nº 1
Viviendas a construirse según material predominante en la construcción, 1989-2010 Perú.
Frecuencia Porcentaje
Ladrillo 987 25,9
Adobe 2014 52,9
Quincha 363 9,5
Madera 445 11,7
Total 3809 100,0
Fuente: INEI
TABLA COMPUESTA
Tabla Nº 2
Viviendas a construirse según material predominante en la construcción y sexo del jefe de
hogar, 1989-2010
Sexo
Masculino Femenino Total
N° % N° % N° %
Material predominante Ladrillo 455 532 987 100
en la construcción Adobe 1010 1004 2014 100
Quincha 250 113 363
Madera 125 320 445
Total 1840 1969 3809 100,0%
Fuente: INEI
455
100 = 11,95%
3809
455
100 = 24, 72%
1840
455
100 = 46,10%
987
15
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
GRÁFICO
La forma gráfica constituye un complemento importante para la presentación de los
resultados ya que permite incrementar la información científica que se trata de transmitir.
Son representaciones visuales que emplean símbolos, barras, polígonos y sectores, de los
datos contenidos en tablas o cuadros. La utilidad de los gráficos es doble, ya que pueden
servir no sólo como sustituto a las tablas o cuadros, sino que también constituyen por sí
mismos una poderosa herramienta para el análisis de los datos, siendo en ocasiones el
medio más efectivo y fácil no sólo para describir y resumir la información, sino también
para analizarla
El gráfico, al igual que las tablas, debe ser auto explicativo, sencillo y de fácil
comprensión.
Las partes del gráfico son:
• Número de orden.
• Título
• Cuerpo o gráfico propiamente dicho
• Leyenda
El número de orden y el título deben cumplir los mismos requisitos señalados
anteriormente para la tabla o cuadro estadístico.
El cuerpo o gráfico propiamente dicho, varía en su configuración en dependencia
del tipo de dato que se representa, pero siempre debe indicar claramente las coordenadas,
las escalas y las unidades de medida, reservando el eje de las abscisas (eje X) para la
variable y el eje de las ordenadas (eje Y) para las frecuencias.
La leyenda permite identificar claramente los diferentes elementos del cuerpo del
gráfico.
Existen varios tipos de gráficos, o representaciones gráficas, utilizándose cada uno
de ellos de acuerdo al tipo de información que se está usando y los objetivos que se
persiguen al presentar la información, mencionaremos algunas consideraciones que
conviene tomar en cuenta al momento de realizar cualquier gráfica a fin de que la
información sea transmitida de la manera más eficaz posible y sin distorsiones:
El eje que represente a las frecuencias de las observaciones (comúnmente el vertical
o de las ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones
erróneas al comparar la altura, longitud o posición de las columnas, barras o líneas que
representan las frecuencias.
16
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
GRÁFICO DE BARRAS
Un gráfico de barras, también conocido como gráfico de columnas, es un diagrama con
barras rectangulares de longitudes proporcional al de los valores que representan. Los
gráficos de barras son usados para comparar dos o más valores. Existen dos principales
clases de gráficos de barras:
➢ Barra simple: se emplean para graficar hechos únicos
➢ Barras compuestas: es muy recomendable para comprar una serie estadística con
otra, para ello emplea barras simples se distinto color o tramado en un mismo plano
cartesiano, una al lado de la otra
Fuente: INEI
Fuente: INEI
GRÁFICO DE LINEAS
Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe
cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional,
la evolución del peso o estatura de una persona a través del tiempo, el desempeño
académico de un estudiante a lo largo de su instrucción escolar, las variaciones presentadas
en la medición realizada en algún experimento cada segundo o minuto) se pueden utilizar
las gráficas de líneas, que consisten en una serie de puntos trazados en las intersecciones de
las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas:
Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos
individuos a lo largo de cinco observaciones anuales.
18
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
GRÁFICOS DE SECTORES
Cuando los datos representan partes de un total y se desea ver la importancia de
cada parte en relación a las otras o al total, se utiliza este tipo de diagrama.
El gráfico de sectores, gráfico circular, o, como es tradicionalmente llamado gráfico
de pastel es un diagrama circular donde los valores de cada categoría estadística
representada son proporcionales a las respectivas medidas de los ángulos (1% en el gráfico
de sector equivale a 3,6º). Es decir, es el resultado de dividir un círculo en sectores
circulares de ángulos proporcionales a las frecuencias absolutas (Nº) de cada valor de la
variable. Para calcular los grados de cada sector se divide la frecuencia entre el número de
datos y se multiplica por 360.
Gráfico Nº 3
Viviendas a construirse según material predominante en la construcción, 1989-2010
Fuente: INEI
19
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
DISTRIBUCIÓN DE FRECUENCIAS
INTRODUCCIÓN
Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma
de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente
DEFINICIONES
Uno de los primeros pasos que se realiza en cualquier estudio estadístico es la
tabulación de resultados, es decir, recoger la información de la muestra resumida en una
tabla en la que a cada valor de la variable se le asocian determinados números que
representan el número de veces que ha aparecido, su proporción con respecto a otros
valores de la variable, etc. Estos números se denominan frecuencias.
20
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
siguientes conceptos:
n
i =1
i = n1 + n2 + ..........+ nk = n
n
i =1
i = n ; 0 ni n i = 1, 2, ......., k
Nk = n
21
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
i
H i = h j = h1 + h2 + .......... + h j
j =1
Ni
Hi = ; Hk = 1
n
yi ni Ni hi Hi
y1 n1 N1 = n1 n1 N1
h1 = H1 = h1 =
n n
y2 n2 N2 = n1 + n2 n2 N2
h2 = H 2 = h1 + h2 =
n n
yk nk Nk = n nk Nk
hk = Hk = 1 =
n n
n 1
Ejemplo 1
Se quiere saber el número de viviendas construidas en 50 comunidades con el programa
Techo Propio. Se obtienen los siguientes datos:
0 2 1 2 2 0 1 2 1 3 2 3 2
2 2 1 2 4 2 0 3 3 3 0 2 1
4 3 1 3 2 3 3 3 4 2 2 4 2
22
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
3 3 2 3 3 2 2 4 2 2 3
Elaborar una tabla de distribución de frecuencias.
Solución
yi ni Ni hi Hi
0 4 4 0,08 0,08
1 6 10 0,12 0,20
2 20 30 0,40 0,60
3 15 45 0,30 0,90
4 5 50 0,10 1
y 'i−1 − y 'i ) y sus puntos medios yi marcas de clase (valor que nos representa la información
23
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
y 'i−1 − y 'i ) yi ni Ni hi Hi
1 y '0 − y '1 ) y1 =
y0 + y1 n1 N1 h1 H1
2
2 y '1 − y '2 ) y2 =
y1 + y2 n2 N2 h2 H2
2
k y 'k −1 − y 'k ) yk =
yk −1 + yk nk Nk hk Hk
2
MAS DEFINICIONES
➢ RANGO (R): Es el intervalo en que se distribuyen los datos y se determina
restándole el mayor valor observado el menor valor observado:
R = XMax - XMin
24
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
➢ AMPLITUD DE CLASE: Para una distribución de frecuencias que tiene clases del
mismo tamaño, la amplitud de clase se obtiene restando el límite inferior de una
clase del límite superior de la misma clase: Ci = y 'i − y 'i−1
➢ MARCA DE CLASE (punto medio): punto que divide a la clase en dos partes
iguales. Es el promedio entre los límites superior e inferior de la clase.
y 'i −1 + y 'i
yi =
2
La marca de clase no es más que una forma abreviada de representar un intervalo
mediante uno de sus puntos. Por ello hemos tomado como representante, el punto
medio del mismo. Esto está plenamente justificado, si recordamos que cuando se
mide una variable continua como el peso, la cantidad con cierto número de
decimales que expresa esta medición, no es el valor exacto de la variable, sino una
medida que contiene cierto margen de error, y por tanto representa a todo un
intervalo del cual ella es el centro.
1.- No existe ninguna ley que defina cómo obtener el número de intervalos de clase, pero la
experiencia recomienda que no sea menor que 5 ni mayor que 20. Por lo tanto, la amplitud
25
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Ejemplo 2
1. En el siguiente conjunto de datos, se proporcionan la cantidad de cemento que se
utilizó (en kg.) para 50 diferentes mezclas en un cierto intervalo de tiempo en una obra de
construcción: 3, 8, 4, 14, 8, 6, 7, 9,13, 8, 10, 9, 7, 11, 10, 8, 5, 9, 6, 2, 13, 6, 3, 7, 6, 9, 12,
4, 7, 12, 8, 8, 9, 15, 8, 9, 10, 8, 5, 8, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
Construir una distribución de frecuencias de estos pesos.
Solución
R = XMax - XMin = 15 - 2 = 13
y 'i−1 − y 'i ) yi ni Ni hi Hi
2 - 4 3 3 3 0,06 0,06
4 - 6 5 7 10 0,14 0,20
6 - 8 7 12 22 0,24 0,44
8 - 10 9 17 39 0,34 0,78
10 - 12 11 5 44 0,10 0,88
12 - 14 13 4 48 0,08 0,96
14 - 16 15 2 50 0,04 1
26
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
50 1 R 13
C= = = 1,857 2
k 7
GRÁFICOS
1. HISTOGRAMA
El histograma es la representación gráfica en el plano coordenado de las características
concentradas en la tabla de la distribución de una variable cuantitativa continua, que
representa frecuencias mediante el volumen de las áreas. Un histograma consiste en un
conjunto de rectángulos con:
(a) En el eje de las abscisas (horizontal) se representan las clases con centros en las marcas
de clase y longitudes iguales a los tamaños de los intervalos de clase.
(b) En el eje de las ordenadas (vertical) representamos las frecuencias absolutas o relativas.
En el caso de un histograma para intervalos desiguales sólo se señalizan los valores sobre
el eje horizontal, el eje vertical no tiene sentido porque las frecuencias corresponden al
área de cada rectángulo.
27
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
28
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Histograma 4 parece faltarle una parte y por ello se le llama censurado o sesgado (en
este caso, a la izquierda). No representa una variabilidad natural y por tanto hay que
sospechar que se han eliminado algunos valores. Igual ocurre con las curvas de frecuencias
poco asimétricas o sesgadas a la izquierda o de asimetría negativa.
2. POLÍGONOS DE FRECUENCIA
El polígono de frecuencias es una representación gráfica de la distribución de
frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo
mediante segmentos los centros de las bases superiores de los rectángulos del histograma
(es decir, los puntos de las marcas de clase).
29
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
primera fase descriptiva de los datos, ésta tiene por objeto sintetizar la información
mediante el cálculo de medidas estadísticas o medidas resumen que hacen referencia al
análisis de una sola variable (análisis unidimensional).
Aunque se organicen los datos en una forma útil y significativa es preciso disponer
de los datos de forma tal que puedan presentarse proposiciones cuantitativas (Haber y
Runyon, 1992). Una forma útil de describir a un grupo en su totalidad es encontrar un
número que lo represente (Levin, 1979). Se ha observado que una de las características
que se presenta en múltiples distribuciones de frecuencias es que los datos se acumulan
alrededor de un valor central situado entre los dos extremos de la variable que se estudia
(Haber y Runyon, 1992). En la investigación social, ese valor se conoce como una medida
de tendencia central, ya que está generalmente localizada hacia el medio o centro de una
distribución en la que la mayoría de los puntajes tienden a concentrarse (Levin, 1979). La
tendencia central es un índice de localización central empleado en la descripción de las
distribuciones de frecuencias. La capacidad de localizar un punto de tendencia central
puede ser muy útil para el investigador. Por ejemplo, podrá reducir una masa de datos a un
simple valor cuantitativo que llegará a ser comprendido y comunicado a otros especialistas.
Puesto que el centro de una distribución puede ser definido de diferentes maneras,
habrá también diferentes medidas de tendencia central. Las medidas de tendencia central
comúnmente empleadas son:
Media aritmética
Mediana
Moda
Cuartil
MEDIA ARITMÉTICA
MEDIA ARITMÉTICA O PROMEDIO
La media aritmética o promedio es la medida de tendencia central comúnmente
utilizada. Es el centro de gravedad, el punto alrededor del cual los valores se aglutinan.
Usted probablemente estará íntimamente familiarizado con la media, porque siempre que
obtiene un "promedio" de calificaciones (notas) donde suman los valores de las notas y se
divide por el número total de notas se calcula la media aritmética.
31
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
x i
x1 + x2 + ....... + xn
X = i =1
=
n n
Ejemplo
Una muestra de cinco ejecutivos recibió la siguiente cantidad en bonos el año pasado:
$14000, $15000, $17000, $16000 y $15000. Encuentre el promedio en bonos para los
cinco ejecutivos.
Solución
Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es:
n
x i
X = i =1
= (14000 + 15000 + 17000 + 16000 + 15000) / 5 = $15400.
n
➢ Media para datos agrupados - Si los datos vienen agrupados en una tabla de
frecuencias, la expresión de la media es:
k
n y i i
n1 y1 + n2 y2 + ....... + nk yk
Y = i =1
=
n n
Ejemplo
En la tabla se tiene el número viviendas construidas en 50 comunidades con el programa
Techo Propio:
yi ni Ni hi Hi ni yi
0 4 4 0,08 0,08 4
1 6 10 0,12 0,20 6
2 20 30 0,40 0,60 40
3 15 45 0,30 0,90 45
4 5 50 0,10 1 20
32
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
111
Calcular el número medio de viviendas construidas.
n
ni yi 111
i =1
Y= = = 2, 22
n 50
y 'i−1 − y 'i ) yi ni yi ni
2 - 4 3 3 9
4 - 6 5 7 35
6 - 8 7 12 84
8 - 10 9 17 153
10 - 12 11 5 55
12 - 14 13 4 52
14 - 16 15 2 30
50 418
Solución:
n
ni yi
418
i =1
Y = = = 8,36
n 50
33
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
6. M c = c
7. M cX = c M X
8. M aX b = a M X b
10. La media aritmética de los valores de una variable no varía si todas las frecuencias de
su distribución se multiplican o dividen por un mismo número
MEDIANA
La mediana, a diferencia de la media no busca el valor central del recorrido de la
variable según la cantidad de observaciones, sino que busca determinar el valor que tiene
aquella observación que divide la cantidad de observaciones en dos mitades iguales. Por lo
tanto es necesario atender a la ordenación de los datos, y debido a ello, este cálculo
depende de la posición relativa de los valores obtenidos. Es necesario, antes que nada,
ordenar los datos de menor a mayor (o viceversa).
Ejemplo
Calcule la mediana para la edad de una muestra de cinco estudiantes: 21, 25, 19, 20 y 22.
Solución:
Al ordenar los datos de manera ascendente y es n impar quedan:
19, 20, 21, 22, 25
entonces la mediana es 21.
M e = X n +1 = X 3 = 21
2
n+1 5 +1
= = 3
2 2
34
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Ejemplo
1.- Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés
de lavadora; se toman como muestra ocho circuitos y sus mediciones son: 11,3; 11,2; 11,5;
11,2; 11,2; 11,4; 11,5; 11,4 cm.
Solución:
Ordenando los datos de mayor a menor valor: 11,1; 11,2; 11,2; 11,2; 11,3; 11,4; 11,4; 11,5
cm. Se observa que en la parte central de los datos no hay dato alguno por lo que la
mediana se determina con el promedio de los datos subrayados, entonces:
Xn + Xn
+1
Me = 2 2
2
n 8 n 8
= =4 +1 = +1 = 5
2 2 2 2
X4 + X5
Me =
2
11, 2 + 11,3
Me = = 11, 25 cm
2
yi ni Ni hi Hi
0 4 4 0,08 0,08
1 6 10 0,12 0,20
2 20 30 0,40 0,60
3 15 45 0,30 0,90
35
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
4 5 50 0,10 1
Solución:
Xn + Xn
+1
Como n es par: M e = 2 2
2
- Primero se debe calcular las posiciones:
n 50 n 50
= = 25 y +1 = + 1 = 26
2 2 2 2
Luego ubicar estas posiciones en las frecuencias absolutas acumuladas de la tabla de
distribución de frecuencias y reemplazar en la fórmula:
X 25 + X 26 2 + 2
Me = = = 2
2 2
Nota: Es imprescindible para calcular el valor de la mediana el que primero se ordenen los
datos en cuanto a su magnitud, ya que, de no hacerlo, se incurriría en un grave error.
Ejemplo:
En la siguiente tabla de distribución de frecuencias, se proporcionan la cantidad de
cemento que se utilizó (en kg.) para 50 diferentes mezclas en una obra de construcción en
un cierto intervalo de tiempo:
36
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
y 'i−1 − y 'i ) yi ni Ni
2 - 4 3 3 3
4 - 6 5 7 10
6 - 8 7 12 22
8 - 10 9 17 39
10 - 12 11 5 44
12 - 14 13 4 48
14 - 16 15 2 50
50
PROPIEDADES DE LA MEDIANA
1. La mediana es única para cada conjunto de datos.
2. No se ve afectada por valores muy grandes o muy pequeños, y por lo tanto es una
medida valiosa de tendencia central cuando ocurren.
3. Puede obtenerse para datos de nivel de razón, de intervalo y ordinal. Puede calcularse
para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se
encuentra en una de estas clases.
MODA
La moda se define como aquel valor o valores que más se repiten o que tienen
mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una
población nos genera la distribución de los datos una vez que estos se han graficado y en
esta gráfica es posible observar la moda o modas de la misma, es por esto que una
distribución de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda),
bimodal (tiene dos modas) o polimodal (tiene más de dos modas).
37
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Ejemplo
1. Las calificaciones de un examen de diez estudiantes son:
81, 93, 84, 75, 68, 87, 81, 75, 81, 87.
Solución
Como la calificación 81 es la que más ocurre, la calificación modal es 81, M 0 = 81
yi ni Ni hi Hi
0 4 4 0,08 0,08
1 6 10 0,12 0,20
2 20 30 0,40 0,60
3 15 45 0,30 0,90
4 5 50 0,10 1
Calcule la moda de las viviendas construidas
Solución:
Como el número de viviendas construidas que tiene mayor frecuencia es 2, entonces:
M0 = 2
38
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
y 'i−1 − y 'i ) ni
2 - 4 3
4 - 6 7
6 - 8 12
8 - 10 17
10 - 12 5
12 - 14 4
14 - 16 2
50
1 = ni − ni−1 = 17 − 12 = 5 2 = ni − ni +1 = 17 − 5 = 12
1 5
M 0 = y 'i −1 + c = 8 + 2 = 8,59
1 + 2 5 + 12
Las distribuciones pueden describirse según la forma que asume su gráfica. Cuando
se construye el polígono de frecuencias la gráfica tiene una forma que puede ser simétrica
o asimétrica.
40
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
MEDIDAS DE DISPERSION
Una de las funciones de la estadística se relaciona con el cálculo de la variabilidad.
Conocer las medidas de dispersión (variación) es de suma importancia, ya que la no
consideración de diferencias puede conducir a errores de juicio en la toma de decisiones
(Sánchez, 1992). Una medida particular de tendencia central da lugar a un valor que, en
cierto sentido, "representa" a todos los valores que toma la variable estadística en estudio
(Glass & Stanley, 1974). Sin embargo, cuando se usa cualquier medida de tendencia
central, ésta nos da sólo un cuadro incompleto de un conjunto de datos y, por consiguiente,
podría conducir a conclusiones erróneas o distorsionadas (Levin, 1979), porque este
proceso pasa por alto las diferencias entre las puntuaciones en sí (Glass & Stanley, 1974).
Sería incorrecto concluir que dos conjuntos de datos son iguales sólo porque tienen las
mismas medidas de tendencia central, es decir, que el valor de la media aritmética sea el
mismo para ambos conjuntos, cuando la distancia de los datos de ambos conjuntos se
distribuye de una forma diferente (Elorza, 1987).
Para describir una distribución en forma más completa o para interpretar con más
detalle una calificación, necesitamos información adicional acerca de la dispersión de las
calificaciones con respecto a nuestra medida de tendencia central (Haber & Runyon,
1992). Es necesario un índice de cómo están diseminados los valores alrededor del centro
de la distribución. A tales distancias se les suele denominar medidas de dispersión o
variación.
Las medidas de dispersión, también conocidas como medidas de variación o
variabilidad, indican el grado en que los sujetos se dispersan respecto al centro de la
distribución. A través de las mismas el investigador verifica cuán homogéneos, parecidos
o estables son los elementos bajo estudio, en contraste con otros grupos de interés
(Sánchez, 1992). Si todos los valores son los mismos, no existe dispersión; si no todos son
los mismos, hay dispersión en los datos. La magnitud de la dispersión puede ser pequeña,
cuando los valores, aunque diferentes, están próximos entre sí y si los valores están
ampliamente separados, la dispersión es mayor.
41
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
Coeficiente de variación
RANGO
Una manera de medir la variación en un conjunto de valores es calculando el
rango. El rango es la más sencilla y directa de las medidas de dispersión (Runyon &
Haber, 1992) y a la vez la menos confiable (Sánchez, 1992). Se trata simplemente de la
distancia entre el valor menor y el valor mayor en un conjunto de observaciones. El hecho
de que sólo tome en consideración dos valores, hace que la medida sea muy pobre.
Nótese que si hay un valor extremo en la distribución, se tendrá la impresión de que la
dispersión es grande cuando, en realidad, si hiciéramos caso omiso de esa calificación,
podríamos encontrar que dicha distribución es, por el contrario, una distribución
"compacta". El rango o recorrido refleja únicamente las dos calificaciones extremas de la
distribución (Runyon & Haber, 1992), es decir, solamente dos puntuaciones exactas de un
grupo son las que los determina, ignorando así, todas las demás puntuaciones.
El rango no puede darnos una idea precisa con respecto a la dispersión y en el
mejor de los casos, debe considerarse sólo como un índice preliminar o muy aproximado
(Levin, 1977). Puede expresarse de la siguiente manera:
R = XMax - XMin
42
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
punto cero. La varianza se define como las desviaciones cuadradas medias respecto a la
media.
VARIANZA
La varianza también está definida como el promedio de las diferencias elevadas al
cuadrado entre cada valor que se tiene en la muestra (xi) y la media aritmética X .
(x − X )
i
2
1 k 2
- Varianza para datos no agrupados: S 2 = = xi − nX 2
n −1 n − 1 i =1
k
ni ( yi − Y )2
1 k 2
ni yi − nY
i =1
- Varianza para datos agrupados: S2 = = 2
n −1 n − 1 i =1
m m
(n − 1)S + n ( X
i i
2
i i − X )2
- Varianza para submuestras: S2 = i =1 i =1
n −1
Ejemplo:
1. En la siguiente tabla de distribución de frecuencias, se proporcionan la cantidad de
cemento que se utilizó (en kg.) para 50 diferentes mezclas en un cierto intervalo de tiempo
en una obra de construcción:
Calcular la varianza de la cantidad de cemento utilizado
Solución
2 - 4 3 3 27
4 - 6 5 7 175
6 - 8 7 12 588
8 - 10 9 17 1377
10 - 12 11 5 605
12 - 14 13 4 676
14 - 16 15 2 450
50 3898
43
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
k
ni ( yi − Y )2
1 k 2
S =
2 i =1
n −1
= ni yi − nY =
n − 1 i =1
2 1
( )
3898 − (50)8,362 = 8, 2352 kg 2
49
Desviación estándar
Es la desviación o diferencia promedio que existe entre cada valor de la muestra y la media
aritmética de la muestra. Y se obtiene a partir de la varianza, sacándole raíz cuadrada.
S = S2
Ejemplo
1. En la tabla se tiene el número viviendas construidas en 50 comunidades con el programa
Techo Propio:
yi ni Ni hi Hi
0 4 4 0,08 0,08
1 6 10 0,12 0,20
2 20 30 0,40 0,60
3 15 45 0,30 0,90
4 5 50 0,10 1
44
Matemática Avanzada para Ingenieros Mgt. Rina M. Zamalloa Cornejo
2. S = S 2 = 8, 2352 = 2,8697 kg
COEFICIENTE DE VARIACION
Otra medida de dispersión que se suele utilizar es el coeficiente de variación (CV).
Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación
típica muestral por la media y multiplicando el cociente por 100.
S
CV = x 100%
X
Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos
o más grupos o comparar dispersiones a escalas distintas pues es una medida invariante
ante cambios de escala. Sirve para comparar variables que están a distintas escalas pero
que están correlacionadas estadísticamente y sustantivamente con un factor en común. Es
decir, ambas variables tienen una relación causal con ese factor.
Es importante que todos los valores sean positivos y su media por tanto un valor
positivo. A mayor valor de C.V. mayor heterogeneidad de los valores de la variable; y a
menor C.V., mayor homogeneidad en los valores de la variable
S 2,8697
CV = = = 0,3432 34,32% de la cantidad de cemento empleado
X 8,36
45