Está en la página 1de 110

Universidad de Cundinamarca

Facultad de Ingeniería

Programa Ingeniería Industrial – Sede Soacha

Módulo de Estadística Descriptiva

PRESENTACION

La estadística en el enfoque metodológico de estudio, presenta tres momentos


fundamentales en el grado de avance, a saber: la parte descriptiva, la teoría y
aplicaciones de la probabilidad, y finalmente la inferencia estadística, en la
cual, a partir del análisis de una muestra, se infieren o concluyen
características generales para toda la población.

El módulo de estadística ha sido denominado Descriptiva y Probabilidades,


Distribuciones de Frecuencia e Inferencia estadística en concordancia con el
contenido para el programa profesional de ingenierías . La asignatura se ubica
dentro del esquema conceptual por áreas en el plan de estudios de la
Universidad de Cundinamarca en la línea de Ingeniería

Con este módulo se pretende dar elementos y herramientas conceptuales,


metodológicos y prácticos al futuro ingeniero, de tal manera que le sirvan de
base para la prospección de situaciones de la vida cotidiana y en el ejercicio
profesional, para la toma de decisiones adecuadas, en los supuestos de
desarrollar su actividad en la investigación y desarrollo, la gestión
tecnoadministrativa, financiera y/o de la labor en líneas de producción.

En concordancia con lo anterior, el presente módulo presenta un enfoque


globalizador, una metodología relativamente clara y una serie de
consideraciones de tipo práctico aplicadas a situaciones y casos específicos de
la vida empresarial y cotidiana.

El grado de tratamiento de cada una de las unidades y lecciones, ponen a


disposición y posibilitan una formación tecnocientífica del ingeniero para su
futuro ejercicio profesional.

INTRODUCCION

El presente módulo de estadística para Ingenieros presenta de una manera


sencilla y a través de ejemplos prácticos la forma de analizar y describir el
comportamiento de un grupo de datos.

Los temas aquí incluidos son de gran interés en el campo de la Ingeniería por
cuanto son de múltiple aplicación en el desarrollo de la carrera, los cuales son
presentados mediante una breve explicación del tema, desarrollados a través
de ejemplos y complementados con ejercicios prácticos.

1
Será función del estudiante profundizar, mediante la consulta de la bibliografía
aquí presentada o en la que tenga a su disposición, el contenido de los mismos
hasta lograr sus propios objetivos; para lo cual siempre tendrá el apoyo y
dirección del tutor además que podrá contar con el apoyo y experiencia de sus
compañeros virtuales.

En la Estadística Descriptiva y Probabilidades, se han desarrollado en primer


lugar, los aspectos referidos a la gestación, planeación y ejecución de
investigación y desarrollo empresarial, la descripción y manejo de la
información, las medidas de tendencia central, las medidas de dispersión y/o
variabilidad y una introducción a la teoría y aplicación de las probabilidades.

En esa primera parte, se ha enfatizado en la descripción de situaciones e


información de poblaciones y/o muestras sin prever ningún tipo de compromiso
hacia la inferencia o conclusión de los resultados logrados en el segundo caso,
más allá de los colectivos descritos.

En la práctica, debido a que generalmente los recursos tanto económicos como


de infraestructura y talento humano son relativamente limitados, es muy
dispendioso estudiar a todos y cada uno de los elementos de una población. En
este caso, se trabaja con una muestra o subconjunto de esa población y los
resultados se generalizan y aplican para toda la población.

Los resultados obtenidos en el trabajo de campo, del análisis de una muestra,


nos permite a concluir si la población en estudio posee o no una cierta
propiedad ó característica. La prueba de hipótesis nos da los elementos
fundamentales para establecer cuando es razonable o no aceptar alguna
conclusión. En esto se basa el proceso de toma de decisiones.

En el presente módulo se dan precisamente, las herramientas que sirven de


base para la toma de decisiones en los campos de competencia del ingeniero.

JUSTIFICACION:

Una característica esencial de muchos de los fenómenos reales es su


variabilidad por causas desconocidas lo cual hace que sean representados por
estructuras matemáticas y/o estadísticas llamadas modelos o distribuciones de
probabilidad. Estas distribuciones refleja no solo el comportamiento de las
características de los fenómenos reales a estudiar sino que son pilares
fundamentales para la estimación de los parámetros poblacionales. Es
justificable, entonces, el hecho de que el estudiante conozca todas las
herramientas fundamentales para dicha estimación como son: La estadística
descriptiva y la teoría de la probabilidad

La infinidad de fenómenos reales a los que se enfrentan los ingenieros, en


general, son aleatorios, por lo tanto, el programa de estadística pretende que el
estudiante conozca la mayoría de herramientas básicas que le permitan
desarrollar adecuadamente las etapas de la investigación estadística, a
implementarlas y a analizarlas

2
Con lo anterior es de esperar que el futuro ingeniero este en condiciones de
generar, transformar y estimar información para la toma de decisiones.

DESCRIPCIÓN DEL MÓDULO

Para el estudio del presente módulo se han agrupado los temas que lo
componen en dos partes la primera corresponde a la estadística descriptiva en
la cual se estudiarán y analizaran temas como la definición y clasificación de
variables, gráficos y distribuciones de frecuencia, medidas de tendencia central
y medidas de dispersión. La segunda parte corresponde al estudio de las
probabilidades, en la cual se abordarán temas como espacios y eventos
muestrales, concepto e interpretación de la probabilidad de un evento,
probabilidad dependiente e independiente, esperanza matemática, variables
aleatorias adicionalmente, Distribuciones de probabilidad, metodologías y
distribuciones de muestreo, estimación de parámetros y prueba de hipótesis.

En el estudio de los temas entes anotados omitiremos la parte de la deducción


matemática de las formulas utilizadas, por cuanto tales deducciones se salen
de los objetivos del módulo y corresponden más al interés de los matemáticos.

Cada uno de los temas aquí tratados fueron divididos en lecciones para que
mediante una breve explicación del tema y la presentación de algunos
ejercicios resueltos el estudiante pueda desarrollar los ejercicios propuestos,
apoyados el las lecturas complementarias. Cada lección y la correspondiente
unidad finaliza con una evaluación o retroalimentación del tema o temas
tratados.

IMPORTANCIA

En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo,


hasta el punto de incursionar en la totalidad de las ciencias; inclusive, en la
lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un
escrito o los caracteres más relevantes de un idioma.

La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad
se entiende mejor si tenemos en cuenta que los quehaceres y decisiones
diarias embargan cierto grado de incertidumbre... y la Estadística ayuda en la
incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un
determinado grado de confianza.

Los críticos de la estadística afirman que a través de ella es posible probar


cualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia
en este campo y de lo polifacético de los métodos estadísticos. Sin embargo
muchos "investigadores" tendenciosos han cometido abusos con la estadística,
elaborando "investigaciones" de intención, teniendo previamente los resultados
que les interesan mostrar a personas ingenuas y desconocedoras de los
hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando
modelos inapropiados o razonamientos ilógicos y erróneos que conducenl
rotundo fracaso de sus investigaciones. Lincoln N L.Chao, hace referencia a

3
uno de los más estruendosos fracasos, debido a los abusos en la toma de una
muestra:

Se trata del error cometido por la Literary Digest que, en sus pronósticos para
las elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D.
Roosvelt obtendría 161 votos electorales y Alfred Landon, 370. La realidad
mostró a Roosvelt con 523 votos y a Landon con 8 solamente. El error se debió
a que la muestra fue tomada telefónicamente a partir de la lista de suscriptores
de la Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y
suscripciones a revistas no configuraban una muestra representativa de los
votantes de EE.UU. y, por ende, no podía hacerse un pronóstico confiable con
tan sesgada información.

OBJETIVO

Proporcionar un método sencillo y práctico de aquellos modelos y métodos


estadísticos y probabilísticas con los que más probablemente los estudiantes
de ingeniería se encontrarán en su carrera.

HISTORIA

Desde los comienzos de la civilización han existido formas sencillas de


estadísticas, pues ya se utilizaban representaciones gráficas y otros símbolos
en pieles, rocas, palos de madera y paredes de cuevas para contar el número
de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los babilonios
usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la
producción agrícola y de los géneros vendidos o cambiados mediante trueque.
Los egipcios analizaban los datos de la población y la renta del país mucho
antes de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de
Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El
primero contiene dos censos de la población de Israel y el segundo describe el
bienestar material de las diversas tribus judías.

En China existían registros numéricos similares con anterioridad al año 2000


a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia
el año 594 a.C. para cobrar impuestos. El Imperio romano fue el primer
gobierno que recopiló una gran cantidad de datos sobre la población, superficie
y renta de todos los territorios bajo su control. Durante la edad media sólo se
realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino
el Breve y Carlomagno ordenaron hacer estudios minuciosos de las
propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de
la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra

4
encargó un censo. La información obtenida con este censo, llevado a cabo en
1086, se recoge en el Domesday Book. El registro de nacimientos y
defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662
apareció el primer estudio estadístico notable de población, titulado
Observations on the London Bills of Mortality (Comentarios sobre las partidas
de defunción en Londres).

Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en


Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund
Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la
generalización del método científico para estudiar todos los fenómenos de las
ciencias naturales y sociales, los investigadores aceptaron la necesidad de
reducir la información a valores numéricos para evitar la ambigüedad de las
descripciones verbales.

En nuestros días, la estadística se ha convertido en un método efectivo para


describir con exactitud los valores de los datos económicos, políticos, sociales,
psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y
analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en
reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa
información. El desarrollo de la teoría de la probabilidad ha aumentado el
alcance de las aplicaciones de la estadística.

Muchos conjuntos de datos se pueden aproximar, con gran exactitud,


utilizando determinadas distribuciones probabilísticas; los resultados de éstas
se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para
comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y
la cantidad de datos necesarios en un determinado estudio estadístico.

OBJETIVO

Dar una visión de la importancia de la estadística y sus métodos de aplicación,


como una herramienta fundamental en el proceso de investigación y desarrollo
empresarial a partir de su contexto histórico y los conceptos más básicos
utilizados hoy día.

ESTADÍSTICA

Rama de las matemáticas que se ocupa de reunir, organizar y analizar datos


numéricos y que ayuda a resolver problemas como el diseño de experimentos y
la toma de decisiones.

5
Clasificación de la Estadística

De la anterior definición se desprende que la labor estadística se divide en dos


partes:

Estadística Descriptiva

La cuál como su nombre lo indica tiene como finalidad realizar un diagnostico


de la situación actual del problema (fenómeno) bajo estudio o investigación.

Estadística Inductiva o Inferencial

Cómo se desprende de la definición, es aquella que tiene por objeto hacer


válidas las conclusiones obtenidas en un conjunto que se supone representa
bien a la población (muestra) a todos lo elementos de la población objeto de
estudio.

Distribución o no parametricas

Las pruebas aplicadas a los datos de variable nominal no implican ninguna


consideración en lo que se refiere a la distribución básica de la población a
partir de la cual se selecciono la muestra. A estas pruebas se les denominan
pruebas libres de distribución o no parametricas.

Metodología para realizar una investigación Estadística

La estadística tiene finalidades muy precisas que van desde el conocimiento de


la realidad acerca de un fenómeno determinando lo normal o típico del
fenómeno, sus cambios y la relación que tiene con otros fenómenos hasta
determinar las causas que lo originan, haciendo estimaciones sobre su
comportamiento futuro y estableciendo inferencias partiendo de una muestra.

Para cumplir con esas finalidades, la estadística utiliza el método científico que
aplica en su campo del saber. Este método consiste en un conjunto específico
y sistemático de pasos para observar, recolectar, describir numéricamente,
clasificar, tabular y analizar datos de un fenómeno bajo estudio, formulando
leyes que simplifiquen la descripción de un gran número de experiencias y
observaciones.

La metodología de la investigación estadística se desarrolla en ocho fases a


saber:

Planeación, Organización, Recolección, Crítica y codificación,


Clasificación, Tabulación, Análisis e interpretación, Planeación

6
Al iniciar una investigación hay que definir exactamente el plan de trabajo y
reparar con detalle los aspectos de la investigación, para lo cual se debe tener
en cuenta las etapas de la planeación, las cuales incluyen:

Objetivo General de la investigación.

Se refiere al enunciado global de la investigación, al hecho o fenómeno que se


va a observar y registrar numéricamente; el objeto mismo de la investigación
precisando el concepto de lo que se desea indagar.

El objeto de la investigación debe establecerse de forma clara, mensurable y


comparable, se debe establecer la naturaleza cuantitativa o cualitativa del
objeto de la investigación, la posibilidad de la investigación examinando si sus
modalidades cuantitativas pueden ser conocidas con precisión y si admiten su
existencia y su intensidad, el límite del objeto investigable en el tiempo y en el
espacio al concretarse a ciertos aspectos o modalidades. El proyecto también
tiene que fijar el número exacto o aproximado de casos que deben
investigarse.

Objetivos específicos de la investigación

Se refiere a aquellos temas o subtemas en que debe ser descompuesta la


investigación con el fin de lograr el objetivo general. Determina los demás
puntos del proyecto tales como la fuente de información, los procedimientos de
la investigación, el material estadístico y el presupuesto.

Las fuentes de información

Se refiere al lugar, documento, oficina, persona o texto, en donde es posible


encontrar alguna manifestación del fenómeno. La fuente informativa puede ser
directa o indirecta, primaria o secundaria y interna o externa.

Los procedimientos de la investigación

Para hacer una investigación estadísticas el investigador debe responder como


mínimo estos interrogantes:

¿Cómo investigaremos?, ¿Quién debe hacer la investigación y por qué


sistema?, ¿Cuáles deben ser las normas generales y particulares de la
estadística que proyectamos?

Presupuesto de la investigación

Comprende el cálculo del costo y su financiación a niveles de: organización,


trabajo de campo, sistematización y publicación.

7
Organización

Después de haber redactado el plan de la investigación estadística y haber sido


sometido a su aprobación, este requiere ser sometido a un ensayo el cual se
denomina preparación.

La preparación comprende la práctica y el ensayo en los siguientes aspectos:

 Adiestramientos y elección del personal, que va a intervenir en la


investigación.

 Ensayo de la investigación sobre el terreno.

 Elección y preparación de la fuente informativa instruyendo también a


los sujetos o a las entidades que van a ser investigados.

 Preparación del material de la encuesta.

 Propaganda, anunciando en que consiste la investigación y las


disposiciones del ánimo del público afectado por la investigación.

Recolección

Consiste en el conjunto de medios destinados a la obtención de los datos


requeridos para llevar a cabo los cálculos estadísticos. Del éxito de la
recolección depende la efectividad del análisis y la claridad en la interpretación
de sus resultados.

Entre los diversos sistemas de recolección de información primaria como


secundaria se encuentran: la entrevista personal, entrevista telefónica, el
referéndum postal o encuesta por correo, la recopilación documental, bien sea
en bibliotecas, a través de datos contables de la misma organización, el código
de barras, los formularios o cuestionarios, la observación directa, etc.

Después de un examen cuidadoso de los diversos modos de respuesta, el


investigador podrá determinar ¿cuál sería el medio más adecuado para obtener
la información deseada?.

Crítica y Codificación

De la fase inmediatamente anterior se obtienen datos individuales o colectivos


aislados, representados por una cifra que muestra la intensidad de un hecho.
La crítica de la información consiste en un examen severo con el objeto de
comprobar si los datos cumplen con las condiciones de ser exactos, completos,
precisos, y representativos.

8
En el caso en que la característica bajo estudio sea un atributo, es necesario
codificar las respuestas obtenidas con el fin de facilitar la manipulación de la
información estadística obtenida en la investigación.

Clasificación

En esta etapa la información los datos inicialmente se encuentra en desorden


(datos originales), con el fin de facilitar el análisis e interpretación de los
resultados, es necesario, establecer una serie de clases o categorías donde
agrupamos los elementos comunes de la variable de acuerdo a un criterio
previamente establecido, ordenando a su vez la información bien sea en orden
ascendente o descendente.

Tabulación

La tabulación consiste en el conteo, bien sea en términos absolutos o relativos


del número de observaciones que caen en cada clase o categoría previamente
definida en la etapa de clasificación.

Análisis e interpretación

Es un estudio general de la consistencia de la información procesada cuyo


procedimiento va desde un chequeo, general de la cobertura de la encuesta,
hasta la interpretación general de la evolución del fenómeno en cuestión. En
esta fase de análisis e interpretación, se hace énfasis en la variación entre los
datos recogidos y la realidad de los hechos identificando diversos tipos de error
generados por diferentes causas y clasificados entre absolutos y relativos.

Finalidades de la estadística

 Ayudar a establecer las causas que originan el fenómeno

 Establecer lo normal o típico del fenómeno


 Hacer comparaciones entre fenómenos
 Hacer inferencias sobre el comportamiento futuro del fenómeno bajo estudio
 Facilitar la toma de decisiones en condiciones de riesgo e incertidumbre.

Variables de medición

 Introducción

9
La información recopilada en una investigación estadística, generalmente tiene
una estructura de datos categóricos, es decir basados en observaciones que
son clasificadas en categorías.

En algunos casos puede requerirse agrupar o clasificar una población por sexo,
edad, religión, peso o de acuerdo a su nacionalidad, en estos casos las
categorías estarán definidas por aspectos cualitativos.

Las categorías pueden también definirse al especificar recorridos de valores


sobre una variable de mediciones numéricas para una variable, como puede
ser el ingreso, que se categorizaría de la siguiente manera: Alto para aquellos
que reciben más de $1.000.000 y bajo para los que ganan menos de $500.000
y medio para los que ganan entre $500.000 y $1.000.000, aquí el aspecto para
determinar la categoría es cuantitativo y para este tipo de datos también es
aplicable el análisis de datos categóricos.

Para entender un poco mejor el tipo de datos que se pueden analizar con los
métodos que veremos a lo largo de este curso, es importante que conocer las
variables de medición existentes. Esto es fundamental ya que el análisis de
datos categóricos esta enfocado básicamente a datos cualitativos, es decir, a
datos que se encuentran medidos en variables nominales y ordinales y como
se dijo anteriormente es también aplicable a datos cuantitativos, que utilizan
las variables de intervalo o de razón.

 Propiedades de las variables de medición

Aunque las distintas variables de medición guardan ciertas diferencias y


características propias, existen algunas propiedades comunes para los cuatro
tipos generales de niveles de medición:

 Mutuamente Excluyentes

Las clasificaciones que se hagan de los individuos u objetos en estudio deben


ser mutuamente excluyentes, de tal manera que cada miembro de la población
pueda ser colocado en una y solo una categoría, lo cual significa por ejemplo,
que una persona no podría estar codificada como posible elector de Alfonso
Valdivieso y al mismo tiempo de Horacio Serpa, en una encuesta para saber el
nombre del futuro presidente.

 Exhaustividad

Consiste en proporcionar suficientes categorías para acomodar a todos los


miembros de la población bajo estudio, es decir, cada individuo, objeto o
medición debe aparecer en una de las categorías. Si una persona se negara a
indicar su favoritismo por alguno de los dos aspirantes a la presidencia de la

10
República, se le incluirá en la categoría de "no sabe" o "no piensa votar"
dependiendo del caso.

 Igualdad

La información de categorías se basa en que exista igualdad de los objetos o


eventos por clasificar con respecto a algún atributo. Por ejemplo, si el atributo
es el estado civil, será igual un hombre soltero de 25 años a una mujer soltera
de 35 años.

8 Clasificación

CLASIFICACION

Los cuatro tipos de variables, o niveles de medición son: nominal, ordinal, de


intervalo y de razón.

Variable Nominal

A este nivel se le considera el más sencillo, el más "primitivo", él más "bajo", o


el tipo más limitado de medición de datos categóricos, en la cual lo que se hace
es clasificar observaciones en categorías. Si nos basamos en el sentido exacto
de las palabras (variable de medición nominal), no intervienen mediciones ni
variables. En vez de esto solo hay cuentas o conteos. Dichas categorías
pueden ser el resultado de clasificar a las personas de acuerdo con su estado
civil (soltero, casado, viudo, divorciado), con su nacionalidad (colombiano,
venezolano, peruano, chileno, etc.), con su raza, su sexo, etc.

Estas categorías son identificadas por números que se asignan de manera


arbitraria a los diversos atributos, de manera similar a como se usan números
arbitrarios para identificar a los jugadores de fútbol (1,2,3...) en donde (por
ejemplo) uno representa soltero, dos casado, y así sucesivamente. La
disposición de las categorías podría modificarse, en primer lugar el estado civil:
viudo, en segundo lugar soltero, etc. Esto indica fundamentalmente que para el
nivel nominal de medición no existe orden particular para los grupos.

La codificación de las categorías en números facilita el conteo cuando se


utilizan estos números algebraicos. Por ejemplo 1+2 no es igual a 3; es un
soltero + casado, lo cual no es igual a una persona viuda, los datos nominales
también difieren de otro tipo de información en que son discretos, por ejemplo,
una persona es soltera o no lo es. Usando datos de esta clase, un investigador
no puede manejar graduaciones sutiles de comparación y no es valido decir:
es más soltero que..., o menos soltero que..., ni pueden establecerse
comparaciones de cuanto se es más o menos soltero.

11
Variable Ordinal

Corresponde también al tipo de datos cualitativos, pero en esta variable si es


posible reconocer un orden y establecer comparaciones. En ciertas situaciones,
ciertos conceptos pueden únicamente (o al menos rápida o económicamente)
ser medidos en un nivel ordinal.

Una categoría es mayor que la siguiente, esto es, que una categoría uno es
mayor que una categoría dos, y que una categoría dos es mayor que una
categoría tres, y así sucesivamente.

Sin embargo no puede decirse que una categoría codificada como uno es dos
veces más o mejor que una categoría codificada como dos, y así
sucesivamente. Solo se puede decir que la categoría uno es superior a la dos y
esta a su vez superior a la tres. Por ejemplo, en un concurso de belleza un juez
puede estar seguro de que una concursante que haya pasado a la final es más
bella que otra que no paso. No obstante, dicho juez seguramente no estaría
dispuesto a exponer un juicio cuantitativo del tipo: una concursante que paso a
la final es seis veces más bella que una que no paso. Lo que comúnmente se
hace en esta variable, es asignar números a las categorías de una variable
ordinal para distinguir el orden implícito; por ejemplo, al clasificar el ingreso
podría usarse el número uno para indicar bajo, el dos para medio y el tres para
alto.

En resumen, la principal diferencia entre un nivel de medición nominal y uno


ordinal es la relación "mayor que" entre las categorías de nivel ordinal . Por otra
parte, la variable ordinal de medición tiene las mismas propiedades que la
variable nominal.

Variable de Intervalo

Es el siguiente nivel, nos encontramos ya en una variable cuantitativa. Incluye


todas las características de la variable ordinal, pero además la distancia entre
valores es constante. Dicha variable tiene como característica fundamental el
que en ella se puede establecer la igualdad de intervalos o de diferencias.

Casi todas las técnicas estadísticas comunes son aplicables a datos medidos
en esta variable; las variables de tiempo calendario ofrecen un ejemplo de
variables de intervalo; las fechas de un calendario son transformables a las de
otro mediante una relación lineal; otro ejemplo del uso de esta variable lo
tenemos con la medición de la temperatura. Las puntuaciones en un cierto

12
examen y las calificaciones en uno de historia o de matemáticas también son
ejemplos de la variable de medición de intervalo.

En estas variables no tiene sentido decir que un valor es un cierto numero de


veces o alguna proporción, mayor que otra, pues no existe un punto cero u
origen real, sino que el origen se define por convención o conveniencia.

Variable de Razón o Cociente

Es el nivel de medición más "alto". Tiene todas las características de la variable


de intervalo pero además la razón o cociente de dos números es significativa, y
los datos de nivel de razón tienen un punto cero significativo.

Esta variable es la que se encuentra más frecuentemente en la física y existe


solo cuando se pueden definir operaciones para determinar las siguientes
cuatro relaciones: igualdad, ordenamiento, igualdad de intervalos e igualdad de
cocientes.

En el terreno practico, la determinación de la ultima de estas relaciones puede


tomar la forma de la determinación de intervalos iguales y sucesivos, a partir
del punto cero de la variable. Este es uno de los procedimientos mediante el
cual se asignan números, para que razones o cocientes iguales entre dichos
números correspondan a razones iguales del atributo que desea medirse.

Después de que se ha construido la variable de razón, sus valores numéricos


pueden ser transformados mediante la multiplicación de cada valor por una
constante, como se hace al pasar de centímetros a metros. Desde luego, esta
variable es la más potente, pues mediciones en ella pueden convertirse en
mediciones en cualquiera de las variables mencionadas. Esta variable permite
hacer comparaciones y determinar si la primera categoría tres veces más que
la segunda y la segunda tres veces más que la tercera y así sucesivamente.

TIPOS DE CARACTERISTICAS BAJO INVESTIGACION EN ESTADÍSTICA

Características cuantitativas (Variables)

Una variable es todo aquello que está sujeto a cambio y es susceptible de


medición en una variable numérica (variable de intervalo o de razón). Se

13
notan con letras mayúsculas de nuestro alfabeto, generalmente las últimas (X,
Y, Z etc.).

CLASIFICACION SEGUN SU NATURALEZA

Según su naturaleza las variables se clasifican en discretas y continuas.

Variable Discreta

Es aquella que sólo toma valores enteros. También podemos definirla como
aquella cuyo recorrido es finito o infinito numerable.

Ejemplo: El número de facturas mal elaboradas mensualmente en una


compañía, durante los últimos doce meses.

Variable continua

Es aquella que puede tomar tanto valores enteros como valores fraccionarios.
También se puede definir como aquella cuyo recorrido es infinito.

Ejemplo: Las ventas mensuales de una compañía durante los últimos doce
meses, medidas en millones de pesos.

Tipos de datos estadísticos

Básicamente hablamos de dos tipos de datos: datos originales, y datos


agrupados.

 Datos originales

Son aquellos que analizamos tal como son recibidos de la fuente de


información. Suponga que usted está interesado en invertir $5.000.000 en un
papel de renta variable. Finalmente le interesan tres valores (acción de Bavaria,
Acción de suramericana y acción de Coltabaco), pero sólo desea invertir el
dinero en uno de ellos. Para efectos de tomar su decisión de inversión el día 6
de enero de 1998 decide estudia el comportamiento de la rentabilidad de cada
una de dichas acciones durante los últimos 35 días, obteniendo la siguiente
información:

Día Bavaria Suramericana Coltabaco

Diciembre 2, 1997 4.85 8.34 12.15

Diciembre 3, 1997 5.27 7.45 18.17

14
Diciembre 4, 1997 7.64 4.87 19.42

Diciembre 5, 1997 5.72 8.56 7.35

Diciembre 6, 1997 6.26 9.73 4.81

Diciembre 7, 1997 6.67 8.24 1.02

Diciembre 8, 1997 7.59 9.75 0.83

Diciembre 9, 1997 8.25 8.26 0.05

Diciembre 10, 1997 9.31 7.32 19.12

Diciembre 11, 1997 7.73 10.50 15.23

Diciembre 12, 1997 3.78 9.75 18.36

Diciembre 13, 1997 7.73 5.84 5.28

Diciembre 14, 1997 6.67 8.56 2.03

Día Bavaria Suramericana Coltabaco

Diciembre 15, 1997 7.73 6.58 0.01

Diciembre 16, 1997 8.25 8.23 2.37

Diciembre 17, 1997 9.24 7.45 20.01

Diciembre 18, 1997 8.25 9.73 5.03

Diciembre 19, 1997 7.73 8.24 19.42

Diciembre 20, 1997 8.25 7.32 7.35

Diciembre 21, 1997 6.65 6.58 4.81

Diciembre 22, 1997 6.26 7.32 1.02

Diciembre 23, 1997 6.67 3.78 0.83

Diciembre 24, 1997 7.57 8.43 0.05

15
Diciembre 25, 1997 7.73 3.01 19.12

Diciembre 26, 1997 8.25 8.23 15.23

Diciembre 27, 1997 9.24 7.45 18.36

Diciembre 28, 1997 8.35 9.73 5.28

Diciembre 29, 1997 7.36 8.24 2.03

Diciembre 30, 1997 7.73 7.32 0.01

Diciembre 31, 1997 5.75 6.58 2.37

Enero 1, 1998 7.36 7.32 20.01

Enero 2, 1998 6.67 3.78 5.03

Enero 3, 1998 7.73 8.43 0.02

Enero 4, 1998 8.25 3.01 7.65

Enero 5, 1998 9.24 9.73 18.17

Datos originales

 Suponiendo que su tasa de oportunidad del mercado es del 7.56%:

 Describa el comportamiento histórico de la tasa de rentabilidad de estos


tres papeles.

 ¿Qué decisión de inversión tomaría usted para el día 6 de enero de


1998?

Nota: Haga todos los comentarios y supuestos que considere convenientes


con el fin de tomar la decisión de inversión óptima.

DISTRIBUCIÓN DE FRECUENCIA

Objetivo

Construir una distribución de frecuencias en una tabla en la cual se agrupan


por clases los valores posibles para una variable y se registra el número de
valores observados que corresponde a cada clase. Elaborar, gráficas de barra
y histogramas de una distribución de frecuencia.

16
Ejemplo 1

En la tabla es una variable cualitativa que describe la situación profesional. Las


etiquetas numéricas utilizadas la convierte en una variable de tipo nominal.
Puede tomar los valores 1, patrón o profesional que emplea personal; 2,
empresarios o profesional que no emplea personal; 3, persona que trabaja a
sueldo con carácter fijo; 4, persona que trabaja a sueldo con carácter eventual.

La distribución de frecuencias absolutas son: f1=23, f2=48, f3=1, f4=3.

EJEMPLO 1

Representaciones Gráficas

Veremos tres tipos de representaciones gráficas de la distribución de


frecuencias de una variable cualitativa; el diagrama de barras, el diagrama de
Pareto y el pictograma.

Diagrama de Barras

17
Diagrama de Pareto

El diagrama de pareto es ordenar la frecuencia de mayor a menor.

5 Pictograma

El Pictograma

Consiste en un círculo en el que se representan sectores con áreas


proporcionales a las frecuencias de cada una de las clases.

18
Ejemplo 2

En la tabla se presenta la situación profesional de 40 familias colombianas.

19
EJEMPLO 2

20
Calcular la EDC:

a) .La frecuencia absoluta.


b) . Diagrama de barras

c) .Diagrama de pareto.

Solución:

a.

EJEMPLO 2

b.

21
Diagrama de barras.

c.

Diagrama pareto

22
1 DISTRIBUCIONES DE FRECUENCIA ABSOLUTA ACUMULADA. -

La frecuencia acumulada, son la suma de frecuencias y frecuencias relativas,


respectivamente, para el intervalo y todos los intervalos que se encuentren
debajo de ellos.

Ejemplo 1

Encuesta de las 50 mayores empresas en Colombia

EJEMPLO 1

continua en la siguente página

23
EJEMPLO 1 (continuación)

EJEMPLO 1

Descripción de las clases

Solución:

a.Para calcular la frecuencia absoluta se realiza el conteo sobre la muestra por


cada clase, obteniendo:

FRECUENCIA

24
b.

fA(0)=15

fA(1)= fA(0)+ fA(1)=15+14=29

fA(2)= fA(1)+ fA(2)=29+8=37

fA(3)= fA(2)+ fA(3)=37+13=50

FRECUENCIA ACUMULADA

c.

Histograma

25
Ejemplo 2

De la encuesta familiar de hogares calcula la frecuencia Absoluta Acumulada y


diagrama de pareto de SOC (encuesta de hogares que aparece en el módulo 2
lecc 1 pag 5).

Recuerde que 1=Trabajos Agrarios, 2= Empresas Agrarias, 3= Obreros, 4=


Clase Media, 5= Clase Media Alta, 6= Clase Alta.

EJEMPLO 2

Si tomamos por ejemplo la clase 4 de la gráfica nos indica que entre la clase
1,2,3 incluida la 4 hay 30 familias.

26
Ejercicios

1. De la Encuesta Familiar de hogares ejemplo 2 calcular CAPITAS:

a. La frecuencia absoluta acumulada, b. Diagrama de barras acumulada


c. Diagrama de pareto acumulada y c. Pictograma acumulada.

2. De la Encuesta Familiar de hogares ejemplo 2 calcular TMUN:

a. La frecuencia absoluta acumulada, b. Diagrama de barras acumulada c.


Diagrama de pareto acumulada y c. Pictograma acumulada.

Una distribución de frecuencias relativa es aquélla en la que el número de


observaciones de cada clase se convierte en una frecuencia relativa
dividiéndolo entre el número total de observaciones en la distribución. Por esto,
cada frecuencia relativa es una proporción y se le puede convertir en
porcentaje multiplicándola por 100.

Ejemplo 1

Los siguientes datos corresponden a la tenencia de carro en Colombia.

Calcula la frecuencia relativa y el Pictograma.

EJEMPLO 1

Sumamos 7.500.000+5.006.000+3.290.000+635.000+1.800.000+450.000=

=18.681.000

27
.fr, f1=7.500.000/18.681.000=0.40

f2=5.006.000/18.681.000=0.27

f3=0.18

EJEMPLO 1

PICTOGRAMA

28
Ejemplo 2

De la encuesta familiar de hogares calcular la frecuencia relativa de EDC. .

f1=5/40=0.13, f2=9/40=0.23, f3=6/40, ..... f8=5/40=0.13

EJEMPLO 2

Ejercicios

1. De la Encuesta Familiar de hogares ejemplo 2 calcular CAPITAS:

a. La frecuencia Relativa b. Pictograma acumulada.

2. De la Encuesta Familiar de hogares ejemplo 2 calcular TMUN:

a. La frecuencia relativa b. Pictograma acumulada.

DISTRIBUCIONES DE FRECUENCIA ABSOLUTA RELATIVA ACUMULADA

29
Ejemplo 1

Los siguientes datos corresponde a la tenencia de carro en Colombia.

Calcula la frecuencia relativa acumulada.

EJEMPLO 1

Sumamos 7.500.000+5.006.000+3.290.000+635.000+1.800.000+450.000=

=18.681.000

fr, f1=7.500.000/18.681.000=0.40

f2=5.006.000/18.681.000=0.27

f3=0.18

fA(1)=0.40

fA(2)= fA(1)+ fA(2)=0.40+0.27=0.67

fA(3)= fA(2)+ fA(3)=0.67+0.18=0.85

fA(4)= fA(3)+ fA(4)=0.85+0.03=0.90

fA(5)= fA(4)+ fA(5)=0.90+0.10=0.98

fA(6)= fA(5)+ fA(6)=0.98+0.02=1.00

EJEMPLO 1

30
Ejemplo 2

De la encuesta familiar de hogares calcular la frecuencia relativa acumulada y


el diagrama de EDC (grado de educación: 1 = Analfabeto, 2 = Sin estudios, 3 =
Estudios primarios, 4 = Bachillerato elemental, 5 = Bachilleratos superiores, 6 =
Profesional, 7 = Técnico, 8 = Posgrados).

.f1=5/40=0.13, f2=9/40=0.23, f3=6/40, ..... f8=5/40=0.13

EJEMPLO 2

31
HISTOGRAMA

Ejercicios

1.De la Encuesta Familiar de hogares ejemplo 2 calcular CAPITAS: a.La


frecuencia Relativa acumulada b. Diagrama de pareto.

2.De la Encuesta Familiar de hogares ejemplo 2 calcular TMUN: a.La


frecuencia relativa acumulada b. Diagrama de pareto.

RESUMEN

Distribución de Frecuencia Variables Cualitativas

Este modulo se estudió como se distribuyen los datos obtenidos en una


población o una muestra, apoyándonos en el tipo de variable cualitativa.

Este tipo de variables representan una cualidad o atributo que clasifica a cada
caso en una de varias categorías. La situación más sencilla es aquella en la
que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano,
fumador/no fumador). Son datos dicotómicos o binarios. Como resulta obvio, en
muchas ocasiones este tipo de clasificación no es suficiente y se requiere de
un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión,
etcétera).

32
En el proceso de medición de estas variables, se pueden utilizar dos escalas:

Escalas nominales: ésta es una forma de observar o medir en la que los datos
se ajustan por categorías que no mantienen una relación de orden entre sí
(color de los ojos, sexo, profesión, presencia o ausencia de un factor de riesgo
o enfermedad, etcétera).

Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía


entre las categorías calculamos: la frecuencia absoluta, la frecuencia
acumulada, la frecuencia relativa y relativa acumulada.

Se mostró la representación gráfica de las frecuencias.

DISTRIBUCIONES DE FRECUENCIA CUANTITATIVAS

Una distribución es una tabla en la cual se agrupan en clases los valores


posibles para una variable y se registra el número de valores observados que
corresponde a cada clase. Los datos organizados en una distribución de
frecuencias se denomina datos agrupados. Por el contrario, para los datos no
agrupados, se enumeran todos los valores observados de variable aleatoria.

DISTRIBUCIONES DE FRECUENCIA ABSOLUTA

Una distribución frecuencial absoluta en esencia proporciona una cuenta de


sólo el número de observaciones.

Ejemplo 1

En una clase de 50 alumnos, las notas obtenidas en un cierta asignatura son:

33
EJEMPLO 1

En donde mediante una señal (I), colocada en el lugar correspondiente,


registramos cada una de las puntuaciones obtenidas. Contando cada señal,
conseguiremos las frecuencias de cada nota.

Se simplificaría más aún la labor del observador si en lugar de darle números,


si se muestran los resultados gráficamente. Una forma de hacerlo sería
mediante un diagrama de barras o diagrama de frecuencias.

34
Reglas Generales para Formar las Distribuciones de Frecuencias

1. Determinar el mayor y el menor entre los datos y así encontrar el rango


(diferencia entre el mayor y el menor de los datos).
2. Dividir el rango en un número conveniente de intervalos de clase del
mismo tamaño El número de intervalos de clase se toma generalmente
entre 5 y 20 dependiendo de los datos. Los intervalos de clase se elige
también de forma que las marcas de clase o puntos medios coincidan
con datos realmente observados.

Existen diferentes recomendaciones para determinar el intervalo, una


regla utilizada frecuentemente cuando tenemos N observaciones es
tomar el número de clase igual al entero más próximo a la raíz cuadrada
de N.

3. Determinar el número de observaciones que caen dentro de cada


intervalo de clase, es decir encontrar las frecuencias de clase.

Ejemplo 2

Dados los siguientes valores de ciertos trozos de madera en pulgadas:

a. Construir la tabla de distribución de frecuencias.

b. Construir el histograma correspondiente.

35
INTERVALO CLASES

-Para elaborar los intervalos, primero, buscamos el menor y el mayor de todos


los datos en este caso, 60 y 156

-Entonces tenemos el intervalo; que es el número de datos (N), se le saca la


raíz cuadrada de 81=9. Se entero más próximo es 10.

-El rango o recorrido es (156-60)/10=9.6

RANGO DE CLASES:

a.

EJEMPLO 2

b.

36
Ejemplo 3

La tabla muestra una distribución de frecuencias de salarios semanales en


dólares de 65 empleados de la compañía J y R

Hallar:

a. El limite inferior de sexta clase.


b. El límite superior de la cuarta clase.
c. La Marca de clase o punto medio de la tercera clase.
d. Histograma.

Respuestas:

a.100

37
b.89

c. (70+79)/2=74.5

d.

Ejercicios

1. Una moneda fue lanzada al aire 1.000 series, de 5 veces cada serie y se
observó el número de caras de cada serie.

El número de series en los que se presentaron 0, 1, 2, 3, 4 y 5 caras se


muestra en tabla. Representar los datos gráficamente.

2. El la siguiente tabla corresponde a las estaturas de ciertos estudiantes


de un colegio.

38
a. Construya la tabla de distribución de frecuencias.
b. Construya el histograma correspondiente.

DISTRIBUCIÓN DE FRECUENCIA ABSOLUTA ACUMULADA

Una distribución de frecuencias acumuladas identifica el número de


observaciones acumuladas incluidas bajo el limite exacto superior de cada
clase de la distribución.

Ejemplo 1

En una clase de 50 alumnos, las notas obtenidas en una cierta asignatura son:

Calcular la frecuencia acumulada

fA(0)=1

fA(1)= fA(0)+ fA(1)=1+0=1

fA(2)= fA(1)+ fA(2)=1+1=2

fA(3)= fA(2)+ fA(3)=2+4=6

fA(4)= fA(3)+ fA(4)=6+8=14

fA(5)= fA(4)+ fA(5)=14+13=27

fA(6)= fA(5)+ fA(6)=27+8=35

fA(7)= fA(6)+ fA(7)=35+7=42

39
fA(8)= fA(7)+ fA(8)=42+4=46

fA(9)= fA(8)+ fA(9)=46+2=48

fA(10)= fA(9)+ fA(10)=48+2=50

EJEMPLO 1

Ejemplo 2

Del ejemplo 2 de la lección anterior (pag 6) calcular la frecuencia acumulada.

fA(60.0-69.6)=6

fA(69.6-79.2)= fA(60.0-69.6)+ fA(69.6-79.2)=6+8=14

fA(69.6-79.2)= fA(69.6-79.2)+ fA(69.6-79.2)=14+9=23

fA(146.4-156.0)= fA(136.8-146.4)+ fA(1146.4-156.0)=76+5=81

40
EJEMPLO 2

Ejemplo 3

Construya un histograma acumulado de la frecuencias de la tabla.

41
EJEMPLO 3

Calculamos los empleados acumulados

EJEMPLO 3

Histograma

Ejercicios

1. La distancia recorrida por unos autobuses. La frecuencia de distribución


que aparece. Calcular la frecuencia acumulada y histograma.

42
2. El la siguiente tabla corresponde a las estaturas de ciertos estudiantes
de un colegio.

MUESTRA EJERCICIO 2

 Construya la tabla de distribución de frecuencias acumulada.

Construya el histograma correspondiente

DISTRIBUCIÓN DE FRECUENCIA RELATIVA

La frecuencia relativa se define como:

Ejemplo 1

43
Construya una tabla de frecuencias relativas para la distribución de
frecuencias que se presenta en la Tabla:

EJEMPLO 1

Se calcula el número de datos y la frecuencia relativa:

EJEMPLO 1

44
Ejemplo 2

En una clase de 50 alumnos, las notas obtenidas en un cierta asignatura son:

Calcular la frecuencia relativa

EJEMPLO 2

Ejercicios

1.La frecuencia de distribución que aparece en la tabla corresponde a la


distancia recorrida por unos autobuses. Calcular la frecuencia relativa.

45
2.La siguiente tabla corresponde a las estaturas de ciertos estudiantes de un
colegio.

EJERCICIO 1

Construya la tabla de distribución de frecuencias.

Ejemplo 1

Construya una tabla de frecuencias relativas acumuladas para la distribución


de frecuencias que se presenta en la Tabla:

EJEMPLO 1

46
Solución

EJEMPLO 1

Ejemplo 2

En una clase de 50 alumnos, las notas obtenidas en un cierta asignatura son:

Calcular la frecuencia relativa acumulada

EJEMPLO 2

47
Ejercicios

1.La distancia recorrida por unos autobuses. La frecuencia de distribución que


aparece. Calcular la frecuencia relativa acumulada.

EJERCICIO

2.El la siguiente tabla corresponde a las estaturas de ciertos estudiantes de un


colegio.

48
 Construya la tabla de distribución de frecuencias relativa acumulada.

RESUMEN

Distribución de Frecuencia Variables Cuantitativas.

El modulo estudio las variables que pueden medirse, cuantificarse o expresarse


numéricamente. Las variables cuantitativas pueden ser de dos tipos:

Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un


rango numérico determinado (edad, peso, talla).

Variables cuantitativas discretas, si no admiten todos los valores intermedios en


un rango. Suelen tomar solamente valores enteros (número de hijos, número
de partos, número de hermanos, etc).

Calculamos: la distribución de clase, el número de individuos pertenecientes a


cada clase, que es la frecuencia de clase. Lo mismo que la representación
gráfica de las frecuencias.

MEDIDAS DE TENDENCIA CENTRAL

Objetivo

Establecer por los métodos matemáticos, el valor que tienden a situarse en el


centro del conjunto de datos ordenados según su magnitud. Proporcionar los
diversos procedimientos estadísticos a que se refieren a las medidas de
posición, tanto para una muestra, como para datos agrupados

49
2 Media Aritmética

La media es el valor promedio de los valores en un grupo. Se calcula dividiendo


la suma de los valores individuales en un grupo entre el numero de valores en
el grupo. Matemáticamente, este proceso se expresa como sigue:

Ejemplo 1

Calcular la media de un grupo de 10 valores:

5,10,25,30,35,40,90,110,130,200

La media aritmética, que se requiere para muchos análisis estadísticos, es la


tendencia central mas usada. Una limitación de la media es que, de las tres
medidas a discutir aquí, es la medida que más se afecta si en el grupo están
presentes algunos valores extremos, grandes o pequeños.

Ejemplo 2

Un alumno ha obtenido en una evaluación las siguientes calificaciones


7,10,4,5,8,6,5,3,6.¿Cuál es su puntuación final si todas los notas tienen el
mismo valor?

50
La discusión y él calculo hasta este punto han estado enfocados en la
identificación de la media, para grupos de observaciones individuales. Estas
medidas también pueden obtenerse de datos tabulados en una distribución de
frecuencias simples. Esto se realiza por lo común para facilitar al calculo de
estas medidas. Una distribución de frecuencias simples es aquella basada en
unidades "simples" de cualquier unidad de medida que sea usada.

DATOS AGRUPADOS

Ejemplo 3

La siguiente tabla representa las notas de un examen:

NOTAS DE UN EXAMEN

¿Cuál es la media aritmética?

51
Como se observa en la tabla, fi es el numero de estudiantes, y xi son las notas.

Sería más fácil calcular previamente, cuánto vale cada paréntesis. Por eso, en
la práctica, para calcular la media se crea en la tabla una nueva columna en la
que se escribe el producto xifi.

NOTAS DE UN EXAMEN

Para una distribución que se da con los datos agrupados, la media es:

52
Ejemplo 4

Dado la distribución frecuencial que corresponde al peso en kilogramos, de un


grupo de niños con edades comprendidas entre 2 y 5 años. Calcular la media.

FRECUENCIA- PESO NIÑOS (Kg)

Calculamos xi,x1=(8+8.9)/2=8.5, x2=(9+9,9)=9.5...........xi

FRECUENCIAS E INTERVALOS

53
Ejercicios

1. Las notas obtenidas por los alumnos de cierta universidad son:


3,4,5,2,1,3,4,2,1,3,3,4,5. Calcular la media.
2. Las notas obtenidas por los alumnos de cierta universidad se expresan
mediante las siguientes tablas. Calcular la media.

ALUMNOS

3. Dado los intervalos y las frecuencias de unos trozos de acero de


diferentes medidas en pulgadas. Calcular la media.

TROZOS DE MADERA

EJEMPLO 5

Hallar la media de los pesos de 40 estudiantes de la Universidad de


Cundinamarca ver cuadro:

54
x1=(118+126)/2=122

x2=(127+135)/2=131

Mediana

La mediana en un grupo de datos, es el valor o punto en una serie, que divide


los valores ordenados en dos grupos de igual tamaño: formado por valores
iguales o menores a la mediana, y el otro, por valores iguales o mayores a la
mediana. La mediana es la medida de tendencia central más representativa

55
que la media, en aquellos grupos de datos que se inclinan en una dirección u
otra (que tienen uno o más valores extremos).

Para obtener el valor de la mediana de datos no agrupados es necesario:

1. Ordenar o poner en secuencia los valores, en forma ascendente o


descendente.
2. Identificar el punto-medio de la secuencia. a) Si hay un numero impar de
valores, identificar el número medio. b) Si hay un número par de valores,
identificar el punto-medio entre los dos números en la mitad de la
secuencia. La formula general para identificar el punto-medio, o posición
de la mediana de una secuencia de valores es: Ubicación de la mediana
= (Numero total de valores en la secuencia + 1 / 2 )
3. Tomar el valor del punto-medio o del caso mediano, y definir el valor
mediano en el grupo.

Ejemplo1

¿ Cuál es la mediana? si las calificaciones de los estudiantes son:

3, 4, 5, 5, 6, 6, 7, 8, 10,

Tras ordenar los valores obtenidos en las calificaciones, habrá uno de ellos que
esté en la mitad de la tabla

3,4,5,5 6, 6,7,8,10

la mediana será 6

Otra manera sumamos la cantidad de números (9+1)/2 =1 0/2 =5 el quinto


número es 6.

Ejemplo 2

Mediana de un grupo que contiene un número impar de valores:

1. Valores ordenados de manera ascendente: 7, 9, 11, 13, 15.

2. El punto-medio de la secuencia = (5 valores + 1) / 2= 6 / 2= 3.Entonces la


mediana es el valor del tercer número de la secuencia. 3. El tercer valor es el
11, entonces la mediana es 11.

56
Ejemplo 3

Mediana de un grupo que contiene un número par de datos:

a) Situación donde la mitad de los números son diferentes

1. Valores ordenados en forma ascendente: 7,9, 11, 13, 15, 17

2. La posición de la mediana = (6+1) / 2 = 7 / 2= 3.5 Entonces la mediana es el


valor que cae en la mitad entre el tercer y el cuarto valor en la secuencia.

1. El tercer y cuarto valores son, respectivamente, 11 y 13.

4. La mediana = (11 + 13) / 2= 24 / 2= 12.

b) Situación donde los números medios (o de en medio) son los mismos.

1. Valores acomodados en orden ascendente: 7, 9, 11, 11, 13, 15.

2. En este ejemplo la posición de la mediana también es el valor 3.5, en


el grupo ordenado de valores: (6 + 1) / 2 =

7 / 2 = 3.5

2. Como los valores tercero y cuarto de la secuencia son ambos 11, la


mediana es también 11: (11 + 11) / 2 =

22 / 2= 11.

LA MEDIANA PARA DATOS AGRUPADOS

Para datos agrupados, en primer lugar es necesario determinar la clase que


contiene el valor de la mediana, para después determinar la posición de la
mediana dentro de la clase mediante interpolación. La clase que contiene la
mediana es la primera cuya frecuencia acumulada iguala o excede la mitad de
total de observaciones. Una vez que se identifica esta clase, se determina el
valor especifico la siguiente fórmula:

57
Ejemplo 4

Hallar la mediana de los pesos de 40 estudiantes de la Universidad de


Cundinamarca ver cuadro:

EJEMPLO 4

Acumulamos la Frecuencia fA

EJEMPLO 4

58
EJEMPLO 4

En este caso la clase que contiene la mediada es la que incluye el valor


40/2=20. La primera cuya frecuencia acumulada es igual o superior a 20 es la
clase que tiene los límites nominal 145-153; así, la interpolación para
determinar el valor especifico de la mediana se realiza en esta clase.

59
8 Ejemplo 5_1

Ejemplo 5

La tabla muestra la distribución de frecuencia de la duración de 400 circuitos de


TV, comprobados en la compañía Lucho, determinar la mediana.

EJEMPLO 5

Se calcula los circuitos acumulados:

EJEMPLO 5

60
En este caso la clase que contiene la mediada es la que incluye el valor
400/2=200. La primera cuya frecuencia acumulada es igual o superior a 200 es
la clase que tiene los límites nominal 700-799; asi, la interpolación para
determinar el valor especifico de la mediana se realiza en esta clase.

Ejercicios

1. Hallar la mediana a) 3,5,2,6,5,9,5,2,8,6 b) 51,6,48,7,50,3,49,5.48,9


2. Una muestra de 20 trabajadores de la compañía Lucho obtuvieron los
siguientes salarios para el mes de septiembre de 2001:

240.000,240.000, 240.000,240.000, 240.000, 240.000,240.000, 240.000,


255.000,

255.000,265.000, 265.000,280.000, 280.000,290.000, 300.000,305.000,


325.000,330.000 y 340.000. Calcular la mediana.

3. De la siguiente tabla calcular la mediana.

61
Moda

La moda es aquel valor en un grupo de datos que se presenta con mayor


frecuencia. Se identifica contando el número de veces que aparece cada valor
en el grupo y seleccionando el valor que aparece con mayor frecuencia.
Algunas veces ocurre que un grupo de datos contiene más de una moda. Si un
evento puede complicar la interpretación de datos. Ya que la moda
generalmente no se usa en cálculos estadísticos elaborados, se usa menos
frecuentemente que la media.

Ejemplo 1

Moda de un grupo de 7 observaciones: 3, 4, 6, 6, 6, 9, 12 La moda es el 6, que


es el que mas aparece (3 veces).

Ejemplo 2

Un grupo de 12 observaciones que contiene mas de una moda: 1, 3, 4, 4, 4, 5,


7, 9, 9, 9, 14, 15

Hay 2 números que ocurren con igual frecuencia, entonces esta distribución
tiene 2 modas, el 4 y el 9.

62
LA MODA PARA DATOS AGRUPADOS

Para datos agrupados en un distribución de frecuencias con intervalos de clase


iguales, primero se identifica la clase que contiene la moda determinando cuál
de ellas tiene el mayor número de observaciones.

Ejemplo 3

Hallar la moda de los pesos de 40 estudiantes de la Universidad de


Cundinamarca ver cuadro:

EJEMPLO 3

Con referencia a los datos de la tabla la clase modal es la que tiene límites
nominales 145-153.

63
Ejemplo 4

La tabla muestra la distribución de frecuencia de la duración de 400 circuitos de


TV, comprobados en la compañía Lucho, determinar la moda.

EJEMPLO 4

64
6 Moda6

Ejercicios

1. El número de automóviles que vendió cada une de los 10 vendedores de


una distribuidora en un mes especifico, en orden ascendete, es ,
4,7,10,10,10, 12,12,14 y 15. Determinar la moda.
2. Se presentan los siguientes resultados de un examen practicado a 20
estudiantes en un curso de análisis de decisiones, en orden ascendete:

39,46,57,65,70,72,72,75,77,79,81,81,84,84,84,87,93,94,97 y 97.
Calcular la moda.

3. Calcular la moda del tiempo de ensamble del siquiente cuadro:

EJERCICIOS

65
EJERCICIO

La siguiente tabla contiene los pesos en libras de un grupo de estudiantes del


Sena seccional pasto.

138 164 150 132 144 125 149 157

146 158 140 147 136 148 152 144

168 126 138 176 163 119 154 165

146 173 142 147 135 153 140 135

161 145 135 142 150 156 145 128

Hallar la moda de los datos de la tabla anterior

 Construir el Histograma.

La Media Geométrica

La media geométrica G de una serie de N números x 1, x2, x3,x4.......xn es la raíz


del producto de los número:

Ejemplo 1

Calcular la media geométrica de los números 2,4,8.

Ejemplo 2

Hallar la media geométrica de 3,5,6,6,7,10,12

66
LA MEDIA GEOMETRICA PARA DATOS AGRUPADOS

Ejemplo 3

La tabla muestra la distribución de la carga máxima en toneladas que soportan


ciertos cables producidos por una compañía. Determinar la media geométrica.

EJEMPLO 3

Calculamos x1=(9.3+9.7)/2=9.5, x2=(9.8+10.2)/2=10,.......x8=(12.8+13.2)/2=13

Calculamos log(x1)=0.98, log(x2)=1.00...................log(x8)=1.11

Calculamos f1log(x1)=2x0.98=1.96, f2log(x2)=5x1=5......... f8log(x8)=1x1.11=1.11

Calculando la media geométrica se obtiene:

67
EJEMPLO 3

Ejemplo 4

De la tabla siguiente calcula la media geométrica

EJEMPLO 4

Calculamos x1=(9+10)/2=9.5, x2=(11+12)/2=11.5,.......x5=(17+18)/2=17.5

Calculamos log(x1)=0.98, log(x2)=1.06...................log(x8)=1.24

Calculamos f1log(x1)=4x0.98=3.91, f2log(x2)=8x1.06=8.49..


f8log(x8)=3x1.24=3.73

68
5 Media geo5

EJEMPLO 4

Ejercicios

1. Hallar la media geométrica de los números a) 4,2 y b) 3,6

69
2. Hallar la media geométrica de los números 3,5,8,3,7,2

3. Calcular la media geométrica de las Horas extras:

EJERCICIOS

MEDIA ARMÓNICA

La media armónica H de una serie de N números x 1, x2,x3.....xn es la recíproca


de la media aritmética de los recíprocos de los números:

Ejemplo 1

Calcular la media armónica de los números 2,4,8.

70
Ejemplo 2

Calcular la media armónica de los números 1,2,4,5,8,10.

MEDIA ARMÓNICA DATOS AGRUPADOS

Ejemplo 3

La tabla muestra la distribución de la carga máxima en toneladas que soportan


ciertos cables producidos por una compañía. Determinar la media armónica.

EJEMPLO 3

71
Calculamos x1=(9.3+9.7)/2=9.5, x2=(9.8+10.2)/2=10,.......x8=(12.8+13.2)/2=13

EJEMPLO3

EJEMPLO 3

72
Ejemplo 4

Del cuadro de circuitos, calcular la media armónica.

EJEMPLO 4

Calculamos x1=(300+399)/2=349.50, x2=(400+499)/2=449.50..........................

X9=(1100+1199)/2=1149.50

73
EJEMPLO 4

EJEMPLO 4

74
Ejercicios

1. Hallar la media armónica a) 2,3,6 b) 3,2,5,2,4,8


2. Hallar la media aritmética, la media geométrica y la media armónica de
los números 0, 2, 2, 4, 6,8.
3. La tabla muestra una distribución de frecuencias de las calificaciones del
examen final de álgebra lineal de UL. Calcula la media armónica.

EJERCICIOS

4. Calcular la media aritmética, la media geométrica y la media armónica de la


de los salarios de la compañía JR.

75
EJERCICIOS

1 Cuartiles Deciles y Percentiles

Los cuartiles, deciles y percentiles se parecen mucho a la media porque


también subdividen una distribución de mediciones de acuerdo con la
proporción de frecuencias observadas. Mientras que la mediana divide a la
distribución en dos mitades, los cuartiles la dividen en cuatro cuartos, los
deciles la dividen en diez décimos y los puntos percentiles la dividen en cien
partes.Qi. Di, Pi

Ejemplo 1

Ocho vendedores vende los siguientes cantidades de aparatos electrónicos, en


orden ascendente: 5, 8, 8,11.11, 11,14 y 16. Encuentre la posición del tercer
cuartil para esta distribución.

76
Ejemplo 2

Las siguientes cifras son los importes de 15 personas en un restaurante, en


orden ascendente:

1000,1000,2500,2500,2500,3500,4000,5300,9000,12500,13500,24500,27500

30900 y 41000

Determinar a) el segundo cuartil, b) el segundo decil y c) el punto percentil 40.

77
CUARTILES,DECILES Y PERCENTILES AGRUPADOS

Para datos agrupados, la fórmula de la media se modifica de acuerdo con el


punto fraccionario de interés. Al utilizar esta fórmula modificada, en primer lugar
se determina la clase que contiene el punto el punto de interés, de acuerdo con
las frecuencias acumuladas, y después se lleva a cabo la interpolación como
se hizo antes.

Ejemplo 1

Hallar: a) el cuartil b) el 6 decil c) 40 percentil de los pesos 40 estudiantes de la


Universidad de Cundinamarca ver cuadro:

EJEMPLO 1

78
Acumulamos la Frecuencia Fa así:

Continua..

 En este caso la clase que contiene el tercer cuartil es la que incluye el valor
3(40)/4=30. La primera cuya frecuencia acumulada es igual o superior a 30 es
la clase que tiene los límites nominal 154-162; así, la interpolación para
determinar el valor especifico del tercer cuartil se realiza en esta clase.

79
 En este caso la clase que contiene el 6 decil es la que incluye el valor
6(40)/10=24. La primera cuya frecuencia acumulada es igual o superior a 24 es
la clase que tiene los límites nominal 145-153; así, la interpolación para
determinar el valor específico del tercer cuartil se realiza en esta clase.

80
C. En este caso la clase que contiene el 40 percentil es la que incluye el
valor 40(40)/100=16. La primera cuya frecuencia acumulada es igual o
superior a 16 es la clase que tiene los límites nominal 136-144; así, la
interpolación para determinar el valor específico del tercer cuartil se
realiza en esta clase.

EJERCICIOS

1. Una muestra de 20 trabajadores de una compañía pequeña obtuvieron los


siguientes salarios para un mes determinado:

81
240000,240000,240000,240000,240000,240000,240000,
240000,255000,255000,265000,265000,280000,280000

29000, 300000, 305000, 325000, 330000,340000.

Calcular:

a) El tercer cuartil b) el noveno decil, c) el punto percentil 50.

2. La tabla muestra la distribución de la carga máxima en toneladas cortas que


soportan ciertos cable producidas una compañía. a.) Calcular los cuartiles Q1 Y
Q2 Y Q3.

EJERCICIOS

3. Del ejercicio 2 hallar a) p10 b) p90

RESUMEN

Medidas de Tendencia Centrales

Una vez que se recogieron los valores que toman las variables de nuestros
módulos anteriores (datos), procedimos al análisis descriptivo de los mismos.
Para variables categóricas, como la estatura, el peso, salario etc se quiere
conocer el número de casos en cada una de las categorías, reflejando
habitualmente el porcentaje que representan del total, y expresándolo en una
tabla de frecuencias.

82
Para variables numéricas, en las que puede haber un gran número de valores
observados distintos, se ha de optar por un método de análisis distinto,
respondiendo a la siguiente pregunta:

¿Alrededor de qué valor se agrupan los datos? Supuesto que se agrupan


alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy
dispersos? Las medidas de centralización vienen a responder a la primera
pregunta. La medidas más evidentes que se calcularon en este modulo para
describir un conjunto de observaciones numéricas son:

La media aritmética, no es más que la suma de todos los valores de una


variable dividida entre el número total de datos de los que se dispone.

Otra medida de tendencia central que se utilizamos es la mediana. Es la


observación equidistante de los extremos.

No tan usual como las anteriores, es la moda, siendo éste el valor de la


variable que presenta una mayor frecuencia.

Y por ultimo estudiamos la media geométrica y armónica, los cuartiles deciles y


percentiles

MEDIDAS DE DISPERSION

Objetivos

Calcular un dato o valor para medir la dispersión de un muestra o grupo,


evaluando en qué medida la variable toma valores de muy próximo o por el
contrario, presentan valores muy distantes.

Las técnicas estudiadas en las lecciones anteriores permite una descripción


visual de la distribución de una variable mediante tablas y gráficos. En muchos
casos, el resumen puede hacerse eficazmente de una forma más sencilla y
presa: utilizando valores numéricos que den idea de la ubicación o del centro
de los datos, medidas de posición, usando cantidades que informen de la
concentración de las observaciones alrededor de dicho centro medidas de
dispersión y mediante números que reflejen otros rangos de la distribución,
como asimetría o apuntamiento.

Los estadísticos de tendencia central o posición nos indican donde se sitúa un


grupo de puntuaciones. Los de variabilidad o dispersión nos indican si esas
puntuaciones o valores están próximas entre sí o si por el contrario están o
muy dispersas.

83
Una medida razonable de la variabilidad podría ser la amplitud o rango, que se
obtiene restando el valor más bajo de un conjunto de observaciones del valor
más alto. Es fácil de calcular y sus unidades son las mismas que las de la
variable, aunque posee varios inconvenientes:

No utiliza todas las observaciones (sólo dos de ellas); Se puede ver muy
afectada por alguna observación extrema; El rango aumenta con el número de
observaciones, o bien se queda igual. En cualquier caso nunca disminuye.

En el transcurso de esta sección, veremos medidas de dispersión mejores que


la anterior. Estas se determinan en función de la distancia entre las
observaciones y algún estadístico de tendencia central.

Ejemplo 1

Calcular el rango de los números 2, 3, 3, 5, 5, 5, 8, 10, 12 R=12-2=10

El rango R=10

Rango Modificado ( Semiintercuartilico o Desviación Cuartilica)Un rango


modifica es un rango para el cual se elimina cierto porcentaje de los extremos
de la distribución.

Ejemplo 2

Los datos de unos vendedores de aparatos electrónicos son: 5, 8, 8, 11, 11, 14,
16. Calcular el rango (R) al 50%.

84
El RANGO Y LOS RANGOS MODIFICADOS PARA DATOS AGRUPADOS
Para datos agrupados en una distribución de frecuencias, por lo general se
define el rango como la diferencia entre el límite exacto superior de la clase
más alta, y el límite exacto inferior de la clase más baja.

Ejemplo 3 La tabla muestra la distribución de la edades de los cabezas de


familias en Colombia durante los años 1990.Calcular el rango al 85%.

Calculamos la frecuencia acumulada

95*90.44/100=85.92

85
10*90.44/100=9.044

Ejemplo 4

86
En el cuadro de salarios calcular: a) EL rango b) El rango Central del 50%

Se calcula la frecuencia acumulada:

Tenemos que:

 Límite superior de clase más alto=50, y el límite inferior de clase=119

R=119-50=69

b) 75*65/100=48.75

25*65/100=23.75

87
Ejercicios

1. Para una muestra de 15 clientes en un restaurante se determinaron las


siguientes cuentas, en orden de magnitud $1.000, 1.000, 2.500,2.500,
3.500

4.000, 5.300 9.000, 12.500, 13.500, 24.500, 27.500, 30.900, 41.000.

Determínese a) el rango b) el rango del 50%.

2. El número de automóviles que vendió cada uno de 10 vendedores de


una distribuidora en un mes especifico, en orden ascendente es:
2,4,7,10,10,10,

12,12,14,15. Determine a) el rango y b)el rango del 80%.

3. Del problema de circuitos calcular: a) El rango b) el rango 65%.

88
LA DESVIACIÓN MEDIA

La desviación media MD se basa en la diferencia entre el valor absoluto de


cada uno de los elementos conjuntos de datos y media del grupo. Después, se
calcula la media de esas desviaciones. Si se calculara la media por la suma de
las diferencias positivas y negativas entre cada valor y la media aritmética la
respuesta sería, siempre igual a 0. Por esta razón, son los valores absolutos de
las diferencias lo que se suma.

Ejemplo 1

Hallar la desviación media de los números 2, 3, 6, 8,10

Ejemplo 2

Para una muestra de 15 clientes en un restaurante se determinaron las


siguientes cuentas, en orden de magnitud:

89
$1.000, 1.000, 2.500,2.500, 3.500,4.000, 5.300 9.000, 12.500, 13.500, 24.500,
27.500, 30.900, 41.000.

Calcula la desviación media.

LA VARIANZA

La varianza es la media de dispersión más utilizada, y es un indicador de


desviaciones respecto a la media aritmética. Un valor grande de la varianza
indica que el conjunto de datos está muy disperso alrededor de su media,
mientras que un valor pequeño indica agrupamiento del conjunto de datos
alrededor de su media.

Se expresa con la fórmula siguiente:

Una de las principales propiedades de la varianza es que siempre es mayor o


igual a cero.

En efecto, al ser una suma de cuadrados, su valor mínimo es cero, y esto


ocurrirá precisamente cuando todos los valores de la variable sean iguales.

90
DESVIACIÓN ESTÁNDAR O TÍPICA

La desviación estándar es la raíz cuadrada, con signo positivo, de la varianza.


Esta medida de dispersión suple un inconveniente de la varianza y es que esta
viene medida en las unidades de la variable, pero elevadas al cuadrado. En
este sentido, una medida de dispersión asociada a la varianza, pero que no
tiene la anterior limitación es la desviación estándar.

En consecuencia, se interpreta de la misma manera que la varianza. En otros


términos:

A veces, la desviación típica de los datos de una muestra viene definida con
(N-1) en lugar de N en los denominadores de la expresión, porque el valor
resultante representa un estimador mejor de la desviación típica de una
población de la que se ha tomado una muestra. Para valores grandes de N
(por ejemplo N>30), prácticamente no hay diferencia entre las dos definiciones.

Ejemplo 1.

El número de horas que un grupo de niños dedica a jugar es; 2, 3, 3.5, 4, 2, 4,


5. Calcular la varianza y la desviación estándar

Para calcular la varianza se presenta a continuación:

91
Ejemplo 2.

Sumando 5 a cada uno de los números de la serie 3, 6, 2, 1, 7, 5 se obtiene la


serie 8, 11, 7, 6, 12, 10. Demostrar que las dos series tienen las mismas
desviaciones estándar, pero diferente media. ¿Cómo son las medias entre sí?

92
Ejemplo 3

Hallar la desviación estándar de la progresión aritmética 4, 10, 16, 22, ....154.

Hallamos la desviación estándar de 2 números consecutivos.

Ejemplo 4

Hallar la desviación estándar de la progresión aritmética 2 n.

93
LA VARIANZA Y LA DESVIACION ESTANDAR DATOS AGRUPADOS

Para datos agrupados en un distribución de frecuencias, se asume que el punto


medio de cada clase representa a todas las mediciones incluidas en esa clase.

Ejemplo 5

Hallar la a) La varianza b) La desviación estándar. Para la altura de los 100


estudiantes de U. Cundinamarca.

94
EJEMPLO 5

Calculamos xi, X1=(60+62)/2=61..... X5=(72+74)/=73

fixi=f1x1=5*61=305...................f5x5=584

EJEMPLO 5

9 Ejemplo5_2

Calculamos

EJEMPLO 5

95
Ejemplo 6

La tabla muestra el cociente de inteligencia de 480 alumnos de un colegio


distrital. Hallar a) La desviación estándar. b) Determinar que el porcentaje de
inteligencia caiga dentro del intervalo x±s.

EJEMPLO 6

Donde Xi= Cociente intelectual y Fi= Estudiantes

Realizamos el cálculo de la media aritmética y de la desviación estándar


siguiendo los mismos pasos del ejemplo 5 que se encuentra en la página 8 de
esta misma lección y tabulamos los resultados.

96
EJEMPLO 6

11 Ejemplo6_2

calcular el rango de clase

97
EJEMPLO 6

Ejercicios

1. Hallar la desviación estándar, 0, 0, 0, 0, 1, 1, 1,1.

2. Hallar la desviación estándar de la progresión aritmética 2n+1.

3, Calcular la desviación estándar del cuadro siguiente:

98
EJERCICIOS

4. Determinar el porcentaje de altura (pulgadas) que caigan dentro del


intervalo x¯±s.

EJERCICIOS

El COEFICIENTE DE VARIACION

Las desviaciones estándar de dos distribuciones de frecuencia no se pueden


comparar directamente pues dependen del tamaño del medio aritmético
respectivo, para hacerlo hay que expresarlas como porcentajes de esos
medios, los cuales reciben el nombre de coeficientes de variación.

Su fórmula de cálculo es la siguiente:

Ejemplo 1

99
Supongamos que en un cierto grupo el promedio de las edades es de 26 años,
con una desviación estándar de 3; y en otro, el promedio es de 38 años, con
una desviación estándar de 5.

Los coeficientes de variación son, respectivamente, de:

Ejemplo 2

Un fabricante de tubos de televisión tiene dos tipo de tubos, A y B. Los tubos


tienen unas duraciones medias respectivas de:

Calcular el coeficiente de variación

COEFICIENTE DE ASIMETRIA

El coeficiente de asimetría de Pearson mide la desviación de la simetría, la


diferencia entre la media y la mediana con respecto a la desviación estándar
del grupo de mediciones,

100
Para una distribución simétrica, el valor del coeficiente de asimetría es siempre
0, porque la media y la mediana son iguales. Para una distribución con
asimetría positiva, la media es siempre mayor que la mediana y, por ello, el
valor del coeficiente es positivo. Para una distribución con asimetría negativa,
la media es siempre menor que la mediana y, por ello, el valor del coeficiente
es negativo.

Ejemplo 3

Calcula coeficiente de asimetría (3;4;5;2;3;4;5;6;4;7).

EJEMPLO 3

101
4 coef3

EJEMPLO 3

Si tomamos N-1

102
EJEMPLO 3

EJERCICIOS

1. En un examen final de estadística, la puntuación media de un grupo de


150 estudiantes fue de 78 y la desviación típica fue de 8.0. En álgebra,
sin embargo la media final del grupo fue de 73 y la desviación típica 7.6.
¿En qué asignatura hubo mayor dispersión relativa?
2. El número de automóviles que vendió cada uno de 10 vendedores de
una distribuidora en un mes específico, en orden ascendente, es: 2, 4, 7,
10, 10, 10, 12, 12, 14, 15. Determinar el coeficiente de variación.
3. El número de piezas terminadas que hizo cada uno de 10 operarios de
una planta de autopartes en un mes específico, en orden acendete, es:
3, 5, 8, 13, 13, 13, 15, 15, 17, 18. Determinar el coeficiente de asimetría.

103
Esta medida mide el mayor o menor apuntamiento central de una distribución
con respecto a la distribución normal, que es campaniforme (forma de
campana) y simétrica. Es decir, la curtosis o asimetría es una medida
estadística necesaria para conocer en cuánto se parece una distribución a la
distribución llamada " curva normal " y constituye un indicador del lado de la
curva donde se agrupan las frecuencias.

Estas medidas se aplican a distribuciones unimodales, simétricas o ligeramente


asimétricas, y tratan de analizar qué ocurre en la zona central de la distribución.

Devuelve la curtosis de un conjunto de datos. La curtosis representa la


elevación o achatamiento de una distribución, comparada con la distribución
normal. Una curtosis positiva indica una distribución relativamente elevada,
mientras que una curtosis negativa indica una distribución relativamente plana.

Ejemplo 1

Calcular la curtosis de los números: 3;4;5;2;3;4;5;6;4;7.

EJEMPLO1

104
EJEMPLO 1

105
Ejemplo 2

Para una muestra de 15 clientes en un restaurante se determinaron las


siguiente cuenta, 1000, 1000, 2500, 2500, 3500, 4000, 5300, 9000 Calcular la
curtosis.

106
EJEMPLO 2

EJEMPLO 2

107
Ejercicios

1. El número de automóviles que vendió cada uno de 10 vendedores de


una distribuidora en un mes específico, en orden acendete, es: 2, 4, 7,
10, 10, 10, 12, 12, 14, 15. Determinar la curtosis.

2. El número de accidentes que ocurrieron en un mes en 12 departamentos de


una fábrica fueron: 2, 2, 3, 0, 0, 0, 5, 7,0, 6, 1,0. Calcular la curtosis.

108
RESUMEN

Medidas de dispersión

Supuesto que se agrupan alrededor de un número, ¿cómo lo


hacen? ¿Muy concentrados? ¿Muy dispersos?, esa pregunta la
contestamos en este modulo usando.

 Cuando se quieren señalar valores extremos en una


distribución de datos, se suele utilizar el rango como
medida de dispersión. La amplitud es la diferencia entre el
valor mayor y el menor de la distribución.
 La desviación media se basa en la diferencia entre el
valor absoluto de cada uno de los elementos de un
conjuntos de datos y la media del grupo.

 Otro aspecto a tener en cuenta al describir datos continuos


es la dispersión de los mismos. Existen distintas formas de
cuantificar esa variabilidad. De todas ellas, la varianza (S2)
de los datos es la más utilizada. Es la media de los
cuadrados de las diferencias entre cada valor de la variable
y la media aritmética de la distribución
 Esta varianza muestral se obtiene como la suma de las de
las diferencias de cuadrados y por tanto tiene como
unidades de medida el cuadrado de las unidades de
medida en que se mide la variable estudiada.

 La desviación típica (S) es la raíz cuadrada de la


varianza. Expresa la dispersión de la distribución y se
expresa en las mismas unidades de medida de la variable.
La desviación típica es la medida de dispersión más
utilizada en estadística.

 Aunque esta fórmula de la desviación típica muestral es


correcta, en la práctica, la estadística nos interesa para
realizar inferencias poblacionales, por lo que en el
denominador se utiliza, en lugar de n, el valor n-1.
 El haber cambiado el denominador de n por n-1 está en
relación al hecho de que esta segunda fórmula es una
estimación más precisa de la desviación estándar
verdadera de la población y posee las propiedades que
necesitamos para realizar inferencias a la población.
 Como medidas de variabilidad más importantes, conviene
destacar algunas características de la varianza y
desviación típica:

109
 Son índices que describen la variabilidad o dispersión y por
tanto cuando los datos están muy alejados de la media, el
numerador de sus fórmulas será grande y la varianza y la
desviación típica lo serán.
 Al aumentar el tamaño de la muestra, disminuye la
varianza y la desviación típica. Para reducir a la mitad la
desviación típica, la muestra se tiene que multiplicar por 4.
 Cuando todos los datos de la distribución son iguales, la
varianza y la desviación típica son iguales a 0.
 Para su cálculo utilizaremos todos los datos de la
distribución; por tanto, cualquier cambio de valor será
detectado.
 Otra medida que se utilizaremos es el coeficiente de
variación. Es una medida de dispersión relativa de los
datos y se calcula dividiendo la desviación típica muestral
por la media y multiplicando el cociente por 100. Su utilidad
estriba en que nos permite comparar la dispersión o
variabilidad de dos o más grupos.
 Cuando los datos se distribuyen de forma simétrica (y ya
hemos dicho que esto ocurre cuando los valores de su
media y mediana están próximos), se usan para describir
esa variable su media y desviación típica. En el caso de
distribuciones asimétricas, la mediana y la amplitud son
medidas más adecuadas. En este caso, se suelen utilizar
además los cuartiles y percentiles.
 Los cuartiles y percentiles no son medidas de tendencia
central sino medidas de posición. El percentil es el valor
de la variable que indica el porcentaje de una distribución
que es igual o menor a esa cifra.

110