P. 1
ESTADÍSTICA DESCRIPTIVA 100-105

ESTADÍSTICA DESCRIPTIVA 100-105

|Views: 6.087|Likes:
Publicado porwilquin farid

More info:

Published by: wilquin farid on Sep 30, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

11/27/2013

pdf

text

original

Sections

  • INTRODUCCIÓN
  • CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL
  • INTRODUCCIÓN A LA UNIDAD
  • OBJETIVOS ESPECÍFICOS
  • 1. UNIDAD CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL
  • 1.1.2.1 Aleatoriedad Y Representatividad de la muestra
  • 1.1.2.2 Muestra aleatoria simple
  • 1.1.2.3 Muestra Aleatoria sistemática
  • 1.1.2.4 Muestra Aleatoria Estratificada
  • 1.1.2.5 Muestra Aleatoria de conglomerados
  • 1.1.2.6. Determinar: población, muestra y tipo de muestreo a utilizar
  • 1.1.3.1 VARIABLES CUALITATIVAS
  • 1.1.3.2 VARIABLES CUANTITATIVAS
  • 1.1.3.3 ESCALA DE MEDIDA DE VARIABLES
  • 1.1.4. LECCIÓN 4. CARACTERIZACIÓN DE UNA VARIABLE CUALITATIVA
  • 1.1.4.2 REPRESENTACIONES GRAFICAS:
  • TABLA DE CONTINGENCIA DE FRECUENCIA RELATIVAS
  • TABLA DE CONTINGENCIA DE PORCENTAJES
  • 1.2.1.1. Definición del objeto de investigación
  • 1.2.1.2. Unidad de investigación
  • 1.2.1.3 Clase de investigación
  • 1.2.1.4 Las fuentes de información
  • 1.2.2.3 Según la cobertura
  • 1.2.2.4 Según la forma de observación
  • 1.2.4.1 Combinación o arreglo ordenado
  • 1.2.4.2 Arreglo de tallo y hojas
  • 1.2.4.3 Tabulación de la información
  • 1.2.4.1 Distribuciones de frecuencias
  • 1.2.5.6 Componentes de una gráfica
  • 1.2.5.7 iagrama de frecuencias
  • 1.2.5.8 Histograma de frecuencias
  • 1.2.5.9 Polígono de frecuencias
  • 1.2.5.6. Gráficos de línea
  • Egresados de la UNAD en el período 2000-2004
  • 1.2.5.7. Diagramas de barras
  • 1.2.5.8. Diagrama circular
  • 1.2.5.9. Pictogramas
  • Distribución de frecuencias agrupadas
  • ACTIVIDADES DE AUTOEVALUACION DE LA UNIDAD
  • BIBLIOGRAFÍA DE LA UNIDAD
  • MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES
  • MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES
  • 2.1.2 LECCIÓN 17 VARIANZA Y DESVIACIÓN ESTÁNDAR
  • 2.1.2.1 Desviación típica o estándar
  • 2.1.3 LECCIÓN 18 COEFICIENTE DE VARIACIÓN Y DESVIACIÓN MEDIA
  • 2.1.3.1 Desviación media
  • 2.1.5.1 Asimetría
  • 2.1.5.2 Apuntamiento o curtosis
  • 2.1.5.6 Estadística Descriptiva
  • 2.1.5.7 Herramientas Informáticas
  • 2.3.1 LECCIÓN 26 CONSTRUCCIÓN DE NÚMEROS ÍNDICE
  • 2.3.5.1 Calculo del salario y del ingreso
  • 2.3.5.2 Poder de compra o poder adquisitivo o valor del dinero
  • 2.3.5.4 Porcentaje de variación y de devaluación
  • ACTIVIDADES DE AUTOEVALUACION UNIDAD 2

MÓDULO ESTADÍSTICA DESCRIPTIVA 100-105

Milton Fernando Ortegón Pava Director Ing. Francisco Cabrera Acreditador

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD – FACULTAD DE CIENCIAS BÁSICAS E INGENIERÍA UNIDAD DE CIENCIAS BÁSICAS Ibagué. 2009

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

COMITÉ DIRECTIVO Jaime Alberto Leal Afanador
Rector Gloria C. Herrera Sanchez Vicerrector Académico y de investigación Roberto Salazar Ramos Vicerrector de Medios y Mediaciones Maribel Córdoba Guerrero Secretaria General

MÓDULO CURSO ESTADÍSTICA DESCRIPTIVA
© Copyrigth Universidad Nacional Abierta y a Distancia

 

2

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

CONTENIDO
Pág. INTRODUCCIÓN 10

UNIDAD DIDÁCTICA 1 Conceptos Preliminares Y Medidas De Tendencia Central INTRODUCCIÓN A LA UNIDAD OBJETIVOS ESPECÍFICOS 1. CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL 1.1. CONCEPTUALIZACIÓN DE TÉRMINOS ESTADÍSTICOS 1.1.1. ¿QUÉ ES LA ESTADÍSTICA? 1.1.2. CONCEPTOS BÁSICOS 1.1.2.1 Aleatoriedad Y Representatividad de la muestra 1.1.2.2 Muestra aleatoria simple 1.1.2.3 Muestra Aleatoria sistemática 1.1.2.4 Muestra Aleatoria Estratificada 1.1.2.5 Muestra Aleatoria de conglomerados 1.1.2.6.Deter. Población, muestra y tipo de muestreo a utilizar 1.1.3. VARIABLES ESTADÍSTICAS 1.1.3.1 variables cualitativas 1.1.3.2 variables cuantitativas 1.1.3.3 escala de medida de variables 1.1.4 CARACTERIZACIÓN DE UNA VARIABLE CUALITATIVA 1.1.4.1 tablas de frecuencias: 1.1.4.2 representaciones graficas: 1.1.4.2.1 diagramas de barras 1.1.4.2.2 diagrama circular: 1.1.4.3 moda 1.1.5. TABLAS DE CONTINGENCIA: 1.2 INVESTIGACION ESTADISTICA 1.2.1 PLANEACION 1.2.1.1 Definición del objeto de investigación 1.2.1.2.Unidad de investigación 1.2.1.3.Clase de investigación 1.2.1.4 Las fuentes de información

13 15 16 17 17 17 18 20 20 20 21 21 21 22 23 23 23 25 25 26 26 28 28 28 31 31 31 32 32 32

 

3

2.4 1.9 Pictogramas 1. MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES 2.5.2.3.2 Arreglo de tallo y hojas 1.2.2.5.3 1.7 Diagramas de barras 1.5 PRESENTACIÓN DE LA INFORMACIÓN 1.2.3.2.1 Distribuciones de frecuencias 1.2 Según la forma de observación 1.5 Ojiva 1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION ESTADIGRAFOS MEDIA ARITMÉTICA MEDIANA MODA OTRAS MEDIDAS DE TENDENCIA CENTRAL 33 33 33 34 34 35 37 40 40 47 47 48 50 51 52 54 55 58 59 59 60 60 61 64 68 71 81 96 ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD 1 BIBLIOGRAFÍA DE LA UNIDAD UNIDAD DIDACTICA 2 MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES INTRODUCCION A LA UNIDAD OBJETIVOS ESPECIFICOS 2.5.4.5.2.1 1.1.2.5.3 Tabulación de la información 1.1 Desviación típica o estándar 2.5.1.3 1.5. VARIANZA Y DESVIACIÓN ESTÁNDAR 2.1 Según la cobertura 1.2.2.2. ORGANIZACIÓN DE LA INFORMACIÓN 1.1.2 1.2.2.1.2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1. RECOLECCIÓN 1.2.3.4 TABLAS DE DISTRIBUCION DE FRECUENCIAS 1.1.5.3.2.5.1.2.1 MEDIDAS DE DISPERSIÓN Y ASIMETRIA 2.2.3.10 Mapas estadísticos o cartogramas 1.3 COEFICIENTE DE VARIACIÓN Y DESVIACIÓN MEDIA 2.1 Combinación o arreglo ordenado 1.8 Diagrama circular 1.3 Histograma de frecuencias 1.1 Componentes de una gráfica 1.2.3.2.1 RANGO O RECORRIDO 2.2.2.3.2 Diagrama de frecuencias 1.5.3.2.2. Desviación media 98 100 101 102 102 102 104 106 107 108   4 .3.6 Gráficos de línea 1.4 Polígono de frecuencias 1.3.2.

2.CORRELACIÓN 2.3.3.1.REGRESIÓN MÚLTIPLE 2. Porcentaje de desvalorización 2.1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2.3.2.3.5.2 MEDIDAS ESTADÍSTICAS BIVARIANTES 2.5.2.3 Lógica Matemática 2.1.3.1.3.1 Asimetría 2.5.5.Apuntamiento o curtosis 2.3.5.1 REGRESIÓN Y CORRELACIÓN 2. ÍNDICES SIMPLES 2.2 DIAGRAMA DE DISPERSIÓN 2.4.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. porcentaje de variación y de devaluación ACTIVIDADES DE AUTOEVALUACION UNIDAD 2 BIBLIOGRAFÍA DE LA UNIDAD ANEXOA 110 112 112 113 115 116 118 119 120 120 120 121 122 126 129 132 133 134 134 135 140 140 141 141 142 143 153 154   5 .1.3.1.5.5. TIPOS DE NÚMEROS ÍNDICES 2.5.2 Poder de compra o poder adquisitivo o valor del dinero 2.4 Competencias Comunicativas 2.2.1 CONSTRUCCIÓN DE NÚMEROS ÍNDICE 2.1.3 NÚMEROS INDICE 2.1.4 ÍNDICES COMPUESTOS 2.1.5.1.2.3 REGRESIÓN LINEAL SIMPLE 2.5 MEDIDAS DE ASIMETRÍA Y APUNTAMIENTO 2.3.5.3. USOS DE LOS NÚMEROS ÍNDICES 2.7 Herramientas Informáticas 2.4.4 PUNTAJE TÍPICO O ESTANDARIZADO 2.2.3.5. Calculo del salario y del ingreso 2.5 Cultura Política 2.6 Estadística Descriptiva 2.5.5.2.

1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   LISTA DE TABLAS Pág.5. Distribución de frecuencias agrupadas Tabla 3. Distribución de frecuencias simple de visita al odontólogo de niños entre los 6 y 12 años Tabla 2. Distribución de frecuencias simple de latidos cardiacos de 30 personas Tabla 2. Resumen de cálculos. ejemplo 15. Distribución de frecuencias de la asistencia a cine Tabla 3. Ventas por departamento al contado y a crédito en marzo de 2005 Tabla 3. Comparación de la media.9.8.1.6. Clasificación de la estatura de los estudiantes de un grupo de quinto grado Tabla 2. UNIDAD 2 Medidas De Dispersión Y Estadísticas Bivariantes Tabla 4. Número de intervalos de clases sugerido en función del tamaño de la muestra Tabla 2.2 Tabla de Contingencia de Frecuencia Relativas Tabla 1.2.1 Número de egresados de la UNAD en el período 19942004 Tabla 2. Distribución de frecuencias de las calificaciones de estudiantes de Estadística Distribución de frecuencias de las calificaciones de estudiantes de Estadística 103 29 30 30 38 38 39 39 41 43 45 45 49 54 56 63 66 69 69 71 72 76 77 106   6 .10.7. Tabla 4. Egresados de la UNAD en el período 2000-2004 Tabla 2.8.2.11. relativas y acumuladas ascendentes de la velocidad de pulsaciones Tabla 2.3 Tabla de Contingencia de porcentajes Tabla 2.3. Distribución de frecuencias agrupadas de la velocidad de pulsaciones Tabla 2.6.1 Tablas de contingencia Tabla 1.4. Distribución de frecuencias agrupadas de la asistencia a cine Tabla 3.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.2. Distribución de frecuencias absolutas.4. Clasificación de estudiantes por CEAD en la Zona Occidente durante el primer semestre de 2005 Tabla 2.3.4. Distribución de frecuencias agrupadas Tabla 3. UNIDAD DIDÁCTICA 1 Conceptos Preliminares Y Medidas De Tendencia Central Tabla 1. Clasificación de empleados por cargo Tabla 2. Distribución de frecuencias agrupadas Tabla 3. Distribución de frecuencias agrupadas Tabla 3. mediana y moda Tabla 3.5.7.

3.4. Relación de ventas de un producto y la emisión del comercial en televisión Tabla 5.4. Gastos indirectos de producción Tabla 5.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Cálculo de Z para la distribución de frecuencias de las calificaciones de Competencias Comunicativas Tabla 4. Distribución de frecuencias de las calificaciones de primer semestre en Valledupar Tabla 4.2.5. Grado de correlación lineal Tabla 5. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Tabla 4. Precios y cantidades vendidas en una farmacia en 2003 y 2004 115 117 119 124 128 131 138   7 .1. Cálculo de Z para la distribución de frecuencias de las calificaciones de Estadística Descriptiva Tabla 5.3.

Bolivia y Colombia 27 28 36 37 49 50 51 52 53 53 54 55 57 57 58 59 UNIDAD 2 Medidas De Dispersión Y Estadísticas Bivariantes Figura 3.6. Diagrama de barras agrupadas de las ventas por departamento al contado y a crédito en marzo de 2005 Figura 2. Ojiva ascendente de la velocidad de pulsaciones Figura 2. (b) Sesgada a la izquierda. Diagrama de líneas.7.5.12. Diagrama de Barras – Medios de Información Figura 1. Pictograma para el número de árboles talados en Argentina. Diagrama de frecuencias absolutas de visita al odontólogo de niños entre los 6 y 12 años Figura 2.11. Distribuciones sesgadas. UNIDAD DIDÁCTICA 1 Conceptos Preliminares Y Medidas De Tendencia Central Figura 1.1.13. Diagrama de tallo y hojas para los datos de pulsaciones del ejemplo 8.3. Diagrama de doble tallo y hojas para los datos de pulsaciones del ejemplo 8.8.1.1. Polígono de frecuencias absolutas de la velocidad de pulsaciones Figura 2.1. Diagrama de barras segmentadas de las ventas por departamento al contado y a crédito en marzo de 2005 Figura 2.2. Ojiva descendente de la velocidad de pulsaciones Figura 2.14.2. (a) Sesgada a la derecha. Diagrama circular para el estado civil de 1250 aspirantes a empleo Figura 2.2.1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.10. Egresados de la UNAD en el período 2000-2004 Figura 2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   LISTA DE FIGURAS Pág.3. Figura 2.9.2 Diagrama Circular medios Comunicación Figura 2. Curva normal o campana de Gauss Figura 4. Figura 2. Ojiva ascendente y descendente de la velocidad de pulsaciones Figura 2. Histograma de frecuencias absolutas de la velocidad de pulsaciones Figura 2. Curva asimétrica positiva.1. Diagrama de frecuencias absolutas acumuladas de visita al odontólogo de niños entre los 6 y 12 años Figura 2. Diagrama de flujo para el K-ésimo percentil Figura 4. Polígono de frecuencias de calificaciones de Lógica Matemática 70 77 77 110 116   8 .4. Ojiva porcentual ascendente Figura 3. (c) Simétrica Figura 3.

Curva asimétrica negativa. Gráficas de dispersión lineal.5. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 4.3. Gráficas de dispersión. Polígono de frecuencias de calificaciones de Cultura Política Figura 4. (a) positiva. (b) negativa 117 118 120 122 124 126   9 . Curva simétrica leptocúrtica. Polígono de frecuencias de calificaciones de Competencias Comunicativas Figura 4. (c) sin relación Figura 5. (a) lineal.3. Curva simétrica platicúrtica. (b) curvilínea.1. Polígono de frecuencias de calificaciones de Estadística Descriptiva Figura 5.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.4. Diagrama de dispersión de ventas de un producto y la emisión del comercial en televisión Figura 5.2.

Este proceso. etc. Es por ello que con este módulo se pretende que el estudiante se adentre a los conocimientos básicos de la Estadística Descriptiva. es requisito desarrollar una capacidad personal para extraer y describir información presente en un conjunto de datos. Como parte de una base cultural necesaria para desempeñarse en el mundo de hoy. Enfrentarse con datos de muy diversa índole es cosa de todos los días en cualquier práctica del ser humano. abitualmente. El acelerado desarrollo de métodos. administrativas y financieras se basan en resultados obtenidos mediante el análisis estadístico de los fenómenos en ellos involucrados. suele venir precedido de otro: la Estadística Descriptiva. Las interpretaciones que generan los datos pudieran ser erróneas para aquellas personas que no cuentan con criterios válidos para captar la información. intentando descubrir de esta manera posibles relaciones entre los datos. viendo cuáles toman valores parecidos.   10 . llamado Inferencia Estadística. el propósito de la Estadística Aplicada es el de sacar conclusiones de una población en estudio. En todos los campos de la investigación se requiere a menudo el uso racional de los Métodos Estadísticos. cuáles difieren grandemente del resto. el determinar la tendencia de contaminación del agua o el aire. Y es precisamente allí donde resalta la importancia de la Estadística Descriptiva como primer paso en la determinación de decisiones e inferencias que pueden concluirse de la variada información que nos llega en forma de datos numéricos. técnicas y tecnologías para el óptimo análisis de datos justifica que un profesional disponga de una sólida fundamentación conceptual para que realice apropiadamente su evaluación y aporte sustentaciones a su decisión.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. el crecimiento económico de una empresa o el crecimiento de producción y venta de un producto específico. en el que los datos son ordenados. la clasificación de personal en una empresa para efectos de una buena y sana política laboral. Sin embargo. dado la cantidad innumerable de estos. entre otros. no siempre se comprende el real alcance de lo que dicen. Los procesos de planeación. Es muy frecuente encontrarse en las diferentes disciplinas del saber con incertidumbres como el pronosticar el crecimiento poblacional de un país. resumidos y clasificados con objeto de tener una visión más precisa y conjunta de las observaciones. examinando solamente una parte de ella denominada muestra. destacando hechos de posible interés. control y toma de decisiones económicas. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   INTRODUCCIÓN La Estadística es una disciplina que se aplica en muchos campos de la actividad del ser humano. el conocer la efectividad de diferentes abonos en el campo agrario.

y se reconocen cada uno de los pasos a seguir para una correcta y acertada investigación estadística como son la planeación. En esta unidad se identifican algunos conceptos estadísticos como población.. variable. Al final de cada tema. modificaciones y actualizaciones cognitivas y nuevas actuaciones o competencias por parte del estudiante. se trabaja la regresión lineal (simple. Entre las primeras se contemplan las medidas de tendencia central. correlacionadas directamente con el número de créditos académicos asignados al curso académico.C. examine y sintetice adecuadamente la información mediante métodos estadísticos sencillos. ponderada y múltiple). discriminar y relacionar los fundamentos básicos de la Estadística Descriptiva. como medidas estadísticas bivariantes. Este texto busca aportar las herramientas teóricas y prácticas a los estudiantes para que logren. la recolección de la información. se incluyen algunos elementos básicos de la matemática: la sumatoria y productoria. mediante análisis cuantitativos. destinadas a potenciar y hacer efectivo el aprendizaje mediante el desarrollo de operaciones. categorías. a través del análisis de datos tomados de un fenómeno propio de su disciplina y que describa. organizados y desarrollados a partir de palabras clave tomados como conceptos que los tipifican. económico y político. Roberto J. Como Anexo y complemento a esta segunda unidad. Este texto contiene dos unidades didácticas1. y es de tipo teórico. la correlación y los números índice. dar las pautas en la recolección planeada de los mismos y proporcionar un conjunto de técnicas a                                                              1 Conjunto de conocimientos seleccionados. la interpretación de diferentes fenómenos propios de su disciplina de formación y del entorno social. La primera de ellas. esta evaluación será retroalimentada en la información de retorno que encontrará al final de cada unidad didáctica. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Con el presente módulo. dato. se busca que el estudiante se encuentre en capacidad de interpretar. El curso académico de Estadística Descriptiva hace parte de la formación básica disciplinar de los programas que oferta la Universidad Nacional Abierta y a Distancia —UNAD—. Salazar Ramos. Consta de dos (2) créditos académicos. encontrará ejercicios de aplicación que buscan evaluar el grado de conocimiento adquirido.   11 . En la segunda unidad didáctica se reconocen algunas de las medidas estadísticas más comunes. en tanto que busca la identificación y el reconocimiento de las problemáticas. métodos y técnicas indispensables para la formación profesional. EL MATERIAL DIDÁCTICO. UNAD.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. las medidas de dispersión y las de asimetría y apuntamiento y. 2004. etc. Apunta al manejo estadístico de datos. su organización y su presentación gráfica. considera los Conceptos Básicos necesarios para el cumplimiento de los propósitos y objetivos del curso. perspectivas teóricas. en articulación con las intencionalidades formativas. Bogotá D. tanto univariantes como bivariantes. el sistema adoptado por la UNAD como estándar curricular en la formación universitaria. conceptos. muestra.

como parte de las diferentes y diversas herramientas didácticas en las que se apoya el aprendizaje autónomo. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   partir de las cuales se logra presentar. el estudiante encontrará las referencias bibliográficas básicas. resumir e interpretar datos que pueden corresponder a una muestra o a un grupo total.   12 . Además. enfocado en el autoaprendizaje y en relación directa con la Guía de Actividades referenciada en el protocolo del presente curso. para que con ellas refuerce en conceptos y definiciones.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. busca entregar los conceptos de un modo más didáctico. Al final de cada unidad. encontrará una serie de páginas web recomendadas que amplían los temas tratados. El módulo no pretende reemplazar las diferentes referencias bibliográficas clásicas de la Estadística. pero no únicas. Se trata pues de un material didáctico de apoyo para el curso de Estadística Descriptiva de la UNAD.

 TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Unidad Didáctica Uno CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL   13 .UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

Lección 11 Estadígrafos.  GENERALIDADES Y VARIABLES  ESTADÍSTICAS  Lección 5 Lección 6 Lección 7 Lección 8 Que es la estadística? Conceptos Básicos Variables estadísticas Caracterización de una variable cualitativa Tablas de contingencia Planeación Recolección. Organización de la información.   INVESTIGACIÓN ESTADÍSTICA  Lección 10 Presentación de la información. Lección 12 Media Aritmética CAPITULO 3. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   UNIDAD 1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Lección 14 Moda Lección 15 Otras medidas de tendencia central.   14 . Tablas de distribución de frecuencias. Lección 9 CAPITULO 2. CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL Lección 1 Lección 2 Lección 3 Lección 4 CAPITULO 1.  MEDIDAS DE TENDENCIA CENTRAL O  DE POSICIÓN    Lección 13 Mediana.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

INTRODUCCIÓN A LA UNIDAD

La investigación estadística es necesaria para cualquier individuo en el mundo de hoy, cualquiera que sean sus actividades siempre hay aplicaciones estadísticas en ellas. Pero cualquier investigación estadística requiere seguir unos pasos y procedimientos establecidos para que esta tenga validez. En esta unidad se desarrollarán en forma introductoria y general algunos conceptos preliminares con el fin de utilizar un mismo lenguaje en cuanto se refiere a esta disciplina. De igual manera, se presentan los elementos iniciales básicos y necesarios para la comprensión y aplicación de la estadística en cualquier campo.

En el capítulo uno se ampliarán algunas definiciones de términos básicos de la estadística como población, muestra, variable, dato, etc., buscando que el estudiante los identifique en ejemplos sencillos de la vida diaria. En el capítulo dos se reconocerán cada uno de los pasos a seguir para una correcta y acertada investigación estadística como son la planeación, la recolección de la información, su organización y su presentación gráfica y en el capitulo III se mencionaran las medidas de tendencia central y de posición para lo cual se hace indispensable recordar algunas nociones aritméticas y algebraicas básicas en estadística, es por esto que se recomienda al lector iniciar el capítulo repasando la sumatoria como propiedad aritmética fundamental para entender las medidas estadísticas de una población o muestra. Todo cuanto tiene que ver con sumatoria y productoria puede ser repasado y consultado en el anexo A, que se encuentra al final del texto.

 

15

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

OBJETIVOS ESPECÍFICOS

• • • • • • • • • •

Conocer el significado de la palabra estadística. Diferenciar entre los conceptos de Estadística Descriptiva y Estadística Inferencial. Establecer los conceptos de población, muestra, variable, dato y parámetro. Identificar las etapas que sugiere una investigación estadística. Manejar los diferentes métodos de recolección de información para la investigación estadística. Advertir la importancia de las distribuciones de frecuencias para la descripción de datos. Aplicar los conceptos de frecuencia, marca de clase y distribución de frecuencias a un conjunto de datos estadísticos. Construir diferentes tipos de distribuciones de frecuencias para conjuntos de datos. Reconocer algunas características que debe tener una gráfica para que represente mejor una situación. Representar calculadas. gráficamente distribuciones de frecuencias dadas o

 

16

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

1. UNIDAD CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL

1.1.

CAPITULO 1. GENERALIDADES Y VARIABLES ESTADÍSTICAS

En un principio se consideraba que la función de la estadística era la descripción de las características de grupo, actividad que la hacia confundir con el papel que cumple la ”historia“ de observar y describir el hecho. En su origen las estadísticas era históricas ; hoy en día, la estadística, además de ser descriptiva, es analítica, considerándose esta ultima como la función mas importante que realiza, ya que permite obtener conclusiones para un grupo mayor, denominado población, partiendo de una investigación realizada en un grupo menor, denominado muestra cuyos elementos se seleccionan aleatoriamente o al azar.

1.1.1. LECCION 1. ¿Qué es la Estadística? Antes de dar a conocer los conceptos de los términos estadísticos que lleven a entablar el lenguaje común que se utilizará en adelante, es necesario saber qué es la Estadística y en qué consiste la Estadística Descriptiva.

Empíricamente se sabe que la Estadística tiene que ver con datos y la manera en que estos son agrupados. Esto se reconoce en muchos casos de la vida cotidiana que involucran información numérica y el contexto en que esta información es dada a conocer. Aunque también puede darse en muchos casos que, si bien están relacionados con la estadística, obedecen a otros fenómenos de disciplinas relacionadas con —pero que no conforman— la Estadística propiamente dicha.

La Estadística es un método científico de operar con un grupo de datos y de interpretarlos.

Si bien esta definición parece un poco ambigua, se verá más adelante el marco en que éste método se desarrolla y las “leyes” que lo rigen. Pero, por ahora, se deja abierta al cuestionamiento del estudiante la gama de posibilidades que abarca esta definición.

La Estadística, o el método de la estadística, se divide en dos ramas: la Estadística Descriptiva o deductiva y la Inferencia Estadística o estadística
  17

individuos u objetos que comparten una característica en común. examinando solamente una parte de la población denominada muestra. ¿qué le corresponde entonces a la Estadística Descriptiva? Esta tiene por fin elevar los aspectos característicos del grupo de datos pero sin intentar obtener más conocimiento del que pueda adquirirse por sí mismos. en qué consiste la Inferencia Estadística. De la población es extraída la muestra. 1. Estos pueden ser experimentales. clasificados. CONCEPTOS BÁSICOS Población es el conjunto de medidas. Los datos son todas aquellas características o valores susceptibles de ser observados. Es por ello que a la Inferencia Estadística también se le conoce como Estadística Analítica.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Este curso se dedica a la Estadística Descriptiva.1. Si esto es así. de encuesta. A este tipo de muestra se le denomina muestra aleatoria. es necesario que la muestra sea seleccionada adecuadamente. Es decir. clasificados y contados. La unidad estadística es el elemento de la población que reporta la información y sobre el cuál se realiza un determinado análisis. Los resultados obtenidos en la muestra sirven para estimar los resultados que se obtendrían con el estudio completo de la población. en términos generales. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   inductiva. Muestra es un conjunto de elementos extraídos de la población. cuando están   18 . o bien puede ser el todo de un análisis básico y limitado del grupo de datos. Para que los resultados de la muestra puedan generalizarse a la población. La población se basa en cuatro características: contenido. cuando se le aplica un tratamiento especial a las unidades muestreadas.2. LECCIÓN 2. Es por ello que la Estadística Descriptiva es el punto de partida del análisis de un grupo de datos que involucran una cierta complejidad. La Inferencia Estadística comprende en un todo articulado el método y las técnicas necesarias para explicar el comportamiento de un grupo de datos en un nivel superior de lo que estos datos pueden dar a conocer por sí mismos. tipo de unidades y elementos.. de modo que cualquiera de los elementos de la población tengan la misma posibilidad de ser seleccionados. cuando son tomadas sin ningún tratamiento. se puede concluir sobre el grupo de datos sobrepasando los límites del conocimiento inicial que estos suministran. es decir. por lo que se hace necesario dar a conocer. ubicación espacial y ubicación temporal.

Variable es una característica susceptible de tener distintos valores en los elementos de un grupo o conjunto. en este caso el objeto de medición es cada uno de los estudiantes seleccionados de la muestra. se ampliará más estos dos conceptos. Por el contrario. decide entonces establecer períodos de tiempo para realizar el conteo. cuando son recopilados por otra persona o entidad diferente al investigador. Parámetro son aquellos valores que caracterizan numéricamente a la población como tal.). • • • • • • En esta investigación se considera que el total de estudiantes del CEAD que hacen uso de la biblioteca es la población en estudio. primarios. pero una población puede tener muchas características —o parámetros— de interés. originales. Como el coordinador zonal de biblioteca no puede revisar todo el día quienes acceden a la biblioteca. El coordinador zonal de biblioteca es designado para este trabajo y decide hacer la investigación el día 14 de mayo de 2005. etc. identifica la ubicación espacial. un estadístico es una magnitud correspondiente a una muestra aleatoria extraída de la población. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   agrupados según una característica determinada. entonces será discreta.   19 . Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas. o secundarios. sólo puede tener un valor de entre cierta cantidad de valores dados.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. En la Unidad Didáctica Dos. por lo que cambiando la muestra cambiará entonces el estadístico (media muestral. El CEAD de San Juan de Pasto. varianza muestral. selecciona una muestra. Cada uno de los estudiantes seleccionados para la observación representa la unidad estadística de estudio de la población. cuando son recogidos. etc. El parámetro poblacional de interés es único (media.1. varianza. EJEMPLO 2. El día 14 de mayo de 2005 indica la ubicación temporal. anotados u observados por primera vez. información que no ha recibido ningún tratamiento estadístico. se ubica la unidad estadística. Si por el contrario. Es común designar los parámetros con letras minúsculas del alfabeto griego y los estadísticos con letras de nuestro alfabeto. Identificada la población y la muestra. La Universidad Nacional Abierta y a Distancia UNAD desea establecer cuántos estudiantes hacen uso de la biblioteca en el CEAD de San Juan de Pasto. entonces esta variable será continua. En otras palabras.). En pocas palabras se puede decir que parámetro es a población como estadístico es a muestra.

Después de esto el coordinador selecciona los datos necesarios para el estudio. la población se encuentra organizada por algún código ya sea por fecha. edad.2. tiene igual probabilidad de ser seleccionada.2. etc. pues debe estar formada por un número razonable de elementos y aleatoria porque debe ser escogida al azar. Representativa.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. En este caso. libros más consultados. 1. el coordinador zonal puede además. tomar otro tipo de datos como sexo.3 Muestra Aleatoria sistemática Cuando los elementos son seleccionados de una manera ordenada. 1. hora. El muestre aleatorio puede ser: 1.1.2.1.1 Aleatoriedad Y Representatividad de la muestra La muestra asociada a un estudio debe ser representativa y aleatoria.   20 . de tal manera que quien realiza el estudio no pueda influir en la elección de los individuos por encuestar.1. razón por la cual visita la biblioteca. Sin embargo. orden de llegada o algún otro aspecto. del mismo tamaño. Cada elemento de la población debe tener la misma oportunidad de ser seleccionado. una variable discreta. en este caso específico sólo requerirá del número de estudiantes que acceden a la biblioteca. como se puede ver. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • • Y la variable será el número de estudiantes seleccionados de la muestra.2 Muestra aleatoria simple Si cada posible muestra de la población.

Una muestra de conglomerados usualmente. 1. se divide la población en grupos que sea conveniente para el muestreo. se selecciona una parte de los grupos al azar o por un método sistemático.6.2.1. por último.2.1. Si la población no tiene ninguna organización interna.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.4 Muestra Aleatoria Estratificada Cuando la selección tiene en cuenta los diferentes grupos o estratos que conforman la población. El comité científico de una reconocida multinacional de medicamentos desea promover un producto que ha sido efectivo en el tratamiento de la malaria en varios países. Luego.5 Muestra Aleatoria de conglomerados Si para su selección se tiene en cuenta el siguiente procedimiento: En primer lugar. Determinar: población. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   La manera en que se realiza la selección depende del número de elementos en la población y el tamaño de la muestra.1. EJEMPLO 2. de los grupos seleccionados para conformar la muestra. Los estudios de la población. 1. muestra y tipo de muestreo a utilizar • La población está formada por todas las personas que habitan en Colombia   21 . basados en muestras estratificadas usualmente. tienen mayor precisión (o menor error muestral) que cuando se seleccionan por muestreo aleatorio simple. entonces se dice que la muestra puede tomarse de forma aleatoria simple y todos los individuos de la población tienen la misma probabilidad de ser seleccionados en la muestra. se toman todos los elementos. Los elementos de la muestra se seleccionan de cada grupo en forma aleatoria o por un método sistemático.2. Para esto dicho comité decide realizar una campaña en seis hospitales que están ubicados en tres de las zonas colombianas donde se ha detectado la enfermedad.2. produce un mayor error muestral que una muestra aleatoria simple del mismo tamaño. 1. o parte de ellos al azar o por un método sistemático.

la muestra será tomada de forma aleatoria simple. lo cual indica que no se requiere de una estratificación. Dado que la población está dividida en tres grandes zonas. Por ello.1. la muestra será tomada de forma estratificada.3. o si pertenecen a una pregunta cuya respuesta tiene un valor correspondiente a una escala numérica. el director de un hospital realizará un estudio relacionado con el tipo de sangre que ellos tienen Dada la gran cantidad de pacientes a los cuales se les presta el servicio. la característica fundamental del estudio (el tipo de sangre) hace que no haya una distinción especial en la población. la costa atlántica y la Amazonía. LECCIÓN 3. Las zonas de mayor registro de contagio en Colombia son la costa pacifica. Una variable es estadística.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. es posible seleccionar dos hospitales por zona y luego en forma aleatoria. VARIABLES ESTADÍSTICAS Una variable es una característica que va a sr estudiada en una población. Determinar: población. EJEMPLO 2. La muestra estará formada por los pacientes seleccionados en los seis hospitales y que además tienen la enfermedad. 1. La muestra estará formada por los 400 usuarios encuestados. Por ello. si se puede escribir como una pregunta cuyas respuestas pueden ser tabuladas o clasificadas en determinados rangos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • y que han contraído la malaria. decide encuestar a 400 de los usuarios que normalmente acuden al hospital en un mes. • En este caso. se puede seleccionar la muestra.3. Las variables estadísticas se clasifican en cualitativas y cuantitativas   22 . muestra y tipo de muestreo a utilizar • La población incluye a todos los usuarios que normalmente acuden al hospital en un periodo de un mes. Para mejorar el servicio a los usuarios.

1. lo cual indica que n unidades de medida están representadas en el gráfico e una sola.2 VARIABLES CUANTITATIVAS Una variable es cuantitativa si la característica que se va a estudiar se pude medir en una escala numérica.1. en las cuales el individuo que suministra la información pueda elegir una de ellas. por ejemplo: tipo de sangre. entonces será discreta. preferencias u opiniones.1 VARIABLES CUALITATIVAS Una variable es cualitativa si en la característica que se va a estudiar se busca conocer gustos. 1.3 ESCALA DE MEDIDA DE VARIABLES Una escala es la relación numérica entre la longitud real y la longitud que se asigna en el plano en el cual se va a representar su gráfica. • Si por el contrario. de tal manera que sea posible asignarles una escala a todos.   23 .. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1. Una variable cualitativa es estadística cuando es posible clasificar los datos obtenidos de la muestra en clases bien definidas. color de cabello. etc.3. entonces esta variable será continua.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.3. sólo puede tener una valor de entre cierta cantidad de valores dados. • Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas. gaseosa preferida. Los datos asociados a un estudio deben estar en las mismas unidades. Cuando una variable es cualitativa es necesario determinar las posibles respuestas. La notación de una escala es de la forma 1 : n.3.1. 1. Las variables cuantitativas pueden ser consideradas en diferentes escalas teniendo en cuenta las unidades asociadas a la población que se encuentra en estudio.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.1. la variable estatura es cuantitativa y continua ya que los datos que resultan son números reales. El número de hermanos de cada jugador del equipo de futboll.2. 5.   24 . La variable es consumo de gas. se decidió preguntar por el tipo de variedad que más consumen sus clientes. En un barrio de la ciudad se aplicó una encuesta para conocer el consumo. 4. es posible considerar las mediciones en centímetros o en metros. En un café gourmet. Determinar si es cualitativa o cuantitativa. Es cualitativa. 2. En cada una de las siguientes situaciones. en centímetros cúbicos. La variable es situación de violencia. La variable es número de hermanos. 4. del servicio de gas natural. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   EJEMPLO 3. Solución 1. La variable es variedad de café. Es cualitativa 3. Suponiendo que los estudiantes de primaria tienen alturas entre 100 cm y 140 cm la representación gráfica de la escala 1:10 es la siguiente: _ EJEMPLO 3. El profesor de educación física puede usar un escala de 1 : 10 en la cual cada 10 centimetros de ltura están representados en 1 cm del gráfico. El alcalde de la ciudad quiere revisar la situación de violencia intrafamiliar en las familias de estrato 3. Es cuantitativa y continua 2. 1. 3. En este caso. identificar la variable de estudio. Es cuantitativa y discreta 4. Los profesores de Educación Física de un colegio medirán la estatura de los niños de secundaria en cada uno de los grados.

de tal manera que al obtener una lista de preferencias. LECCIÓN 4. Para ello. cada opción de respuesta de la variable se relaciona con el número de datos correspondiente. cualidades o gustos. Se obtuvo la siguiente lista de datos. según algunos parámetros establecidos. De acuerdo con el tipo de variable estadística que se desee estudiar existen distintas técnicas para caracterizarla. Para caracterizar una variable cualitativa se utilizan tres herramientas: • • • Tablas de frecuencias Representaciones gráficas La moda 1.4. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1.4.1. EJEMPLO 4. CARACTERIZACIÓN DE UNA VARIABLE CUALITATIVA Caracterizar una variable significa describir su comportamiento en la población. realizó un estudio a cuarenta personas a quienes se les preguntó por su medio de información de noticias preferido. sobe las noticias del país. se pueda analizar su comportamiento en la población. Una tabla de frecuencias contiene:   25 . Una agencia de noticias quiere saber cuál es el medio de comunicación por el cuál se informan las personas.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.1.1. puesto que pregunta por el medio de información. El tipo de variable que se registra en este estudio es cualitativa. El estudio de una variable cualitativa requiere de la incorporación de algunos criterios.1 TABLAS DE FRECUENCIAS: Una distribución o tablas de frecuencias es un resumen de los datos en el cual.

gustos. en la tabla anterior se puede apreciar que: • • La mayoría de personas el 37. La frecuencia relativa representa un porcentaje. preferencias. Hay varios tipos de representaciones gráficas para las variables cualitativas: los diagramas de barras.4.5% de personas que se informan de las noticias haciendo uso de la radio o de la prensa. Frecuencia: es el número de datos que pertenece a cada clase. La siguiente tabla de frecuencias corresponde a los datos de la variable medio de comunicación del ejemplo 4. Hay un 52. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Clases: que corresponde a opiniones.1. La frecuencia se simboliza con f .5% se informan de las noticias por medio de la televisión y la menor cantidad un 10.   26 .4.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. que se haya multiplicando por 100 al cociente indicado de la frecuencia relativa. Por ejemplo. 1. se simboliza fr .2. para deducir cuales son las principales características de la variable en estudio.1 Diagramas de barras: un diagrama de barras es una representación gráfica de los datos asociados a una variable cualitativa.2 REPRESENTACIONES GRAFICAS: Un gráfico estadístico es un resumen visual de la tabla de frecuencias. 1.1 Es necesario interpretar la información contenida en las tablas de frecuencia.1.8% se informa haciendo uso de la internet. Frecuencia Relativa: es el cociente entre la frecuencia y el número total de datos. cualidades o características. los diagramas circulares. entre otros. El conteo de la frecuencia de cada clase se puede registrar mediante marcas en grupos.

2 Diagrama Circular: un diagrama circular es la representación gráfica de los datos en un círculo. por lo cual es necesario hallar el ángulo correspondiente a cada frecuencia.1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   La gráfica se realiza en sistema de coordenadas cartesianas.2)   27 . (ver figura 1. El diagrama circular presenta los porcentajes correspondientes a cada clase. la información correspondiente a cada clase se representa usando sectores circulares. El diagrama de barras (figura 1. en el eje horizontal se representan las clases correspondientes a la variable y en eje vertical se representan las frecuencias correspondientes a cada clase. En un diagrama circular.2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.4.1) correspondiente a la variable medios de comunicación de nuestro ejemplo es el siguiente: FIGURA 1.1 1.

La tabla de contingencia. es decir. Hay estudios en los cuales no existe la moda.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. y hay casos en los cuales existen varias modas. ya que tiene en cuenta las diferentes clases que se pueden establecer para cada una de las variables en estudio. ya que corresponde al 37.5. Para el ejemplo 4. En general. si se encuesta a una persona al azar la probabilidad que se informe por las noticas es alta.3 MODA La moda es el dato que tiene mayor frecuencia.1.4.1.   28 . ya que la información contenida en cada una de las casillas corresponde a la cantidad de personas o individuos que poseen ambas características.1. pues varias clases pueden tener la misma frecuencia. la moda corresponde a informarse de las noticias por medio de la televisión.2 1. LECCIÓN 5. la tabla de contingencia ofrece una completa distribución de la información. es decir. TABLAS DE CONTINGENCIA: En una tabla de contingencia o tabla cruzada las filas corresponden a las clases de una variable cualitativa y las columnas corresponden a las clases de la otra variable cualitativa. 1. también es una tabla de frecuencias. ya que todas las clases tiene una misma frecuencia. el dato que mas se repite. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   FIGURA 1.5% del total.

Los resultados se muestran en la siguiente tabla de contingencia. se podrían proponer a los estudiantes de una universidad. como en la suma correspondiente a la variable deporte preferido (horizontal). Las sumas de columnas corresponde a la cantidad de personas que prefieren cada uno de los deportes sin distinguir el género.1. correspondiente. (ver tabla 1. Con el fin de determinar que materias opcionales. A partir de la información de la tabla anterior se puede construir la tabla de   29 .1 TABLAS DE CONTINGENCIA En la tabla de contingencia se observa: Hay dos variables cualitativas que son género y deporte favorito • • • • • • • Para la variable género hay dos clases hombre y mujer En la variable deporte preferido hay 5 clases: futbol. Se puede decir que participaron 72 hombres y 82 mujeres en el estudio. para ello. En ambos casos. voleibol. sin discriminar el deporte preferido. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   EJEMPLO 5.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 29 personas prefieren el voleibol. El número total de personas que participaron en el estudio debe ser igual tanto en la suma correspondiente a la variable género (vertical). 19 el atletismo y 18 personas prefieren otros deportes. en deportes. hizo una encuesta entre 156 estudiantes de varias carreras y se les preguntó acerca de su deporte preferido para practicar en tiempo libre. se hizo necesario hacer un estudio acerca de la actividad física que ellos realizan en su tiempo libre. la suma es 156 personas. Por ejemplo el número 38 corresponde al número de mujeres que prefieren el baloncesto. al cruce de las clases de las dos variables en estudio. 52 personas prefieren baloncesto.1) TABLA 1. Por ejemplo: hay 38 personas que prefieren futbol. baloncesto. atletismo y otros. Las sumas de filas corresponde a la cantidad de hombres y a la cantidad de mujeres que participaron en la encuesta.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.85% de los hombres se inclinan por el atletismo y el 1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   contingencia de frecuencias relativas . TABLA 1.36% de la personas que fueron encuestadas fueron mujeres que prefieren practicar el baloncesto El 3.92% de las mujeres prefieren el futbol.33%. es el baloncesto con un 33.3 TABLA 1. los mas bajos y aquellos que tiene mayor representación. • • • El 24.3 TABLA DE CONTINGENCIA DE PORCENTAJES Un buen análisis incluye la descripción de los porcentajes más altos. en este caso se debe escribir un cociente entre la información contenida en cada celda y el número total de personas que participaron en la encuesta. el cual es el porcentaje mas bajo de la muestra El deporte que mas practican independientemente del género.2 TABLA DE CONTINGENCIA DE FRECUENCIA RELATIVAS Ya que cada uno de los cocientes mostrados tiene su equivalencia en porcentaje. se puede construir la tabla de contingencias de porcentajes como se muestra en la tabla 1.   30 .

La investigación estadística puede ser tan sencilla y poco compleja como la recopilación ordenada y coherente de datos que se encuentren en instituciones estatales o privadas que las suministren. y que genera muy variadas funciones. sea como fuere. o inclusive para un país. o bien pueden ser tan elaboradas y complejas como lo son los censos poblacionales. el fin que persigue. es una operación compleja.2. 1. los censos agrícolas o industriales que tengan importancia estratégica para una región. la fuente o fuentes de información. A continuación se presentan algunos aspectos básicos que se deben seguir para desarrollar un trabajo así. de la naturaleza de los fenómenos que se desean estudiar y de la facilidad que se tenga para observar los elementos.1.2. es por ello que no puede haber ambigüedad en sus planteamientos y alcances. procedimientos y acciones que conlleven a la resolución satisfactoria para la cual se estableció la investigación. por sencilla que sea. LECCION 6. PLANEACIÓN La planeación de una investigación estadística debe abarcar el conjunto de lineamientos. los procedimientos a seguir y resolver los aspectos logísticos. CAPITULO 2 . que requiere atender múltiples aspectos.1.1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Es este punto el núcleo de la investigación.   31 . 1. Es por ello que el plan de investigación debe fijar concretamente su objeto. la investigación debe seguir una orientación en su planteamiento y resolución. debe también restringir el espacio físico o geográfico donde se llevará a cabo. físicos y humanos siguiendo un presupuesto de costos establecido. El resultado depende en gran parte de la finalidad que se persiga.INVESTIGACIÓN ESTADÍSTICA La investigación estadística.2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1. Definición del objeto de investigación Debe responder el qué. Pero. el cómo y establecer el momento correcto para hacerse.

información cotidiana y fácil de identificar. Este tipo de fuentes son las mejores. adecuada. Cuando los datos son primarios. provocada por el investigador en condiciones controladas.3 Clase de investigación En la planeación. pero no siempre son posibles.4 Las fuentes de información Después de determinar el qué y el por qué de la investigación estadística. De igual manera. ellos pueden provenir de muchas fuentes como: hechos. y a veces en el número.2.1. La unidad o elemento de investigación debe ser clara. debe también tenerse en cuenta el tipo de investigación que se va a realizar. es necesario delimitar esta unidad en el tiempo y en el espacio.2. referidos a lo que la gente piensa respecto a algo. cuando los datos son recopilados por la misma entidad en los registros básicos de la misma organización. se debe preguntar el dónde conseguir la información requerida. experimental o controlada. Ésta puede ser descriptiva. o bien. en la que se busca conocer por qué causa se produce un caso particular. aquella donde el hecho se refleja.1. o bien pueden provenir de una fuente   32 . definir qué aspectos de la unidad de investigación son cuantitativos (registrados por medio de números) o cualitativos (recogidos mediante anotaciones literarias). TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1. motivos. 1. explicada o analítica. que permite establecer comparaciones y verificar hipótesis. Unidad de investigación Se trata del elemento de la población que origina la información.1.2. Se trata entonces de definir las fuentes de información. opiniones.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Estas pueden ser directas o indirectas.2. En muchos casos este tipo de fuentes son complementarias de las primeras. Una fuente de información estadística directa es aquella en donde el hecho se produce. se emplea una fuente de información estadística indirecta. Cuando no sea posible. es decir. Debe determinarse la naturaleza cuantitativa o cualitativa de esta unidad. También ha de considerarse la posibilidad o viabilidad de la investigación y si estos aspectos pueden ser conocidos con precisión. mesurable y comparable. 1. Cuando son secundarios ellos provienen de una fuente interna. razones que explican por qué se actúa de una manera u otra. que consiste en obtener información con respecto a grupos.

2. mayor rapidez y menor número de personas que intervienen en la investigación. por encuesta o tomada de publicaciones y/o fuentes confiables que han efectuado investigaciones estadísticas. Este método se basa en el registro de los eventos que ocurren.2. cuando cada uno de los elementos tiene la misma probabilidad de ser escogido obteniendo así una muestra aleatoria. se dice que se toman los datos por encuesta. etc. es decir contar con todos los elementos de las fuentes de información. de manera caprichosa. que se clasifican según su cobertura y según su forma de observación. entrevista. en donde la medición se realiza sin que la fuente de información se dé cuenta del hecho. 1. Para esto se selecciona el método de recolección de la información acorde a las necesidades de la investigación. cuando los datos se recopilan por otra entidad diferente a la que hace la investigación. 1. entrega personal de cuestionario. de manera que las muestras no son seleccionadas aleatoriamente y los resultados no ofrecen confiabilidad alguna. por conveniencia o por cuotas. comienza la recolección de los datos.3 Según la cobertura Se trata de decidir si se va a estudiar a la población en su totalidad o sólo una parte de ella. teléfono.2. motivación. se hace una enumeración parcial de las fuentes de información. Esta consiste en un conjunto de operaciones de toma de datos que puede ser por observación. se usa el muestreo. Si. El muestreo puede ser de dos tipos: muestreo probabilístico o al azar. en cambio. Si se hace de manera que la fuente de información se da cuenta de la medición que efectúa. Éstas se pueden realizar por correo.2.2. y muestreo no probabilístico.4 Según la forma de observación En este método se tiene en cuenta la forma de medición del dato. por ejemplo cuando se examina el número de estudiantes que entran a la biblioteca   33 . TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   externa.2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 1. Por su menor costo. se usa el censo. LECCION 7 RECOLECCIÓN Después de planeada la investigación. cuando el investigador selecciona los datos a su propio criterio. Si lo que se desea es atender a una cobertura total. el muestreo es el método más utilizado. El otro método de recolección de información es por observación.

A continuación se hace un acercamiento a las diferentes formas de organizar los datos estadísticos tomados en el proceso de recolección de una investigación estadística.2. 1. La organización hace referencia al arreglo de los datos en un formato lógico para su interpretación. LECCION 8 ORGANIZACIÓN DE LA INFORMACIÓN Luego de tomar la información necesaria en la investigación que se sigue. La organización y el resumen de la información son dos procesos distintos que se desarrollan por separado. EJEMPLO 8. De ahí que se tome primero la forma de organizar la información tomada en una investigación estadística. permite un rápido análisis e interpretación de estos.3. Los siguientes datos representan la evaluación de los latidos cardíacos de un grupo de 30 personas después de cierta actividad física. simplemente se observa la acción del estudiante al entrar a la biblioteca: si hace o no la consulta que se investiga.1 Combinación o arreglo ordenado El sólo hecho de tener ordenado un conjunto de datos en forma ascendente o descendente. 82 82 91 87 110 95 95 82 80 60 92 70 94 68 75 62 85 76 58 88 85 84 88 76 64 92 95 91 85 74   34 . el resumen implica la condensación de varias mediciones en una forma compacta. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   con el fin de hacer una consulta referida a las Ciencias Sociales. La información estadística puede organizarse de diversas maneras: ordenando el conjunto de datos como una combinación ordenada o en un arreglo denominado tallo y hojas. ya sea gráfica o numéricamente.2.1. Para esto se debe depurar y clasificar la información aplicando técnicas adecuadas. se obtiene una gran cantidad de datos que requieren ser interpretados y sobre los cuales se busca concluir algo específico.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.4. En cambio. Este método puede ser también indirecto cuando la recolección consiste en corroborar los datos que otros han observado. otro de los métodos usados es el uso de tablas y más específicamente la tabla de frecuencias. 1.

 TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Es muy poca la información que arroja este conjunto de datos cuando se encuentran sin un tratamiento. unidades o décimas.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. pero 110 se encuentra más alejado del grupo de datos. es decir hay una cierta continuidad en los valores entre 58 y 95. A continuación estos datos son presentados como una combinación ordenada en forma ascendente (de menor a mayor): 58 60 62 64 68 70 74 75 76 76 80 82 82 82 84 85 85 85 87 88 88 91 91 92 92 94 95 95 95 110 A partir de esta lista ordenada se pueden concluir varias cosas: • • • • • • La más alta evaluación de latidos es 110 La más baja evaluación de latidos es 58 La mitad de la combinación se encuentra entre 82 y 85 Hay una predominancia en los latidos con una evaluación entre 80 y 95 Hay un “vacío” entre el valor 95 y el valor 110. denominada tallo. Sin embargo.. En   35 .2. Tomando la serie de datos del ejemplo 8. Estos números representarán el tallo. La primera. Para una mejor ilustración. se puede observar que éstos tienen un rango desde los cincuentas hasta los ciento diez. llamada hojas.2 Arreglo de tallo y hojas El arreglo de tallo y hojas es una técnica que resume de manera simultánea los datos en forma numérica y presenta una ilustración gráfica de la distribución. Es posible que esta persona tenga perturbaciones cardíacas. irán las correspondientes decenas. 1. Hay una evaluación atípica dentro del grupo de 30 personas. el que registra el valor 110. en el siguiente ejemplo se continuará con los datos del ejemplo 8. es necesario ampliar la información antes de lanzar un juicio apresurado. Ellos se pueden presentar como un arreglo de tallo y hojas en una columna de números del 5 al 11 y trazando una línea vertical a su derecha. corresponderá a las decenas.4.2.1. Se trata de organizar los datos numéricos en dos columnas divididas por una línea vertical. Para construir el correspondiente arreglo de tallo y hojas. centenas o unidades que representan el grupo de datos y en la segunda. EJEMPLO 8.1.

se enlistan las unidades (de manera ordenada) de cada uno de los datos registrados y correspondientes con su respectiva decena. 8. La primera posición del tallo dispone las hojas 0. en grupos de cinco hojas. 9. se usa un diagrama de doble tallo. • • • La mayoría de los registros de latidos cardiacos del grupo de 30 personas se encuentra entre los ochentas. Tallo 5 6 7 8 9 10 11 Hojas 8 0 2 0 4 0 2 1 1 0 4 5 2 2 8 6 2 2 6 4 4 5 5 5 5 5 5 7 8 8 Observe que el diagrama de tallo y hojas al mismo tiempo que ordena los datos de forma ascendente. 3. Diagrama de tallo y hojas para los datos de pulsaciones del ejemplo 8. 7. 4. Que consiste en dividir en dos cada posición del tallo.1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. y se resalta cómo el valor de 110 se encuentra aislado del resto de conjunto de datos. 1.   36 . permite una visualización del comportamiento de estos. Se ve más claramente el “vacío” que existe entre los valores 95 y 110. Con este se pueden confirmar muchas de las afirmaciones que se hacían en el ejemplo 8.1. y la segunda posición dispone las hojas 5. La forma general del conjunto de mediciones es asimétrico.1. Si se quisiera clasificar más ampliamente los datos. 6. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   la columna de las hojas. Figura 2. 2.

1. Tallo 5 5 6 6 7 7 8 8 9 9 10 10 11 Hojas 8 0 8 0 5 0 5 1 5 2 4 6 2 5 1 5 4 6 2 5 2 5 2 7 2 4 8 4 8 0 Observe ahora que esta subdivisión más fina entrega más detalles del conjunto de datos.2. Por ejemplo. En ellos se plasman las series estadísticas.4. una sucesión de datos referentes a un fenómeno observado a través del tiempo y del espacio. el número de egresados de la UNAD en el período 1994-2004 (ver tabla 2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 2.)   37 .2. Diagrama de doble tallo y hojas para los datos de pulsaciones del ejemplo 8. Una serie cronológica es aquella donde se analiza un fenómeno a través del tiempo en un espacio determinado.1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. ¿Qué puede concluir usted? 1.3 Tabulación de la información Una de las mejores técnicas usadas en la estadística es la elaboración de tablas o cuadros.

2. el total de estudiantes de la UNAD en la Zona Occidente en el primer semestre de 2005. Número de egresados de la UNAD en el período 1994-2004 Año 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 Total Número de egresados 338 424 556 971 1358 2119 3328 4357 3400 3697 4774 25322 Una serie espacial es aquella donde se estudia un fenómeno a través del espacio en un tiempo determinado.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Tabla 2. Clasificación de estudiantes por CEAD en la Zona Occidente durante el primer semestre de 2005 CEAD Medellín Pereira La Dorada Turbo Total Número de estudiantes 1507 1850 350 371 4078   38 .1. Por ejemplo. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Tabla 2.

 TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Una serie cualitativa es aquella donde se estudia un atributo o característica de la población investigada. Clasificación de empleados por cargo Cargo Administrador Jefe de producción Contador Secretaria Supervisor Operario Vigilante Total Cantidad 1 1 1 2 5 45 3 58 Una serie cuantitativa es aquella donde se expresa numéricamente un atributo o característica de la población en estudio.4. Tabla 2. los empleados de una empresa clasificados por cargo. Por ejemplo. la estatura en centímetros de un grupo de estudiantes de quinto grado. Clasificación de la estatura de los estudiantes de un grupo de quinto grado Estatura (en centímetros) 125 — 129 129 — 133 133 — 137 137 — 141 141 — 145 145 — 149 149 — 153 Total Número de estudiantes 1 4 9 24 28 22 12 100   39 . independiente del tiempo y del espacio. independiente del tiempo y del espacio. Por ejemplo.3.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Tabla 2.

pues permite conocer el comportamiento de un conjunto determinado de datos y no se ocupa de detalles individuales que.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. organice los datos en una distribución de frecuencias simple.5 LECCIÓN 9 TABLAS DE DISTRIBUCION DE FRECUENCIAS 1. en muchos casos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1.. EJEMPLO 9. Un conjunto de datos puede organizarse de diferentes maneras. Y para ello se parte del concepto básico en la distribución de frecuencias: el número de veces que un dato se repite de un conjunto de datos se le denomina frecuencia. Una de ellas es construir una distribución de frecuencias simple.1. que indica las frecuencias con que aparecen los datos.2.   40 . Es este el tipo de distribución de frecuencias más utilizado en estadística. es necesario manejar algunos conceptos con suficiente claridad.1.4. Continuando con la serie de datos del ejemplo 8.2. poco puede ayudar en la toma de decisiones.1 Distribuciones de frecuencias Una tabla de frecuencias es otro de los formatos que se usan para organizar y resumir los datos. Para comprender la técnica de la distribución de frecuencias y dominar sus aplicaciones.

Clase es. El rango o recorrido es la diferencia entre los valores extremos de todo el conjunto de datos. Distribución de frecuencias simple de latidos cardiacos de 30 personas Velocidad de pulsaciones 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 Velocidad Frede cuencia pulsaciones 1 76 0 77 1 78 0 79 1 80 0 81 1 82 0 83 0 84 0 85 1 86 0 87 1 88 0 89 0 90 0 91 1 92 1 93 Velocidad Frede cuencia pulsaciones 2 94 0 95 0 96 0 97 1 98 0 99 3 100 0 101 1 102 3 103 0 104 1 105 2 106 0 107 0 108 2 109 2 110 0 TOTAL Frecuencia 1 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 30 Observe que esta manera de agrupar se vuelve engorrosa cuando se tienen muchísimos datos. El valor correspondiente al punto medio de un intervalo de clase es la marca de clase y su valor es igual a la mitad de la suma de los límites de clase del intervalo de clase. Y se interpreta como el valor que corresponde asignar a cada uno de los elementos del intervalo de clase. entonces. un grupo que presenta una característica común cuantificable del conjunto de datos. La diferencia entre estos límites en cada intervalo de clase se denomina ancho.5. Cada intervalo de clase está limitado por dos valores. que indica las frecuencias con que aparecen los datos agrupados en lo que se denomina intervalos de clase. en él se encuentran distribuidos todos los datos. Otra forma de organizar un conjunto de datos es construir una distribución de frecuencias agrupadas.   41 . llamados límites de clase (límite inferior y límite superior).UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. tamaño o amplitud del intervalo de clase. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Tabla 2.

De manera que el rango es alterado y requiere. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   En la construcción de la distribución de frecuencias se deben responder a estos interrogantes fundamentales: ¿Cuántos intervalos de clase crear?. y que permite sugerir el número de intervalos de clase que debe usarse de acuerdo al tamaño de la muestra. viene dado por: k = 1 + 3. Los intervalos de clase tienen por lo general el mismo ancho. A. Sturges en 1926). se tendrá entonces un exceso que deberá distribuirse entre el límite superior y el límite inferior. Este exceso es calculado restando el rango del nuevo rango. efectuar un ajuste: R * = ( A)( k ) • Con este nuevo rango. Esta regla afirma que el número de intervalos de clase (k).322 log n donde n es el tamaño de la muestra. Este número depende de la cantidad de datos disponibles. conviene redondear al entero superior. por tanto. Una de las técnicas usadas es la Regla de Sturges (desarrollada por H. De esta manera. ¿Cuál debe ser el tamaño de cada intervalo?.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. • • Hallar el rango (R) o recorrido del conjunto de datos. Si este cociente no es un entero. • Hallar el ancho o amplitud del intervalo de clase (A).6. el cálculo del número de intervalos de acuerdo al tamaño de la muestra. de modo que al fijarse el número de clases se obtiene éste por una operación aritmética simple: A= R k donde R es el rango o recorrido y k es el número de clases. Exceso = R − R *   42 . Seleccionar el número de intervalos de clase (k). Si de este cálculo resulta un número decimal.6. éste de redondearse al entero superior. puede determinarse bien por la Regla de Sturges o bien por la tabla 2. ¿Qué propiedades posee cada intervalo? Las siguientes pautas resuelven estas inquietudes. Esta fórmula ha sido usada para obtener los números de intervalos de clase que aparecen en la tabla 2.

En general. es decir. Número de intervalos de clases sugerido en función del tamaño de la muestra Número de Tamaño muestral intervalos de clase Menos de 16 Datos insuficientes 16 – 31 5 32 – 63 6 64 – 127 7 128 – 255 8 256 – 511 9 512 – 1023 10 1024 – 2047 11 2048 – 4095 12 4096 – 8190 13   43 . • • Determinar la frecuencia de clase. haciendo la salvedad de cuál clase será tomada por dicho límite. no permiten ambigüedad en los límites cuando estos se repiten como inferior de un intervalo y como superior en el siguiente intervalo.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Contando el número de observaciones que cae dentro de cada intervalo de clase. Tabla 2. • Fijar los límites reales de cada intervalo de clase. Estos corresponden al punto medio entre el límite superior de una clase y el límite inferior de la clase siguiente. Dado que los intervalos de clase son mutuamente excluyentes. Se agrega A − 1 al límite inferior de cada clase. esto no quiere decir que sea repartido en partes iguales a los datos extremos. se trata de distribuir el exceso entre el límite inferior y el límite superior de modo que sea considerado la tendencia general de los datos. En muchos casos se permite que se repita el límite superior de una clase y el límite inferior de la clase siguiente.6. Construir la tabla de distribución de frecuencias agrupadas. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Este valor debe distribuirse lo más equitativo posible. • Formar los intervalos de clase. se determinan los límites reales de clase. iniciando por el límite inferior del rango. es considerado el límite superior de la clase como valor de esta.

6. se seguirán los pasos propuestos: • • Rango = 110 – 58 = 52 Número de clases. debe hallarse el nuevo rango: R * = (9)(6) = 54 • Existe pues un exceso de 2. [54 – 52 = 2].1. • Intervalos de clase. esta indica que deben usarse 5 clases.91 ≈ 6 Si se usa la tabla 2. iniciando por el límite inferior del rango. Aplicando la Regla de Sturges: k = 1 + 3. En este caso se trabajará con el resultado que arroja la Regla de Sturges.2. este hubiera sido un número impar. En este caso.322 log 30 = 5.. Así: 57 + 8 = 65 66 + 8 = 74 75 + 8 = 83 84 + 8 = 92 93 + 8 =101 102+8 =110   44 . Para esto.67 ≈ 9 6 Como se ha redondeado. Queda a criterio del investigador la decisión. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   EJEMPLO 9.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Para los datos del ejemplo 8. Se agrega A − 1 = 9 − 1 = 8 al límite inferior de cada clase. Elabore una tabla de distribución de frecuencias agrupada. los datos tienen una mayor tendencia hacia el límite inferior de modo que el exceso mayor se repartiría en él. A= • 52 = 8. • Amplitud de los intervalos de clase. la distribución entre los límites se calcularía considerando hacia dónde se agrupan más los datos. Este exceso debe distribuirse quitando 1 al límite inferior y agregando 1 al límite superior: X mín = 58 − 1 = 57 X máx = 110 + 1 = 111 Si en el cálculo del exceso.

. más aún ¿Qué porcentaje de la muestra presentan.7.5 65. Así: 56 + 57 = 56 . por ejemplo. de distribución de frecuencias   45 .5 74.5 101.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 110.5 – 65. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • Límites reales.. 56. Frecuencias de clase en cada intervalo. se refiere a la frecuencia absoluta. fr = f × 100 n donde fr es la frecuencia relativa de clase.5 2 74 + 75 = 74 . pero si ésta se da en términos del total de frecuencias se tiene entonces la frecuencia relativa.5. f es la frecuencia absoluta de clase y n es el tamaño de la muestra.2..5 – 110.5 2 • 65 + 66 = 65 . Esta se obtiene en porcentaje al dividir la frecuencia de clase entre el número total de frecuencias (o tamaño de la muestra).5 – 83.…. pulsaciones menores de 92.5 Total Frecuencia (Número de personas) 4 3 7 11 4 1 30 Al obtener la tabla de distribución agrupada como en el ejemplo 9.5 83. Tabla 2. 65. Que se obtiene de calcular la suma de cada límite y dividirlo entre dos.7. indica que son 7 personas pero ¿Qué porcentaje es ese? Y.5? La tabla 2.5.8. son muchos los interrogantes que continúan sin responderse como: ¿Qué porcentaje del grupo de personas evaluadas presentan pulsaciones entre 74.5 92.5.5 – 74.5? Cuando se habla de la frecuencia de una clase. En la tabla 2.5 – 101.5 2 . Distribución de frecuencias agrupadas de la velocidad de pulsaciones Intervalos de clase (Velocidad de pulsaciones) 56.5 y 83. 74.5.5 – 92.

la última frecuencia relativa acumulada tendrá un valor del 100%. La última frecuencia absoluta acumulada corresponderá al número total de frecuencias.5 – 110.5. Si la frecuencia absoluta acumulada es ascendente.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. La primera es la acumulación sucesiva en forma descendente o ascendente de las frecuencias absolutas.5 – 83.3% 4 3 10% 7 7 23.5 101.5 y 92.3% registran valores altos.3% 29 1 3. Distribución de frecuencias absolutas. se expresan estos tipos de frecuencia tomando los datos del ejemplo 8.5 Total Frecuencia Frecuencia Frecuencia absoluta (Número de relativa acumulada personas) (%) Ascendente 4 13.3% 30 30 100% Frecuencia relativa acumulada Ascendente 13.5 65.5 – 101. entre 101.5 92.4% 14 11 36. la primera frecuencia absoluta corresponderá a la primera frecuencia absoluta acumulada.4% 96. y así sucesivamente. relativas y acumuladas ascendentes de la velocidad de pulsaciones Intervalos de clase (Velocidad de pulsaciones) 56. De la misma manera. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   agrupadas de los datos del ejemplo 8. Esta tabla arroja información tan completa que permite concluir afirmaciones tales como: • El 36.7% 83.3% 46.1. La segunda acumulada se obtiene sumando las dos primeras absolutas.5 – 65.7% 100% La distribución de frecuencias acumuladas se construye con el cálculo de la frecuencia absoluta acumulada y la frecuencia relativa acumulada. la frecuencia relativa acumulada es una acumulación sucesiva en forma ascendente o descendente de frecuencias relativas.5 74. Si es ascendente. Tabla 2. En la tabla 2.1.3% 23.5 y sólo el 3.7% de las personas evaluadas registran pulsaciones entre el 83. se calculan las correspondientes frecuencias relativas de cada intervalo de clase.5 y 110.5 83.5 – 74.5 – 92.8..   46 .8.7% 25 4 13.

identificar los ejes coordenados (X y Y) e indicar sus magnitudes correspondientes.5? ¿A cuántas personas corresponde? ¿Qué porcentaje registra valores de más de 75? 1. 1. A continuación. Construya la distribución de frecuencias absoluta acumulada descendente y relativa acumuladas descendente con los datos de la velocidad de pulsaciones.2. la ojiva. deben tenerse en cuenta ciertos aspectos con el fin de mejorar su apariencia y mostrar con claridad lo que se quiera que ella refleje.6 Componentes de una gráfica Cuando se diseña una gráfica. ¿Qué porcentaje de la muestra registra valores superiores a 92. esto corresponde al 83. Ya se ha desarrollado todo cuanto tiene que ver con la organización de la información. lineales. que indique de dónde han sido tomados los datos incluyendo el tipo de publicación. el año del registro y otros indicadores que resulten importantes para la investigación. Es decir. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • De las 30 personas. 25 de ellas no superan registros de 92. sea esta cual fuere. sin embargo debe tenerse en cuenta para   47 . se tratarán las partes más fundamentales de una gráfica y los aspectos a tener en cuenta para su construcción. de barras y circulares y los pictogramas. los gráficos de puntos. Una gráfica siempre debe poseer un título que indique la descripción del contenido de ella. es importante indicar la escala con la que se trabaja. que es la mejor manera para resumir una investigación estadística. el polígono de frecuencias. La escala se aplica para saber la dimensión del fenómeno graficado. La forma y el tipo de la gráfica que se seleccione depende en gran parte del investigador o de quien la elabora.2.5 LECCIÓN 10 PRESENTACIÓN DE LA INFORMACIÓN Anteriormente se mencionó que la organización y el resumen de la información son dos procesos distintos que se ejecutan en forma independiente.5. se verá ahora lo que implica el resumen o presentación de la información. Se trata pues de conocer algunas técnicas de construcción de gráficas. Otro aspecto importante a tener en cuenta es la fuente de información. luego se presentarán los distintos tipos de gráficas usadas más comúnmente en estadística entre las cuales se encuentran el histograma. En muchas ocasiones.4% del total.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 pulsaciones.

1.7 iagrama de frecuencias Los diagramas de frecuencia se representan por medio de líneas verticales. La mejor gráfica es la más sencilla. estas deben estar enumeradas en forma consecutiva. leyendas. el lugar de exposición y otros factores de logística que intervienen en la decisión del mejor diseño.2. Este último diagrama. Existen ciertos principios generales que se deben tener en cuenta en el logro de una buena gráfica: • • • • • • • • • • Si en la investigación se tienen varias gráficas. genera una serie de líneas horizontales que dan la sensación de los peldaños de una escalera. deben ser más gruesas que las demás. Haga uso de sólo lo estrictamente necesario. notas. La lectura de la escala del eje horizontal se hace de izquierda a derecha y la del eje vertical se hace de abajo hacia arriba. debe ser el complemento. ya sean absolutas o relativas. En toda gráfica se debe explicar la fuente de donde fueron obtenidos los datos. esta se hará por medio de líneas horizontales. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   quién va dirigida ésta.   48 . Toda gráfica debe tener un título que aclare su contenido. Si la representación se refiere a las frecuencias acumuladas (absolutas o relativas). Las gráficas nunca preceden al texto. ubicando en el eje vertical los valores de la frecuencia acumulada. denominado diagrama de frecuencias acumuladas. aclarar las escalas.5. Evite saturar la gráfica de datos o textos innecesarios. llamadas y convenciones que ayuden a identificar e interpretar las características presentadas. las líneas de la ordenada y la abscisa que llevan escala. La gráfica no sustituye el cuadro o la tabla. En los diagramas.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. La representación del hecho debe variar sólo en una dimensión. Toda gráfica debe ir acompañada de convenciones para identificar las características que se grafican. cuya altura está dada por los valores de las frecuencias.

Diagrama de frecuencias absolutas de visita al odontólogo de niños entre los 6 y 12 años Frecuencia 10 9 8 7 6 5 4 3 2 1 0 0 2 4 6 8 10 12 14 Edad   49 .UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Construya un diagrama de frecuencias absolutas y un diagrama de frecuencias absolutas acumuladas. Distribución de frecuencias simple de visita al odontólogo de niños entre los 6 y 12 años Edad del niño (Años) 2 3 4 5 6 7 8 9 10 11 12 Total Frecuencia absoluta (Número de visitas) 3 1 2 3 7 9 4 0 1 0 0 30 Frecuencia absoluta acumulada 3 4 6 9 16 25 29 29 30 30 30 Esta tabla de frecuencias indica las veces que un grupo de 30 niños de 6 a 12 años de edad visitó en los últimos 6 meses al odontólogo. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   EJEMPLO 10.9.3. Figura 2.1 Tabla 2.

pues el “salto” se debe a que existe un niño de la muestra de 10 años que sí ha asistido al odontólogo.2. existe un gran “salto” a los 7 años. la forma de representación gráfica más común.4.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 2.4. Estos se construyen representando los intervalos de clase en la   50 . y 2. Diagrama de frecuencias absolutas acumuladas de visita al odontólogo de niños entre los 6 y 12 años Frecuencia 35 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Edad En las figuras 2. se reflejan los diagramas de frecuencia absoluta y frecuencia absoluta acumulada. las dos últimas líneas horizontales son de mayor tamaño que las demás. De igual manera se percibe un agrupamiento a la izquierda de los datos. rápidamente se puede concluir que los niños de 7 años de edad son los que más han asistido al odontólogo en los últimos seis meses de la muestra tomada. respectivamente. se conoce con el nombre de histograma de frecuencias. En cambio. En la figura 2.3. Obsérvese que a partir de la figura 2. es decir no es simétrica la gráfica.4. ¿sabe usted por qué? 1. Este tipo de gráficos suelen llamarse asimétricos sesgados a la izquierda.8 Histograma de frecuencias En el caso de las distribuciones de frecuencia agrupada. 11 y 12 años.5.3. Se puede ver también que estas dos últimas líneas están menos separadas que las otras. esto se debe a que no hay registro de niños que asisten al odontólogo con edades de 9.

de ahí el nombre.5 – 92. de manera que permite acortar la distancia entre el origen y el primer valor de la variable. Histograma de frecuencias absolutas de la velocidad de pulsaciones 12 Frecuencia (número de personas) 10 8 6 4 2 0 56.2. En el primer caso.5 Velocidad de pulsaciones 1.5. Esta convención también puede usarse en el eje vertical u ordenada.5 – 74. que corresponde a la marca de clase.5. En la figura siguiente se registra el diagrama de frecuencias absolutas del grupo de datos del ejemplo 8.5 101.1.5 92. La figura 2. se unen los puntos de intersección de la abscisa.5 – 83.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 – 65. Pero se grafican las marcas de clase de cada intervalo.5 65.5 – 101. Nótese el origen o punto de partida de la variable es cero y luego aparece un corte o puente.6. en el segundo caso. generando una secuencia de puntos que se unen en segmentos de recta para formar un polígono.5 – 110. con la ordenada correspondiente a la frecuencia relativa o absoluta.9 Polígono de frecuencias Describe también la información de la distribución de frecuencias absolutas o relativas. se unen los centros de las bases superiores de los rectángulos. representa el polígono de frecuencias de los datos graficados en el histograma de la figura 2. Figura 2.5.   51 . TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   escala horizontal y las frecuencias de clase (absolutas o relativas) en la escala vertical y trazando rectángulos cuyas bases equivalen a la amplitud de los intervalos de clase y sus alturas corresponden a las frecuencias de cada clase.5 83. El polígono puede dibujarse sobre el histograma de frecuencias o de manera independiente.5 74.

No se trata aquí de crear una discusión sobre ello pero queda al lector la decisión si elabora la ojiva como curva suavizada o como la unión de segmentos de líneas. y.5.6. En este módulo se trabajará como curva suavizada. en unimodales.10 Ojiva Contrario al polígono de frecuencias. que está compuesta de segmentos rectilíneos. diferentes curvas lo que no permite el histograma de frecuencias. Polígono de frecuencias absolutas de la velocidad de pulsaciones 12 11 Frecuencia (número de personas) 10 9 8 7 6 5 4 3 2 1 0 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 Velocidad de pulsaciones 1.1. partiendo desde el límite inferior del primer intervalo.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.2.)                                                              Algunos autores consideran que la ojiva no es una curva suavizada. En el eje horizontal se ubican el límite superior de cada intervalo de clase y en el vertical. Las curvas en estadística tienen diversas formas: estas se clasifican de acuerdo a la forma en simétricas y asimétricas siendo estas últimas sesgadas a la derecha o a la izquierda. Ella permite presentar en un mismo gráfico. Observe las siguientes figuras. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 2. las respectivas frecuencias acumuladas. 2   52 . la ojiva es una curva suavizada2. que representan la ojiva ascendente y descendente de los datos tomados de velocidad de pulsaciones de una muestra de 30 personas (ejemplo 8. La ojiva es el gráfico de una distribución de frecuencias acumuladas (relativas o absolutas) y puede ser descendente o ascendente. según los máximos o picos que presenten. Luego se unen estos puntos en una curva suavizada. ya sean relativas o absolutas. bimodales o multimodales.

Ojiva descendente de la velocidad de pulsaciones 30 Frecuencia absoluta acumulada 27 24 21 18 15 12 9 6 3 0 54 58 62 66 70 74 78 82 86 90 94 98 102 106 110 Velocidad de pulsaciones Si ambas ojivas se dibujan en un mismo gráfico. Ojiva ascendente de la velocidad de pulsaciones 30 27 Frecuencia absoluta acumulada 24 21 18 15 12 9 6 3 0 54 58 62 66 70 74 78 82 86 90 94 98 102 106 110 Velocidad de pulsaciones Figura 2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 2.9. se obtiene la figura 2.8. concepto que se discutirá en la siguiente unidad didáctica y que representa el valor del término de la mitad de la distribución.7.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. este punto se denomina mediana.   53 . Obsérvese que ellas se cortan en un punto M.

discriminados por facultad. generalmente durante un tiempo.10.   54 . cuando se comparan dos o más series de datos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 2. EJEMPLO 10. Gráficos de línea Está compuesta de segmentos de líneas que unen los pares ordenados a representar.9. Sirven para describir los cambios o fluctuaciones que sufre un fenómeno. Humanas y Educ. Soc.10. indica el número de egresados de la UNAD en el período 20002004. Egresados de la UNAD en el período 2000-2004 FACULTAD Ciencias Administrativas Ciencias Básicas e Ingeniería Ciencias Agrarias C. generalmente a través del tiempo (series cronológicas). 2000 1391 533 161 1243 2001 2192 603 147 1415 2002 1549 708 130 1013 2003 1773 517 197 1210 2004 2383 830 280 1281 La tabla 2. cuando se dibuja una sola serie de datos o compuestos.2.6.2 Tabla 2. Ojiva ascendente y descendente de la velocidad de pulsaciones 30 27 Frecuencia absoluta acumulada 24 21 18 15 12 9 6 3 0 54 58 62 66 70 74 78 82 86 90 94 98 102 106 110 Velocidad de pulsaciones M 1. Pueden ser simples.5.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

1.10. Diagramas de barras Es una de las gráficas más usadas para representar tanto características cuantitativas como cualitativas.7.2. seguida de Ciencias Sociales Humanas y Educativas.5. Es muy semejante al histograma de frecuencias. independiente de las fluctuaciones en el tiempo. Ciencias Básicas e Ingeniería y por último Ciencias Agrarias. de igual forma en 2002 disminuyó estrepitosamente el número de egresados en las facultades de Ciencias Administrativas y Ciencias Sociales Humanas y Educativas. la Facultad de Ciencias Administrativas es la que reporta mayor número de egresados anuales. Figura 2. También se puede leer de este tipo de gráficos que.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. pero el diagrama de barras no requiere que la información esté agrupada en tablas de frecuencias.   55 . mientras que en Ciencias Básicas e Ingeniería se daba un ascenso. Diagrama de líneas Egresados de la UNAD en el período 2000-2004 2500 2250 Número de egresados UNAD 2000 1750 1500 1250 1000 750 500 250 0 2000 2001 2002 2003 Ciencias Básicas e Ingeniería Ciencias Sociales Humanas y Educativas C iencias Ad ministrativas Ciencias Agrarias 2004 Años De allí se puede ver cómo en 2004 hubo un aumento considerado en todas las facultades. se ve claramente el comportamiento y fluctuación en el tiempo de cada facultad respecto a sus egresados. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   En el siguiente gráfico de puntos.

sombrándolas o rellenándolas con tramas. o bien describir y comparar dos o más características de ella de forma segmentada o agrupada. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Las barras son rectángulos con alturas proporcionales a las frecuencias o magnitudes correspondientes. que también se puede graficar una barra más. la cual permitiría una comparación eficiente de las ventas del almacén.11.12. pueden construirse en forma vertical u horizontal.. Ventas por departamento al contado y a crédito en marzo de 2005 Departamento Alimentos Ropa Calzado Electrodomésticos Contado 200 180 150 300 Crédito 120 110 90 210 Total 320 290 240 510 Los siguientes diagramas de barras verticales describen las ventas por departamento del almacén. Obsérvese que tanto la figura 2. sin embargo son más comunes las verticales.11. en la figura 2.3 La siguiente información corresponde a las ventas por departamento.11. Los valores representan las ventas en millones de pesos. El diagrama de barras se puede trabajar para describir una sola característica de la variable. en este tipo de gráficos se ubica la variable o atributo en el eje horizontal y la altura está dada por los valores o cantidades que toma dicha variable. Para diferenciar una característica de otra en la misma barra se recurre a diferenciarlas usando colores. ofrecen los mismos resultados.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. la correspondiente al total de ventas. ¿Cómo sería esta gráfica?   56 . al contado y a crédito.. Inténtelo haciendo los diagramas de forma horizontal. Tabla 2. diagrama de barras simple. de un almacén de cadena en la ciudad de Bucaramanga en el mes de marzo de 2005. ¿es clara la información? ¿Cuál tipo de diagrama de barras elegiría usted para una investigación? ¿Por qué? Obsérvese además. y 2. aunque sean visualmente diferentes. EJEMPLO 10.

11. Diagrama de barras segmentadas de las ventas por departamento al contado y a crédito en marzo de 2005 Electrodomésticos 300 210 Calzado 150 90 Contado Crédito Ropa 180 110 Alimentos 200 120 0 50 100 150 200 250 300 350 400 450 500 550 Millones de pesos Construya una tabla de frecuencias relativas para los datos de la tabla 2.11.12. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 2. Elabore una pequeña síntesis de los resultados que arrojan las gráficas que ha construido. Diagrama de barras agrupadas de las ventas por departamento al contado y a crédito en marzo de 2005 Electrodomésticos 210 300 90 Calzado 150 Contado 110 180 Crédito Ropa Alimentos 120 200 0 40 80 120 160 200 240 280 320 Millones de pesos Figura 2. y con ella elabore por lo menos dos diagramas de barra diferentes en los que muestre el porcentaje de ventas de contado y a crédito alcanzadas durante ese mes en el almacén de cadena para cada uno de los departamentos evaluados.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.   57 .

25% solteros. proporcionalmente al número o al porcentaje de cada una de las clases en que se ha dividido la observación. como sectores de un círculo.5.4 En una entrevista masiva de una multinacional. Se utiliza para representaciones gráficas de distribuciones porcentuales. Los ángulos de los sectores son proporcionales a los componentes del total. Diagrama circular para el estado civil de 1250 aspirantes a empleo 10% Casado 15% 50% 25% Soltero Separado Unión libre   58 . se debe tener en cuenta que los 360º del círculo equivalen al 100%. 15% separados y 10% en unión libre. Si se quisiera mostrar en un diagrama circular estas proporciones. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1. Diagrama circular Es otro tipo de gráfico que permite observar los componentes de un total. Es una forma efectiva de representar distribuciones de frecuencias en las que la característica es cualitativa. Se construye subdividiendo los 360º de un círculo.2. 15% a 54º y 10% a 36º. Una mayor apreciación se logra coloreando distintivamente los sectores o dándole una trama a cada sector. EJEMPLO 10.8. asistieron 1250 personas con expectativas de emplearse.13. De ellas el 50% eran casados. Compruébelo. Así pues. se grafica el diagrama circular: Figura 2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. el 25% equivale a 90º en el círculo. debe pues plantearse una regla de tres simple: Porcentaje 100% 50% Grados 360º X Donde: 50 × 360 X= = 180 º 100 De la misma manera.

Bolivia y Colombia = 1’000. mostrando en cada uno la correspondiente distribución porcentual. meses o días se quieran representar en la secuencia. Si se le quiere emplear en secuencias cronológicas. Si la cantidad no es exacta.1 millones   59 . por ejemplo. se presenta una fracción de la figura. En la siguiente figura se indica por medio de un pictograma los millones de árboles talados en Argentina. Así es como se encuentran pictogramas señalando la población de un país. ya que se consideran más expresivos.4 millones Bolivia 26.000 de árboles Argentina 35. Pictogramas Es una forma de representar los datos por medio de símbolos o dibujos donde cada uno representa la misma información con un valor fijo. tantos como años.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.14.5. donde una figura humana representaría un millón de personas. Bolivia y Colombia. Figura 2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Este tipo de gráficos es inconveniente cuando se tienen varias partes y cada una representa una pequeña proporción o cuando son muchas las partes que se van a representar.9.2. Los pictogramas son usados comúnmente en el diseño publicitario. Pictograma para el número de árboles talados en Argentina.7 millones Colombia 37. se dibujan círculos de igual radio. Obsérvese que un árbol representará un millón de árboles talados anuales. 1.

independientemente de que esta esté más o menos centrada. etc. barras.1 LECCIÓN 11.3. círculos. En este caso se incluyen también los cuantiles entre estas medidas. organizar y presentar los datos en cualquier tipo de investigación estadística. 1.10. se indican con figuras humanas las zonas en conflicto o en disputa con los diversos grupos armados del país. se hace indispensable recordar algunas nociones aritméticas y algebraicas básicas en estadística. Este número que. con frecuencia es conveniente resumir la información con un solo número. cuando se indica por ejemplo.5.  Pero antes de iniciar con estos nuevos conceptos. suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. ESTADIGRAFOS   En el capitulo anterior nos dedicamos a estudiar los métodos que deben ser aplicados en el proceso de agrupar. CAPITULO 3 . en un mapa de Colombia. el informe del estado del tiempo o. para tal fin. es por esto que se recomienda al lector iniciar el capítulo repasando la sumatoria como propiedad aritmética fundamental para entender las medidas estadísticas de una población o muestra. Mapas estadísticos o cartogramas Este tipo de gráficos muestra la información cuantitativa o cualitativa sobre bases geográficas dentro de las cuales se ubican símbolos o figuras como puntos. Todo cuanto tiene que ver con sumatoria y productoria puede ser repasado y consultado en el anexo A. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1. 1. colores. que se encuentra al final del texto.     Entre las medidas de tendencia central tenemos:     • media aritmética  • media ponderada  • media geométrica  • media armónica  • mediana  • moda.       Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución. Es muy común en la prensa o boletines de información.2.3.     60 .UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.MEDIDAS DE TENDENCIA CENTRAL O DE POSICION Al describir grupos de observaciones. se habla de estas medidas como medidas de posición.

. el mismo que representa a la muestra.   Teniendo en cuenta la anterior la clasificación.350.400 y $1.300. por letras minúsculas. Se define como la suma de los valores de una cantidad dada de números dividido entre la cantidad de números. los símbolos que se refieren a la población se representan generalmente por letras griegas o por las letras mayúsculas de nuestro alfabeto y los que se refieren a la muestra. $1. cuando corresponden a una parte de la población o muestra. $1. x= ∑X i =1 n i n donde: n = cantidad de elementos Xi = valor de cada elemento x = media aritmética. Los estadígrafos permiten hallar un valor numérico. El valor promedio o media aritmética es entonces:   61 . Si bien es cierto que los cuadros y graficas describen el fenómeno.2 LECCIÓN 12 MEDIA ARITMÉTICA Es la medida más conocida y la más fácil de calcular.   Para el análisis de una variable o de una distribución unidimensional se consideran las siguientes clases de medidas:     • Medidas de tendencia central   • Medidas de posición         • Medidas de dispersión         • Medidas de asimetría y apuntamiento   1. y por tanto hay necesidad de acudir a ciertas medidas denominadas parámetros de la población. $1.250.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Ahora trataremos de presentar otros métodos para estudiar o medir el comportamiento de los elementos que constituyen una población.1 El precio de la bolsa de un litro de leche en diferentes supermercados fue: $1. no lo hacen en forma satisfactoria.3. o simplemente media EJEMPLO 12. cuando se hacen sobre el total de ésta y estadígrafos.325.

2 Las ventas promedio de un almacén durante el primer semestre del año fueron $3’422.3 Un agricultor vende la cosecha de papas de la siguiente forma: 30 sacos a $256.500. es decir. Esto es: ∑X i =1 n i = n⋅ x EJEMPLO 12.350 + 1. + K + m n X n .250 + 1.000 y 25 sacos a $261. x= 1 1 = m1 + m2 + K + mn ∑m X i =1 n i n i ∑m i =1 i   62 . TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   x= 1.000) + 18(264. Venta total primer semestre = 6 x (3’422. EJEMPLO 12.325 = $1.325 5 La media aritmética tiene la propiedad de asignar a cada elemento de la suma el mismo valor.856  30 + 18 + 25 La media ponderada se halla al realizar el cociente entre la suma de los productos de los valores por sus respectivos pesos y la suma de los pesos. Si se conoce el valor de la media y el número n de elementos u observaciones.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.000.000) + 25(261. 18 sacos a $264.000. El caso general se expresa así: m X .000 También puede suceder que los elementos que se analizan se encuentren agrupados. en este caso para encontrar el valor de la media aritmética se debe realizar la ponderación de estos elementos agrupados. encontrar el peso que le corresponde a cada valor.000) = $20’532. hallar el total de ventas de este período de tiempo. Esto da lugar a la media aritmética ponderada. + m2 X 2 . ¿Cuál es el precio promedio del saco de papa vendida por el agricultor? Precio promedio saco de papa = 30(256.400 + 1. se puede conocer el valor de la suma total multiplicando la media por el número de elementos.500) =$259. o sea el valor promedio.300 + 1.

las cantidades ponderadas y  m1. = 685 = 27. se hace necesario considerar algunas de sus propiedades:   63 . calcule su Tabla 3.  mn los pesos o ponderaciones. Esta similitud entre la media de una distribución de frecuencias agrupadas y la media aritmética ponderada se muestra en el siguiente ejemplo. Un caso similar al anterior consiste en la media de una distribución de frecuencias agrupadas.X  72 138 196 165 114 685 x= ∑ f ⋅ X . TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Siendo X1  X2. donde los pesos o ponderaciones corresponderían a las frecuencias de los valores de las marcas de clase. EJEMPLO 12.….1.4 Dada la siguiente distribución correspondiente media aritmética: de frecuencias agrupadas.…  Xn.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.  m2.4 25 ∑f De lo anterior puede verse que: x= ∑fX i =1 n i n i ∑f i =1 = ∑ f ⋅X n i Dada la importancia que tiene el cálculo de la media aritmética y su frecuente uso.. recordando que la marca de clase es el valor promedio de un intervalo de clase. Distribución de frecuencias agrupadas Intervalo 16-20 21-25 26-30 31-35 36-40 Total Marca de clase X  18 23 28 33 38 Frecuencia f  4 6 7 5 3 25 f .

en este caso es la media aritmética.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. En síntesis. 1. Esta propiedad. Si la distribución es simétrica no hay necesidad de ponderar. pero cuando el número de datos es par. fácilmente se identifica la mediana. Sin embargo no siempre es recomendable usarla como un promedio. y dividir entre el número de elementos del conjunto. Cuando la cantidad de datos es impar. Para su cálculo es necesario que los datos estén ordenados. es decir. al igual que las demás. la mediana se calcula hallando el valor medio entre los dos valores centrales y no coincidirá con ninguno de los valores del conjunto de datos. que bien podrían ser bastantes.3. las desviaciones con respecto a la media deben ponderarse. se encuentra en el centro de la distribución. ya que es muy sensible a los valores extremos del conjunto de datos. Y en términos aritméticos ella plantea: ∑ ( X − x) = 0 Tenga en cuenta que cuando los datos están agrupados en una tabla de frecuencias. Por otra parte. Esto quiere decir que sólo la media aritmética hace mínima la suma de los cuadrados de las desviaciones en torno a ella. es válida para datos agrupados o no agrupados. además de ser la única de las medidas de tendencia central que permite un tratamiento algebraico.6 LECCIÓN 13 MEDIANA Se define como el valor que divide una distribución de datos ordenados en dos mitades. Esta importante propiedad se retomará más adelante cuando se estudie regresión lineal y el método de los mínimos cuadrados para ajuste de curvas. Es menos usada que la media aritmética. • La suma de los cuadrados de las desviaciones respecto a la media es siempre menor que la suma de los cuadrados de las desviaciones con respecto a cualquier otro valor.   64 . La mediana se simboliza como Me. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • La suma de las desviaciones respecto a la media aritmética es igual a cero. la media es ligeramente más difícil de calcular a mano que las otras medidas que se verán en seguida. Una desviación es la diferencia que se presenta entre los valores que toma la variable y un valor constate. la media o promedio aritmético es la medida de tendencia central más comúnmente usada. puesto que requiere sumar todo el conjunto de datos.

Dados los valores: 19. se calcula el valor de n y con él se 2 busca.5 2 Cuando los datos se encuentran agrupados. Primero se identifica la clase de la mediana (la clase que contiene a la mediana). 28.5. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   EJEMPLO 13. de esta unidad didáctica. calcular la mediana del conjunto de datos. Este valor es 20. En el siguiente ejemplo se describe paso a paso el cálculo de esta medida de tendencia central. puesto que deja cuatro valores por debajo y cuatro valores por encima.1 de distribución de frecuencias agrupadas del ejemplo 12.5 2 2 La clase de la mediana es (26-30).   65 . 18. se considera que los valores en esa clase se distribuyen uniformemente de modo que se pueda calcular la mediana por el método de la interpolación lineal. 26. en las frecuencias acumuladas. determinar su media. Lo primero que debe hacerse es ordenar los datos: 14 15 18 19 20 23 26 28 30 Como el número de datos es 9. 20. b.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. EJEMPLO 13. el valor del medio de estos datos es la mediana.1 a. 15. pues el número de frecuencias acumuladas es el valor más cercano a 12. 30.2 Tomando la tabla 3. 23. 14 Hallar la media del siguiente conjunto de datos ordenados: 15 18 19 20 23 26 28 30 32 Observe que son 10 datos. n 25 = = 12. En este caso se toman los dos valores del medio y se promedian: Me = 20 + 23 = 21.4. Esta clase recibe el nombre de clase de la mediana. 14. el intervalo de clase en donde este se encuentra o se aproxime mejor. un número par de datos. Identificada la clase de la mediana.

la mediana se encontrará 1. Frecuencia Ancho absoluta de clase 7 4 2.   66 . 12. Distribución de frecuencias agrupadas Intervalo Clase de la mediana Hay 10 debajo del límite de la mediana.5 se interpola en el ancho o amplitud de la clase de la mediana que es 4.5 16-20 21-25 26-30 31-35 36-40 Total Frecuencia F  4 6 7 5 3 25 Frecuencia acumulada 4 10 17 22 25 observaciones por inferior de la clase El valor de 2.4 7 Así pues.5 X X = 2.5 − 10 = 2. Fk‐1  es la frecuencia absoluta acumulada de la clase anterior de la clase de la mediana. Ella se deriva del análisis hecho en el ejemplo anterior y se describe de la siguiente manera: n − Fk −1 2 Me = × Ak + Lk fk Donde: n es el tamaño de la muestra o la suma de todas las frecuencias.2.4 = 27.5 × 4 = 1.4 En muchas referencias bibliográficas se expone una ecuación para el cálculo de la mediana cuando los datos se encuentran agrupados.4 unidades más del límite inferior de la clase de la mediana: Me = 26 + 1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Tabla 3.

El cálculo de la mediana es simple. Ya se vio algo cuando se estudiaba la ojiva: al graficar en un mismo eje coordenado la ojiva ascendente y descendente.4 + 26 = 27. es decir con la distribución de frecuencias relativas. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   fk es la frecuencia absoluta de la clase de la mediana. Primero.. No influencian en lo absoluto como sí lo hacen en el cálculo de la media. Cuando la distribución de los datos es muy simétrica. el punto donde estas dos curvas se encuentren corresponde a la mediana de los datos agrupados.   67 . Lk es el límite real inferior de la clase de la mediana. haciendo uso de la ecuación para su cálculo. se podría decir que la mediana no es una medida muy confiable para describir el conjunto de datos. Si se trabaja en cambio con la ojiva porcentual. pues en su cálculo sólo intervienen los valores más centrales sin tener en cuenta los demás y su comportamiento general. Finalmente. Se concluye entonces que la mediana no está afectada por los valores extremos del conjunto de datos. sean estos grandes o pequeños. EJEMPLO 13.4 7 ⇒ Otra manera para hallar la mediana de un conjunto de datos agrupados es el método gráfico.2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. se identifica cada valor: n = 25 Fk‐1 = 10 fk = 7 Ak = 4 Lk = 26 n − Fk −1 2 Me = × Ak + Lk fk 25 − 10 2 Me = × 4 + 26 = 1. condición que no requiere el cálculo de la media. pero siempre requiere que los datos se encuentren ordenados. Ak es la amplitud de la clase de la mediana. leyendo el valor en el eje horizontal. no hay casi diferencia entre la media y la mediana. la mediana será el valor de la abscisa cuya ordenada es el 50%.3 Determine la mediana de la distribución de frecuencias agrupadas del ejemplo 13.

 TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   1.3. Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más alta.. es decir puntos que corresponden a una mayor densidad de frecuencias. En la tabla 3. Generalmente las curvas de frecuencia presentan un solo pico. usando un histograma de frecuencias o un polígono de frecuencias. La moda también puede determinarse gráficamente. . fk+1 es la frecuencia absoluta de la clase posterior en donde se encuentra el dato más frecuente.   68 .1 Las siguientes tablas de frecuencias indican el número de personas de acuerdo a su edad que asistieron al estreno de una película.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. pero a veces se encuentran series con dos o más picos. por lo que el conjunto de datos recibe el nombre de multimodal o polimodal.7 LECCIÓN 14 MODA Se trata del valor más frecuente en un conjunto de datos. la moda es 22. Se considera como el valor más representativo o típico de una serie de valores. valor correspondiente a la mayor frecuencia que es 5. todos los valores son modas. EJEMPLO 14.3. Lk es el límite real inferior de la clase en donde se encuentra el dato más frecuente. La barra más alta o el pico más alto corresponde al valor que más se repite. Es usual también hacer uso de la siguiente ecuación para su cálculo: Mo = f k −1 × Ak + Lk f k −1 + f k +1 Donde: fk‐1  es la frecuencia absoluta de la clase anterior en donde se encuentra el dato más frecuente.Ak es la amplitud de la clase en donde se encuentra el dato más frecuente. donde los datos están sin agrupar. Es simbolizada como Mo. Cuando los datos se encuentran agrupados la moda es la marca de clase del intervalo de clase que contiene la mayor frecuencia. Esto sucede cuando se trabaja con grupos de datos heterogéneos. Si dos valores tienen la misma frecuencia se dice que el conjunto es bimodal.

Su cálculo es poco preciso debido a que no se puede expresar en términos algebraicos.5 Total Marca de clase 15 18 21 24 27 30 Frec. es decir. presenta una ligera estabilidad en el muestreo. es más recomendable emplear la mediana o la moda como medidas de posición. Cuando la distribución es asimétrica a la derecha se cumple que   69 . Si la distribución es casi simétrica. Determinar cuál de ellas usar en un tratamiento estadístico depende mucho de la información que se tenga y del objetivo que se persigue. se tiene: Mo = 9 × 3 + 19. los datos se encuentran agrupados.5 – 22. el cálculo de la moda se hace más preciso.5 y corresponde a la marca de clase que es 21. es por eso que su uso es más frecuente. Distribución de frecuencias de la asistencia a cine X  14 15 16 17 18 19 20 21 22 f  1 0 1 2 3 4 4 4 5 Total X  23 24 25 26 27 28 29 30 31 F  4 3 2 4 3 2 0 0 1 43 Tabla 3. Distribución de frecuencias agrupadas de la asistencia a cine Intervalos de clase 13. Para encontrarla se requiere que los datos estén ordenados.4. Tabla 3.5 – 25..5 – 16. En cualquier distribución el valor de la mediana se localiza entre la media y la moda. de cómo estos se agrupan.5 = 21 9+9 Obsérvese que aunque sean el mismo conjunto de datos.5 – 28. Cuando los datos no están ordenados. cualquiera de ellas puede usarse y resultarán aproximadamente iguales.5 28.5 19. Si la distribución no es simétrica. puede resultar más fácil calcular la media aritmética que la mediana. a diferencia de la mediana y la moda.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 – 22. la moda se encuentra en el intervalo de clase 19. la moda varía dependiendo de su tratamiento.3. usando la ecuación para el cálculo de la moda. La media. 2 9 13 9 9 1 43 La moda no es tan usada como la media o la mediana.5 – 31. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   En la tabla 3. Además.5 16. Cuando los datos no están agrupados. Se han visto hasta ahora tres medidas de tendencia central: media.4.5 25.5 22. mediana y moda.5 – 19.

conociendo las otras dos medidas. (b) Sesgada a la izquierda. la mediana como la medida que permite dividir el área bajo la curva de distribución en dos parte iguales y la moda como el pico más alto de la curva de distribución. Ellas tres son las medidas de tendencia central                                                              Modificado de Probabilidad y estadística. Distribuciones sesgadas (a) Sesgada a la derecha. x − Mo = 3( x − Me) ⇒ Mo = 3Me − 2 x En resumen. Novena edición. Pearson & Addison Wesley.) Figura 3. si en cambio es asimétrica a la izquierda x < Me < Mo . Se dice entonces.1. que una distribución está sesgada si no es simétrica y si se extiende más hacia un lado que hacia el otro.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. se puede entender la media aritmética como el punto de equilibrio del conjunto de datos (como el centro de gravedad de un cuerpo). 3   70 . Y será simétrica cuando la mitad de su histograma es aproximadamente igual a su otra mitad. México. (c) Simétrica La relación de Pearson afirma que la distancia entre la media y la moda es tres veces la distancia entre la media y la mediana. mediana y moda en términos de ventajas y desventajas para su cálculo y uso en la investigación estadística.1. Esta relación es utilizada para calcular cualquiera de ellas. Mario F. Triola. El cuadro siguiente3 resume y compara de una manera didáctica y práctica la media. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Mo < Me < x . Mientras que los datos sesgados a la derecha (sesgo positivo) poseen una cola derecha más larga y su mediana y media están a la derecha de la moda (ver figura 3. 2004. Los datos sesgados a la izquierda (sesgo negativo) presentan una cola izquierda más larga y su media y mediana se encuentran a la izquierda de la moda.

Tabla 3. o cuando se quiere determinar el valor medio para un conjunto de porcentajes. o cuando se quiere dar importancia a valores pequeños.5. las tasas de crecimiento promedio o tasas promedio. mediana y moda Medida de tendencia central ¿Toma ¿Se ve ¿Requiere en afectada que los ¿Existe cuenta por los datos estén siempre? cada valores ordenados? valor? extremos? ¿Qué tan común es? Ventajas y desventajas Presenta una ligera estabilidad frente al muestreo. la media geométrica se calcula hallando el producto de todos los elementos y extrayendo la raíz del orden del número de observaciones. Cuando los datos no son agrupados. Comparación de la media.   71 . Es más precisa cuando los datos no están agrupados.3. Suele utilizarse en negocios y economía para calcular las tasas de cambio promedio. Se simboliza Mg y se define como la raíz n-ésima de la productoria de los n valores de la variable. pues en su cálculo sólo intervienen los datos más centrales. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   más comúnmente usadas.8 LECCIÓN 15 OTRAS MEDIDAS DE TENDENCIA CENTRAL La media geométrica se utiliza para promediar crecimientos geométricos de la variable. No es muy confiable para describir el conjunto de datos. Media Es la más común Si Si Si No Mediana De uso común Si No No Si Moda Usada en ocasiones Podría no existir o haber más de una No No Si 1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. en el tema siguiente se estudiarán otras medidas no menos importantes pero si menos usadas en el tratamiento estadístico.

. + n 1 Xn = ∑x n 1 ⇒ Mh = n ∑x 1   72 . Distribución de frecuencias agrupadas Intervalos de clase 0. ⋅ X n Cuando los datos están agrupados.5 1. Mg = n ∏X i =1 n ni i = n X 1 1 ⋅ X 2 2 ⋅ .1 La media armónica de un conjunto de datos es el recíproco de la media aritmética de los recíprocos de los números de la serie de datos.. Hallar la media geométrica de 2.1 a. 15 Mg = 6 ∏X i =1 6 i = 6 2 ⋅ 4 ⋅ 6 ⋅ 9 ⋅ 12 ⋅ 15 = 6 77. 6. 4. 9.5 – 2.5 3.5 Total Mg = Marcas de clase 1 2 3 4 Frecuencias 2 5 8 5 20 4 ∏X i =1 4 ni i = 4 12 ⋅ 2 5 ⋅ 38 ⋅ 4 5 = 121. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Mg = n ∏X i =1 n i = n X 1 ⋅ X 2 ⋅ .6. 12.. Se simboliza Mh y se define como: 1 = Mh 1 X1 + 1 X2 + .UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 2. la media geométrica se define como la raíz n-ésima de la productoria de los valores de la variable (marca de clase) elevadas cada una de ellas a su correspondiente frecuencia absoluta. ⋅ X n n n ni EJEMPLO 15.53 b.5 – 1.760 = 6..5 – 3..5 – 4.. Tabla 3. Hallar la media geométrica de la siguiente distribución de frecuencias agrupadas.

.25   4 4   73 . El tercer cuartil (Q3) es aquel valor que representa el 75% y es superado por el 25% restante de las observaciones. como la velocidad. Se utiliza preferiblemente para conjuntos de datos que consisten en tasas de cambios.045 1 = = 0.2. EJEMPLO 15. es superado por el 75% restante.2.  Para calcular estos tres promedios se procede de manera semejante al cálculo de la media aritmética. deciles y percentiles son medidas que se utilizan para determinar los intervalos dentro de los cuales quedan proporcionalmente repartidos los términos de la distribución. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   La media armónica es muy influenciable por los valores extremos de la serie.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Los cuartiles.44 0. n 25 = = 6. El segundo cuartil (Q2) corresponderá a la mediana de la distribución. EJEMPLO 15.2 Un obrero se gasta 50 minutos en terminar un producto y otro lo hace en 40 minutos.0225 2 2 44.3 Hallar los cuartiles de la distribución de frecuencias de la tabla 3. El cuartil inferior (Q1) es aquel valor de la variable que representa el 25% de las observaciones y a la vez. de manera que cada una tendrá el 25% de las observaciones. del ejemplo 13. especialmente los más pequeños. Primero se identifica la clase en donde se encuentra el primer cuartil.0225 ⇒ Mh = = 44. Los tres puntos de separación de los valores son los cuartiles.44 minutos es el tiempo medio requerido. ¿Cuál es el tiempo medio requerido para terminar dicho producto? 1 = Mh 1 50 1 + 40 0. Para calcular los cuartiles se divide la distribución en cuatro partes iguales.

esto es la mediana del grupo de datos. Q2 = Me = 27.25. Intervalo 16-20 21-25 26-30 31-35 36-40 Total Frecuencia F  4 6 7 5 3 25 Frecuencia acumulada 4 10 17 22 25 Clase del Q1 Clase del Q3 Hay 4 observaciones por debajo del límite inferior de la clase del primer cuartil. pues el número de frecuencias acumuladas es el valor más cercano a 6.5 = 22.25 × 4 = 1. 6.25 se interpola en la amplitud de la clase del primer cuartil que es 4.25 Ancho de clase 4 X X = 2.25 − 4 = 2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.4 Para el tercer cuartil se procede de la misma manera. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   El intervalo de clase donde se encuentra el primer cuartil es (21-25). 3n 3 × 25 = = 18.5 6 Así pues.5 El segundo cuartil corresponde al punto medio de la distribución.25 El valor de 2.5 unidades más del límite inferior de la clase correspondiente: Q1 = 21 + 1.75 4 4   74 . el primer cuartil se encontrará 1. Frecuencia absoluta 6 2.

 P5. D2=P20. Su cálculo es muy semejante al de los cuartiles. determine el valor de: Q1.4 = 32.4. haciendo uso de la ojiva porcentual ascendente. Para calcular los deciles se divide el conjunto de datos en 10 partes iguales.4 y el 75% está por debajo de 32. El método más sencillo para identificar tanto cuartiles.4 unidades más del límite inferior de su clase: Q3 = 31 + 1.75 Frecuencia absoluta 5 1. el 50% está por debajo de 27. D1. El primer percentil (P1) es igual al valor que supera al 1% de las observaciones y es superado por el 99% restante y así sucesivamente.4 5 El tercer cuartil se encontrará 1. Q2.   75 .2. de manera que se obtienen nueve valores que dividen la frecuencia total en diez partes iguales. D9.5. deciles y percentiles es el gráfico.  EJEMPLO 15.75 − 17 = 1. D5. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   El intervalo de clase donde se encuentra el tercer cuartil es (31-35) y hay 17 observaciones por debajo del límite inferior de la clase de este cuartil.. P95.75 Ancho de clase 4 X X = 1. El primer decil (D1) es igual al valor que supera al 10% de las observaciones y es superado por el 90% restante y así para cada uno de los deciles.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.75 × 4 = 1. Obsérvese que D1=P10.4 Lo que quiere decir que el 25% de los valores está por debajo de 22.. Q3. Sólo requiere buscar en el eje vertical el porcentaje que se busca y leer en el eje horizontal su correspondiente valor...4 A partir de la ojiva porcentual de la distribución de frecuencias agrupadas de la tabla 3. 18. De igual manera se puede calcular el centil o percentil al dividir en cien partes iguales la distribución.

se debe completar la tabla de distribución de frecuencias agrupadas.   76 . mientras que el percentil 5 representa al 5% y el 95 al 95%. el primer cuartil representa el 25%. el tercero 75%. del quinto es el 50% y el noveno corresponderá al 90%. sin embargo es muy útil y sus valores se aproximan al teórico entre mejor esté graficada la ojiva. Esto demuestra que el método gráfico no es el más apropiado para su determinación. teniendo en cuenta qué porcentaje representa. Observe en la figura 3. se inicia el proceso de identificar cada valor pedido. Es decir. Una vez construida. Distribución de frecuencias agrupadas Intervalo 16-20 21-25 26-30 31-35 36-40 Total Frecuencia absoluta 4 6 7 5 3 25 Frecuencia acumulada 4 10 17 22 25 Frecuencia relativa 16% 24% 28% 20% 12% 100% Frecuencia relativa acumulada 16% 40% 68% 88% 100% Con las frecuencias relativas acumuladas se construye la ojiva porcentual ascendente. el segundo 50%.2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Para construir la ojiva. que los valores teóricos (calculados en ejemplos anteriores) no son completamente coincidentes. Tabla 3.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. el primer decil representa el 10%.7.

Resumen de cálculos. ¿Son muy diferentes?   77 . Porcentaje Valor que teórico representa calculado 25% 22.9 35.5 16.9 40 45 Tabla 3.5 37.2 26.2 25 26.4 90% 5% 95% Valor gráfico obtenido 22.5 18 20 22.9 30 31. ejemplo 15.5 50% 27.8.9 Medida Q1 Q2 Q3 D1 D5 D9 P5 P95 Ahora intente lo siguiente: determine los valores teóricos de las medidas que aún no ha calculado y compárelas con las obtenidas por el método gráfico.8 35 35. Ojiva porcentual ascendente 100% P95 D9 90% 80% Q3 70% 60% Q2=D5 50% 40% 30% Q1 20% D1 P5 10% 0% 0 5 10 15 16.4 75% 32.5 37.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.9 31.8 18 26.4 10% 50% 27.4. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 3.2.

2004.. Luego se determina el valor de la expresión: L= k ×n 100                                                              Modificado de Probabilidad y estadística. El valor de Pk corresponde a la posición obtenida del promedio calculado. Se requiere que los datos se encuentren ordenados de manera ascendente. Figura 3. contado desde el dato menor. Novena edición. contado desde el dato menor.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Diagrama de flujo para el cálculo del k-ésimo percentil Hacer arreglo ordenado (ascendente) Calcular Donde: ú d L= k ×n 100 l ¿Es L un número entero? No Redondee L al siguiente entero más grande El valor de Pk es el L-ésimo valor. Triola. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   El cálculo de percentiles para datos no agrupados se hace más sencillo siguiendo el siguiente tratamiento resumido en el diagrama de flujo4 de la figura 3. que clarifica el procedimiento para el cálculo del k-ésimo percentil. Pearson & Addison Wesley.3.3. Mario F. Si Calcule el valor medio entre el L-ésimo valor y el siguiente valor en el conjunto de datos ordenados. 4   78 . México.

Si en cambio. este valor debe ser redondeado al siguiente entero más grande y el valor de Pk corresponderá a la posición L-ésima. El valor del percentil 43.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. de la Unidad Didáctica Uno sobre la evaluación de los latidos cardíacos de un grupo de 30 personas después de cierta actividad física y calcule los siguientes percentiles.3. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Donde: n es el número de valores del grupo de datos k es el percentil en cuestión Si el valor de L es un número entero. se sigue el procedimiento planteado en el diagrama de flujo de la figura 1. En este caso. P43 Se calcula el valor de L: 62 + 64 = 63 2   79 . el valor del k-ésimo percentil estará por el valor medio entre el L-ésimo valor y el siguiente valor.5 Tome el arreglo ordenado del ejemplo 8. que corresponden al tercer y cuarto valor del grupo de datos ordenados. respectivamente. se procede entonces a calcular L. se verifica si el valor de L es un entero o no. EJEMPLO 15. el valor de L no es un número entero. es decir el localizador que da la posición del valor 10. Se tiene entonces: P10 = b. De manera que el décimo percentil está a la mitad entre el valor L-ésimo (tercero) y el siguiente valor (cuarto).1. Es decir. L es entero así que se sigue hacia abajo en el diagrama de flujo. Los datos se encuentran ordenados de forma ascendente. el valor del percentil 10 se ubica entre 62 y 64. P10 Para esto.. L= 10 × 30 = 3 100 Después. 58 60 62 64 68 70 74 75 76 76 80 82 82 82 84 85 85 85 87 88 88 91 91 92 92 94 95 95 95 110 a. El valor del percentil 10.

9 ≈ 13 100 Como el valor de L no es entero. Así: P81 = 92 d.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. El valor del percentil 81. El valor del cuartil 1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   43 × 30 = 12. El valor del percentil 43 es el valor 13º del grupo de datos ordenados contado desde el dato menor. P81 Se calcula el valor de L: L= 81 × 30 = 24. El valor del percentil 81 es el valor 25º del grupo de datos ordenados contado desde el dato menor.5 ≈ 8 100 El valor del percentil 25 es el valor 8º del grupo de datos ordenados contado desde el dato menor. Q1 Recuerde que Q1 es igual que P25. Así: Q1 = P25 = 75   80 . por lo que se procede a calcular el valor del percentil 25. Observe que no se redondea al entero más cercano sino al entero mayor. Se halla el valor de L: L= 25 × 30 = 7. se redondea al siguiente entero más grande. se redondea al siguiente entero más grande. Así: L= P43 = 82 c.3 ≈ 25 100 Como el valor de L no es entero.

Un equipo de fútbol profesional está compuesto de jugadores y cuerpo Técnico. identifique: población. unidad estadística. a. En la UNAD la matrícula en un año es de 10. Se realiza un estudio a 250 hogares en la ciudad de Medellín para conocer si se hace uso adecuado del Manejo Integrado de Residuos Sólidos (MIRS). Las temperaturas registradas en la ciudad de Pereira el 29 de junio de 2005 entre las 6 horas y las 18 horas. ¿tiene sentido registrar la edad del cuerpo técnico? b. b. 1. En las siguientes situaciones. ¿cuál de estas variables es continúa y cuál es discreta? 2. 3. 3. dato y variable. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   ACTIVIDADES DE AUTOEVALUACION DE LA UNIDAD AUTOEVALUACIÓN LECCIÓN 1. Si se toma un jugador y se registra la velocidad con que recorre la cancha y la cantidad de goles anotados en un campeonato. c. “La estadística estudia el comportamiento de fenómenos colectivos y nunca de una observación individual” ¿Qué le dice este principio?   AUTOEVALUACIÓN LECCION 2 1. muestra. Si sólo se está interesado en el grupo de jugadores. ¿qué datos pueden extraerse de ellos que tengan relevancia en el aspecto deportivo? c. a. En cada caso determine si la muestra seleccionada es representativa y Determine que tipo de muestreo es el más adecuado   81 . Si se desea conocer el promedio de edad de la selección Colombia para establecer una correlación entre edad y rendimiento físico. Elabore un mapa conceptual en donde diferencie claramente los conceptos de Estadística Descriptiva e Inferencia Estadística. Se desea conocer el número de estudiantes matriculados en la facultad de Ciencias Agrarias. ¿por qué es útil la estadística en el campo para el cual se está preparando? 2.458 estudiantes distribuidos en las cuatro facultades.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

2. ¿es posible deducir cuál fue el rendimiento de la población? d. La medida de la cantidad de lluvia caída en una localidad en un mes. Valor total de acciones vendidas cada día en el mercado de valores. El volumen de gasolina que se pierde por evaporación durante el llenado de un tanque de combustible. Programa de televisión favorito h. Que variaciones haría para que este estudio sea más significativo?         82 . d. La muestra es aleatoria y ha sido seleccionada de manera sistemática.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. De acuerdo con los resultados observados. g. La siguiente tabla corresponde a los resultados obtenidos por 20 de las 1000 personas que presentaron un examen de inglés. pregunto a 600 clientes que visitan sus almacenes en todo el país. c. Velocidad de un automóvil en kilómetros por hora. Textura de un producto. AUTOEVALUACIÓN LECCION 3 1. clasificarla en discreta o continua. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • El gerente de mercadeo de una empresa de máquinas institucionales propone al departamento técnico la creación de un nuevo modelo de procesador de alimentos para comedores de 100 empresas con más de 500 empleados. e. ¿A que tipo de variable corresponde este estudio? b. En caso de ser cuantitativa. El número de moléculas en una muestra de gas. Determinar si cada una de las siguientes variables es cualitativa o cuantitativa. ¿Esta muestra es representativa? c. a. Candidatos a la presidencia de la República. • Una empresa Colombiana de calzado femenino planea lanzar al mercado un nuevo estilo de botines. f. Los porcentajes fueron redondeados al valor entero más cercano 12% 20% 52% 59% 30% 46% 81% 63% 87% 58% 68% 34% 21% 72% 18% 92% 60% 35% 9% 55% a. b. Para esto.

Determinar la moda e interpretarla f.   83 . Determinar la variable cualitativa a estudiar. a las cuales se les preguntó su estrato económico. obteniendo los siguientes resultados. 2 1 3 1 1 2 2 2 1 1 2 3 3 2 1 1 1 3 1 2 2 2 1 2 1 1 2 1 2 1 1 2 1 2 2 1 3 3 3 3 2 2 1 1 1 2 2 2 a. Construir el diagrama circular de la variable. se realizó una encuesta en uno de los barrios a un grupo de 48 familias. c.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. b. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   AUTOEVALUACIÓN LECCION 4 1. e.Para ello. El alcalde de la ciudad abrirá un comedor comunitario en cada barrio donde el 60% a más de los hogares corresponden a un estrato menor o igual a 2. Elaborar el diagrama de barras correspondiente a la variable d. El alcalde de la ciudad tiene un proyecto de comedores comunitarios en el cual los ciudadanos da bajos recursos puedan acceder a una comida diaria otorgada por la alcaldía . El siguiente diagrama de barras muestra corresponde a la producción de una empresa de confecciones durante el mes de junio. ¿Se abrirá un comedor comunitario en el barrio? 2. Utilizar cada estrato como una clase de la variable para construir la tabla de frecuencias correspondiente.

H: hombre y M: mujer. Construir la tabla de frecuencias para la variable” estudia para los exámenes” c. los resultados fueron: Género H M M H H H M M H M H H H H Estudia S AV S S AV N AV AV S S AV N N AV Género M M H M M M M M H M M M M M Estudia AV S N AV AV AV S S S AV AV AV AV AV Género H H H M M M M M H M M H M M Estudia AV AV AV AV AV S AV S AV AV N AV N S Género H H M M M H M H M M H M H M Estudia N S AV S S AV S AV AV S N AV AV AV a. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   a. Que resultados esperarían su respuestas? Usar la moda para justificar el análisis. Construir la tabla de frecuencias para la variable género. se cuestionó si se prepara o no para los exámenes. b. LECCION 5 En un estudio realizado a un grupo de 56 estudiantes de la UNAD. Si se decide encuestar a un hombre mas. además el género del estudiante que participa en el estudio. e. ¿cuál es el porcentaje de producción correspondiente a cada una de las prendas?   AUTOEVALUACIÓN. el resultado será favorable? d. Extraer 3 conclusiones de los datos. AV: si algunas veces se estudia y N: si nunca se estudia. El profesor de matemáticas afirma que si mas de un 80% de las personas siempre repasan para el examen. Se registro. Construir una tabla de contingencia para las dos variables. ¿Cuál fue el número total de prendas confeccionadas en junio? b. En cada respuesta se reporto: S: si siempre hay un repaso. f.     84 . Construir la tabla cruzada de porcentajes correspondiente.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

Coordinar el personal del campo 2. Señalar el literal más adecuado para las siguientes observaciones: El costo de una encuesta por correo es generalmente: a. En el centro para que sean precedidas y seguidas por preguntas fáciles c. Que se tenga un problema 3. 3. Establecer la hipótesis b. LECCION 7 1. Igual al de una encuesta por medio de entrevistas personales b. Imposible de medir en relación con el costo de una encuesta por medio de entrevistas personales. Que exista un objetivo b. Señalar el literal más adecuado para las siguientes observaciones: La investigación preliminar permite: a. al comenzar por las más fáciles hasta llegar a las difíciles. la investigación estadística requiere: a. para salir inmediatamente de la parte más difícil b. AUTOEVALUACIÓN. Menor al de una encuesta por medio de entrevistas personales d. LECCION 6 1. ¿Que comprende en una investigación estadística la etapa de planeación. luego que se haya establecido un clima de confianza. las preguntas más difíciles deben colocarse a. determinar la muestra c. Mayor al de una encuesta por medio de entrevistas personales. Al final.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Al principio. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   AUTOEVALUACIÓN. En el diseño del cuestionario en la etapa de recolección de la información. Antes que nada. Contestar verdadero o falso según el caso:   85 . c. Que se hayan trazado planes c. 2.

7 36. b.3 34.9 34.1 34.0 34.1 34.0 35.1% de su peso.1 35. Existen dos tipos definidos de tortugas en el área.5 34. Los siguientes datos muestran el número de huevos en cada uno de los nidos de 30 tortugas sobre la playa de Florida.3 34.7 33. f.2 34.7 34.5 33. siempre que está sea clara.2 34. Elabore un diagrama de tallo y hojas y haga un breve comentario de los resultados que este arroja. LECCION 8 1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   a.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Un formulario debe llevar una sola clase de preguntas. Los siguientes datos representan las calificaciones en una prueba de coordinación física aplicada a un grupo de 20 personas después de haber ingerido una cantidad de alcohol equivalente a 0.1 34.2 35.8 34. Un formulario se precodifica para agilizar la codificación.2 34.2 33. Elabore una lista de los valores de datos que aparecen en el diagrama de tallo y hoja siguiente. Tallo 4 5 6 7 Hojas 0 2 1 1 2 3 0 3 8 3 9 7 7 9 3. Se conoce como fuente primaria aquella que obtuvo inicialmente la información directamente de la persona o entidad.5 34. Organice los datos como una combinación ordenada.7 33.6 34. 33. c. 69 57 84 64 52 67 93 72 61 74 74 55 79 82 65 61 88 68 63 77 2.8 33.2 36. En un estudio sobre el crecimiento de los varones se obtuvieron estas observaciones sobre el perímetro craneal en centímetros de un niño al nacer.6 35.6 35. AUTOEVALUACIÓN.4 33.6 35. Después de realizar el formulario se define el objetivo de la investigación e.1 34.9 34.3 4.6 34.2 34. ¿Un arreglo de tallo y hojas revela la existencia de dos poblaciones? ¿Lo hará uno de doble tallo?   86 . Al diseñar un cuestionario no es de gran importancia la forma como se hace la pregunta. La recolección de datos se puede hacer mediante la observación d.8 36.3 35.

i. e. Los siguientes datos corresponden al total de ventas semanales (en cientos de dólares) de una tienda de accesorios para dama.4 94.9 113. ¿Qué concluye? 192. Las siguientes son el número de llamadas semanal que recibe un call center.1 102.1 97. f.5 99. si se emplean el número de clases hallado en el numeral d? Verifique si es necesario hallar un nuevo rango y hacer el ajuste de exceso.1 90.4 96. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   206 197 142 181 101 167 187 192 171 201 175 193 197 163 133 204 124 109 146 141 123 137 126 124 152 138 141 127 184 132 5. Determine el dato mayor y el menor Determine el rango ¿Cuántas clases se necesitan para agrupar estos datos? ¿Cuál es la amplitud mínima necesaria por clase para cubrir el intervalo. Organice los datos como una combinación ordenada.8 192.7 93.8 95.6 96.5 99. d. AUTOEVALUACIÓN LECCIÓN 9 1. relativa y acumulada ascendente y descendente.3 114.8 103.2 97.6 92.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.3 102.5 98.5 102. Construya una tabla completa de distribución de frecuencias agrupadas. Determine los intervalos de clase para este conjunto de datos Halle los límites reales de dichos intervalos.1   87 . Construya la tabla de frecuencias absoluta.1 191. g. h. 1959 2802 2412 6837 5099 6472 5749 3894 4534 2462 7624 8639 6627 8327 1801 5847 7020 4000 1548 7417 4484 8225 4632 4327 6725 3378 4801 6082 5633 6142 9359 6964 7343 737 10241 4148 12130 8973 7428 4189 5321 962 6588 9166 849 a.3 98. c.2 99.4 102. b.5 97.

f. ¿Qué porcentaje pesa menos de 79. g.9 79.9 – 59.0 gramos o menos. e.9 gramos. Los siguientes son los números de venados observados en 72 sectores de tierra en un conteo de vida silvestre.9 19.9 gramos?   88 .0 gramos.9 – 99.0 gramos.9 99.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.34 Marca de clase Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada ascendente Frecuencia relativa acumulada ascendente 3. Más de 59. b. Exactamente 70. Complete la siguiente tabla de distribución de frecuencias.9 TOTAL Número de especimenes 16 38 35 20 11 4 1 125 Si es posible. La siguiente es la distribución de los pesos de 125 muestras de minerales recolectadas en una investigación de campo.9 39.9 59.9 gramos.9 – 79. d.0 a 100 gramos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2. c.9 – 139. Peso en gramos 0.9 119. encuentre cuántas de las muestras pesan: a.9 – 39. Más de 80. Cualquier valor de 60. 18 13 8 2 21 15 8 19 12 16 0 10 9 0 13 11 16 16 22 2 21 18 12 14 12 14 8 10 20 29 16 17 11 28 17 17 20 11 19 15 13 4 33 18 1 24 20 18 15 16 14 8 10 21 21 13 4 20 16 10 18 12 19 6 5 16 13 6 16 7 10 9 Intervalo de clase 0–4 5–9 10 – 14 15 – 19 20 – 24 25 – 29 30 .0 – 19. 80. Como máximo 59.9 – 119.

marzo.1. septiembre.9 gramos? ¿Qué porcentaje pesa exactamente 39.9? 4. agosto. construya un histograma de frecuencias absolutas. Complete la tabla de frecuencias agrupadas y a partir de este. abril. noviembre. junio. febrero.3. septiembre. marzo. junio. agosto. Junio. emita conclusiones. enero.. diciembre. noviembre. junio.. noviembre. sobre el número de egresados de la UNAD en el período 1994-2004. octubre. enero. julio. noviembre. agosto. mayo. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   h. marzo. julio. 2. Frecuencia absoluta acumulada ascendente Estatura (en centímetros) 125 — 129 129 — 133 133 — 137 137 — 141 141 — 145 145 — 149 149 — 153 Total   Número de estudiantes 1 4 9 24 28 22 12 100 Frecuencia relativa Marca de clase AUTOEVALUACIÓN LECCION 10. Con la tabla de frecuencia construida en el ejercicio 2. agosto. ¿Qué porcentaje pesa más 19. del tema 2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. mayo.   89 . noviembre. julio. Construya un diagrama de frecuencias absolutas y de frecuencias absolutas acumuladas con los datos reportados en la tabla 2.5. febrero. abril. junio. diciembre. junio. junio. abril. julio. septiembre. Construya una tabla de frecuencias relativa y un diagrama de barras para los datos recolectados. Un profesor decide registrar el mes de nacimiento de cada uno de los 40 estudiantes del tercer grado. diciembre. sobre el número de llamadas semanal que se recibe en un call center. 3. La siguiente tabla corresponde a la estatura (en centímetros) de los estudiantes de un grupo de quinto grado. septiembre. 1. un polígono de frecuencias absolutas y las respectivas ojivas ascendente y descendente. i.

5% del total. 7. El reporte contable fue: Cartagena: $3’452. $3`985. $6`130. 10. $1`998. en donde se clasifica el número de estudiantes por CEAD en la Seccional Occidente durante el primer semestre de 2005.700 en junio. 5.700 en junio.100 en febrero. 12.400 en marzo. Elabore por lo menos dos gráficas adecuadas para presentar la siguiente información: Durante 5 meses un escritor escribió una novela de 198 páginas de la siguiente manera: en el primer mes. $2`058. en el tercer mes.500 en enero. La siguiente tabla indica las superficies de los distintos continentes del mundo en kilómetros cuadrados (km2).500 10`354.000 24`247.   90 .200 30`244.8%. $3`002.600 8`547.700 en abril.000 13`338.2. $4`875. en el cuarto mes. el 39% restante. $5`468. $4`500.600 en febrero.100 en mayo. Medellín: $2’301. Continente Asia África Norteamérica Suramérica Antártica Europa Oceanía Área en km2 44`391.400 en marzo. $3’400. El administrador del almacén le solicita conocer las ventas totales mes a mes y le pide que entregue un informe escrito y gráfico de los resultados.4% del total y en el último mes.300 en abril.600 en mayo. Elabore también un pictograma.100 en mayo.000 6. Dibuje en un gráfico de línea las ventas de un almacén en el primer semestre del año para sus tres sucursales en el país. Bogotá: $4’750. $2`985. $2’100. 20. Construya un diagrama de barras para la tabla 2.600 en febrero. $2’125. en el segundo mes. ¿Qué tipo de grafico usaría? Elabórelo y escriba un pequeño reporte. 17.000 en enero. $4`923. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   4.500 en enero.000 17`821. $2`932. Haga un pequeño reporte escrito de las fluctuaciones de venta en las tres sucursales al administrador del almacén.700 en abril. $3`032. Represente estos datos en un diagrama circular.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.600 en marzo.3% del total.700 en junio.

6. . 4. Medidas de posición 2. 6.2. 6 X 4 5 6 7 8 9 10 n  f 8 12 11 20 14 10 7 82   91 . Realizar un mentefacto conceptual de las siguientes medidas estadísticas univariantes a. 4. Explique con sus propias palabras que diferencia existe entre estimador y parámetro AUTOEVALUACION LECCIÓN . En la siguiente serie de números indicar: $4. 7.300 $9. Variable 3.000 $8. 7. 8. La media ¿Qué valor de esta serie afecta a la media aritmética? Calcule la media aritmética. Medidas de tendencia central b. b. Cualquier medida aplicda a la características d elas unidades en la poblaciòn se denominada: a. 5. 6.12 1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 7.000 a.250 $9.000 $12. Parámetro b.700 $12.000 $5. Estadístico d.500 $35. a.500 $5. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   AUTOEVALACION LECCIÓN 11 1.000 $4. e. 5. Estimador c.

5 en el 20%. Señalar el literal más adecuado para la siguiente observación: 1. ¿Cuál es la velocidad promedio del viaje completo? 8. Carlos obtiene calificaciones parciales de 65.000. Calcular las desviaciones respecto ala media. $358. 40 trabajan en el día y 60 en la noche.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. que sirva de base para análisis financieros. 2.000.0 en el 30%.200 y que los del turno del día reciben en promedio $28. Intervalos de clase Frecuencia 39 – 49 5 49 – 59 8 59 – 69 10 69 – 79 9 79 – 89 8 89 – 99 6 99 – 109 4 Total 50 3. y 90. 7. ¿Cuál es el salario promedio en cada grupo? 4. 80. La mediana generalmente se define como aquel valor de la variable:   92 . otro 8 horas y un tercero demora 5 horas. En una industria se ha controlado el tiempo que tardan tres obreros en ensamblar un motor. Para evitar la noche en carretera. $365. los sueldos de 5 personas en un almacén son $382. este decide acelerar a 80 km/h para llegar de nuevo a Bogotá.2 en el 10%. Calcule la media ponderada. Halle el rendimiento de un obrero tipo. Un hombre viaja desde Bogotá hasta Acacías a una velocidad de 60 km/h. AUTOEVALUACION LECCIÓN 13. Antes del examen final de Estadística. Si la evaluación final equivale al 40% restante. 83. En el examen final recibe una calificación de 92. Uno demora 6 horas. si cada uno de los exámenes parciales cuenta el 15% y el examen final cuenta 40% de la calificación total. De un grupo de 100 obreros en una fábrica. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   c.000 menos que los trabajadores nocturnos.000. $380. Se sabe que el salario promedio de los 100 obreros es $407. 5.000. ¿que calificación necesita para obtener un promedio final de 3. 4.5? 6. un estudiante obtiene calificaciones de 3.

7. Que supera la mitad y al ismo tiempo es superado por la mitad de las observaciones e.300 $9. 5.000 $4. 7. En la siguiente serie de números indicar: $4. 6 c. 5.500 $35.000 $5.250 $9. 4.La moda generalmente se define como aquel valor de la variable que:   93 .500 $5.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. X 4 5 6 7 8 9 10 n  F 8 12 11 20 14 10 7 82 6. Calcule la mediana de los siguientes conjuntos de datos: a. 4. La mediana 3.000 $8. Que supera a la máxima frecuencia b.000 a. 7. 6.000 $12. Que no supera a la mitad de las observaciones c. b. 2.700 $12. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   a. Que presenta el menor grado de frecuencia. 8. Que presenta la máxima frecuencia d. 6. Intervalos de clase Frecuencia 39 – 49 5 49 – 59 8 59 – 69 10 69 – 79 9 79 – 89 8 89 – 99 6 99 – 109 4 Total 50 AUTOEVALUACIÓN LECCIÓN 14 Señalar el literal más adecuado para la siguiente observación: 1.

Tiene el menor grado de variabilidad 2. $4.000 La moda 3. 5. 6 c. En la siguiente serie de números indicar: $4. b.500 $8.250 $35. Calcule moda de los siguientes conjuntos de datos: a.000 $12. Intervalos de clase Frecuencia 39 – 49 5 49 – 59 8 59 – 69 10 69 – 79 9 79 – 89 8 89 – 99 6 99 – 109 4 Total 50 4. Determinar si en los siguientes conjuntos de observaciones. o si por el contrario no existe:   94 . 4. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   a.000 $5. 7.700 $5. la moda es única (unimodal) .000 $9. bimodal.000 $12. 6.500 $9. Tiene la menor frecuencia d. 7. 8. 6. 4. 7.300 c. Supera a la menor de las observaciones e.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Más se repite c. Se ve afectada por valores extremos b. 5. X 4 5 6 7 8 9 10 n  f 8 12 11 20 14 10 7 82 6.

1. 11.12 y 1. P22 y P94. 18. 1. 15 b. D4. 7. 9. 4. 10. 10. 4. 9. 7. b. 1. el 8%. 3. 2.08. Hallar: D2. 10. La secretaria de transito decidió realizar una medición de los índices de velocidad en un punto a las afueras de una ciudad. 16. 4. 2. 10. Para la siguiente tabla de distribución de frecuencias agrupadas. determine los tres cuartiles tanto teórica como gráficamente. 4. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   a. 20 10. El factor de crecimiento promedio de dinero compuesto con tasa de interés anual del 10%. 7. el 12% y el 7% se obtiene determinando la media geométrica de 1.10. La medición fue hecha en las horas en las cuales se presentaba el mayor número de accidentes en dicho punto. 7. Los resultados de la medición se registran a continuación 85 92 120 88 76 105 125 126 112 106 123 90 115 117 94 86 62 56 77 83 124 123 83 87 75 85 80 94 91 118 72 90 84 72 86 99 87 111 77 114 67 95 91 100 128 128 130 118 75 103 64 105 93 116 122 71 a. 9.10. Hallar los cuartiles y sacar varias conclusiones del estudio. 18 AUTOEVALUACION LECCIÓN 15 1. 7.18 c.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 4. 2. Calcule el factor de crecimiento promedio. Interpretar cada resultado.12. c. 14.07.09. Calcular el número de intervalos y construir una tabla de frecuencias que describa la situación. 10. el 9%. 2. Intervalos de clase Frecuencia 39 – 49 5 49 – 59 8 59 – 69 10 69 – 79 9 79 – 89 8 89 – 99 6 99 – 109 4 Total 50     95 . 10.

Primer Curso. CHRISTENSEN.uaq. Santa fe de Bogotá.unp.edu. McGraw Hill. Santa fe de Bogotá: ECOE Ediciones. A. PORTILLA CHIMAL.cl/eduteca/estadistica/ http://www.com/descriptiva. Editorial Addison – Wesley Iberoamericana. México: Editorial Trillas. (1992). Susan (1999).cl/estentrada.html http://thales. SMITH. Estadística Descriptiva.eneayudas.htm   96 . Stanley.elosiodelosantos. Serie de compendios Schaum. Howard B. (1991). Introducción a la Estadística.es/rd/Recursos/rd98/Matematicas/01/matematicas-01. Hernán (1995). Bogotá: Nueva Editorial Interamericana.ar/estadisitio/estaddes. J. Curso de Estadística Elemental para las ciencias aplicadas. Murria R. Santa fe de Bogotá. Santa fe de Bogotá: ECOE Ediciones. Segunda edición.aulafacil. Enrique (1980).htm http://www.cica.html http://148. Estadística para biología y ciencias de la salud. Ciro (2003). MARTÍNEZ BENCARDINO. Ciro (2004). Lincoyán (2001). (1999). MILTON.216. Estadística y Muestreo.educarchile. Estadística Paso a Paso.mx/matematicas/estadisticas/xu3. Estadística.10. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   BIBLIOGRAFÍA DE LA UNIDAD BEJARANO BARRERA.com/CursoEstadistica/CursoEstadistica. Estadística Básica Aplicada. Primera edición. Madrid: McGraw Hill — Interamericana. México: McGraw Hill.htm http://www. SPIEGEL. PORTUS GOVINDEN.html http://www.htm http://www.83/estadistica/descriptiva. http://www.ing.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. MARTÍNEZ BENCARDINO. Estadística. Santa fe de Bogotá: UNISUR.

html#tema2 http://personal5.htm   97 .edu.html http://www.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.hrc.es/ztt/Tem/T11_Estadistica_Introduccion.universidadabierta.mx/SerEst/MAP/METODOS%20CUANTITATIV OS/Pye/tema_11.es/bioest/M_docente.com/estadistica_15. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   http://www.htm http://html.rincondelvago.iddeo.

 TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Unidad Didáctica Dos MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES   98 .UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

UNIDAD 2. MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES

Lección 16 Rango o Recorrido CAPITULO 4.  MEDIDAS DE DISPERSIÓN  Lección 17 Varianza Lección 18 Coeficiente de variación Lección 19 Puntaje típico o estandarizado Lección 20 Medidas de asimetría y apuntamiento Lección 21 Regresión y correlación CAPITULO 5. MEDIDAS  ESTADÍSTICAS BIVARIANTES  Lección22 Diagrama de dispersión

Lección 23 Regresión lineal simple Lección 24 Correlación Lección 25 Regresión multiple

CAPITULO 6.  NÚMEROS INDICE   

Lección 26 Construcción de números índice Lección 27 Tipos de números índice Lección 28 Índices Simples Lección 29 Índices compuestos Lección 30 Uso de los números indice

 

99

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

INTRODUCCIÓN A LA UNIDAD

La Unidad Didáctica 1 se dedicó a explicar los métodos que deben aplicarse en una investigación estadística tales como la planeación, recolección, organización y presentación de ella. Esta unidad tiene como propósito indicar otros métodos para medir e interpretar el comportamiento de un conjunto de datos dados.

Se ha visto que tanto las tablas como las muy diversas formas de graficar la información describen fenómenos de una población o muestra, pero no siempre lo hacen en forma satisfactoria; es allí donde se hace visible la importancia de las medidas estadísticas bien sean univariantes, en donde interviene una variable, o bivariantes cuando lo hacen dos.

Esta Unidad Didáctica se ha dividido en tres grandes capítulos: Medidas Estadísticas Univariantes que pueden ser medidas de tendencia central vistas en el capitulo 3, medidas de dispersión y de asimetría, Medidas Estadísticas Bivariantes y números índices, obedeciendo al número de variables que intervienen en estos cálculos aritméticos. En el primer capítulo, se considerarán las medidas: de dispersión o variabilidad, de asimetría o de deformación y de apuntamiento o curtosis.

En los capítulos cinco y seis, se estudiará el comportamiento de dos variables, a fin de determinar si existe alguna relación entre sí y de cuantificar dicho grado de relación. Se desarrollarán aquí los conceptos de regresión y correlación de dos variables y el concepto y usos de los números índices.

 

100

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

OBJETIVOS ESPECÍFICOS
• • • • • • • • • • • • • • • •
Ejecutar las operaciones indicadas por la notación sumatoria y productoria. Desarrollar destrezas para calcular algunas medidas de tendencia central. Interpretar las medidas de tendencia central y comprender sus aplicaciones. Comparar las medidas de tendencia central y seleccionar la más útil según las circunstancias. Desarrollar destrezas para calcular algunas medidas de dispersión. Comparar las medidas de dispersión y seleccionar la más útil para una determinada aplicación. Reconocer que las medidas de dispersión complementan la descripción que proporcionan las medidas de tendencia central. Interpretar y utilizar las medidas de dispersión. Identificar los tipos de asimetría y apuntamiento en una distribución de datos. Identificar hechos que admitan intuitivamente un comportamiento lineal simple. Interpretar y manejar los conceptos de regresión y correlación. Dibujar y aplicar gráficos de dispersión. Calcular el coeficiente de correlación entre dos variables. Calcular la ecuación de regresión para dos variables. Identificar e interpretar correctamente números índices. Desarrollar destrezas necesarias para elaborar y aplicar números índices en circunstancias específicas.

 

101

después de la primera evaluación. UNIDAD MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES 2. EJEMPLO 16.0. medidas a las que se les denomina de dispersión o de variación. a un profesor de Estadística poco le dice la media aritmética al afirmar que el promedio de los estudiantes tiene el curso en 3.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.0 ya que no le termina de aclarar si el grupo completo está muy cerca de esa nota.1 Un profesor de Estadística tiene a su cargo dos grupos de 40 estudiantes cada uno.1 LECCIÓN 16 RANGO O RECORRIDO Sobre esta medida ya se había trabajado en la construcción de las tablas de frecuencia agrupada. sea por encima o por debajo de ella. Por ultimo se mencionarán unas nociones básicas sobre curvas asimétricas. Se trata de la diferencia entre el límite superior y el límite inferior de un conjunto de datos. Pero es poco usada como medida de dispersión porque se deja afectar fácilmente de los valores extremos de poca frecuencia. MEDIDAS DE DISPERSIÓN Y ASIMETRÍA Se veía en el tema anterior la tendencia que tiene un conjunto de datos dado a agruparse hacia el centro. Por ejemplo. o si al contrario existe tanta variabilidad en las notas de los estudiantes que puede ir desde 1. Se estudiará a continuación cómo resolver este tipo de problemas y qué medidas de dispersión usar.1. La información que arrojan las medidas de tendencia central no siempre proporcionan conclusiones contundentes frente al conjunto de datos.1 CAPITULO 4. sólo requiere que los datos estén ordenados. Es la medida de dispersión más fácil de calcular. ¿Hay diferencia alguna entre estos dos grupos?   102 . Medir esa variación respecto a los promedios es un cálculo importante en el tratamiento estadístico de datos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2. pero también se descubrió que los datos extremos podían estar bastante alejados de esa tendencia central. La siguiente tabla de frecuencias reporta las calificaciones del grupo A y grupo B de estudiantes. 2.0 hasta 5.

0 − 4. observe que un dato extremo hace variar completamente el conjunto de datos y demuestra que. Sin embargo.5 y 4. Analice qué tanto cambian los valores de la media y el rango del grupo A de estudiantes si se elimina la nota de 5.0 − 4.0.3 4. xA = ∑ fX n = 169.36 40 n RangoB = 5.0 = 1.5 4.4 = 4.7 4.0 4.0 = 0.36 40 n RangoA = 5.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.4 = 4.6 − 4.0 = ∑ fX Tabla 4.2 4.0 de un solo estudiante interfiere muchísimo en el análisis verdadero del comportamiento académico de los estudiantes del grupo A.9 5.6   103 .34 39 RangoA = 4.6 4. La nota de 5. el cálculo de la media y el rango son insuficientes para arrojar análisis certero de comparación.0 = 1.8 4.4 = 4.1.0. Distribución de frecuencias de las calificaciones de estudiantes de Estadística Calificación 4.1 4.0 Total Frecuencia A B 1 2 2 9 3 7 16 4 10 5 4 4 3 3 0 2 0 1 0 1 1 2 40 40 Tanto la media como el rango de ambos conjuntos de datos son iguales.4 4.0 = ∑ fX xB = 174. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Lo primero que se hace para verificar diferencias entre ambos grupos es calcular su media aritmética. ellos se distribuyen de forma muy diferente. Observe que el grupo A es más compacto hacia las notas entre 4. comparado con otro. xA = 174.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Se simboliza s2 para la varianza muestral y σ2 para la varianza poblacional. Para eliminar la influencia de los extremos en el cálculo del rango. ella a su vez da origen a otra mucho más significativa: la desviación típica o estándar. el rango interdecil corresponde a la diferencia entre el noveno y el primer decil: DR = D9 − D1 2. sin embargo presentan inconvenientes para su uso puesto que no consideran todos los valores de la distribución y puede ocurrir que los valores inferiores a Q1 o superiores a Q3 estén o muy compactos o muy dispersos sin que esto afecte a QD y no sea reflejado en su resultado. Se define como la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética. QD 2 = Q3 − Q1 2 Ambas medidas son más confiables como variabilidad comparadas con el rango. es común hacer uso del rango intercuartílico que consiste en determinar la diferencia entre el tercer cuartil y el primero. Para datos no agrupados: s 2 ∑ ( X − x) = n 2 ⇒ s 2 ∑X = n 2 − x2 Para datos agrupados:   104 . Q D = Q3 − Q1 El rango semiintercuartílico o desviación cuartil se obtiene calculando el rango intercuartílico y dividiendo este entre dos. las calificaciones del grupo B se distribuyen mejor alrededor de todo el rango de datos.2 LECCIÓN 17 VARIANZA Y DESVIACIÓN ESTÁNDAR Es una de las medidas más usadas en estadística.1. De la misma manera. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   En cambio.

Pero las muestras difieren mucho en sus tamaños. se pueden utilizar sus varianzas de manera que el resultado indique cuál de ellas es más homogénea o cuál es más heterogénea. para visualizar mejor esto se analizan sus respectivas varianzas.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.80 2 + 2.0 pulgadas. el tamaño de sus tornillos mientras que la empresa A mantiene un rango constante en el tamaño de los tornillos que produce.0 2 = 0. De allí que la varianza de origen a la desviación típica o estándar. 1.02 2 −x = − 2. en su producción.70 2 + 1.0 2 = 0. Las unidades de la varianza son los cuadrados de las unidades de los datos: pesos cuadrados.001 3 2 − x2 = 1. 2.03 2 + 2.70 pulg. Haga un análisis de variabilidad de ambas empresas. Tenga en cuenta que los datos no están agrupados. 1.50 pulg. Esto quiere decir que la empresa B varía mucho. por lo que se hace uso de la primera ecuación: s 2 A ∑X = n 2 s2B = n ∑X2 1.95 2 + 2. medidas difíciles de interpretar.   105 .. alumnos cuadrados.80 pulg. La siguiente tabla indica las longitudes de una muestra de tres tornillos tomados al azar. en cuanto a su variabilidad absoluta.50 2 − 2.127 3 Observe que la empresa A tiene una variación mayor respecto a la empresa B en cuanto a la calidad en la fabricación de tornillos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   s 2 ∑ f ( X − x) = n 2 ⇒ s 2 ∑ f ⋅X = n 2 − x2 La varianza indica la desviación de los datos respecto a la media.95 pulg. 2. EJEMPLO 17.02 pulg. etc. Empresa A Empresa B 1.1 Se quiere conocer la verdadera calidad de producción en dos empresas fabricantes de tornillos para fuselaje. 2. Es fácil calcular que ambas empresas tienen una media de x = 2. Para comparar dos distribuciones.03 pulg.

9 5.5 4.85 761.2 4.48 22.81 33.49 295.0 Total Frecuencia A B 1 2 2 9 3 7 16 4 10 5 4 4 3 3 0 2 0 1 0 1 1 2 40 40 X2  16 16 16.62 17.3 4.01 0 25 25 223. Esta es la medida de dispersión más conocida y más utilizada en el análisis de datos estadísticos.6 4.8 4.04 24.29 123.36 193.64 52. tomando siempre el valor positivo.0 4.6 20.16 63. Se simboliza por s en la muestra y σ en la población.1.1 Desviación típica o estándar Esta medida se obtiene extrayendo la raíz cuadrada de la varianza.24 Calificación 4.7 4.92 18. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2. Tabla 4.01 50 763.25 81 21.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.46   106 .4 4.2 Después de estudiar los conceptos de varianza y desviación estándar.09 0 23. Distribución de frecuencias de las calificaciones de estudiantes de Estadística f∙X2  A B 32 151.48 73.96 96.8 81 63.1 4. se está en capacidad de hacer un análisis mucho más riguroso de la variabilidad de las calificaciones de los estudiantes de Estadística del ejemplo 16.48 44.18 23.84 19. Para datos no agrupados: s= ∑( X − x) n 2 ⇒ s= ∑X n 2 − x2 Para datos agrupados: s= ∑ f ( X − x) n 2 ⇒ s= ∑ f ⋅X n 2 − x2 EJEMPLO 17.1.04 0 24.2.2.

Si las unidades de observación de los conjuntos de datos son iguales.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.0714 = 0. en otras palabras. Cuando se comparan dos o más conjuntos de datos con unidades de medida de observación diferentes.3 LECCIÓN 18 COEFICIENTE DE VARIACIÓN Y DESVIACIÓN MEDIA Las medidas de dispersión que se han estudiado son medidas absolutas y se expresan en las mismas unidades con las que se mide la variable. se tiene: sB = ∑f ⋅X n 2 − x2 = 763.164 40 Y para el grupo B de estudiantes. de lo contrario estas apreciaciones no aportarán una buena conclusión sobre las series que se comparan.   107 . este indica mayor variación en el grupo de datos.36.267 40 La varianza del grupo B es mayor que la del grupo A. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Para el grupo A se tiene: sA = ∑f ⋅X n 2 − x2 = 761. El valor de la desviación estándar puede incrementarse drásticamente cuando se incluye uno o más datos distantes.24 − 4. estos pueden compararse usando cualquiera de estos estadísticos (como en el ejemplo anterior) pero siempre y cuando la media aritmética sea la misma. etc. en el grupo B hubo mayor estabilidad en las notas alrededor de su media: 4. Es importante tener en cuenta las siguientes propiedades de la desviación estándar: • • • • • La desviación estándar es una medida de variación de todos los valores con respecto a la media. El valor de la desviación estándar siempre es positivo y sólo es igual a cero cuando los valores de los datos son iguales. no es posible compararlas con estas medidas absolutas.1.36 2 = 0.36 2 = 0. se dice entonces que los datos del grupo B tiene mayor variabilidad que los del grupo A.46 − 4.0269 = 0. Si el valor de la desviación estándar es muy grande.) 2. centímetros. Las unidades de la desviación estándar son las mismas de los datos originales (pulgadas.

en estadística se usa el coeficiente de variación y así se puede determinar cuál serie tiene mayor o menor variabilidad relativa. Ella toma todos los valores de la variable y es menos afectada que la desviación estándar por los valores extremos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Para efectuar comparaciones entre series de observaciones distintas. sin embargo este valor no proporciona una relación matemática precisa con la posición de un dato dentro de la distribución y. tomadas en valor absoluto5. Es una de las medidas más fáciles de calcular y por ello. muy usada. 2 = 2 . Para datos no agrupados: DM = ∑ X −x n Para datos agrupados: DM = ∑ f ⋅ X −x n Cuanto mayor sea el valor de la desviación media. CV = s × 100% x Cuando el coeficiente de variación es muy alto se dice que la media aritmética no es lo suficientemente representativa en la distribución. Trigonometría y Geometría Analítica de la UNAD o cualquier otro texto de matemáticas básicas.1.   108 . puesto que se toman los valores absolutos.1 Desviación media Se define como la media aritmética de las desviaciones respecto a la media. mayor será la dispersión de los datos.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 2. Por ejemplo: − 2 = 2 .3.                                                              5 Recuerde que el valor absoluto de un número indica siempre su valor positivo. Su valor siempre será menor que la desviación estándar. se recomienda trabajar en los módulos de Matemáticas Básicas o Álgebra. mide la desviación de una observación sin determinar si está por encima o por debajo de la media aritmética. Si requiere repasar este tema.

98 Desviación media: DM = 104.36 Desviación media: DM = 57.66% 643 104.1 Los siguientes datos corresponden a los salarios de 10 empleados (en miles de pesos) de dos empresas de alimentos. Estos resultados llevan a las siguientes conclusiones:   109 .27% 692 Coeficiente de variación: CV = Empresa B: Media aritmética: x = 643 Varianza: s 2 = 14396 Desviación estándar: s = 119.98 Coeficiente de variación: CV = × 100% = 18. Empresa A: $420 $680 $690 $720 $720 $720 $730 $740 $740 $760 Empresa B: $415 $480 $510 $650 $700 $700 $730 $735 $750 $760 Empresa A: Media aritmética: x = 692 Varianza: s 2 = 8716 Desviación estándar: s = 93. Calcular los coeficientes de variación y de desviación media.31% Coeficiente de desviación media: CVM = 643 El CVM es menor que el CV debido a que la desviación media es menor que la desviación estándar.2 Coeficiente de desviación media: CVM = × 100% = 8.86 119. a la desviación media puede calculársele el coeficiente de desviación media: CVM = DM × 100% x EJEMPLO 18.86 × 100% = 16.2 93.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   De la misma manera que la desviación estándar.49% 692 57.36 × 100% = 13.

Z= X −x s Por ser adimensional. En la empresa B los salarios varían grandemente respecto al media: en 14396 miles de pesos cuadrados. que en términos de la desviación estándar esto es $119. En ella la media aritmética se localiza en la mitad de la distribución. el puntaje Z es útil para comparar datos individuales de distribuciones que tienen distintas unidades de medida. El área bajo la curva tendrá un valor del 100% Figura 4. así como diferentes   110 . su polígono de frecuencias revelará una forma de campana muy común en estadística. mientras que en la empresa B el salario promedio es de sólo $643. El coeficiente de variación y el coeficiente de variación media de la empresa B son menores a los coeficientes calculados para la empresa A. denominada distribución normal. Por lo general se simboliza por Z. En el eje horizontal se ubican los valores que toma la variable y en el vertical la frecuencia absoluta o relativa. En cambio.1. se simboliza por t. El puntaje estandarizado mide la desviación de una observación con respecto a la media aritmética.360. en la empresa A la variación es de $93.000. Curva normal o campana de Gauss El puntaje típico o estandarizado o variable normalizada. de error.000.1. 2. en unidades de desviación estándar. determinándose así la posición relativa de una observación dentro del conjunto de datos.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • • • El salario promedio de los 10 empleados de la empresa A es de $692. Esta curva es llamada curva normal. esto indica la variación relativa de los salarios en ambas empresas.980. de probabilidad o campana de Gauss.4 LECCIÓN 19 PUNTAJE TÍPICO O ESTANDARIZADO Cuando se tiene una distribución simétrica. pero cuando el tamaño de la muestra es menor de 30. es una medida de dispersión muy utilizada como variable estadística en este tipo de distribución.

2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.9 y varianza 3. Para saber en cuál hubo mayor dispersión relativa.   111 . basta con hacer una comparación entre sus desviaciones estándar.5. Recuerde que la desviación estándar es la raíz cuadrada de la varianza. ¿En cuál curso hubo mayor dispersión absoluta? ¿En cuál hubo mayor dispersión relativa? b. Dentro de sus propiedades.79>1. ya se tiene el valor de la desviación estándar de las calificaciones de Estadística Descriptiva en cambio.8 y en Estadística Descriptiva 3.9 1. pues 1.7 y desviación estándar 1. las más importantes son que su media es cero y su desviación estándar y varianza es uno.79 Para Lógica Matemática: CV = × 100 = 45. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   medias y desviaciones estándar.1 Al terminar el semestre. se hace uso del puntaje estandarizado. EJEMPLO 19.7. Si un estudiante obtuvo como nota final en Lógica Matemática 3. se recurre al coeficiente de variación: 1. ¿En cuál curso fue su puntuación relativa superior? a. Para determinar la dispersión absoluta. aunque no es mucha la diferencia.7. un grupo de 150 estudiantes de primer semestre de Regencia de Farmacia del CEAD de Medellín obtuvieron los siguientes resultados en el puntaje final de los cursos Lógica Matemática y Estadística Descriptiva: • • Lógica Matemática: puntuación media de 3.9% 3.79 Se tiene entonces que en Lógica Matemática hubo una mayor dispersión absoluta.2 → s = 3. Para Lógica Matemática: s 2 = 3. Es decir.7 En Estadística Descriptiva hubo una mayor dispersión relativa 46%>45.7 Para Estadística Descriptiva: CV = × 100 = 46% 3. se tiene la varianza de las calificaciones de Lógica Matemática. a. Observe que en los datos suministrados.2 = 1. Estadística Descriptiva: puntuación media de 3. se requiere estandarizar las calificaciones convirtiéndolas en puntuaciones Z. Para el cálculo de la puntuación relativa.9% b.

En cursos más avanzados. su puntuación Z correspondiente será negativa. se dice que la puntuación relativa del estudiante fue superior en Lógica Matemática. la mediana también se corre pero menos que la media ya que en ella sólo influyen las frecuencias.8 − 3.1.1.5 en Estadística Descriptiva. de la presente Unidad   112 .5 LECCIÓN 20 MEDIDAS DE ASIMETRÍA Y APUNTAMIENTO Después de conocer cómo varía un grupo de datos respecto a su media e identificar otras medidas de variación.5.3. está por debajo del promedio del grupo en ambos cursos. de la Unidad Didáctica uno).06 s 1.9 = = −0.12 s 1.1 Asimetría Ya se ha mencionado algo sobre los efectos de la asimetría respecto a la media. mediana y moda (ver sección 1. 2.1. 2. En una distribución simétrica se tiene que: x = Me = Mo En las distribuciones asimétricas la media se corre en el sentido del alargamiento o sesgo por efecto de las frecuencias y de los valores extremos de la variable. este tema se profundiza más.1. Este es un principio del puntaje estandarizado: Siempre que un valor sea menor que la media.06 se encuentra más cera a 0 (la media de la variable estandarizada).7 Z= = = −0. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Lógica Matemática: Estadistica descriptiva Z= x − x 3.79 x − x 3. en tanto que la moda no es influenciada ni por las frecuencias ni por los valores extremos (ver figura 3. se trabajará a continuación unas nociones básicas sobre curvas asimétricas. Dado que -0. como Probabilidad. pero para los objetivos que se trazan en este curso basta con las nociones que se desarrollan a continuación. Estos resultados afirman entonces que el estudiante con calificaciones de 3.8 en Lógica Matemática y 3.7 Estos valores de puntuación Z negativos indican que ambas calificaciones se encuentran por debajo de la media.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 − 3.4.

2. La distribución es asimétrica positiva cuando presenta un alargamiento o sesgo a la derecha y: Mo < Me < x Será asimétrica negativa cuando presenta un alargamiento o sesgo a la izquierda y: x < Me < Mo Las asimetrías positivas son las más frecuentes que las sesgadas hacia la izquierda.5. Asimetría en función de la media y la moda. las calificaciones en pruebas. comparadas con la curva de distribución normal. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Didáctica). etc.   113 . pueden presentar diferentes grados de apuntamiento o altura de la cima de la curva. entre otras. As = Q1 + Q3 − 2Q2 Q3 − Q1 Si As = 0 la distribución es simétrica. Se reconocen. los sueldos. As = • x − Mo s ⇔ As = 3 ⋅ ( x − Me) s Media cuartil de asimetría o media de Bowley. Ejemplo de ello es la distribución de valores en los consumos de servicios públicos.2 Apuntamiento o curtosis Las curvas de distribución. porque con frecuencia es más fácil obtener valores excepcionalmente grandes que valores excepcionalmente pequeños. las siguientes medidas para calcular el grado de la asimetría: • Coeficiente de Pearson. Si As > 0 la distribución es asimétrica positiva. Varía entre ±1 y es 0 en la distribución normal. Varía entre ±3 y es 0 en la distribución normal. Si As < 0 la distribución es asimétrica negativa. Esta agudeza en la cima se observa en la moda.1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

recibe el nombre de apuntada o leptocúrtica. Para esto selecciona una muestra de 55 estudiantes de los distintos programas que se ofrecen en el CEAD.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Competencias Comunicativas. EJEMPLO 20. Si Ap < 3 la distribución es achatada o platicúrtica. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Si la curva es más plana que la normal se dice que la curva es platicúrtica. Si la distribución es normal. Estadística Descriptiva y Herramientas Informáticas. La curtosis es la medida de la altura de la curva y esta dada por: ∑Z Ap = 4 i ⋅ fi 4 n⋅s Si Ap = 3 la distribución es normal o mesocúrtica. en los cursos de Lógica Matemática. si es más aguda que la normal.1 El coordinador académico del CEAD de Valledupar desea conocer el rendimiento académico de los estudiantes de primer semestre en el 2005. Otra medida de curtosis que se emplea está basada en el rango semiintercuartílico y los percentiles 10 y 9: Ap = QD 2 Q3 − Q1 = P90 − P10 2( P90 − P10 ) En el siguiente ejemplo se explicarán mejor las medidas de asimetría y apuntamiento. La siguiente tabla. arroja los resultados de la investigación realizada por el funcionario. Si Ap > 3 la distribución es apuntada o leptocúrtica. Cultura Política. la curva se conoce también como mesocúrtica.   114 .

0 Total Lógica Competencias Cultura Estadística Herramientas Matemática Comunicativas Política Descriptiva Informáticas 1 3 2 1 1 4 3 2 1 2 7 5 3 2 3 9 6 4 4 7 9 7 6 11 9 8 7 8 14 11 6 7 9 12 9 4 6 9 6 7 3 5 7 3 3 2 3 4 1 2 2 3 1 0 1 55 55 55 55 55 En la tabla siguiente se reporta un resumen de las medidas estadísticas por cada uno de los cursos (¡compruébelo!): Medida Lógica Matemática 2. Distribución de frecuencias de las calificaciones de primer semestre en Valledupar Calificación 0.5.0 2.5 0.06 2.5 5.53 2.5 2.0.0 y 3.5 3.1.0 1.5 2.5 3.4 x Me Mo s2 s Q1 Q2 Q3 2.5 1.87 2.84 1.0 3.5 2.0 2.0 3. Para confirmarlo se hace uso del coeficiente de Pearson y la media de Bowley: En este caso se trabajará con la media de Bowley.5 3.76 0.5 1.3.3 Lógica Matemática ( Asimétrica Positiva) Se observa que Mo < Me < x .25 2.0 3. lo que indica que la distribución es asimétrica positiva.36 1.5 2.0 Herramientas Informáticas 2.5 y 2.5 2.45 1.75 3. pues la distribución tiene dos modas y no permite un resultado seguro con el coeficiente de Pearson.0 4. 2.5 Estadística Descriptiva 2.20 2.0 3.5 1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 2.0 0.5 3.5 2.0 2.20 1.0 Competencias Comunicativas 2.0 1.5 2.5 y 3.0 1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Tabla 4.0 3.   115 .5 Cultura Política 2.45 1.5 4.0 1.12 1.

5 Q3 − Q1 El polígono de frecuencias de las calificaciones de Lógica Matemática confirma los resultados.2.4 Competencias Comunicativas (Simétrica) Se observa que Mo = Me = x .0 Calificación La curva lleva a concluir que la mayoría de los estudiantes están por debajo de la media en el curso de Lógica Matemática y son pocos los estudiantes que la superan.5 − 1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   As = Q1 + Q3 − 2Q2 1. lo que indica que la distribución es simétrica.33 > 0 3 − 1.5 4.5 1.5 + 3.5 − 2(2.0 4.5) = =0 3.1. Curva asimétrica positiva Polígono de frecuencias de calificaciones de Lógica Matemática 10 9 8 Frecuencia 7 6 5 4 3 2 1 0.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. pues la distribución tiene tres modas y no permite un resultado seguro con el coeficiente de Pearson.5 + 3 − 2(2) = = 0.0 2. As = Q1 + Q3 − 2Q2 1. Para confirmarlo se hace uso del coeficiente de Bowley.5.5 2.5 3.0 0.0 3.5 5.5 Q3 − Q1 El polígono de frecuencias de las calificaciones de Competencias Comunicativas confirma los resultados.0 1. 2.   116 . Figura 4.

838235294 0 Zi f i 34.0309024 34. Curva simétrica platicúrtica Polígono de frecuencias de calificaciones de Competencias Comunicativas con el coeficiente de Pearson.5 1. Tabla 4.0 0. 10 9 8 7 Frecuencia 6 5 4 3 2 1 0.0 Total f 3 3 5 6 7 7 7 6 5 3 3 55 Z -1. se debe determinar el puntaje típico o estandarizado de cada clase y luego aplicar la fórmula que lo calcula.5 3.5 2.5 2.2551328 14.470588235 -1.39910869 14.367647059 0.0309024 7.4.735294118 -0.12788583 1.0 4.0 2.102941176 -0.0 4.39910869 1.0 Calificación Para determinar el grado de apuntamiento o curtosis.0 0.735294118 1.7538628 7.367647059 0 0.0 1.5 5.5 5.102941176 1.2551328 115.838235294 -1.5 3.5 4.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.0 1.0 2. En la siguiente tabla se indican estos valores.3.0 3.7538628 0.5 1. Cálculo de Z para la distribución de frecuencias de las calificaciones de Competencias Comunicativas Calificación 0.0 3. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 4.5 4.470588235 1.12788583 0 0.133785 4   117 .

 TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   ∑Z Ap = 4 i 4 fi n⋅s ⇒ Ap = 115.5 2.0 2.5 − 2(3.0 1. 2.0 Q3 − Q1 As = El polígono de frecuencias de las calificaciones de Cultura Política confirma los resultados.5 1.33 < 0 3. Q1 + Q3 − 2Q2 2. pues la distribución tiene dos modas y no permite un resultado seguro con el coeficiente de Pearson.   118 .0) = = −0.0 3.0 4.5 − 2. además sus notas son muy homogéneas alrededor de la media. Para confirmarlo se hace uso de la media de Bowley.5 5.5 Cultura Política (Asimétrica Negativa) Se observa que Mo > Me > x . lo que indica que la distribución es asimétrica negativa. Figura 4.5 Calificación 3. Curva asimétrica negativa Polígono de frecuencias de calificaciones de Cultura Política 10 9 8 7 Frecuencia 6 5 4 3 2 1 0.0 + 3.62 < 3 55 × 1.36 4 Por lo tanto.0 Esto quiere decir que las calificaciones de la mayoría de los estudiantes del curso Cultura Política están por encima de la media. Estos resultados indican que la mayoría de los estudiantes en Competencias Comunicativas están en el rango de la media del curso.4.13 = 0.0 0.5 4.5.1. la curva es simétrica platicúrtica o achatada.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

6419753 19.27173856 24.0 4.5 = = 0.85835926 1. señalando una alta frecuencia en esta calificación.5 3.5 1. Esto indica que las calificaciones de Estadística Descriptiva de la muestra de 55 estudiantes están muy cerca de la media y que existe además.289837 0 190.0 1.03 ≈ 0 s 0.02210536 9.   119 .114942529 1.1.5 4.540229885 1.0 0.571331981 Zi f i 71.264367816 -1. lo que indica que la distribución es simétrica.53 − 2.0 − 2.70 = 6.0 2.51502275 1. En la tabla siguiente tabla se indican estos valores. un pico en 2.352941176 -4.5 5. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2.5 Cálculo de Z para la distribución de frecuencia de las calificaciones de Estadística Descriptiva Calificación 0.9794E-05 1.034482759 0.0 Total f 1 1 2 4 11 14 12 6 3 1 0 55 4 i 4 Z -2.6 Estadística Descriptiva Se observa que Mo = Me = x .0 As = Para determinar el grado de apuntamiento o curtosis. Para confirmarlo se hace uso del coeficiente de Pearson y la media de Bowley: x − Mo 2.87 4 Por lo tanto.1301647 7.4519547 26.5) As = 1 = =0 Q3 − Q1 3. Tabla 4.609195402 -0.87 Q + Q3 − 2Q2 2.5.0 + 3.5 2.183908046 -0.0 − 2(2. la curva es simétrica leptocúrtica o apuntada.5.333333333 -1.697484 4 ∑Z Ap = fi n⋅s ⇒ Ap = 190.516306 29.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. se debe determinar el puntaje típico o estandarizado de cada clase y luego aplicar la fórmula que lo calcula.689655172 2.908045977 -2.75862069 -1.05 > 3 55 × 0.0 3.

lo que indica que la distribución es simétrica.5.0 1.06 El polígono de frecuencias de las calificaciones de Herramientas Informáticas confirma los resultados.0 2. La curva es simétrica mesocúrtica o normal.5 − 2. que bien pudieran ser ambas discretas o continuas.5 2. Para confirmarlo se hace uso del coeficiente de Pearson: Frecuencia As = x − Mo 2. Curva simétrica leptocúrtica Polígono de frecuencias de calificaciones de Estadística Descriptiva 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 0. con el fin de determinar si existe alguna relación entre las variables. En este capítulo se estudiará el comportamiento de dos variables: distribuciones bivariantes.5 5. salarios y horas de trabajo. Verifíquelo y construya la gráfica.7 Herramientas Informáticas Se observa que Mo = Me = x . En este capítulo se desarrolla el tema de la Regresión y Correlación lineal y los Números Índice.2 CAPITULO 5 MEDIDAS ESTADÍSTICAS BIVARIANTES Hasta ahora se ha estudiado el análisis de una sola variable.0 2.1. 2.5 1.5.5 4. o también una de ellas discreta y la otra continua. 2.0 4. oferta y   120 .0 0.5 = =0 s 1. se requiere conocer la relación entre dos o más variables como la relación entre producción y consumo. calculando los estadísticos de muestras que permiten describir e interpretar la distribución de esa variable.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.2.1 LECCIÓN 21 REGRESIÓN Y CORRELACIÓN En muchos casos se requiere conocer más que el comportamiento de una sola variable.0 3.5 Calificación 3. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Figura 4.

correspondiente a la otra variable. Muchos de estos comportamientos tienen una tendencia lineal. 2.2 LECCIÓN 22 DIAGRAMA DE DISPERSIÓN Una distribución bidimensional o bivariante puede representarse gráficamente en un plano cartesiano. r siendo este un valor entre -1 y 1. sin embargo. son negativos y por tanto la recta será descendente. etc. nos indica que existe una perfecta correlación en otras palabras. Además si es igual a -1. De manera pues que se grafican tantas parejas ordenadas como observaciones hayan de las variables. en este curso sólo se trabajará sobre variables con correlación lineal.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Decimos que la mejor línea que se ajusta a un conjunto de puntos es aquella en donde la suma de los cuadrados de las diferencias entre los valores reales y los estimados es mínima. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   demanda. A continuación se describirá brevemente en qué consiste un diagrama de dispersión y cuáles son los criterios que deben tenerse en cuenta para hallar la mejor línea o línea de tendencia del comportamiento de las variables.   121 . por ser la pendiente negativa. cada valor de la variable deberá ser exactamente igual al estimado. y la varianza explicada igual a la varianza total. Para determinar el grado de correlación entre las variables. frecuentemente se utiliza un coeficiente de correlación rectilíneo. la altura de un árbol y el diámetro de su tronco. no basta con calcular la varianza explicada. y por tanto la varianza residual es igual a cero. aunque hay muchos otros que lo hacen de forma curva. La palabra regresión la utilizamos para significar la estimación de una variable en función de otro valor conocido. como los coeficientes angulares. Si el coeficiente de correlación r es igual o menor que uno. A este conjunto de puntos o nube de puntos se le denomina diagrama de dispersión. nos indica que tanto la covarianza. los valores de la segunda variable.2. ubicando en el eje horizontal o abscisa los valores de la primera variable denominada X y en el eje vertical u ordenada. salarios y productividad. Y. dado que los puntos se ubican de forma dispersa en el plano cartesiano. el nivel socioeconómico de una persona y su grado de depresión. pues existe el coeficiente de determinación o coeficiente de correlación al cuadrado.

(b) curvilínea. (c) sin relación Y Y Y (a) X (b) X (c) X 2.3 . La mejor línea es aquella que hace mínima la suma de los cuadrados de las diferencias entre los puntos dados y los obtenidos mediante la línea ajustada o   122 . LECCIÓN 23 REGRESIÓN LINEAL SIMPLE La regresión examina la relación entre dos variables restringiendo una de ellas respecto a la otra. después de una inspección en la gráfica de dispersión. que una línea recta es la mejor curva que se ajusta al conjunto de puntos se procede entonces a emplear el método de la regresión lineal simple. se conoce la distribución y se va adquiriendo experiencia en su cálculo y determinación. Se trata pues de una dependencia funcional entre las variables. Figura 5.2. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   En muchos casos el sólo diagrama de dispersión indica una tendencia de agrupación de los puntos. Parte del análisis estadístico que hace el investigador es determinar cuál es la mejor línea o curva que representa a ese conjunto de datos. curvilínea o poligonal. Cuando se considera. La regresión es un método que se emplea para pronosticar o predecir el valor de una variable en función de los valores dados de la otra (o de las otras. Cuando se trata de dos variables. El mejor ajuste se hace cuando se elabora bien la gráfica. una (la X) será la variable independiente mientras que la otra (la Y) será la variable dependiente.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. exponencial. que puede ser lineal (hacia arriba o hacia abajo). Gráficas de dispersión (a) lineal. Se habla así de una regresión de Y sobre (o en función de) X. cuando se trabaja más de dos variables).1. con el objeto de estudiar las variaciones de la primera cuando la otra permanece constante.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Se tiene entonces: n∑ XY − ∑ X ∑ Y n∑ X − (∑ X ) 2 2 b= a= ∑ Y − b∑ X n Donde: b: Pendiente de la recta a: Intercepto de la variable Y X: Valores de la variable independiente Y: Valores de la variable dependiente n: Tamaño de la muestra Algunos autores calcular los valores de a y b en términos de las medias de de los conjuntos de datos con las siguientes dos ecuaciones: b= ∑ ( X − x )(Y − y ) ∑ ( X − x) 2 a = y − bx Donde: X: Valores de la variable independiente x: Media del conjunto de datos de la variable X Y: Valores de la variable dependiente y: Media del conjunto de datos de la variable Y   123 . TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   estimada. La ecuación de la recta estimada está dada por: ˆ Y = a + bX Donde: ˆ Y: Variable dependiente (la que se va a predecir) a: Intercepto de la variable Y X : Variable independiente b: Pendiente de la recta En esta ecuación hay dos valores desconocidas: a y b. que deben determinarse aplicando el criterio de los mínimos cuadrados. Es por eso que a este método también se le conoce como el método de los mínimos cuadrados. buscando así la mejor recta que se ajuste a los datos.

2 7.                                                              Puede usarse cualquiera de las ecuaciones propuestas. Relación de ventas de un producto y la emisión del comercial en televisión Ventas Cientos de unidades por mes 8. cien to s de u nid ad e s po r m e s El diagrama confirma la sospecha. se procede ahora a determinar la ecuación de la recta que más se ajusta. la decisión la toma el investigador. Para ello se hace uso del método de los mínimos cuadrados6.1 14.4 5.9 12. Diagrama de dispersión de ventas de un producto y la emisión del comercial en televisión 16 Número de comerciales transmitidos por día 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 14 16 V e n ta s. Figura 5. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   EJEMPLO 23.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 6   124 . toma una muestra aleatoria de siete ciudades.1 El departamento de publicidad de una industria alimenticia desea saber si existe una relación entre las ventas y el número de comerciales de televisión transmitidos por día. La siguiente tabla muestra los resultados obtenidos. Para ello.1.1 10 12. Tabla 5. En este ejemplo se presenta el cálculo con las dos ecuaciones de modo que el estudiante tenga criterio para decidir cómo hacer sus propios cálculos. el primer paso es determinar es si el diagrama de dispersión efectivamente insinúa una tendencia lineal.4 Comerciales Número transmitido por día 9 6 8 11 12 13 14 Para conocer el tipo de relación que puede existir entre estas dos variables.2.

85 66.2571 = 0.8 = = 0.32 7 × 768.1 Y  Comerciales 9 6 8 11 12 13 14 73 XY  75.01 7 y= ∑Y n = 73 = 10.85 463.19 X  Ventas 8.1)(73) 393. se debe determinar primero las medias de cada conjunto de datos.415 = = 1.36 768.19 − (70.8 157.1 14.41 207.3 − (70.4 5.1887 ∑ ( X − x) 2   125 .2 7.56 27.92 Si se quisiera hacer el cálculo con la segunda ecuación planteada.41 146.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.85 X + 1.85 × 70.6 31.1) 13.2 56.9 12.41 100 166. Se tiene entonces: b= ∑ ( X − x )(Y − y ) = 56.1 10 12.6 787.43 7 En la siguiente tabla se resumen todos los cálculos necesarios para determinara la ecuación de la recta ajustada.3 b= n∑ XY − ∑ X ∑ Y n∑ X − (∑ X ) 2 2 = 7 × 787. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   ˆ Y = a + bX Donde: b= n∑ XY − ∑ X ∑ Y n∑ X − (∑ X ) 2 2 a= ∑ Y − b∑ X n X2  70.8 110 154.4 70. x= ∑X n = 70.1 = 10.92 7 7 De modo que la ecuación de la recta ajustada está dada por: ˆ Y = 0.3 201.1) 2 a= ∑ Y − b∑ X n = 73 − (0.04 50.

01) = 1.57 1.57 -0.85 X + 1.01 ( X − x )(Y − y ) 2. Los coeficientes de correlación son números que varían entre +1 y -1.01 2.39 0.89 2.1 10 12.4 70.9 12. Su magnitud indica el grado de asociación entre las variables.2 7.3713 15. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   a = y − bx = 10.3681 19.3083 7.0713 -0.4 LECCIÓN 24 CORRELACIÓN La correlación entre dos variables busca determinar el grado de relación que existe entre ellas dos. Gráficas de dispersión lineal (a) positiva.2571 ( X − x)2 2.2.4681 0.0057 4.1361 8. si al aumentar o disminuir los valores de la variable independiente aumentan o   126 .43 -4.1 Y  Comerciales 9 6 8 11 12 13 14 73 X −x -1.4 5.0001 8. (b) negativa Y Y (a) X (b) X Se dice que existe una correlación lineal positiva entre dos variables.57 2.92 La ecuación de la recta ajustada está dada por: ) Y = 0.85)(10.61 -4.09 4. Ella se calcula con los coeficientes de correlación.3521 4.5373 5.2721 66.6723 56.91 -0.43 − (0.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.43 0.43 -2.57 3.03 Y−y -1. Figura 5.1 14.3023 21.81 -2.92 X  Ventas 8. si es 0 indica que no existe relación alguna y los valores extremos +1 y -1 indican una correlación perfecta positiva o negativa respectivamente.1887 2.3.5921 23.

Se trata pues. Se trata pues de medir el grado de confiabilidad de la ecuación de la recta estimada. 0 ≤ R 2 ≤ 1 Se 2 : Varianza del error estimado.   127 . se dice que la correlación lineal es negativa. En un gráfico de dispersión. cuando al aumentar los valores de la variable independiente disminuyen los valores de la variable dependiente. o viceversa. s2 : y Varianza de la variable dependiente Y. En este caso la nube de puntos descenderá de izquierda a derecha y la pendiente de la recta ajustada será negativa (ver figura 5.) Para determinar el coeficiente de correlación.3. por lo que suele utilizarse un método más breve: Se = n−2 Una vez obtenido el error estándar del estimado. es necesario conocer primero el error estándar del estimado de la recta ajustada. El error estándar indicará la dispersión o la variabilidad de los valores observados alrededor de la línea de regresión y se calcula a partir de la siguiente ecuación: Se = ∑ (Y − Y ) n−2 ) 2 Donde: Se : Error estándar del estimado Y: Valores de la variable dependiente ) Y: Valores estimados de la ecuación n: Tamaño de la muestra Esta ecuación implica demasiadas operaciones. En cambio. de determinar las variaciones de la variable dependiente mediante el coeficiente de determinación (R2). es necesario medir qué porcentaje de la información es recogida o explicada por el modelo de regresión escogido. ∑Y 2 − a ∑ Y − b∑ XY R2 = 1− Se 2 s2 y Donde: R 2 : Coeficiente de determinación. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   disminuyen los de la variable dependiente.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. la nube de puntos tiene forma ascendente y por tanto la recta que se ajusta tendrá una pendiente positiva.

07 sy   128 .80 0.60 0 < r < 0. Se = ∑Y 2 − a ∑ Y − b∑ XY n−2 = 811 − (1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Cuando el R 2 es cercano a 1.90 < r < 1 0.57 7−2 Se calcula así.3) = 0.80 -0. el coeficiente de determinación y el coeficiente de correlación lineal.30 Valores de r (-) = -1 -1 < r < -0. Para ello se determina s 2 .80 < r < 0.60 < r < 0.30 -0.92)(73) − (0.432 = 7.60 < r < -0.1 Determinar el error estándar de la recta ajustada en el ejemplo 23.919 2 7. Siendo r = R 2 .90 -0. la varianza de la variable dependiente Y. denominado el coeficiente de correlación lineal. En la práctica es más frecuente usar r .60 -0.30 < r 0 Interpretación Correlación perfecta Correlación excelente Correlación aceptable Correlación regular Correlación mínima No hay correlación Tomado de “Estadística Básica Aplicada”. se puede entonces interpretar el grado de correlación partiendo de los siguientes límites de referencia: Tabla 5. El coeficiente de correlación lineal r. Ciro Martínez Bencardino.85)(787. es también conocido como coeficiente de Pearson.07 7 ⇒ r = R 2 = 0.2.1.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. EJEMPLO 24.30 < r < 0.57 = 1− = 0. Grado de correlación lineal Valores de r (+) =1 0. y s 2 y ∑Y = n 2 − y2 = 811 − 10.90 0. Ya se mencionaba que el coeficiente de correlación lineal oscila entre +1 y -1.96 R2 = 1− Se 2 0. se dice que el modelo de regresión lineal ajustado tiene un alto grado de confiabilidad.80 < r < -0. si al contrario este se acerca a 0 su grado de confiabilidad es muy bajo y se recomienda no utilizar el modelo de regresión estimado.90 < r < -0.

92 ⇒ ) Y = (0. determinar el error de estimación y analizar la correlación entre las variables. Y el valor de r confirma además el grado de relación entre las variables: el número de ventas del producto está directamente relacionado (en un 96%) con los comerciales de televisión que se emiten diariamente. que consiste en el mismo procedimiento de una regresión lineal simple: describir la ecuación de regresión. 2.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.92 ≈ 19 El departamento de publicidad requerirá de 19 comerciales de televisión diariamente para que el número de ventas ascienda a 2000 unidades mensuales. si el gerente de ventas de la empresa quisiera aumentar el número de ventas del producto a 2000 mensuales.5 LECCIÓN 25 REGRESIÓN MÚLTIPLE Cuando se emplea más de una variable independiente para evaluar una variable dependiente es conveniente utilizar un método de regresión múltiple.92 = 18. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Con los resultados obtenidos se puede asegurar que la ecuación de la recta es una muy buena estimación de la relación entre las dos variables. Así: ) Y = 0.85)(20) + 1. Para más variables independientes. sólo basta con seguir los mismos pasos.2. La ecuación de regresión está dada por: ) Y = a + b1 X 1 + b2 X 2 Donde:   129 . Ahora. El R2 afirma además que el modelo explica el 91. la variable independiente por el valor que se pretende y así obtener el valor de la variable dependiente (número de comerciales). ¿Cuántos comerciales estima el departamento de publicidad de la empresa que debe emitir diariamente? Se trata simplemente de reemplazar en la ecuación estimada. A continuación se desarrollarán estos conceptos suponiendo dos variables independientes.85 X + 1.9% de la información.

a: Intercepto de la variable Y. El jefe de producción define: X1 : Horas de trabajo (cientos). y: Media de los valores de la variable dependiente. EJEMPLO 25. respectivamente.   130 . X 2 : Valores de las dos variables independientes. estará dado por: R = 2 a ∑ Y + b1 ∑ X 1Y + b2 ∑ X 2Y − ny 2 ∑Y 2 − ny 2 Donde: Y: Valores de la variable dependiente. b1 . b2 : Pendientes asociadas con cada variable independiente. X 1 . se determina el error estándar de la estimación de regresión múltiple: Se = ∑ (Y − Y ) n−3 ) 2 ⇔ Se = ∑Y 2 − a ∑ Y − b1 ∑ X 1Y − b2 ∑ X 2Y n−3 Y el coeficiente de determinación múltiple.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. b1 . b2 : Pendientes asociadas con cada variable independiente. Los valores de las tres constantes numéricas se obtienen resolviendo el siguiente sistema de ecuaciones: ∑ Y = na + b ∑ X + b ∑ X ∑ X Y = a∑ X + b ∑ X + b ∑ X X ∑ X Y = a∑ X + b ∑ X X + b ∑ X 1 1 2 2 1 1 1 2 1 2 1 2 2 1 1 2 2 2 2 2 Una vez obtenida la ecuación de regresión. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   ˆ Y: a: Variable dependiente. respectivamente. Intercepto de la variable Y.1 El jefe de producción de una empresa manufacturera desea estimar los gastos indirectos de producción con base en el número de horas de trabajo y en el número de horas máquina. X 1 . X 2 : Valores de las dos variables independientes. En la siguiente tabla se relaciona la información correspondiente al primer semestre del año.

83b1 − 6.5 = 265a + 11704.5 − 6.17b1 + 3754.83b1 − 1.83b2 (5)   131 .83b2 1.83b2 Se despeja la variable b1 de la ecuación (4): 7.5 = 85a + 13754 .83 ( 4) b1 = Ecuación (1) multiplicada por 265/6 y restada por ecuación (2): 7022.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.17b1 + 1204 .17b2 − 2260 = −85a − 3756b1 − 1211b2 − 7. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   X2 : Horas de máquina (cientos) Y : Gastos indirectos de producción (cientos de miles de pesos) Tabla 5. Gastos indirectos de producción X1 2 2025 1764 1936 2025 1849 2116 11715 X2 2 256 196 225 169 169 196 1211 Y2 841 576 729 625 676 784 4231 Mes Enero Febrero Marzo Abril Mayo Junio TOTAL X1 45 42 44 45 43 46 265 X2 16 14 15 13 13 14 85 Y 29 24 27 25 26 28 159 X1 Y 1305 1008 1188 1125 1118 1288 7032 X2Y 464 336 405 325 338 392 2260 X1X2 720 588 660 585 559 644 3756 ∑ Y = na + b ∑ X + b ∑ X ∑ X Y = a∑ X + b ∑ X + b ∑ X X ∑ X Y = a∑ X + b ∑ X X + b ∑ X 1 1 2 2 1 1 1 2 1 2 1 2 2 1 1 2 2 159 = 6a + 265b1 + 85b2 2 2 2 (1) (2) (3) ⇒ 7032 = 265a + 11715b1 + 3756b2 2260 = 85a + 3756b1 + 1211b2 Se resuelve el sistema de ecuaciones: Ecuación (1) multiplicada por 85/6 y restada por la ecuación (3): 2252 .5 = −10.17b2 − 7032 = −265a − 11715b1 − 3756b2 − 9.5 = −1.3.

Sin embargo.31 6 Se obtiene así la ecuación de regresión múltiple: ) Y = a + b1 X 1 + b2 X 2 ⇒ 2.5 − 6.3 CAPITULO 6 NÚMEROS INDICE ) Y = −17.31 + 0. es decir.7 1. la variación en los precios de un producto respecto al año anterior. el costo de producción por unidad de este trimestre comparado con el inmediatamente anterior.83 ⎝ ⎠ b2 reemplazada en la ecuación (4): b1 = ⇒ b2 = 67. Son indicadores muy utilizados en el sector económico por ejemplo. se trata de un indicador de variación en la variable observada. etc.83b2 1. Los números índices no son una medida cuantificable. que sirven para indicar las variaciones que sufre una serie de valores respecto a una de ellas. pero si la serie es extensa se debe seleccionar cono período base aquel que haya sido más estable.83b2 = 0.91X 2 Los números índice son cifras relativas expresadas en términos porcentuales.5 − 6.83b2 ⎞ 9. la cantidad de unidades vendidas de un producto respecto al mes anterior. tomada como punto de referencia y a la cual se le denomina base. el período base seleccionado será el primer valor de la serie.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Variable b1 reemplazada en la ecuación (5): ⎛ 7.97 7.5 = 10.83 b1 y b2 reemplazada en la ecuación (1): a= 159 − 265b1 − 85b2 = −17. la selección de la   132 .19 = 0.91 73.7 X 1 + 0. Si se trata de una serie corta. que no presente cambios muy bruscos debido a factores internos y/o externos.83⎜ ⎟ + 1.

. I tt−1 = Donde: Xt × 100% X t −1   133 . medianos. Estos últimos se clasifican a su vez en agregativos y de promedios. determinando así el número índice respecto a la base definida. Los promedios se clasifican en aritméticos. geométricos.3. Se pueden obtener bases fijas y bases variables para establecer comparaciones. La base fija es aquella que representa el mismo período de referencia o de comparación para toda la serie. X 0 : Precio. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   serie base dependerá de los análisis que el investigador requiera hacer para sus variables. 2. se hablará de índices simples y para un conjunto de datos dados. cantidad o valor del período que se investiga. pero en la práctica los más utilizados son los aritméticos. t I0 = Xt × 100% X0 Donde: t I0 :  0:  t: Índice. cantidad o valor del período considerado como base. Los índices son de base variable cuando a cada observación se le divide por el valor de la observación inmediatamente anterior. Período que se analiza. Los números índice se pueden construir para una sola observación o para un conjunto de ellas. X t : Precio. se hablará de índices compuestos. Este cociente debe expresarse en porcentaje. etc.1 LECCIÓN 26 CONSTRUCCIÓN DE NÚMEROS ÍNDICE Para calcular un número índice se toma un valor de la serie como base y se establece un cociente entre el valor de la variable a estudiar y el valor de la variable base.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. en el primer caso. Período base.

2 LECCION 27 TIPOS DE NÚMEROS ÍNDICES El índice de mayor aplicación es el índice de precios. los índices simples son los más adecuados. cantidad o valor del período que se investiga.3 LECCIÓN 28 ÍNDICES SIMPLES Se construyen para una sola observación y su base puede ser fija o variable. este índice se emplea para definir el costo de vida. es decir. X t : Precio. 2.   134 . X 0 : Precio. El índice de valor mide los cambios en valor monetario total. El más conocido es el índice de precios al consumidor.1 Un almacén vende cinco referencias diferentes de un artículo determinado. Mes A Febrero 86 95 Marzo B C D E 395 1308 430 113 380 1466 469 108   Se desea analizar la variación del artículo con referencia C en el inventario de marzo respecto al mes de febrero. EJEMPLO 28. 2.3.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   I tt−1 : Índice. combina los cambios de precios y cantidad para presentar un índice más informativo. Un índice de cantidad mide la variación de las cantidades de uno o más bienes en un período dado respecto al período base. que mide los cambios de precios en uno o más artículos en un período determinado respecto a un período base. Cuando se trata de medir la variación de un fenómeno observado a través de una serie de períodos.3. que mide el cambio de todos los precios respecto a una variedad de artículos que se consumen. cantidad o valor del período considerado como base. Período que se analiza. Los datos siguientes indican las ventas de ellos en los meses de febrero y marzo.  t‐1:  t: Período base.

sino de un grupo de ellos respecto a otro considerado de más importancia. Walsh. Cuando se van a calcular los índices de precios en un grupo de artículos. Se habla entonces de calcular un índice agregado ponderado. Drobisch y Sidgwick. Se trata de examinar el valor no de un artículo. etc. Marshall. Keynes.. febrero I marzo = 95 + 380 + 1466 + 469 + 108 × 100 = 108% 86 + 395 + 1308 + 430 + 113 Se concluye pues. las ponderaciones son las cantidades.1. los más conocidos son los de Laspeyres. Los índices compuestos determinan una condición particular.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. por ejemplo el costo de vida relativo a transporte. Paashe. vivienda. Generalmente en ellos las ponderaciones son las cantidades o precios. Este último índice calculado en el ejemplo 25.1 LECCIÓN 29 ÍNDICES COMPUESTOS Se construyen a partir de un grupo de series de tiempo. se suman todos los elementos correspondientes al período de estudio y se divide entre la suma de los mismos elementos del período base. Edgeworth.3. Si se quisiera comparar el total de artículos vendidos correspondiente al período de estudio respecto al total de artículos vendidos del período base.   135 . concernientes a varios artículos.4. que las ventas del producto aumentaron en marzo en un 8% (108-100) respecto a las ventas del mismo en febrero. alimentación. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   febrero I marzo = 1466 × 100% = 112% 1308 Se considera que el aumento en ventas del artículo con referencia C es del 12% en el mes de marzo respecto al mes de febrero. se denomina índice agregativo (o agregado) simple y se define como: t I0 = ∑X ∑X t × 100% t −1 2. y en el cálculo de los índices de cantidad las ponderaciones son los precios. Fisher. Son muchas las fórmulas para calcular índices ponderados.

El índice de precios de Paashe es la relación que existe entre los precios actuales de un grupo de artículos. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   El índice de Laspeyres de precios es la relación que existe al comparar los precios actuales de un grupo de artículos con los precios de esos mismos artículos considerados en el período base. con los precios de ellos en el período base. Precio de los artículos en el período que se investiga. P I0 = t ∑ PQ ∑P Q t 0 t t × 100%   136 . LI 0 = Donde: L : Índice de Laspeyres. t ∑ PQ ∑P Q t 0 0 0 ×100% I tt−1 : Pt : P0 : Q0 : Índice de precios. t ∑P Q ∑P Q 0 0 t × 100% 0 J tt−1 : P0 : Q0 : Qt : Índice de cantidad. De igual manera se puede representar así el índice de Laspeyres de cantidad: LJ 0 = Donde: L : Índice de Laspeyres. Cantidad de los artículos en el período base. Cantidad de los artículos en el período base. Cantidad de los artículos en el período que se investiga. manteniéndose constante las ponderaciones que corresponden a las cantidades de dichos artículos para el período que se investiga. manteniéndose constante como ponderación las cantidades del período base. Precio de los artículos en el período base. Precio de los artículos en el período base.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.

 TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Donde: P : Índice de Paashe.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Precio de los artículos en el período que se investiga. Cantidad de los artículos en el período que se investiga. Cantidad de los artículos en el período base. El índice de precios de Fisher es un promedio geométrico. Así mismo. Precio de los artículos en el período base. Precio de los artículos en el período que se investiga. que se define como la raíz cuadrada del producto del índice de Laspeyres por el de Paashe. Para indicar las variaciones en las cantidades. t ∑ PQ ⋅ ∑ PQ ∑P Q ∑P Q t 0 t 0 0 0 t t × 100% I tt−1 : P0 : Pt : Q0 : Qt : Índice de precios. Cantidad de los artículos en el período que se investiga. Cantidad de los artículos en el período base. el índice de cantidad de Paashe señala: P J0 = t ∑ PQ ∑ PQ t t t × 100% 0 Donde: P : Índice de Paashe. J tt−1 : Pt : Q0 : Qt : Índice de cantidad. I tt−1 : Pt : P0 : Qt : Índice de precios. Precio de los artículos en el período base. F I0 = Donde: F : Índice de Fisher. Precio de los artículos en el período que se investiga. Cantidad de los artículos en el período que se investiga. se tiene el índice de cantidad de Fisher:   137 .

1 Una farmacia reporta la siguiente tabla referente a los precios (en cientos de miles de pesos) y cantidades vendidas (por empaque) de cinco fármacos comunes en los dos últimos años. J tt−1 : P0 : Pt : Q0 : Qt : Índice de precios. se deben determinar todos los valores que interviene en ellos. EJEMPLO 29. Cantidad de los artículos en el período base. Precios y cantidades vendidas en una farmacia en 2003 y 2004 ARTÍCULO A B C D E 2003 Precio Cantidad 30 20 18 10 45 12 26 7 35 11 2004 Precio Cantidad 25 32 38 5 47 15 40 3 36 12 Para el cálculo de cada índice. Calcular los índices de precios y de cantidades por los métodos de Laspeyres.   Tabla 5. Cantidad de los artículos en el período que se investiga. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   F J0 = t ∑ P Q ⋅ ∑ PQ ∑ P Q ∑ PQ 0 t t 0 0 t t × 100 0 Donde: F : Índice de Fisher.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Precio de los artículos en el período que se investiga.4. Paashe y Fisher. Precio de los artículos en el período base. en la siguiente tabla se resumen todos los cálculos:   138 .

D y E de la farmacia aumentaron en un 17.57% 1887 2223 P I 2003 = 2004 ∑P ∑P 2004 2003 ×100% = F I 2003 = 2004 ∑P ∑P 2004 2003 Q2003 Q2003 ⋅ ∑P ∑P 2004 2003 Interpretación: los precios de los productos A.Q2004 30 20 25 32 600 800 500 960 A 18 10 38 5 180 190 380 90 B 45 12 47 15 540 705 564 675 C 26 7 40 3 182 120 280 78 D 35 11 36 12 385 432 396 420 E TOTAL 1887 2247 2120 2223 Cálculo de índices de precios: LI 2003 = 2004 ∑P ∑P 2004 2003 Q2003 Q2003 Q2004 Q2004 × 100% = 2120 × 100% = 112. durante el año 2004 respecto al 2003. durante el año 2004 respecto al 2003. D y E de la farmacia aumentaron en un 2. Paashe y Fisher.35%.81% 1887 P J 2003 = 2004 ∑P ∑P 2004 2004 Q2004 Q2003 Q2004 Q2003 × 100 % = 2247 × 100 % = 106 % 2120 × 100% = 2223 2247 ⋅ × 100% = 111. C. Paashe y Fisher. B.Q2004 P2004.Q2003 P2004.Q2003 P2003.08% y 6.   139 . 6% y 11. B.74% según le método de Laspeyres.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. 1.81%.74% 1887 2120 F J 2003 = 2004 ∑P ∑P 2003 2003 ⋅ ∑P ∑P 2004 2004 Q2004 Q2003 Interpretación: las cantidades vendidas de los productos A. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Artículo P2003 Q2003 P2004 Q2004 P2003. Cálculo de índices de cantidad: LJ 2003 = 2004 ∑P ∑P 2003 2003 Q2004 Q2003 ×100% = 2223 ×100% = 117.08% 2223 Q2004 Q2004 × 100% = 2120 2247 ⋅ × 100% = 106. respectivamente. C.35% 1887 2247 ×100% = 101. respectivamente.75% según le método de Laspeyres.

280 más para un salario de $956.4 2004 2005 IPC 2004 = × 100 = 100 IPC 2004 = × 100 = 122.938 de los $780.6 2532 .UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. índice de pérdida de poder adquisitivo.1 Un empleado ganaba en diciembre de 2004 $780.   140 .1 Calculo del salario y del ingreso Salario Real Ingreso Real ⇒ ⇒ Salario nominal ($) × 100 IPC Ingreso nominal ($) IR = × 100 IPC SR = EJEMPLO 30. A continuación se ampliará un poco sobre los más importantes números índices. Se quiere saber si con el reajuste que le hicieron su salario mejoró con relación al que tenía anteriormente.000 y en el mes de junio de 2005. El salario real para junio de 2005 es: SR = 890.4 y 3105. índice de importación o exportación.000 que recibía. el aumento es injusto. Aunque gane más salario. etc. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2.3. 2. Los IPC para los mismos meses y años fueron: 2532.2 respectivamente.   Se calcula primero el IPC de cada año respecto al 2004. Su aumento debería de ser mínimo el 22.000 × 100 = 725938 122. es común escuchar términos como índice de precios al consumidor (IPC).5. 3105.5 LECCIÓN 30 USOS DE LOS NÚMEROS ÍNDICES Los números índices tienen especial importancia en la vida económica de un país.6% para el período diciembre de 2004 y junio de 2005.2 2532 .000 más.280. es decir: $176.6% de lo que ganaba en diciembre de 2004.4 Esto quiere decir que los artículos de primera necesidad aumentaron en un 22.4 2532. aumentaron su salario en $110.6 Esto quiere decir que el empleado sólo está recibiendo el equivalente a $725. De manera que debe haber un porcentaje igual o mayor de incremento en el salario nominal para que las condiciones económicas sean iguales o mejores para el empleado.3.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.45% de su poder de compra.2 Poder de compra o poder adquisitivo o valor del dinero Poder de compra ⇒ ⇒ PA = Índice de poder adquisitivo 1 × 100 IPC I IPA = 0 × 100 It Donde: I0: Índice de precios al consumidor. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2.8156 122.   PA = 1 × 100 = 0.56% 3105.2 Determinar el poder de compra y el índice de poder de compra para junio de 2005 respecto a diciembre de 2004.6 Esto quiere decir que un peso en diciembre de 2004 equivale a 82 centavos en junio de 2005. considerado como período que se investiga.4 ⎤ % de desvalorización = 100 ⎢1 − = 18.   141 .2. EJEMPLO 30. Esto quiere decir que en junio de 2005 se necesita más dinero para comprar el mismo artículo en diciembre de 2004. considerado como período de referencia.3 Determinar el porcentaje de desvalorización para los datos del ejemplo 30. Su valor se ha reducido durante ese período en 18 centavos.3.4 × 100 = 81.2 2. It: Índice de precios al consumidor.5.5.2 ⎥ ⎦ De diciembre de 2004 a junio de 2005.3.   ⎡ 2532. la moneda ha perdido un 18.45% ⎣ 3105. IPA = 2532.3 Porcentaje de desvalorización ⎡ I ⎤ % de desvalorización = 100 ⎢1 − 0 ⎥ ⎣ It ⎦ EJEMPLO 30.

Tt: Valor de la moneda que se quiere cambiar.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.4 Porcentaje de variación y de devaluación ⎡T ⎤ % de variación = 100 ⎢ 1 − 1⎥ ⎣ T0 ⎦ ⎡ T ⎤ % de devaluación = 100 ⎢1 − 0 ⎥ ⎣ T1 ⎦ Donde:   T0: Valor de la moneda de referencia. La devaluación es entendida como la pérdida de valor de una moneda en relación a las monedas extranjeras. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   2.3.5.       142 .

El empresario presento la siguiente tabla: Jugador 1 18 Jugador 2 30 16 20 14 14 17 4 20 17 ¿Por qué la junta decidió contratar el jugador 1? Justifica tu respuesta utilizando la varianza y la desviación típica 2.35 3. dos competidores Johan y Samantha obtuvieron los resultados que se indican a continuación.1. el rango de tiempo de uso en un mes es de 27 minutos.20 2. usando medidas estadísticas.16 4. de esta Unidad Didáctica.   143 .20 5.35 6. 2.32 7. 5 6 3 8 0 1 b.8 3. si el mayor tiempo de consulta en ese mes duró 1 hora y 12 minutos.10 5. En una prueba de tiro al blanco de cinco anillos. el empresario dueño de los pases presentará a los dos jugadores y mostrará la cantidad de goles que han anotado en las ultimas cinco temporadas.10 8. 5. La junta directiva de uno de los equipos de fútbol de la ciudad decidió comprar el pase de un jugador para ocupar la posición de delantero. halle el menor tiempo de consulta en ese mes. Para tal fin. Calcule el rango intercuartílico y semiintercuartílico de los datos agrupados en la tabla del numeral 1. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   ACTIVIDADES DE AUTOEVALUACION UNIDAD 2 AUTOEVALUACIÓN LECCIÓN 16 1 En un café Internet.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Halle el rango de 44las siguientes series: a.8 c.16 1. quién es el mejor. 2 0 3   AUTOEVALUACIÓN LECCIÓN 17 1. 2. 3 1 0 2 1 0 d.9 de los ejercicios del tema 1.32 4. Determine.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

Johan 1 Tiro de 5 Puntos 8 Tiros de 4 Puntos 14 Tiros de 3 Puntos 5 Tiros de 2 Puntos 1 Tiro de 1 Punto 1 Tiro de 0 Puntos

Samantha 4 Tiros de 5 Puntos 9 Tiros de 4 Puntos 7 Tiros de 3 Puntos 5 Tiros de 2 Puntos 3 Tiros de 1 Punto 2 Tiros de 0 Puntos

0

1

2

3

4 5

3.

4.

Tome los datos de la tabla de distribución de frecuencias agrupadas del numeral 1.2.c de los ejercicios del tema 1.1. de esta Unidad Didáctica y determine varianza y desviación estándar. Tome los datos del ejemplo 2.1., de la Unidad Didáctica 1 que representan la evaluación de los latidos cardíacos de un grupo de 30 personas después de cierta actividad física. Continúe con esos datos para terminar el análisis completo de ese fenómeno y ahora calcule varianza, desviación estándar, desviación media.

AUTOEVALUACIÓN LECCIÓN 18 1. Un fabricante de bombillas de neón tiene dos tipos de tubos, A y B. Los tubos tienen unas duraciones medias respectivas de 1.495 horas y 1.875 horas, y desviaciones estándar de 280 horas y 310 horas respectivamente.

a. ¿Qué tubo tiene la mayor dispersión absoluta? b. ¿Qué tubo tiene la mayor dispersión relativa? c. Si se extrajo un tubo de cada tipo y su duración fue de 1.350 horas y 1.750 horas respectivamente, ¿cuál tipo de tubo tiene menor posición relativa?

2. El alcalde de la ciudad está considerando la posibilidad de implementar un peaje de ingreso. Sus asesores han llegado a la conclusión que existen dos ubicaciones posibles y favorables para ello. El alcalde decide medir el número de automóviles que ingresan a la ciudad por cada uno de los puntos durante los últimos 15 días. Los resultados se muestran en la siguiente tabla.

Punto 1 430 460 501 423 455 473

Punto 2 406 153 491 505 467 421

 

144

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

450 481 442 429 439 414 475 452 474

556 470 348 472 479 403 278 440 234

a. Calcular el valor de la dispersión absoluta para los dos puntos. ¿cuál tiene mayor dispersión? b. ¿Que punto tiene la mayor dispersión relativa.
 

AUTOEVALUACION LECCIÓN 19 1. Dada la serie de puntuaciones 9, 5, 6, 11, 1, 2, 10, 4, hallar el puntaje estandarizado de cada puntuación

2.

Las estaturas de los hombres adultos tienen una media de 1,75 metros y una desviación estándar de 7 centímetros. Calcule las puntuaciones Z que corresponden a las siguientes personas: a. Carlos Alberto que mide 156 centímetros. b. Juan José que mide 1,81 metros. c. Francisco que mide 1,68 metros.

3.

En un grupo de estudiantes la estatura promedio es 163,1 cm., con una desviación estándar de 9,38 cm. y su peso promedio es de 61,3 kg con desviación estándar 11,7 kg. Mauricio mide 1,70 metros y pesa 63 kg, calcule: a. La puntuación estandarizada de cada medida. b. ¿En cuál de las dos medidas hay mayor dispersión absoluta? c. ¿En cuál de las dos medidas hay menor dispersión relativa?

 

AUTOEVALUACIÓN LECCIÓN 20 1. Determine el tipo de asimetría de las siguientes distribuciones con sus estadígrafos de dispersión: a. b.
 

x = 189,97 x = 5,3

Me = 189,7 Me = 5

Mo = 189,16 Mo = 4
145

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

c. 2.

x = 17,5

Me = 17,9

Mo = 18,1

Tomando una distribución ligeramente simétrica, calcule su moda sabiendo que su media es 3 y que la diferencia entre la media y la mediana es igual a -2.

3.

Con los salarios semanales de los empleados de una empresa se tienen los siguientes resultados:
Me = 9672 s = 1217 ,50

x = 9725

Calcule el coeficiente de asimetría de Pearson.

4.

Calcule los coeficientes de asimetría y los coeficientes de apuntamiento de las siguientes distribuciones correspondientes a la edad de los niños quemados por pólvora reportados en tres centros hospitalarios durante el mes de diciembre:

X  5 7 9 11 13 15 Total

f  3 19 10 8 7 3 50

f  3 7 8 9 20 3 50

f  6 8 11 11 8 6 50

Construya sus respectivos polígonos de frecuencia y haga un análisis comparativo de los resultados obtenidos.
 

AUTOEVALUACIÓN LECCIÓN 21 1. Nombrar tres ejemplos de fenómenos económicos que puedan ser analizados mediante la regresión. 2. ¿cuál es la razón para que los coeficientes angulares y el coeficiente de correlación tengan signos iguales? 3. ¿Que nos indica que el coeficiente angular sea negativo? 4. Son ciertos o falsos las siguientes afirmaciones?

 

146

Un veterinario desea expresar esta relación por medio de una ecuación.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Los datos reunidos producen los siguientes resultados: 12 11 8 9 8 7 Litros por día Número de días 10 30 40 50 55 65 ¿Sugiere la gráfica una asociación lineal 2. La cantidad de leche producida por una vaca decrece después de que esta da a luz. Si r es mayor que 1. correspondientes a la producción X (miles de unidades) y Y el costo de la producción de esas unidades (millones de pesos). La cantidad de leche producida por una vaca decrece después de que esta da a luz. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   a.   AUTOEVALUACIÓN LECCIÓN 22 Dibuje un diagrama de dispersión de cada una de las siguientes situaciones 1. Un veterinario desea expresar esta relación por medio de una ecuación.la recta ajustada explica más que suficiente las relaciones entre las dos variables. El coeficiente de correlación es un valor menor que -1 y mayor que 1 c. se pide: X (miles de unidades) 2 5 8 10 12 15 17 20 Y (millones de pesos) 4 8 10 11 12 14 15 16 a ¿sugiere la gráfica una asociación lineal?   AUTOEVALUACIÓN LECCIÓN 23 1. Un coeficiente de correlación igual a -1 indica que la línea de regresión no es la mejor que refleja las relaciones entre las dos variables b. Los datos reunidos producen los siguientes resultados: 12 11 8 9 8 7 Litros por día Número de días 10 30 40 50 55 65   147 . Con los siguientes datos.

e. c. Y verifique si la ecuación obtenida se ajusta correctamente. desea saber cómo son afectadas las ventas de viviendas por diferentes tasas de interés. Y como variable dependiente. Y verifique si la ecuación obtenida se ajusta correctamente. 2.       Estimar las ventas en función de la tasa de interés. Se desea conocer la relación que pueda existir entre las alturas en una muestra de 12 padres y sus hijos. La siguiente tabla refleja los datos obtenidos (en pulgadas): Altura del padre 65 63 67 68 62 70 66 68 67 69 71 68 66 68 69 66 68 65 71 67 68 70 Altura del hijo Determine la mejor ecuación que se ajusta a los datos dados.   148 . 3. ¿Es confiable el modelo? Calcule el tipo de asociación entre las variables. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Determine la mejor ecuación que se ajusta a los datos dados. X 3 5 6 8 9 11 Y 2 3 4 6 5 8   AUTOEVALUACION LECCIÓN 24 1. Una compañía de ahorro y crédito. b.5 6 8 8. d. ¿Cuántas viviendas se pueden vender si el interés es del 7.5%? Determinar el error estándar del estimado.5 Ventas de viviendas 23 38 45 36 16 18 39 41 a.5 6 6. Ajustar a una recta los datos de la siguiente tabla tomando: a.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. Durante ocho meses se recopiló la información y se obtuvo el siguiente resultado: Tasa de interés (%) 7 6.5 5. X como variable independiente b.

Estime el porcentaje de fruta que se podría dañar en un viaje de 480 km a una temperatura de 9ºC. Con estos datos calcular los índices simples de precios con base 1983 y luego los índices con base en 1986.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. c. d. Se realizó un muestreo para ocho destinos diferentes y estos son los resultados: Distancia Temperatura Carga dañada (decenas de km) (ºC) (%) 39 8 7 52 6 6 48 7 7 46 12 10 61 9 9 34 6 4 25 10 3 55 4 4 a.   Estimar el porcentaje de carga dañada en función de la distancia y de la temperatura. la temperatura a la cual se mantiene y el porcentaje del despacho que se daña al llegar a su destino. ¿Es confiable el modelo? AUTOEVALUACIÓN LECCIÓN 26 Supongamos los precios de un artículo en el periodo 1983-1988. está interesada en precisar la relación que existe entre la distancia a la cual se transporta una carga de fruta. según la tabla AÑOS PRECIOS INDICE 1983=100 1986=100 A B 100 140 120 200 240 300 50 70 60 100 120 150 % DE VARIACIÓN (A) + 40 +20 +100 +140 +200 (B) -50 -30 -40 0 +20 +50 1983 1984 1985 1986 1987 1988 200 280 240 400 480 600 1. b. Determine el error estimado. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   AUTOEVALUACIÓN LECCIÓN 25 1.   149 . Una empresa transportadora de frutas.

en un grupo de artículos. Productos 2002 2004 A 11.686 7.2 2003 6.357 C 1.2 2002 6. Tomadas las cosechas de ciertos productos agrícolas (en cientos de toneladas).460 1.3 10.978 I 204 202 2. AUTOEVALUACIÓN LECCIÓN 28 1.111 1.6 3.9 3.196 1.2 5.6 9.3 4.8 4.2 4.044 B 1.326 D 1.5 5.7 3.3 4.106 870 G 41 59 H 6. determinar el índice agregativo simple para 2004 con base en 2002. empleando como base el año 2001 y utilizando como ponderación los datos sobre horas-hombre empleadas por docena de bolsos en 2001.158 13. Una marroquinería produce bolsos para dama en tres líneas diferentes.840 E 859 997 F 1. Los datos sobre producción de bolsos y de tiempo por empleado (en horas) ocupados en la empresa durante el período 2001-2003 son los siguientes: Producción en miles de docenas 2001 2002 2003 5 7. b. comprados en el mes de junio de 2008. Calcule un índice de producción de 2002 con base en 2001.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.5 8.4 11. respecto a las cantidades compradas en mal estado de conservación en el mes de mayo del mismo año   150 . Calcular el índice agregativo de las cantidades que resultaron en mal estado de conservación.2 ARTÍCULO A B C a.   Calcule un índice de cantidad para el año 2003.2 Horas-hombre por docena 2001 6. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   AUTOEVALUACION LECCIÓN 27.

0 3. ARTÍCULO A B C D E 2002 Precio 320 140 80 560 1120 Cantidad 15 18 35 28 14 Precio 320 200 600 520 1200 2004 Cantidad 26 35 54 25 18 2.0 2. Paashe y Fisher. Con los siguientes datos.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS.0 6.0 10. Paasche y Fisher           151 .0 Calcular los índices de Laspeyres.0 15. ARTÍCULO A B C D E UNIDAD DE MEDIDA Kg Lts Lbs Doc Unidad 2007 CANTIDAD 10 5 2 1 2 2008 CANTIDAD 8 7 5 2 1 PRECIO 26. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   ARTICULOS UNIDAD DE MEDIDA CANTIDADES DEFECTUOSAS MAYO DE 2008 JUNIO DE 2008 18 15 8 20 70 131 A B C D E Total   Kg Lts Doc Lbs Unidad --------- 12 8 20 14 50 104 AUTOEVALUACIÓN LECCIÓN 29 Para los siguientes datos. calcular los índices de precios y de cantidades por los métodos de Laspeyres.6 PRECIO 38.0 1.0 6.0 4. referentes a los precios y cantidades ( valores arbitrarios) par un grupo de artículos dados para dos periodos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

AUTOEVALUACIÓN LECCIÓN 30 Con los siguientes datos:

AÑOS 1998 1999 2000 2001 2002 2003 2004

SALARIOS (miles de millones de pesos) 18.0 20.6 23.0 38.0 51.0 58.0 60.0

OBREROS IPC Nº 1991=100 320 380 400 700 1.000 1.050 1.100 140 148 152 160 166 168 170

Se pide a. Salarios reales con respecto a 1998. b. Salarios nominales por obrero. c. Índices de los salarios reales con base 1998. d. Índices de los salarios nominales con base 1998. e. Salarios reales por obrero, con base 1998. f. Índices de salarios reales por obrero, con base 1998.
 

 

152

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

BIBLIOGRAFÍA DE LA UNIDAD

BEJARANO BARRERA, Hernán (1995). Estadística Descriptiva. Santa fe de Bogotá: UNISUR. CHRISTENSEN, Howard B. (1999). Estadística Paso a Paso. México: Editorial Trillas. MARTÍNEZ BENCARDINO, Ciro (2004). Estadística Básica Aplicada. Santa fe de Bogotá: ECOE Ediciones. MARTÍNEZ BENCARDINO, Ciro (2003). Estadística y Muestreo. Santa fe de Bogotá: ECOE Ediciones. MILTON, J. Susan (1999). Estadística para biología y ciencias de la salud. Madrid: McGraw Hill — Interamericana. PORTUS GOVINDEN, Lincoyán (2001). Introducción a la Estadística. Segunda edición. Santa fe de Bogotá. McGraw Hill. PORTILLA CHIMAL, Enrique (1980). Estadística, Primer Curso. Bogotá: Nueva Editorial Interamericana. SPIEGEL, Murria R. (1991). Estadística. Serie de compendios Schaum. México: McGraw Hill. SMITH, A. Stanley. (1992). Curso de Estadística Elemental para las ciencias aplicadas. Primera edición. Santa fe de Bogotá. Editorial Addison – Wesley Iberoamericana. TRIOLA, MARIO F. (2004). Probabilidad y Estadística. Novena edición. México. Pearson Educación. http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm http://www.elosiodelosantos.com/regresionlineal.html http://www.universidadabierta.edu.mx/SerEst/MAP/METODOS%20CUANTITATIV OS/Pye/tema_12.htm http://server2.southlink.com.ar/vap/MEDIDAS.htm http://cosmech.tripod.com/Estadistica/medidas1.htm http://eris.unalmed.edu.co/~cescobar/Bioestadistica/bioestadistica.htm

 

153

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva  

http://ftp.medprev.uma.es/libro/node42.htm http://www.eumed.net/cursecon/medir/

 

154

+ C = nC i =1 n   155 . para el caso más general. Con el fin de utilizar el lenguaje algebraico que permita realizar simplificaciones. i es el elemento genérico de la sumatoria. donde el subíndice i  indica la cantidad relativa de elementos considerados. la suma de n términos cualquiera. se puede expresar la anterior operación como: S = X 1 + X 2 + X 3 + . 14.. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   Anexo A Sumatorias y Productorias A lo largo de los trabajos en estadística se encontrarán muchas veces con la suma de un gran número de términos.. + X 8 = 77 Ahora.. 15.. se requiere el uso del símbolo sumatoria el cual representa la operación de adición algebraica sobre una determinada cantidad de elementos numéricos. ∑ C = C + C + . 3. Estos términos pueden sumarse de la forma más común: S = 7 + 9 + 15 + 14 + 8 + 3 + 5 + 16 = 77 Si cada uno de estos términos numéricos es representado por Xi.. i = 1 es el límite inferior de la sumatoria. Considere las siguientes cantidades: 7. 5. que se lee sumatoria representa. Se tiene entonces que: ∑X i =1 n i es la suma de n términos. + X 8 = 77 El símbolo griego sigma (∑). esta operación puede expresarse de la siguiente forma: ∑X i =1 8 i = X 1 + X 2 + X 3 + .. 9. La sumatoria tiene algunas propiedades importantes que deben tenerse en cuenta: • La sumatoria de una constante C de 1 a n es igual a n veces la constante. 16. 8.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. donde n es el límite superior de la sumatoria.

d. el producto de n términos cualquiera está dado por: ∏X i =1 n i = X 1 ⋅ X 2 ⋅ .. que se lee producto de.... + CX n = C ∑ X i i =1 n • La sumatoria de los valores de una variable más una constante es igual a la sumatoria de la variable más n veces la constante. c. f. X4 = 0. b..UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. + ( X n + C ) =∑ X i + ∑ C i =1 i =1 i =1 n n n • La sumatoria de una constante con límite inferior diferente a 1 es: ∑ C =(n − m + 1)C i =m n EJEMPLO A. hallar: a. ∑ CX i =1 n i = CX 1 + CX 2 + . e. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   • La sumatoria del producto de una constante por una variable es igual a la constante por la sumatoria de la variable. X6 = 7. X5 = 7. ∑ ( X i + C ) = ( X 1 + C ) + ( X 2 + C ) + . Se utiliza la letra griega pi (Π). X3 = 1. ∑X ∑X ∑X i =1 7 i =3 6 i =3 5 i =1 7 5 i = X 1 + X 2 + X 3 + X 4 + X 5 = 2 + 6 + 1 + 0 + 7 = 16 = X 3 + X 4 + X 5 + X 6 + X 7 = 1 + 0 + 7 + 7 + 8 = 23 2 2 2 = X 12 + X 2 + X 32 + X 4 + X 52 = 2 2 + 6 2 + 12 + 0 2 + 7 2 = 90 7 i i ∑ 7 X i = 7∑ X i = (7)( X 3 + X 4 + X 5 + X 6 + X 7 ) = (7)(1 + 0 + 7 + 7 + 8) = 161 i =3 ∑ 5 =(6 − 2 + 1)(5) = 25 ∑ ( X i − 2) =∑ X i − ∑ 2 = [X 2 + X 3 + X 4 + X 5 ] − [(5 − 2 + 1)(2)] = 14 − 8 = 6 i =2 i =2 i =2 i=2 5 5 5 La productoria indica el producto de determinada cantidad de elementos numéricos. ⋅ X n   156 . X2 = 6.1. X7 = 8. Dados los valores: X1 = 2. De este modo..

calcular: a. Si X1 = 2. b. ∏X i=2 5 i = 6 ×1× 0 × 5 = 0 4 ∏2 = 2 × 2 × 2 × 2 = 2 i =1 6 4 = 32 ⎡ 6 ⎤ 3 X i = 3 6 ⎢∏ X i ⎥ = 729 × [2 × 6 × 1 × 0 × 5 × 3] = 0 ∏ i =1 ⎣ i =1 ⎦ EJERCICIOS ANEXO A 1. i es el elemento genérico.. c. i = 1 es el límite inferior.2. ∑X2 ∑ ( X − 4) i =3 i =1 5 3 c.   157 . X4 = 0. ⋅ C = C i =1 n n • El producto de una constante C por una variable es igual a la constante elevada al límite superior por la productoria de la variable. n ⎡ n ⎤ CX i = C n ⎢∏ X i ⎥ ∏ ⎣ i =1 ⎦ i =1 La productoria de una constante con límite inferior diferente a 1 es: • ∏C = C i =m n n − m+1 EJEMPLO A. 2 ∑5X ∑X i =1 i =2 4 4 f. ∏ C = C ⋅ C ⋅ . X6 = 3.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. ∑X ∑ ( X + 2) i =1 i =1 5 5 b. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   donde n es el límite superior de la productoria. 2 −4 Complete el siguiente cuadro. Este símbolo es usado para calcular la media geométrica. la productoria tiene propiedades importantes: • La productoria de una constante C es igual a una potencia. X4 = 6 y X5 = 1. Dados los valores: X1 = 2. d. hallar: a.. X2 = 6. X2 = 4. e. X3 = 5. Igual que la sumatoria. donde la base es la constante y el exponente es el límite superior del producto. 2. X3 = 1. X5 = 5.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   OPERADOR DESARROLLO RESULTADO ∑i i =1 5 10 ∑i i =1 5 i =1 5 2 ∑10 ∑ (2i + 1) i =1 3 ∑ (2 x x =1 5 x=2 7 2 + 2 x + 1) 2 ∑ (2 x − 1) ∑ (x x=4 4 2 − 2) ∑x x =1 x ⎡ 5 ⎤ ⎢∑ x ⎥ ⎣ x =1 ⎦ 4 i =1 5 2 ∏ (2i − 4) ∏i ∏8 ∏ 3i 2∑ 2 n + 1 3∏ 2n − 1 n=2 n=2 5 i =1 5 i =1 4 i =1 5   158 .

f. 64 77 2. 18 28 b. 45 14 c. a. d.UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD   ESCUELA DE CIENCIAS BÁSICAS. OPERADOR RESULTADO 55 55 50 35 43 164 OPERADOR RESULTADO 288 2 ∑i i =1 5 10 ∑x x =1 4 x ∑i2 i =1 5 ⎡ 5 ⎤ ⎢∑ x ⎥ ⎣ x =1 ⎦ 4 i =1 225 0 120 32768 1944 ∑10 i =1 ∏ (2i − 4) ∏i i =1 5 5 ∑ (2i + 1) i =1 5 ∑ (2 x x =1 5 x=2 3 2 + 2 x + 1) ∏8 i =1 4 ∑ (2 x − 1)2 ∑ (x x=4 7 2 ∏ 3i i =1 − 2) 2∑ 2 n + 1 118 5 3∏ 2n − 1 n=2 n=2 5 57 5759     159 . TECNOLOGÍA E INGENIERÍA   CONTENIDO DIDÁCTICO DEL CURSO: 100105  – Estadística Descriptiva   INFORMACIÓN DE RETORNO DEL ANEXO A 1. e.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->