P. 1
Guía Didáctica de ADE

Guía Didáctica de ADE

|Views: 648|Likes:
Publicado porFrancelina Mendez

More info:

Published by: Francelina Mendez on Sep 24, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

01/10/2013

pdf

text

original

Sections

  • PRESENTACIÓN
  • UNIDAD II: ORGANIZACIÓN DE LOS DATOS
  • UNIDAD III: REPRESENTACIÓN DE LOS DATOS
  • UNIDAD IV: MEDIDAS DE POSICIÓN, DE TENDENCIA CENTRAL Y DE DISPERSIÓN
  • UNIDAD V: INTRODUCCIÒN A LA PROBABILIDAD, MUESTREO Y ESTIMACIÓN

REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DE EDUCACIÓN SUPERIOR UNIVERSIDAD BOLIVARIANA DE VENEZUELA DIRECCIÓN GENERAL ACADEMICA DIRECCIÓN DE PLANIFICACIÓN Y DISEÑO

CURRICULAR PROGRAMA DE FORMACIÓN DE GRADO “GESTIÓN DESARROLLO LOCAL”

SOCIAL

DEL

ANÁLISIS DEL DATO ESTADÍSTICO
GUIA DIDÁCTICA Por los profesores

Deivis Cardoza Emilio Silva José Silva Julio César Falcón Melsi Goitte Ramón Roberto Herrera C.

TERCERA EDICIÓN AGOSTO 2.006 CARACAS-VENEZUELA
1

ÍNDICE

Presentación Unidad I Unidad II Unidad III Unidad IV Unidad V Bibliografía La Estadística: Herramienta fundamental en diversos escenarios de aplicación Organización de los Datos Representación de los Datos Medidas de Posición, de Tendencia Central y de Dispersión Introducción a la Probabilidad, Muestreo y Estimación

3 7 23 40 57 93 102

2

ANÁLISIS DEL DATO ESTADÍSTICO GUÍA DIDÁCTICA PRESENTACIÓN La Guía Didáctica de "Análisis del Dato Estadístico” está diseñada para que los profesores-facilitadores de la UBV contribuyan al logro, por parte de los estudiantes, de la competencia en el uso de las herramientas estadísticas, integradas en todos los Programas de Formación en la UBV. La Estadística es una herramienta fundamental para la formulación, ejecución y seguimiento de cualquier proyecto socio-comunitario y de investigación. El egresado de la UBV tiene que manejar con soltura un leguaje estadístico revestido con una gran sencillez y comprensibilidad, que permita una fluida comunicación dentro de un grupo de trabajo interdisciplinario, y que al mismo tiempo pueda apoyar la resolución de una gran cantidad de situaciones que requieran el estudio de un conjunto de datos para su mejor compresión y aporte de soluciones. Por tanto, no se está buscando de que el egresado de la UBV se convierta en un experto especialista en Estadística, sino más buen que desde su disciplina profesional pueda hacer un adecuado uso de aquella especialidad matemática para su propia área de trabajo individual y colectivo. Esta Guía Didáctica expone de manera sencilla, sustancial y consistente los principales métodos de la Estadística y sus relaciones. La sencillez de esta Guía no disminuye su validez didáctica, apta para todo aquel que se inicia en el estudio de la Estadística Descriptiva e Inferencial. Esta herramienta es indispensable para los proyectos socio-comunitarios y de investigación que aspiren a tener base cuantitativa, pues un proyecto sin datos estadísticos presenta una gran debilidad. Esta unidad curricular básica ha sido diseñada de maneja de suministrar una herramienta de gran utilidad, la cual, apoyada en la antropogogía como estrategia didáctica, impulsará el trabajo autónomo, creativo, responsable y participativo de los alumnos en la ejecución eficaz de las tareas propias de Proyecto I y Proyecto II. La estructura de la Guía consta de cinco Unidades divididas en Temas. Unidad I Unidad II Unidad III La Estadística: Herramienta escenarios de aplicación Organización de los Datos Representación de los Datos fundamental en diversos

3

Se presentan como estrategias de aprendizaje/evaluación para ser realizadas por los estudiantes bajo la guía y supervisión del profesor-facilitador. 4.3) Comunitarias: Actividades centradas en la interacción socio comunitario y el trabajo participativo. informes y exposiciones que deberán ser realizados en forma individual por el alumno. de Tendencia Central y de Dispersión Introducción a la Probabilidad. Muestreo y Estimación En estas Unidades se presentan los contenidos y las correspondientes actividades didácticas que se realizan en el lapso académico estimado para esta Unidad Curricular. ensayos.Unidad IV Unidad V Medidas de Posición. de ejemplos propios de la vida cotidiana individual y colectiva del estudiante en su ámbito académico y social. Sugerencias para uso de la Guía Para los profesores: La Guía constituye una orientación para apoyar la actividad. combinar o eliminar contenidos. debe ser utilizada en forma secuencial y flexible.2) Grupales o Cooperativos: Incluyen investigaciones. Son de varios tipos: 4. 2) Competencia a lograr. 4) Actividades. Estructura del Unidad Cada Unidad está compuesta de cuatro partes: 1) Objetivo. 3) Contenido. agregar. 4 .1) Individuales: Incluyen resúmenes. y así se podrá percibir y valorar objetivamente la utilidad práctica de esta disciplina. En todo momento el profesor debe hacer uso constante. aclarando conceptos y explicando los ejercicios (actividades) que se les propongan y no entiendan. pues de esa manera se podrá facilitar el proceso educativo y dialógico de enseñanza-aprendizaje de las ideas y planteamientos matemáticos de la Estadística. El profesor actuará como compañero facilitador del aprendizaje (es un estudiante más de la sección pero con Título Universitario). debates y otros trabajos y experiencias realizadas en equipo por los estudiantes. 4. en forma amena y sencilla. de manera que podrá cambiar. negativa y prejuiciada de considerarla como algo muy difícil y aburrido y de escaso provecho y nula importancia. y a su vez se contrarrestará la tendencia equivocada. El profesor–facilitador debe orientar y adaptar esta propuesta al grupo de estudiantes que tiene a su cargo.

 Podrá presentado en eventos científicos y exposiciones de interés. Al final de cada Unidad se propone realizar una prueba diagnóstica a fin de validar el avance del proceso de aprendizaje o logro de las competencias 5 . para lo cual llevará un registro. cada alumno podrá elaborar con mayor facilidad su portafolio de aprendizaje. Los alumnos se agruparan en equipos de trabajo para realizar las actividades asignadas. entre otros. La actividad a ejecutar por el profesor–facilitador en cada sección de facilitación del proceso de aprendizaje constará de dos partes. Aprendizaje por Proyecto.El profesor–facilitador llevará el registro de la evolución del proceso de aprendizaje. respondiendo las preguntas que se presenten u ofreciendo algunas ideas del material mediante el uso de diversas metodologías pedagógicas. en el se reunirán todos los aportes y resultados de las actividades grupales e individuales. como por ejemplo mapas conceptuales. El desarrollo del portafolio de aprendizaje queda a libre decisión de los integrantes del curso.  Sirve como registro de la actividad creadora de los estudiantes para ser recopilado como testimonio de producción de saber en la UBV. Para los estudiantes El estudiante debe comprometerse con su proceso de aprendizaje. indagar. De esa manera. Se sugiere usar metodologías pertinentes con respecto a los lineamientos institucionales de la UBV en materia de evaluación. con quienes se reunirá para validar el desarrollo de sus actividades y aprendizaje. y tiene varias finalidades:  Sirve como insumo para la evaluación. ampliar lo conocimientos que ha adquirido por si mismo. leyendo cuidadosamente la guía consultando los textos de estadística a su alcance y cumpliendo con las actividades asignadas. 2) Presentar la nueva propuesta de actividad. Tablas de resumen acerca de la teoría presentada a consideración. 1) Validar la ejecución de las actividades por parte de cada grupo y al mismo tiempo evaluar la evolución del proceso de aprendizaje individual. Debe acudir a los encuentros programados con el profesor para comentar. problemas estadísticos y otros relacionados que puedan surgir. y para encontrar orientación acerca de temas relacionados. así como la metodología de evaluación de cada uno de los estudiantes.

Esperamos que esta Guía sea realmente útil para todos ustedes. Independientemente de los mecanismos de evaluación a implementarse.es.esperadas. Como propuesta organizativa para las actividades asignadas. Dentro del equipo de trabajo se nombrará un coordinador quien ejercerá dicha función (asignándole a cada uno su aporte en la ejecución de la actividad) y apoyará positivamente la discusión y ejecución de las actividades a realizar en cada Unidad.com. y silvachapellin@yahoo. estos deben tener carácter formativo para que. y que sirva de apoyo y estímulo para el desarrollo profesional y la creación de su propio conocimiento individual y colectivo. el verdadero objetivo sea alcanzar resultados cualitativos que reflejen el aprendizaje de los conocimientos de la Unidad Curricular. los equipos de trabajo contarán como máximo con el 20% del total de alumnos de la sección. 6 . que disfruten de la aventura de aprender haciendo. Con el fin de que el lector pueda aportar ideas y sugerencias para enriquecer y mejorar la Guía Didáctica. ponemos a su disposición los siguientes correos electrónicos: mgoitte@yahoo. más allá de obtener cualquier nota o resultado cuantitativo.

analizar. Mencionar y definir las diferentes ramas de la Estadística. explicar.UNIDAD I: LA ESTADÍSTICA: Herramienta fundamental en diversos escenarios de aplicación. clasificar. haciendo más fácil y práctica la transmisión de esa información. 6) Definir los conceptos de dato y variable. explicación y comparación de un fenómeno (al cual están asociado tales hechos) que afecta a grupos de naturaleza diversa. Estadística se refiere a información numérica que puede presentarse tanto en forma grafica como en tablas. la Estadística es el estudio de la incertidumbre y capacita para enfrentar el azar. sus conceptos básicos y aplicaciones. Ejemplos: 7 . 1. organizar. controlar y evaluar hechos sujetos a un estudio numérico como base para la descripción. las ventajas y la necesidad de las muestras. presentar.1. O sea. y reconocer la diferencia entre una variable discreta y una continua y la escala o nivel de medición de un grupo de datos. simular. COMPETENCIAS A LOGRAR: 1) 2) 3) 4) 5) Definir y analizar la Estadística. Citar algunas aplicaciones de la Estadística en la vida real. 8) Comprender cada uno de los procesos que involucra una investigación estadística. 9) Definir la fuente y la técnica de muestreo a emplear en la recolección de datos. CONTENIDO: TEMA 1 1. y ayudar a tomar mejores decisiones sobre dicho fenómeno además de predecirlo a futuro. Definir y diferenciar población y muestra. 7) Comprender la importancia de obtener buenos datos y los métodos para su obtención. OBJETIVO: El estudiante comprende la importancia de la Estadística. teniendo ese estudio el fin de generar conocimientos de los mismos. 10) Diseñar el instrumento para la recolección de datos.1 ¿Qué significa Estadística? En nuestro lenguaje cotidiano. Explicar el objetivo.1 ¿Qué es la Estadística? Es un conjunto de métodos y técnicas a usarse para recolectar.

 El número de niños que viven en una determinada parroquia de Caracas. 1.  La cantidad de estudiantes de la UBV por cada Programa de Formación de Grado y por cada sede a nivel nacional. la Estadística:  Es una herramienta que ayuda a interpretar los datos generando información y conocimiento de la realidad.  El porcentaje de graduados de las universidades públicas del país.3 ¿Cuál es la utilidad de la Estadística? El verdadero alcance de la Estadística no puede circunscribirse a las formulaciones abstractas numérico-algebraicas propias de su concepción técnicometodológica. extraña o poco común.1. y las soluciones y decisiones a tomar pueden ser o no ser de orden cuantitativo. Luego. se tomarán decisiones que involucren datos. 8 .  El número de decesos anuales debidos al alcoholismo. bien sea un experimento comparativo. quien estudie y use la Estadística debe contextualizarla en su justa dimensión. La Estadística se ocupa de la caracterización y aplicación de técnicas para: 1) Diseñar una investigación. a partir de los datos de la investigación.  Ayuda a obtener la información indispensable en la planificación de las soluciones necesarias que las comunidades requieren en diversos otros escenarios.1. Esos tres elementos tienen su origen en situaciones cotidianas de la vida real que el ser humano debe resolver de diversas maneras.  El número de goles anotados por la vino tinto. y asimilarla e interpretarla en función de revelar el carácter teórico-práctico y abstracto-concreto de la vinculación entre conocimiento y realidad. 3) Inferir sobre grupos numerosos en estudio. 3) No importa cual sea la línea de trabajo. 1. una encuesta por muestreo.  El salario promedio de los habitantes de la parroquia La Vega. 2) Las técnicas estadísticas se usan para tomar decisiones que afectan nuestro bienestar. un estudio observacional.2 ¿Por qué y para qué se estudia la Estadística? Hay tres razones para estudiar Estadística: 1) Hay datos en todas partes. o de construcción de un modelo. La Estadística es algo más que números. cuentas y fórmulas de apariencia complicada. Si son de ese orden. 2) Resumir los datos de la investigación.

4 Ciencias y fenómenos que requieren del uso de la Estadística En vista de la utilidad de la Estadística en diversas áreas. tales fenómenos podemos clasificarlos en: Los que no pueden estudiarse por simple observación porque es muy grande la cantidad de objetos o casos a considerar en esos fenómenos. las ciencias que la necesitan se clasifican en:  Las que obligatoriamente la requieren. como la Astronomía. representándose esta con letras griegas minúsculas. individuos u objetos a los que se le consideran en estudio una o varias características comunes.1. como las investigaciones socio-económicas. cantidades. la Física y la Meteorología. la Educación. etc. Permite procesar información que sirve de base a la ejecución de cualquier proyecto. como la Biología.  1. Partiendo de este criterio.  Los que deben estudiarse desde el punto de vista cualitativo y cuantitativo. Cada una de estas ciencias se aboca a estudiar fenómenos que por sus características particulares requieren de diferentes tratamientos al aplicarles los métodos estadísticos. dejaría de tener sentido cualquier tendencia a descontextualizar la Estadística en particular. Ejemplo: Los pacientes de los hospitales públicos del país. como un compendio de conocimientos misteriosos y de escasa o nula utilidad real. la Economía. Partiendo de las anteriores consideraciones. o se presentan con diferentes intensidades o frecuencias. y la Matemáticas en general.2 Población y Parámetro Población es el conjunto total de elementos. 9 . 1. la Sociología. como es el caso de la Demografía. Parámetro es una medida numérica obtenida por el manejo y procesamiento de los datos de la población descrita por dicha medida.  Las que deben obtener sus resultados con la máxima exactitud posible. lo cual implica que muchas veces se confundan con esta. el tiempo en que estos ocurren es muy distante.  Los que al estudiarse cuantitativamente reproducen errores que necesitan de la Estadística para corregirlos o eliminarlos.  Las que la usan para estudiar fenómenos cualitativos y cuantitativos.

776.727. gráficas y tablas. condensarlos y presentarlos mediante cuadros.1 Estadística Descriptiva o Deductiva (o Análisis Estadístico) Consiste en procedimientos usados para tratar y organizar los datos de una muestra en estudio con el fin de sistematizarlos. Ejemplo: De la población anterior.4.E. Medida Media Desviación Estándar Varianza 1.852 100% 1. los pacientes del hospital de los Magallanes de Catia.393 28.610. las características esenciales de la muestra en cuestión sin que sobrepasen los conocimientos que proporcionan los datos. generalmente minúsculas.85% Pobres 7.113.05% Pobres Extremos 6. Estadígrafo o Estimador es una medida numérica obtenida por el manejo y procesamiento de los datos de la muestra descrita por dicha medida. Estadígrafo o Estimador Muestra es un subconjunto o parte de la población. representándose esta con letras latinas.3 Símbolo del Parámetro μ σ σ2 Muestra y Estadístico.) Cuadro 1: Hogares y personas en situación de pobreza Primer Semestre 2.104 39.2 Estadística Inferencial o Inductiva (o Inferencia Estadística) 10 .355 32. procedimientos que permiten describir y analizar. Ejemplo: De acuerdo a los datos suministrados por el Instituto Nacional de Estadística (I. reducirlos. por medio de ciertas medidas.4.10% Población Total 24.004 Categoría Cantidad Porcentaje No Pobres 9. Estadístico.4 Tipos de Estadística Símbolo del Estadístico X S S2 1.Medida Media Desviación Estándar Varianza 1.N.

presupuesto y suficiente tiempo antes y después del levantamiento. y simplificar éstas obteniendo algunas medidas que las representan (estadísticos). en lugar de realizarse un censo. De los 1. 11 . generalizaciones e inducciones válidas mediante el procesamiento de los datos de esa muestra. En el caso del censo. se investiga una población en base a muestras. planificación. tenemos que investigar todos y cada uno de los elementos de la población. responda las preguntas y agréguelo a su portafolio. tomamos decisiones u obtenemos conclusiones.176 dijeron que comprarían el atún si lo ponían en venta.  ¿Que información obtuvo la cooperativa de enlatados de Río Caribe acerca de la aceptación del atún con orégano por parte de la población?  ¿Es éste un ejemplo de Estadística Descriptiva o Estadística Inferencial?  Tome este ejemplo. En el caso de una muestra. Es importante diferenciar en el estudio estadístico que se realiza si los datos provienen de una población o de una muestra.960 encuestado 1. y en base a los resultados deducimos las leyes que rigen a la muestra o al fenómeno (a través de las Probabilidades) e inferimos sobre las características de la población total para hacer previsiones sobre los mismos. y todos sus elementos deben contener características en la misma proporción en que se hallan para la población total.5 Consideraciones acerca de la Población y la Muestra Para estudiar las características de los elementos que integran una población o de algún fenómeno que la afecte. Para realizar un censo se requiere de gran cantidad de personas entrenadas. 1. Una muestra debe ser representativa de la población de la que ha sido extraída. reduciendo los datos a tablas o distribuciones. podemos analizarlos mediante los métodos que provee la Estadística Descriptiva. De allí que gran número de veces. analizamos sus características particulares. se puede ejecutar un censo o escoger una muestra. siendo que el alcance de los conocimientos aportados por esos datos es sobrepasado por las estimaciones antes referidas. investigamos solo un conjunto parcial de los elementos que integran una población.Es un conjunto de técnicas que se utilizan para una población con el propósito de seleccionar una muestra representativa de esta y obtenerle estimaciones.960 consumidores probar una variedad de atún enlatado con orégano llamado Delicias de Sucre. Si disponemos de los datos de las características de todos los individuos que componen una población. y mediante la Inferencia Estadística se determinan las características de la población total. Ejemplo: La cooperativa de enlatados de Río Caribe pidió a una muestra de 1.

2) Se recolecta una muestra de la población siguiendo un procedimiento establecido e idóneo. En general se le denomina simplemente como Dato. también usaremos la Estadística Descriptiva para analizarlos y obtener algunas medidas (estadísticos) que nos describan las características de los datos de la muestra.6 Datos y Variables 1. 4) Se aplican las teorías de inferencia estadística a la información de la muestra para obtener conclusiones sobre la población muestreada (estas conclusiones o respuestas se denominan inferencias). 3) Los datos de la muestra se convierten en información útil (la cual.1 Definiciones Dato Estadístico es una cantidad o categoría susceptible de ser observable y medible en una población o muestra. pero para conocer de manera muy aproximada las características de la población (parámetros) es necesario recurrir a la Estadística Inferencial. 1. Variable Estadística es una característica o propiedad 12 . dada en forma numérica o gráfica. Por otra parte. se denomina Estadísticas de la Muestra). Para dar así una solución estadística a un problema. En conclusión. Estos pasos se indican en la siguiente figura.6. se desarrolla una secuencia de pasos: 1) La situación bajo investigación se define cuidadosa y completamente. un objetivo típico en Estadística es describir la población con base en información obtenida mediante la observación de relativamente pocos elementos individuales.Si los datos provienen de un conjunto parcial de la población (muestra).

cualidad. Las variables asumen los datos como valores.que varía de acuerdo con alguna escala o dimensión al asumir diferentes valores (cantidades o categorías) por parte de los componentes de una población o muestra. denotan modalidad. Ejemplos: -. Ejemplos: -. Generalmente se le denomina solamente como Variable. y recíprocamente ocurre lo mismo. Si un valor no aparece en algún componente o elementos de la población o muestra. entonces ese valor no es un dato y sí lo es en caso contrario.Kilómetros recorridos -.Estatura.Número de televisores vendidos en el año Continuas: son respuestas numéricas surgidas del proceso de medición.7 Tipos de variables Variables Cualitativas o Categóricas: son aquellas características o variables que no son numéricas.  Ayuda en el proceso de toma de decisiones cuando se estudia un determinado evento.Numero de hijos por familia -. 13 .Estado civil -.Género Cuantitativa o Numérica: son aquellas características o variables que son cantidades. Ejemplos: -. 1. es decir. Discretas: son respuestas numéricas surgidas del proceso de conteo.6. es decir. 1. es decir.2 ¿Para qué necesitamos recolectar datos?  Mide el desempeño de un servicio o proceso de producción en curso que realizan las distintas comunidades. es decir. Una variable está asociada a una colección de datos.  Facilita la administración de recursos de diversa índole a ser empleados en la concreción y/o ejecución de las decisiones.Número de empleado por empresa -. Asume cantidades decimales e ininterrumpidas en su extensión. categoría o atributo. cualquier número entre dos dados. números enteros o exactos. Asume cantidades específicas e interrumpidas en su extensión. producen respuestas numéricas.Peso de los alumnos -.

decimos que para una variable discreta se dan de modo inherente separaciones entre valores observables sucesivos. cada categoría asumida por está se halla asociada a un grupo de datos. Un proceso de medición que sea confiable proporciona datos con poca variación y mayor exactitud respecto al objeto a medirse.8 Escalas o Niveles de Medición de los Datos La medición es la asignación de valores numéricos a atributos. una variable discreta es aquella tal que entre 2 valores cualesquiera observables (potencialmente). ha dado motivo para que las características o propiedades que se miden sean denominadas como variables. elementos. con la cual debe haber inevitablemente un error de medida. Por otra parte. categorías. o sea. No importan lo próximas que sean dos mediciones de un mismo objeto en dos instantes distintos. Si el proceso es válido entonces mide lo que se desea medir. hay otro valor observable (potencialmente).Explicando de otra forma la clasificación de las variables cuantitativas. Tal variación. Si la variable es cualitativa. una variable continua puede tomar todos los valores a lo largo de un intervalo. aquellas pueden dar resultados diferentes. Se requiere prestar atención a la variación 14 . En cambio. y entre valores registrables adyacentes la magnitud de la distancia queda determinada por la precisión de la medición. Las variables se representan con letras mayúsculas del alfabeto latino. es decir. El problema de la variación se complica al reconocer que esta también ocurre en quienes miden y en los instrumentos que se usan para medir. por lo que sería deseable disponer de un proceso de medición válido y confiable. pero colocándoseles subíndices para diferenciarlas. podemos hablar de datos cualitativos y cuantitativos. existen datos discretos y continuos. y los datos se representan con el mismo tipo de letra de las correspondientes variables con las que están vinculadas. y entre estos. los resultados pueden ser diferentes. Una variable continua siempre se registra en forma discreta. La medición corresponde a las características o propiedades propias de los objetos en estudio y no de los objetos en sí mismos. hay por lo menos un valor no observable (potencialmente). que ocurre de modo natural. Si se mide cierta propiedad de dos objetos. pero a diferencia de una variable discreta. nunca se puede medir exactamente a la variable continua. TEMA 2 1. Por tanto. los datos se pueden clasificar con las mismas denominaciones que tengan las respectivas variables a la que están asociadas. sucesos u otros valores según ciertas escalas o reglas. una variable continua tiene la propiedad de que entre 2 valores cualesquiera observables (potencialmente).

multiplicación y división). Esta escala se utiliza para variables cuantitativas. Ejemplo: El escalafón militar.8. Por tal motivo se han propuesto criterios de validez y confiabilidad referentes a aspectos que conviene tener en cuenta para evaluar la calidad de los datos. Uno de esos criterios a considerar es la Escala o Nivel de Medición de Datos.8. Tiene la 15 Frecuencia 6 28 25 12 3 . Calificación Superior Bueno Aceptable Pobre Inferior 1. Cualquiera que sea el símbolo. y no representa la ausencia de la característica en estudio. 1.3 Escala de Medición de Intervalo Escala en la que se establece distancias o intervalos iguales entre valores numéricos. no se le aplican operaciones matemáticas (suma. y en la misma no existe un cero absoluto o verdadero. este se fija arbitrariamente en forma relativa. En esta escala no se indica la magnitud de la diferencia entre categorías. que no tienen vinculación entre sí y se les asignan nombres o símbolos. es decir. o la siguiente lista de las calificaciones que los alumnos dieron a un profesor de la UBV en el curso de PIUNI. que se define como un sistema de valores y condiciones relacionales que asigna un grado o valor a una variable en base a los sujetos u objetos sometidos a medición.8. resta. La técnica estadística a emplearse en el análisis de los datos obtenidos depende del uso de una de las cuatro escalas de medición que se dan a continuación. este sustituye a las palabras. Si el símbolo es numérico. Ejemplos: Género (hombre. ni se aplican operaciones matemáticas básicas a los nombres o símbolos que las representan. únicamente se cuantifican frecuencias en cada categoría. mujer).1 Escala de Medición Nominal o Clasificatoria Es una escala adoptada por variables cualitativas. y sólo se cuantifica la frecuencia o el número de casos asociados a una categoría. número de revistas deportivas. Al igual que en el nivel ordinal.2 Escala de Medición Ordinal o de Rango Escala en la que se establece un orden jerárquico entre datos o categorías de variables cualitativas.y a como esta puede afectar la calidad de los datos. número de estudiantes con credencial que entran a juego de fútbol y que sean mujeres. la cual consiste en la clasificación en dos o más categorías. 1.

y además la distancia entre las medidas tiene significado. Por otra parte.9 Fuentes de los datos Tipo de Escala Usos admisibles Clasificar Clasificar y ordenar Clasificar.8. y esa medición representa otro valor de la temperatura cuando se mide en Grados Fahrenheit. el salario diario de los miembros de la comunidad. 1. o los obtenidos por la realización de un estudio u observación directa.4 Escala de Medición de Razón o de Proporción Es la escala más alta. la temperatura en Grados Centígrados no posee un cero absoluto. Ejemplos: El peso de las personas. Modo de Medir Asignación de nombres y Nominal o símbolos (pudiendo ser Clasificatoria numéricos) Asignación de nombres y Ordinal o de símbolos (pudiendo ser Rango numéricos) Asignación de símbolos numéricos comparándolos con De Intervalo una unidad de medición. En esta escala sí es posible realizar diferentes operaciones matemáticas. ordenar y obtener diferencias y proporciones de mediciones Son los sujetos u objetos que generan o contiene la información a usarse en una investigación estadística. la densidad de un objeto. El siguiente cuadro resume las escalas aquí referidas. ya que 0º no implica ausencia de temperatura. 16 . Tiene todas las características de la escala de intervalo. Kelvin o Réaumur. como el Calendario Gregoriano o el Musulmán. y además el valor cero tiene significado y representa la ausencia de la característica estudiada. y la distancia y relación proporcional entre dos números tiene sentido.propiedad de orden de la Escala de Medición Ordinal. la altura de las personas. Por ejemplo. los datos publicados por fuente gubernamentales. y se fija el cero relativo inicial Asignación de símbolos De Razón o de numéricos comparándolos con Proporción una unidad de medición. o los dados en la aplicación de una encuesta o un experimento. Ejemplos: El tiempo calendario. y se fija el cero absoluto inicial 1. ordenar y obtener diferencias de mediciones Clasificar.

10 Técnicas e Instrumentos de Recolección de Datos 1. 1. que se utiliza para contener. Sin embargo. si por la naturaleza del fenómeno y de los recursos disponibles no es posible usar esas fuentes.1 Relación entre Técnica e Instrumento Técnica: Se entiende como Técnica el procedimiento o forma particular de obtener datos o información. En la práctica es aconsejable utilizar fuentes primarias. La aplicación de una técnica conduce a la obtención de información.10.  Una libreta en la que el investigador anota lo observado. estos se denominan fuentes privadas. La fuente primaria más notable es la que publica la información de los Censos Nacionales. y si se obtienen por personas. entre otros.Los datos necesarios para la investigación estadística pueden hallarse a través de diferentes fuentes. y si no lo obtuvieron tenemos fuentes secundarias. Son ejemplos de instrumentos:  Un cuestionario en cuya estructura queda registradas las respuestas suministradas por el encuestado (formulario para rellenar). registrar o almacenar información.  Computadora portátil con sus respectivos medios de almacenaje. Las dependencias gubernamentales que suministran los datos son fuentes oficiales. video-filmadora. agencias u organizaciones no gubernamentales. 17 . es aconsejable emplear las secundarias siempre y cuando los datos facilitados se hayan obtenido de manera técnicamente rigurosa.  Dispositivos como cámara fotográfica. grabador de audio. Instrumento de Recolección de Datos: Es un dispositivo o formato (en papel o digital). que son primarias si los datos suministrados por una persona o una institución fueron obtenidos directamente por estos. la cual debe ser resguardada mediante un instrumento de recolección de datos.

Encuesta escrita: Se realiza a través de un cuestionario auto-administrado. Observación Diario de Campo. Su duración es bastante corta por lo cual se realizan pocas preguntas. Computadoras.2 Tipos de cuestionarios 18 . Cámara de video. siempre es respondido de forma escrita por el encuestado. Esta modalidad utiliza como instrumento la guía de encuesta. Entrevistas No Estructurada Libreta de Notas. Guía de encuesta. o en relación a un tema en particular. Cámara de video. medios magnéticos o electrónicos contentivo de una serie de preguntas.10. Grabador. el cual como su nombre lo indica. Cámara de video. En esta Guía desarrollaremos la técnica de la Encuesta. Se le denomina cuestionario auto-administrado porque debe ser llenado por el encuestado sin intervención del encuestador. Oral DISEÑO DE INVESTIGACION DE CAMPO Encuestas Cuestionario Escrita Guía de entrevista. No Estructurada Cámaras fotográfica y de video.Diagrama de Técnicas e Instrumentos para la Recolección de Datos TECNICAS DISEÑO DE INVESTIGACION DOCUMENTAL Análisis Documental Análisis del contenido INSTRUMENTOS Fichas. Encuesta: Se define como una técnica que pretende obtener información que suministra un grupo. Cuestionario: Se realiza de forma escrita mediante un instrumento o formato en papel. 1. Estructurada Escala de Estimación. Grabador. muestra o población de sujetos acerca de si mismo. Estructurada Grabador. Cuadro de Registro y clasificación de categorías Lista de Cotejo. Encuesta Oral: Se fundamenta en un interrogatorio cara a cara o vía telefónica en el cual el encuestador pregunta y el encuestado responde. La encuesta puede ser oral o escrita.

1. la edad y el salario. 10)Utilizar escalas de rangos para preguntas sobre tópicos muy personales. estudios convencionales o construcción de modelos es un paso para lograr inferir resultados obtenidos de los estudios particulares hacia las 19 .10. y corregir cualquier falla y elaborar una versión definitiva del instrumento. quien construye su respuesta de manera independiente. sino que se da la libertad de responder al encuestado. Ejemplo: ¿Posee usted un televisor? Si No Preguntas Abiertas o de desarrollo: Son las que no ofrecen opciones de respuesta. 5) No incluir preguntas que induzcan a la respuesta (preguntas guías). de Ernesto Rivas. es decir. 2) Ordena las preguntas de lo general a lo particular. 1. 7) Separar las preguntas de “doble cañón”. encuestas. 6) Omitir preguntas que originen múltiples interpretaciones.Preguntas Cerradas: Son aquellas que establecen previamente las opciones de respuesta. 3) Evitar preguntas que abusen de la memoria del encuestado. 11) Una vez construido el cuestionario se recomienda aplicar una prueba piloto o sondeo preliminar a un pequeño grupo que no forme parte de la muestra. 9) Emplear frases de enlace cuando sea necesario. 4) Obviar preguntas sobre temas o conocimientos especializados. tales como. se puede consultar el libro “Estadística General”.4 Planeamiento y ejecución de un estudio estadístico comunitario La descripción de los datos producidos por experimentos comparativos. Ejemplo: ¿Que actividades deportivas realiza durante el último mes? Preguntas Mixtas: Es aquel cuestionario que combina preguntas abierta y cerradas. Para mayores detalles al respecto. Esto con la finalidad de establecer la validez del cuestionario. es decir estas deben tener una correspondencia con los objetivos específicos de la investigación.3 Recomendaciones para la elaboración del cuestionario 1) Las preguntas del cuestionario no se inventan a capricho. aquellas que se interroga sobre dos puntos en una misma pregunta.10. 8) Incluir preguntas que permitan verificar respuestas anteriores o preguntas de control. pero que sea equivalente en cuanto a su característica.

la descripción se apoya en el análisis estadístico de los datos. y luego hay que diseñar el instrumento para la recolección de la información. alcance y limitaciones. ya que en él se necesita del esfuerzo creativo y constructivo del investigador. Estos estilos deben tomarse en cuenta para el planeamiento y ejecución de la investigación estadística. En otras situaciones. 2) Desarrollo del instrumento para la obtención de los datos Este paso tiene un carácter subjetivo.6. 2) Exploratorio: se emplea cuando no tenemos preguntas específicas que guíen la recolección de datos. así como el alcance de la investigación en el espacio y el tiempo. abarcándose los siguientes pasos: 1) 2) 3) 4) 5) 6) Formulación de problema especifico de la investigación Desarrollo del instrumento para la obtención de los datos Recolección de los datos Organización y presentación de los datos Análisis estadístico Interpretación de los resultados 1) Formulación de problema especifico de la investigación Este paso consiste en la definición del evento. es decir.2. 4) Organización y presentación de los datos Este se realiza mediante: 20 . La necesidad de hacerlo ya la expusimos previamente en la sección 1. 3) Recolección de los datos Este es el paso mas importe dentro de la investigación estadística desde el punto de vista operativo. Es necesario el estudio de antecedentes y experiencias similares. y a aquella la podemos clasificar en los siguientes estilos o maneras: 1) Descripción rígida (sin exploración): dispone el uso de técnicas de análisis prescritas sin el examen previo de los datos. Para poder lograr su exacta definición es necesario detener conocimiento sobre el objeto a investigar. definir los tipos de casos que han de ser estudiados. La recolección de datos es el fin del planeamiento y ejecución de la investigación estadística.poblaciones de interés. recursos disponibles y necesarios. Previamente se ha de definir el universo estadístico. 3) Confirmatorio: se usa cuando formulamos preguntas precisas en una investigación y recolectamos datos con el fin de darles respuesta. fenómeno u objeto y finalidad de la investigación.

Grupal Cooperativo  Busque información estadística en la prensa. las respuestas ilógicas y las omisiones.11 ACTIVIDADES Individual Lea la guía con cuidado antes de realizar las siguientes actividades. Se interpreta los resultados emitiendo en este momento opinión sobre lo estudiado.  Recolecte dentro de su grupo familiar las observaciones y datos referentes a las variables edad.4) La Presentación (tablas y gráficos): Luego de la agrupación de los datos estos se pueden presentar ordenados en tablas ó cuadros y mediante la representación de graficas.  Resuelve los siguientes ejercicios e incorpórelos a su portafolio de aprendizaje: 21 . 4. Comente su utilidad y aplicación e inclúyalo en su portafolio. ejecución y seguimiento de proyectos y trabajos de investigación. 4. e inclúyalo en su portafolio de aprendizaje. 4.3) La Clasificación: Se determina cada variable evaluada en los instrumentos. de entre estos últimos. altura y color de ojos.2) El agrupamiento: Significa volcar en una hoja todos los datos contenidos en los cuestionarios (instrumentos). 6) Interpretación de los resultados Consiste en traducir las medidas o características numéricas obtenidas en el lenguaje relativo al objeto o evento estudiado.  Escribe un ensayo sobre la utilidad de la Estadística en la formulación.1) 5) Análisis estadístico En este paso se calcula todas las medidas o características numéricas (parámetros o estadísticos según sea el caso). ¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición.La Revisión: Consiste en la inspección de los registros donde se han reunido los datos para corregir los errores. 4. sexo. los que están asociados a la variable en cuestión. 1. y de todas las hojas antes usadas para registrar los datos se escogen.

Altura de los árboles de Caracas. FUNDACREDESA. Tipos de vivienda en la comunidad. 6. Comunitario Trasládese en compañía de su profesor de Proyecto I (II) a la comunidad o lugar donde se ejecutará el Proyecto I (II). 6. además de su correspondiente nivel de medición. 3.1. Explique la diferencia entre variables cualitativas y cuantitativas. Número de camas en el hospital. 5. Internet. 2. Numero de vivienda. 5. y de ejemplos. Investigue y elabore tres tipos diferentes de encuestas (instrumentos). Diseñe el instrumento para la recolección de los datos. Tipo de teléfono. 22 . ¿Cuál es la variable cualitativa y cuál la cuantitativa?  Determine si los siguientes datos son cualitativos y cuantitativos. INE. Formule el problema e identifique las variables presentes que serán consideradas dentro de su diagnóstico.004. Considere las variables Población y Fuerza de Trabajo. las cuales clasificará según sus características. Todos y cada uno de los grupos escogerán un conjunto de estas variables. 1. Recuerda trabajar en campo usando sólo lápices de grafito.  Recuerde sistematizar todas y cada una de las actividades y generar un reporte para tu portafolio. 1. Color de la vegetación. Busque en la página Web del INE la información poblacional que allí se suministra sobre la fuerza de trabajo (población ocupada). 4. 7. 3. 2. nunca con bolígrafo. De ejemplos. Duración de llamadas a larga distancia. 2. Aplique el instrumento y recolecte los datos en campo. 4. siguiendo las recomendaciones presentada en la guía. Explique la diferencia entre una población y una muestra. Inclúyalo en su portafolio. Tome los cuadros correspondientes al primer semestre del año 2. 3. Diga la utilidad de esta investigación y de las variables escogidas. 4.

2) El Agrupamiento: Luego de ejecutarse el paso anterior. SPSS. es necesario ordenarlos en forma lógica. y observar aquellas respuestas absurdas. es necesario efectuar: La Revisión: Consiste en constatar y hacer recuento todos los instrumentos contentivos de los datos con el objeto de detectar los espacios en blanco u omisiones.2 ¿Qué se entiende por Observación. Clase y Frecuencia? 23 . En ese sentido.1 Necesidad de organizar los datos Para poder realizar un análisis lógico de los datos obtenidos en una investigación y contenidos en una serie de instrumentos. CONTENIDO: TEMA 1 2. 5) Usar paquetes computacionales (Excel. es decir. expresar (resumidamente) y agrupar en una hoja los datos tal como aparecen descritos en el respectivo instrumento a ser asociado a dicha hoja. otros) para la elaboración de tablas de datos simples y agrupados. 2.UNIDAD II: ORGANIZACIÓN DE LOS DATOS OBJETIVO: Organizar datos estadísticos en una distribución de frecuencias. conceptual y sectorizada del volumen de información a ser expuesta en forma manejable para su procesamiento estadístico con las técnicas a ser estudiadas en la presente Guía Didáctica. de entre estos últimos. 4) Elaborar una presentación organizada para distribuciones de frecuencias. COMPETENCIAS A LOGRAR: 1) Explicar la necesidad de organizar los datos.10.4 del Unidad I. clasificarlos en base a determinados criterios. erróneas o ilógicas. Stargrafic. corresponde seleccionar. y recordando el paso 4 de la Sección 1. los que están asociados a la variable en cuestión. 1) Así obtenemos una mejor percepción visual. 3) La Clasificación: Se determina cada variable evaluada en los instrumentos. 2) Manejar la clasificación de distribuciones de datos y frecuencias 3) Construir distribuciones de frecuencias para datos simples y agrupados. corrigiéndolas cuando sea posible. y de todas las hojas antes usadas para registrar los datos se escogen.

cada dato u observación se asocia a una y sólo una de las k clases dadas.3 Distribuciones de Datos y Frecuencias Una Distribución de Datos en un conjunto de datos obtenidos de una serie de observaciones. cada dato está asociado a una sola observación.Una Observación (o Unidad Estadística) es un dato asumido por una variable cuando esta es cualitativa. Este procedimiento se ejecuta para todas las observaciones previa aplicación de algún criterio que permita ordenarlas. Necesariamente deben aplicarse técnicas de conteo con el fin de identificar y cuantificar las observaciones de manera cuidadosa para evitar errores. un dato es un valor numérico repetido por las observaciones. En el segundo caso. Si cada observación aparece repetida una sola vez. O sea. Si la variable es cualitativa. y dispuestos de manera separada y consecutiva. cada observación es un dato y cada categoría asumida por la variable viene siendo una clase. es decir. Una Distribución de Frecuencias es un agrupamiento de datos en grupos mutuamente excluyentes. Una Clase es un grupo determinado de datos u observaciones estudiados. y la frecuencia de una clase es la suma de las frecuencias de los datos que la conforman. cuya frecuencia en todo caso viene dada por la cantidad o porcentaje de datos que caen en esa categoría. dando el número o porcentaje de observaciones a cada grupo. el número N de observaciones de todos los datos es mayor o igual al número n de datos obtenidos (N ≥ n). los cuales se pueden ubicar en k grupos. En el primer caso. y ordenados según la escala o nivel de medición empleada al efecto. entonces la cantidad de datos resulta igual a la cantidad de observaciones (N = n). Si la variable es cuantitativa. en la cual se van tachando a medida que se van encontrando. y se distribuyen de forma que un mismo dato u observación no tenga ubicación simultánea en clases diferentes. no hay Distribución de Frecuencias sin Distribución de Datos. o es una repetición de un dato propio de una población o muestra cuando la variable es cuantitativa. la cantidad N de observaciones es igual a la cantidad n de datos (N = n) pues cada observación es un dato en sí misma. y aquella tendrá su respectiva denominación de acuerdo al tipo de frecuencia a 24 . pudiéndose colocar estos en orden de magnitud de ser así posible (de acuerdo a la escala o nivel de medición a usarse). 2. ya sea en forma unitaria o grupal conforme a las categorías o valores de una variable. Es decir. La más sencilla es escoger una observación de una serie dada y en una hoja se le colocan al lado tantas rayitas como repeticiones se encuentren en la serie. Se entiende por Frecuencia a la cantidad o porcentaje de observaciones asociadas a un dato o a una clase. cada dato está asociado a una serie de observaciones que lo repiten. y la cantidad de estas es la frecuencia del dato.

cada uno de los n datos es tomado de manera unitaria y por separado. resumir o hacer más fácilmente manejable la información. Luego tenemos las correspondientes expresiones que simbolizan lo antes dicho: Datos Simples N = ∑f j j =1 n Datos Agrupados N = ∑F j j =1 k 2. Cuando a estas clases les asociamos sus respectivas frecuencias.1 Frecuencia Absoluta (f o F) Es la cantidad f de veces que se repite cada uno de los n datos dentro de una colección de estos.2 Frecuencia Absoluta Acumulada (fa o Fa) Es la suma de las frecuencias absolutas comprendidas hasta un determinado dato (fa) o hasta cierta clase (Fa). los datos se agrupan en k clases o grupos con el fin de sintetizar. o el número de observaciones F asociadas a cada una de las k clases.definirse en la Sección 2.5. A veces a la Frecuencia Absoluta se le denomina Frecuencia Absoluta Simple.5 Tipos de Frecuencia 2. condensar. Por ejemplo.5. Por otra parte. respectivamente) da el número N de todas las observaciones.4 Tipos de Distribuciones de Datos y Frecuencias 2. se puede hablar de una Distribución de Frecuencias Relativas. 2.2 Distribución de Datos Agrupados A partir de una Distribución de Datos Simples o no Agrupados previamente elaborada.1 Distribución de Datos Simples o no Agrupados Así se le denomina cuando a los datos no se les han aplicado algún tratamiento de agrupación.4. toda serie de N observaciones se puede representar como una distribución de n datos simples y viceversa. 2. 2.5. estamos ante una Distribución de Frecuencias para Datos Agrupados. y de uno se construye el otro. estamos ante una Distribución de Frecuencias para Datos Simples o no Agrupados. 25 . es decir.4. La suma de n o k frecuencias (para datos simples o agrupados. por lo que uno es equivalente al otro. Cuando a estos datos les asociamos sus respectivas frecuencias.

Datos Simples faj = f1 + f2+…+fj, j = 1,…, n 2.5.3 Frecuencia Relativa (h o H)

Datos Agrupados Faj = F1 + F2+…+Fj, j = 1,…, k

Se define como el porcentaje que resulta de dividir cada frecuencia absoluta sobre la sumatoria de todas las frecuencias absolutas de n datos o k clases, y luego multiplicar ese cociente por 100%, obteniéndose h o H respectivamente. A veces a la Frecuencia Relativa se le denomina Frecuencia Relativa Simple. Datos Simples
hj = fj N ×100%, j = 1,2,..., n

Datos Agrupados
Hj = Fj N ×100%, j = 1,2,..., k

2.5.4 Frecuencia Relativa Acumulada (ha o Ha) Es la suma de las frecuencias relativas comprendidas hasta un determinado dato (ha) o una cierta clase (Ha). Datos Simples haj = h1 + h2+…+hj, j = 1,…, n Datos Agrupados Haj = H1 + H2+…+Hj, j = 1,…, k

TEMA 2
2.6 Construcción de Distribuciones de Frecuencias para Datos Simples y Agrupados Si la variable X es cualitativa, hallaremos las frecuencias absolutas y relativas de cada una de las k modalidades de la variable. Aquí cada clase se expresa como una modalidad representada de acuerdo a la Escala de Medición Nominal u Ordinal de la variable. Si la escala no es ordinal, no tiene sentido calcular las frecuencias absolutas acumuladas y las frecuencias relativas acumuladas. Modalida d F H Fa Ha de Clase c1 F1 H1 Fa1 Ha1 c2 F2 H2 Fa2 Ha2 c3 F3 H3 Fa3 Ha3 . . . . . . . . . . . . . . . ck Fk Hk = 100% Fak Hak = 100% N N

26

Ejemplo: Un estudio hecho en un conjunto de 25 varones con objeto de determinar su grupo sanguíneo ha conducido a los siguientes resultados: A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O, B La variable que indica el tipo sanguíneo es cualitativa, y no hay jerarquía entre los atributos o modalidades. Luego obtenemos la siguiente Distribución de Frecuencias. Tipo de sangre A B O AB F H

11 44% 7 28% 6 24% 1 4% N = 25 100%

Si la variable X es cuantitativa (discreta o continua), hallaremos las frecuencias de cada uno de los valores o datos de la variable si son pocos, y se hará de manera similar a como se expuso anteriormente. Ejemplo: Observemos la siguiente tabla en la que se expresan las calificaciones obtenidas en un ejercicio evaluado en escala de 1 a 10 puntos. Tenemos una distribución de frecuencias asociadas a una variable cuantitativa. Calificaciones 1 2 3 4 5 6 7 8 9 10 f 1 2 1 2 3 4 3 1 2 1 N = 20 h 5% 10% 5% 10% 15% 20% 15% 5% 10% 5% 100% fa ha 1 5% 3 15% 4 20% 6 30% 9 45% 13 65% 16 80% 17 85% 19 95% 20 100%

2.7) Pasos necesarios en la construcción de una Distribución de Frecuencias para Datos Agrupados En caso de asumir la variable cuantitativa X una cantidad relativamente numerosa de valores, los agrupamos en clases y hallamos sus frecuencias. Aquí la clase se representa por un número, y a esta se halla asociado un intervalo de la recta real llamado Intervalo de Clase, y una Marca de Clase Xm o valor que representa ese intervalo, tal como veremos a continuación.

27

Nº de Clase 1 2 3 . . . k

Intervalo de Clase [Li1, Ls1] [Li2, Ls2] [Li3, Ls3] . . . [Lik, Lsk]

Xm Xm1 Xm2 Xm3 . . . Xmk

F F1 F2 F3 . . . FK N

Fa Fa1 Fa2 Fa3 . . . FaK = N

H H1 H2 H3 . . . HK 100%

Ha Ha1 Ha2 Ha3 . . . HaK = 100%

Ejemplo: Una cooperativa de producción fundada hace algunos años se dedicó a vender productos agrícolas que producía. Como consecuencia del paro petrolero y de escasez de alimentos enlatados en las comunidades a las que servía la cooperativa, se propuso negociar productos enlatados a fin de aumentar la oferta de productos y de esta manera ampliar sus servicios a la comunidad. Dada la gran variedad de productos así como de sus precios, la cooperativa necesita desarrollar una investigación estadística de productos y precios que ofrecían a fin de encontrar las variaciones en los precios y las tendencias de preferencia de la comunidad. A continuación presentamos una serie de datos de los precios de los nuevos productos ofrecidos por la cooperativa. 1.560 1.630 1.220 3.550 1.630 2.735
1)

1.870 3.240 1.630 3.030 3.240 2.330

1.890 2.330 2.010 2.750 1.893 3.240

2.330 2.550 1.150 2.330 2.111 2.567

3.030 2.010 3.020 2.110 1.630 2.789

1.990 3.030 1.893 1.630 2.010 1.234

Definimos la variable X, determinamos el número N de observaciones, y se ordena la serie de datos de menor a mayor (por filas o columnas)

Sea X la variable que indica el precio de cada producto enlatado vendido por la cooperativa. Vemos que X es cuantitativa y discreta. Hay N = 36 observaciones que ordenaremos por columnas en forma creciente. Para hacer esto, de cada una de las m columnas (filas) de la agrupación anterior se selecciona la menor de las observaciones, y de allí se escoge la menor de las m cantidades así obtenidas por columna. Luego, en una nueva columna (fila) a escribirse en otra agrupación posterior, se expresan las repeticiones de ese valor a la vez que se tachan en la agrupación anterior, y en ésta se aplica el procedimiento de nuevo sin tomar en cuenta los valores ya tachados.

28

330 x22 = 2.234 x4 = 1.630 x8 = 1.330 x24 = 2. No sería posible obtener la tabla que veremos a continuación sin la tabla anterior donde las observaciones están ordenadas en forma creciente.240 3.111 y el resto un precio mayor. 2.110 x19 = 2.240 x35 = 3.990 x15 = 2.893 1.220 x3 = 1.735 X17 = 2.220 X3 = 1..240 3.330 2.630 1.630 1.240 x34 = 3.550 f 1 3 3 1 Dada la variable X.030 x31 = 3.020 3. pues de una se puede extraer la otra.550 Interpretación: Al observar los precios ordenados podemos decir que hay 18 productos con precios por debajo de Bs.630 X6 = 1.789 3. La cantidad de observaciones realizadas es de 36 precios correspondientes a 36 productos enlatados diferentes.330 X14 = 2.990 X10 = 2. j = 1.030 X21 = 3. j = 1.630 x6 = 1. donde el número de datos es n = 22. las observaciones se denotan con el símbolo xi.110 2. n.890 X8 = 1.010 2.030 3.567 x26 = 2.630 1.….893 x14 = 1.630 x10 = 1.150 X2 = 1. 2.240 x36 = 3.010 X11 = 2.890 1.234 1.550 X15 = 2..111 2.030 3.893 x13 = 1..030 3.234 X4 = 1. Esa tabla es un ejemplo de una Distribución de Frecuencias Absolutas para Datos Simples.010 x18 = 2.560 x5 = 1.330 2.330 x23 = 2. x1 = 1.567 2.240 3.. Ambas tablas son equivalentes.030 x33 = 3.789 x29 = 3.010 2.. N. 2) Determinamos la cantidad de datos n y la correspondiente Distribución de Frecuencias para Datos Simples.735 x27 = 2.550 De aquí obtenemos la siguiente tabla.560 X5 = 1.150 1.630 1.010 x16 = 2.890 x12 = 1.560 1.750 x28 = 2.870 f 1 1 1 1 5 1 X X7 = 1.550 x25 = 2.630 1.240 X22 = 3.870 x11 = 1.870 1.020 x30 = 3.330 x21 = 2. 2.630 x9 = 1. X X1 = 1.111 x20 = 2. donde a cada dato Xj se le asocia su correspondiente frecuencia absoluta fj.150 x2 = 1.030 x32 = 3.330 2.630 x7 = 1.020 X20 = 3.. Dada la variable X. en la Distribución de Frecuencias Absolutas para Datos Simples cada uno de estos es tomado aisladamente del resto al representarlo con el símbolo Xj. donde j asumirá el valor de la posición de cada observación.750 X18 = 2. 3.010 x17 = 2. donde j asumirá el valor de la posición de cada dato y X = Xj (j = 1..010 2.735 2. n).330 2..750 2.990 2. 29 .567 X16 = 2.550 2.220 1.111 f 1 2 1 3 1 1 X X13 = 2.893 1.893 X9 = 1.1.110 X12 = 2.789 f 4 1 1 1 1 1 X X19 = 3.

350 A = 3. 30 . 3. El valor encontrado para k será el número de clases para la agrupación. Un procedimiento útil para este fin es la Regla de 2 a la k. Xmás pequeño = Bs.630 está asociado a las observaciones x5.150. Existen muchas maneras de definir la cantidad de clases a considerar. Ahora asumimos el valor de k = 6. Se recomienda que el número de clases este entre 5 y 25 (5 ≤ k ≤ 25). Tomamos el menor valor entero para k de tal manera que 2k sea mayor o igual a N (numero de observaciones consideradas). Rango o Recorrido de la distribución de datos considerada Para esto primero determinamos el valor mayor Xmás grande y el valor menor Xmás pequeño de la Distribución de Datos Simples. 1.630.2. tenemos que Xmás grande = Xn y Xmás pequeño = X1. x8 y x9.630. que se repite con una frecuencia f5 = 5. Siempre el valor de 2k tiene que ser mayor o igual que N (o sea. Luego calculamos la Amplitud. N ≤ 2k). Asumimos (por tanteo) un valor de k = 5.En el presente caso. entonces en este caso se usarán 6 clases. el valor de k = 5 no es útil. 4) Calculo el número k de clases Necesitamos determinar la cantidad de clases o grupos en que debemos separar a los distintos datos de la distribución. 3) Calculamos la Amplitud. y como 32 es menor que N = 36. La idea es hacer más fácil el manejo de la información vinculada a numerosas observaciones o datos. x7. las cuales asumen cada una el valor 1.200 Interpretación: La variación de precios entre el mayor y el menor es de Bs. Como en esta distribución los datos están ordenados del menor al mayor valor. Interpretación: Hay 5 productos enlatados que tienen un precio de Bs. Rango o Recorrido mediante la siguiente formula: A = Xmás grande – Xmás pequeño = Xn – X1. el dato X5 = 1.150. 1. Entonces 25 = 32. Xmás grande = Bs. Ahora usamos esta regla para hallar el número de clases del ejercicio considerado.200. x6. y como ahora 64 es mayor que N = 36. A = 2.350 – 1. calculamos 26 = 64.

5) Cálculo de la distancia entre los límites consecutivos de los Intervalos de Clase (DC) y su correspondiente longitud (Ic) Un Intervalo de Clase se define como aquel sector de la recta real que contiene una clase o conjunto de datos que se encuentra ubicado entre dos extremos o límites establecidos. aunque pueden abarcar una distancia mayor. Lsj] se representa como Lij – Lsj tal como aparece en algunos libros de Estadística. DC = Li2 – Li1 = Ls2 – Ls1. En la presente Guía Didáctica no estudiaremos los procedimientos para obtenerlos. Ls2] estarán separados de esa manera pues se debe cumplir que Li2 – Ls1 = 1.…. para las clases 1 y 2 los respectivos intervalos [Li1. a veces cada intervalo [Lij. y estará separado de los intervalos adyacentes a una distancia de una unidad de longitud para cada uno. Siguiendo el ejemplo dado. no decimal. La sucesión de estos intervalos deben abarcar por lo menos la distancia desde el menor valor Xmás pequeño hasta el valor mayor Xmás grande. Aquí cada intervalo se tomará cerrado en sus extremos. Para hallar esa distancia podemos utilizar la siguiente formula: Dc = A + 1 ( X másgrande − X máspequeño ) + 1 = k k Si el resultado dado por esta fórmula da un número decimal. Sea DC la distancia existen entre los límites inferiores o superiores consecutivos para dos intervalos de clases. Por ejemplo. Ls1] y [Li2. 31 . este se redondea por exceso y se escoge como el valor buscado para DC. k. Tratar esa cantidad de clases es un trabajo más práctico que usar 22 datos o 36 observaciones. Se selecciona así para garantizar que los intervalos de clase puedan contener a todos los datos.Interpretación: Los datos los agruparemos en 6 clases o grupos para poder obtener la mayor información posible de la distribución considerada. pudiéndose consultar en otros textos de Estadística. Hay casos en que los intervalos de clase se pueden tomar abiertos o semiabiertos en sus límites. En tal caso no se está representando una resta ni un intervalo que no sea cerrado en sus extremos. Con respecto a la clase j = 1. El tamaño de cada intervalo debe ser el mismo para todas las clases. el intervalo de clase que la contiene posee como extremos un límite inferior Lij y un límite superior Lsj. y el valor de esa distancia debe ser un número entero. Por razones de orden práctico.

k.…. sumamos al Li1 el valor DC y tendremos Li2 = Li1 + DC = 1.2) Cálculo de los límites superiores Ls Para calcular el limite superior Ls1 de la clase 1.883. 3. A = 2.150.516. Luego.516 + 367 = 1. La diferencia entre los valores extremos consecutivos de cada clase es Bs. por lo que Ic = Lsj – Lij. y así Ls1 = Li2 – 1 = 1. j = 1.3)Tabulación de los Intervalos de Clase Ahora determinamos los intervalos de clases que usaremos. Nº de Intervalo 32 . 6. 1. Interpretación: Determinamos que el precio menor de la distribución es Bs.150 y el mayor Bs. Para calcular el límite inferior Li2 de la clase j = 2.350.516. Recordemos que su tamaño o longitud es Ic = Lsj – Lij = Dc – 1. En base a los cálculos anteriores. 6. j = 1. el cual es igual para todos los intervalos de clase. Lsj]. para calcular Ls2 le sumamos DC a Ls1 y tendremos Ls2 = Ls1 + DC = 1. Expondremos esta información por medio de una tabla. Entonces Li2 = 1. y así sucesivamente hasta completar los 6 límites superiores de los correspondientes intervalos de clases.883.….150 como límite inferior de la clase j = 1. pues todos los intervalos tienen igual tamaño. por lo cual tenemos que Dc = 367 e Ic = 366. y así sucesivamente hasta completar los 6 límites inferiores de los correspondientes intervalos de clases. 6) Determinamos los Intervalos de Clases 6.220 + 1 = 366.200. 367. k. Lsj].350. tenemos que Xmás pequeño = 1.Sea Ic la longitud que tiene cualquier intervalo de clase [Lij. a Li2 le restamos la unidad. Entonces Ls2 = 1.83 6 A este resultado lo aproximamos al entero inmediatamente superior.517 – 1 = 1.517.517.1) Cálculo de los límites inferiores Li Tomamos Li1 = Xmás pequeño = 1. Xmás grande = 3. k = 6 Aplicamos la formula: Dc = 2. Ls1 = 1.150 + 367 = 1. A la clase j le corresponde el intervalo [Lij. Es fácil deducir que Ic = Dc – 1.

618.…. 1.353] Xm 1.333 2 2 De igual manera determinamos el resto de las marcas de clase.250] [2. asociándolas a sus correspondientes clases. 2. 1.883. y la variación entre estos dos límites o extremos es de Bs.150.883] [1.516] [1.985. Xm1 = Li1 + Ls1 1. 2.517.985.Clase 1 2 3 4 5 6 de Clase [1.884. 2.150 + 1. 366.517 y menores o iguales a Bs. 1. a la tabla anterior le anexamos una columna contentiva de dichas cantidades. j = 1.150 y Bs.065 2.516. 1.617] [2. Luego. 1. 2. 1. Se calcula a partir de la semisuma de sus límites.801 3.984] [2.251.164 Interpretación: El primer grupo de precios está definido entre Bs. 2.516] [1.333 .770 2.333.333 1.517. Xm1 = 1. 1.883] [1.353] Interpretación: La clase o grupo 2 consta de todos los precios registrados de enlatados mayores o iguales a Bs. Xm j = Li j + Ls j 2 . 7) Calculamos la Marca de Clase La Marca de Clase es el punto medio del respectivo intervalo de clase al cual pertenece. 3.984] [2. y el precio promedio de estos valores extremos es de Bs.251.618. 1.516 = = 1.884.250] [2.150. 1. 3. k Calculamos el valor medio Xm1 de la clase j = 1. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.617] [2.434 2. 2. 8) Calculamos la Frecuencia Absoluta de cada clase 33 .

tenemos que Faj es la cantidad de observaciones contenidas entre el correspondiente intervalo de clase más las de los anteriores siguiendo el orden. 9) Calcularemos la Frecuencia Absoluta Acumulada (Fa) Para la clase j = 1.150.617] [2.353] Xm 1.516] [1. 2. 2.770 2.618. 1.884.333 1.065 2. Faj = F1 + F2 +…+ Fj. Las frecuencias absolutas acumuladas aquí obtenidas se ubican en la tabla anterior por orden de clase en una columna anexa a la de la frecuencia absoluta.516] [1.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 34 .883] hay 7 observaciones.984] [2. Es decir. en el intervalo [1. 2. k. 2.…. 1. 1.251.434 2. 2. y los datos X4 = 1.883] [1.617] [2. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.….517. 2. Para la clase j = 3 tenemos que Fa3 = F1 + F2 + F3 = 3 + 7 + 9 =19.517.250] [2.353] Xm 1.250] [2. X5 = 1.517 y menores o iguales a 1. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.770 2. Luego tenemos que F2 = f4 + f5 + f6 = 7. Para el caso de la clase j = 2.434 2.251.517. 1. k es la suma de las frecuencias de los datos pertenecientes a esa clase.870 conforman la clase 2.De la distribución de frecuencias para datos simples.801 3.985.984] [2.883].883] [1.560. 1. el respectivo intervalo de clase es [1.630 y X6 = 1. 1.333 1.618.883.985. la frecuencia absoluta Fj de la clase j = 1.884.801 3. es decir.150.517. 3. 3. Las frecuencias así obtenidas las anexamos a la tabla en una columna adjunta a la de las marcas de clase.164 F 3 7 9 6 3 8 N = 36 Interpretación: Los precios de 7 productos enlatados son mayores o iguales a Bs.065 2. 1.

33% 22.617] [2. tenemos que H2 = F2 × 100% N Nº de Clase 1 2 3 4 5 6 = 7 × 100% 36 = 19.44% De igual manera se calcula la frecuencia relativa de cada una de las clases restantes.516] [1.250.99% 35 .22% 99.985.250] [2.884. 1.801 3.984] [2.67% 8.618. 1. 2. Intervalo de Clase [1.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 H 8.353] Xm 1.353] Xm 1.617] [2.883] [1.883] [1.Interpretación: Los precios de 19 productos enlatados son menores o iguales a Bs. 3. 1.985. 1.065 2.884.065 2.517.333 1. 2. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.164 ← ← → F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 → Fa 36 33 26 17 11 8 ← Para la clase j = 3 tenemos que Fa 3 = F3 + F4 + F5 + F6 = 9 + 6 + 3 + 8 = 26.150. En algunos textos la Frecuencia Absoluta Acumulada Faj aquí referida para la clase j viene siendo la Frecuencia Absoluta Acumulada hacia Arriba Fa j .00% 16. 2. 2.251.801 3. 2.33% 19.770 2. 10) Calculamos la Frecuencia Relativa (H) Aplicando la fórmula respectiva para la clase j = 2.333 1.434 2.44% 25. mientras que la Frecuencia Absoluta Acumulada hacia Abajo es Fa j = Fj + Fj+1 + …+ Fk-1 + Fk.984] [2.770 2.618.251.150.434 2. 1.517. 3. 2. 2.250] [2.884. Interpretación: Los precios de 26 productos enlatados son mayores o iguales a Bs.516] [1.

2. La frecuencia acumulada Ha4 = 25 de la cuarta clase.434 2. 1.250] [2. 2. o incluso de milésimas.33% 22.00% 16.67% 8. aunque a veces por errores de cálculo a nivel de centésimas. Para la clase j = 3 tenemos que Ha3 = H1 + H2 + H3 = 8. De aquí se deduce que necesariamente la frecuencia relativa acumulada de la clase j = k tiene que ser Hak = 100%. 36 → ← .44% de los productos enlatados tienen precios mayores o iguales a Bs.78% 99.353] Xm 1. 11) Calculamos la Frecuencia Relativa Acumulada (Ha) Para la clase j = 1. en forma análoga se puede definir Frecuencia Relativa Acumulada hacia Arriba ( Ha ) y hacia Abajo ( Ha ).985.78% 69.517.150 y Bs. 1. 1.99% Ha 8. 3. Haj = H1 + H2+…+Hj. La frecuencia relativa acumulada Ha5 = 77.619.00% de la tercera clase.619. 2.251. puede que ese valor de la última clase se ubique en el entorno de 99.33% 19.884 y Bs.44% 25. significa que el 25% de los productos referidos tienen precios que oscilan entre Bs.99% La última tabla así obtenida es la Distribución de Frecuencias para Datos Agrupados del problema tratado hasta ahora. 2.0 % = 52.801 3.44% + 25. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.884. Interpretación: La frecuencia absoluta F4 = 6 de la cuarta clase.33% + 19.984] [2.150 y Bs.78% 52. La frecuencia relativa H3 = 25.618.065 2.33% 27.516] [1.22% 99. 1.517 y menores o iguales a Bs.150.883] [1.770 2. significa que 25 productos tienen precios que oscilan entre Bs. es decir.987. 1.617] [2. significa que 6 productos enlatados tienen precios que oscilan entre Bs.78%. De igual manera calculamos las restantes frecuencias y las anexamos.78% de los productos tienen precios que oscilan entre Bs. 2.99 %. 1. Así como nos hemos referido a la Frecuencia Absoluta Acumulada hacia → ← Arriba ( Fa ) y hacia Abajo ( Fa ).883. 2.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 H 8.…. k.44% 77.333 1. significa que el 77. 2. 2. tenemos que Haj es el porcentaje de observaciones contenidas en el correspondiente intervalo de clase más los porcentajes de observaciones de las anteriores clases siguiéndolas en orden creciente.252 y Bs.Interpretación: El 19.251. 1.78% de la quinta clase.

252 y Bs. se ejecutan los pasos 8.1. para cada uno de estos se calcula la frecuencia absoluta. 2. 10 y 11 de la sección antes mencionada. 34 23 40 37 30 26 37 23 26 34 18 37 37 21 18 37 26 37 26 23 A esta serie de observaciones se le aplica los pasos 1 y 2 de la Sección 2. por lo que se pierde información y la segunda distribución mencionada es una aproximación de la primera.Del ejemplo anterior contesten las siguientes preguntas: ¿Cuántos productos enlatados tienen precios entre Bs. no hay intervalos de clase. acumulada (hacia arriba y hacia abajo).251? ¿Cuál es el precio promedio del 25% de los productos enlatados? ¿En qué precios oscilan por lo menos 28 productos enlatados? Nota 1: Al tener una Distribución de Frecuencias para Datos Simples o no Agrupados. Como los datos se toman unitariamente y no agrupados en clases. 2. Ejemplo: Las edades de los 20 integrantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta.986? ¿Cuántos productos enlatados tienen precios entre Bs.2.7 para construir una tabla donde aparezcan ordenados en forma creciente los datos con sus respectivas frecuencias absolutas. X f 18 2 21 1 23 3 26 4 30 1 34 2 37 6 40 1 Posteriormente. y relativa acumulada (hacia arriba y hacia abajo. relativa. La Distribución de Frecuencias para Datos Agrupados expresa información muy resumida y austera acerca de estos.150 y Bs. Manejarlos de cualquiera de las 37 . X 18 21 23 26 30 34 37 40 f 2 1 3 4 1 2 6 1 N = 20 fa 2 3 6 10 11 13 19 20 → fa 20 18 17 14 10 9 7 1 ← h 10% 5% 15% 20% 5% 10% 30% 5% 100% ha 10% 15% 30% 50% 55% 65% 95% 100% → ha 100% 90% 85% 70% 50% 45% 35% 5% ← Nota 2: La Distribución de Frecuencias para Datos Simples expresa información muy detallada y abundante acerca de los datos. 9.

1. 1. ¿Cómo se llaman los datos 1.500 en esta serie de datos? 38 .670. y si tal variable hace uso de una Escala de Medición Ordinal tiene sentido determinar las frecuencias absolutas acumuladas y frecuencias relativas acumuladas para cada categoría que asuma la variable en cuestión.629. 2. 3. Grupal Cooperativo  Del análisis de las evolución de enfermedades endémicas de una región del país se encontró que los casos de dengue hemorrágico en los últimos quince años varió de la siguiente forma: 1. Nota 3: Todos los pasos de la Sección 2. respectivamente.8 ACTIVIDADES Individual  Lea con cuidado los contenidos presentados en esta unidad y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.930.345. Nota 4: Dependiendo de las particularidades del problema a estudiar y de la variable usada para una distribución de frecuencias para datos agrupados.540. 1.500.495.510. 1.250.7 se han aplicado para una variable cuantitativa.250 y 3. 1. 1.510. y se distribuyeron en 6 grupos por edades. los intervalos asociados a las clases j = 1 y j = k (o sea.dos maneras es más práctico y explícito en su contenido que tenerlos desordenados y dispersos.300. En ese caso no se podrían calcular el rango ni nada referido propiamente a intervalos de clase. 2. En este caso hablamos de una Distribución Abierta. 1. 1. 1.475.890. pero algunos se pueden usar y adaptar para cualquier variable cualitativa. el primer y el último intervalo) pueden no tener definidos el límite inferior Li1 y el límite superior Lsk.590.650. 1. 1. Edades Número de (años) asistentes Menos de 29 16 30-39 25 40-49 51 50-59 80 60-69 20 Más de 70 8 2. 1. Ejemplo: En una Unidad de Barrio Adentro fueron atendidas 200 personas en un día de consulta.

calcule el valor medio de la clase. Agrúpelos ordenados de mayor a menor.2. H y Ha. En cada reunión se levanta un acta donde se deja constancia de la asistencia. 5. se aplicó una encuesta con el fin de conocer la edad de los habitantes de una comunidad y encontraron los siguientes datos: 77 26 62 58 18 50 62 51 63 34 65 71 84 44 61 38 41 60 54 58 60 52 58 45 59 53 66 54 51 83 56 62 71 36 63 63 Agrupe la serie de datos en clases. Fa. Agrupe la serie de datos en clases. 2. 39 . H y Ha. Intervalo de Clase. Revíselos. Fa. calcule el valor medio de cada clase. Comunitario  Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II) siga el siguiente tratamiento: 1. número de k clases. F. Interprete los resultados. Interprete los resultados. 4. ellos se reúnen una vez a la semana para realizar el seguimiento de los principales problemas de la comunidad y adelantar acciones a favor de su resolución. Resuelve y agrégalos a tu portafolio. F. Fa. F.  La Junta Comunal de una comunidad de los Valles del Tuy esta compuesta por quince miembros o representantes. Número de N observaciones. Interprete los resultados. numero de n datos. H y Ha. F. 5 3 1 5 7 8 11 12 4 2 14 12 13 9 6 5 15 5 3 4 6 8 9 1 8 9 5 8 9 2 3 3 3 1 10 1 2 1 11 7 4 2 12 10 9 1 14 8 2 10 6 Organice y agrupe los datos en clases. 3.  Durante un diagnóstico realizado en una comunidad de los paramos del Estado Mérida. resuelve y agrégalos a tu portafolio. Fa. Punto Medio de cada clase. H y Ha. resuelve y agrégalos a tu portafolio de aprendizaje. De análisis de las 51 reuniones convocadas el año pasado se encontraron los siguientes datos. Determine si son datos discretos o continuos. y calcule el valor medio de cada clase. Calcule los elementos de los datos agrupados.

En cualquier caso. pues en el caso de que el texto sea muy largo cansaría al lector y no le permitiría comprender totalmente lo expuesto. 3) Grafica los datos. COMPETENCIAS A LOGRAR: 1) Comprende la función de las tablas. CONTENIDO: En la práctica se realiza la representación de los datos. En gran parte el carácter de este proceso es publicitario por la forma de informar al interesado los resultados y datos obtenidos en una investigación. el 25% de los productos enlatados.558 y Bs. con el propósito de representarlos. cuadros y gráficos para presentar los datos procesados. de los cuales Bs. podrá presentar los datos usando técnicas de tabulación y graficación para extraer conclusiones descriptivas. entre otras). la tabular y la gráfica. 5) Uso de herramientas computacionales (Excel. dentro de la investigación estadística. 2. o sea. 3. 4) Interpreta las representaciones gráficas. luego de haberse agrupado y calculado los valores de frecuencia requerida.45% de los productos enlatados que vende la cooperativa. 2) Representa e interpreta datos en tablas. SPSS.253 representa el precio más alto del 69. TEMA 1 3.1 Forma Textual Es la que se realiza a través de palabras ó símbolos algebraicos. 2. En la práctica se utiliza como un complemento de la forma tabular o de la forma grafica.253 presentan una frecuencia de 9. los precios que están en el intervalo entre Bs. Ejemplo: Los enlatados que vende una cooperativa de producción presentan precios que están agrupados en varias clases. entendiéndoseles como una ordenación de datos numéricos en filas y columnas 40 .2 Forma Tabular Es aquella que se realiza a través de las tablas o cuadros estadísticos.UNIDAD III: REPRESENTACIÓN DE LOS DATOS OBJETIVO: Cuando el estudiante culmine este Unidad. 1. Esta forma es quizás la menos aconsejable. y solo debe utilizarse en los casos en que se requiera exponer resultados brevemente. las formas de presentación de los datos son la textual.

7 del Unidad II. la forma tabular contiene en sí misma todas las cantidades que conforman una Distribución de Frecuencias para Datos Simples o Agrupados. Ejemplo: Consideremos el ejemplo estudiado en la Sección 2. cuando las notas se encuentra al final del cuadro se denominan notas al pie. Columna Matriz: Abarca las designaciones de cada fila de datos y se encuentra en la parte izquierda del cuadro. ¿Dónde? (referencia geográfica). y así poder apreciar de la mejor forma las características y la cuantía del fenómeno estudiado y establecer comparaciones entre dichos datos. Notas: Aparecen en cual parte del cuadro. 2) 3) Encabezamiento: Comprende los títulos de cada columna de datos.con las especificaciones correspondientes acerca de la naturaleza de los datos (simples o agrupados). ¿Cuándo? (referencia cronológica). 4) 5) 41 . y explican algunas aclaratorias sobre los datos y casi siembre la fuente de los datos. Cuerpo: Consiste en las cifras o símbolos que se encuentran colocados en las filas y columnas del cuadro debajo del encabezamiento y a la derecha de la columna matriz. 3. Al respecto.1 Componentes del Cuadro Estadístico Las partes que componen un Cuadro Estadístico son: 1) Título: Comprende el número del cuadro (cuando el mismo forma parte de un grupo).2. el tema del cuadro y a veces una nota complementaria. contesta el titulo las preguntas: ¿Qué? (tema de los datos).

Los cuadros. Foto 2. Foto 3. gráficos.33 19.  Referencia Cronológica. Grafico 2.770 2.. Es preciso redactar con claridad y expresar concisamente los datos que se presentan en el cuadro. 3. y usando letras mayúsculas para todo el enunciado.883] [1.353] Xm 1.801 3.  Naturaleza de los datos.44 % 25. Deberá colocarse sin subrayar.884 – 2.618 – 2.065 2.00 % 16.333 1.33% 22... Por ejemplo: Cuadro 1.78 69.984] [2.2 Pasos recomendados para elaborar un Cuadro Estadístico 1) Numeración del Cuadro.. Grafico 1. fotos y figuras de un informe deben esta numerados según su tipo de presentación y en orden correlativo..44 77.. Cuadro 2.985 – 3.251 – 2. .78 52.150 – 1.250] [2.Cuadro 3 Título ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOS COOPERATIVA DE PRODUCCION DE RÍO CARIBE 2.67 % 8. Fuente: Gerencia de Ventas de la Cooperativa de Producción de Río Caribe.164 F 3 7 9 6 3 8 Fa 3 10 19 25 28 36 H (%) 8. Figura 1.…...2. Foto 1.99 Nota: Representan los productos enlatados ofrecidos por la Cooperativa en Marzo de 2.617] [2.516] [1.517 – 1.003..33 Cuerpo 1 2 3 4 5 6 27.78 99. el orden del enunciado será el siguiente: 2)  Referencia Geográfica.434 2.003 Encabezamiento 42 (Bolívares) Nº de Clase Columna Matriz Intervalo de Clase [1.. Título propiamente dicho.. centrado en la parte superior del cuadro.22 % Ha (%) 8. Figura 2. En general.

Las notas preferiblemente se colocarán al pie del cuadro. 1. 43 .959. El arreglo puede hacerse de la siguiente manera: 4)  Cuando se trate de datos cualitativos. 1.958. Columna matriz o principal. Así mismo se dispondrán en un orden lógico de izquierda a derecha. y las designaciones que comprenden deberán escribirse en lo posible horizontalmente.  Cuando su función sea analizar una tendencia de un fenómeno se ordenarán en forma ascendente ejemplo: 1.  En lo que refiere a meses del año o los días de semana se comenzarán con enero y lunes respectivamente. 6) 3. Debe disponerse en la parte superior del cuadro.957. Todo cuadro deberá en lo posible hacerse en tamaño carta.2. Estas deberán colocarse entre paréntesis y utilizando mayúsculas únicamente al iniciar la palabra. y debe planearse de tal manera que no sea ni muy largo y angosto. 2) Facilita la observación de la relación existente entre los diversos datos presentados en un mismo cuadro o entre cuadros diferentes. Ejemplo: Cuadro 3 ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOS COOPERATIVA DE PRODUCCION DE RIO CARIBE 2. Presentación de notas y fuentes. éstos deberán ordenarse alfabéticamente. Cuando se trate de la fuente de los datos.954.956.3 Ventajas de la presentación tabular 1) Se sigue un orden o plan de acuerdo a la finalidad de la investigación.956. esta deberá presentarse citando al autor y el año de la publicación. ni muy ancho ni corto. pero si se trata de la importancia de los últimos años se ordenarán los años de manera descendente ejemplo: 1. Detalles de clasificación o unidades.003 (Bolívares) 3) Encabezamiento.955. 1. 1. 1. 5) Tamaño del cuadro. debiendo ser claras y concisas.

TEMA 2 3. La excelencia del gráfico consiste en la comunicación de ideas complejas con claridad. Tenemos los Histogramas (de Frecuencia y de Frecuencia relativa). pero los gráficos también le dan coherencia a grandes conjuntos de datos. los 44 . evitando la distorsión en el mensaje de los datos. El volumen de información que aportan no es tan extenso como la que se entrega en una tabla de varias columnas a leerse por separado. es preciso presentar dicha información mediante algún tipo de gráfico estadístico que facilita la visualización y descripción del comportamiento de las variables y sus particularidades más notables. altura de los brotes. Suministrar información de manera gráfica es un verdadero arte funcional que no sólo sirve para presentar los datos sino también para expresar ideas que se desean destacar. enfermedades.). tipología de las viviendas. Por esta razón. del lugar de exposición y de otros factores a analizar para escoger el diseño que facilite la mejor y más adecuada comunicación posible. En base a los planteamientos anteriores. 4) Facilita el resumen de los principales resultados obtenidos. presentándolos en un espacio más reducido y revelando diversos detalles comparables de los mismos a nivel general y específico. notas finales de los alumnos del primer año.  Gráficos Cartesianos: Son los que se basan en un sistema de coordenada cartesianas conformados por el Eje X (horizontal) y el Eje Y (vertical). etc. edad y genero de los habitantes de una comunidad.3) Favorece el descubrimiento de irregularidades en los datos por omisiones o errores de indagación o clasificación. eficiencia y precisión. quien haga uso de esta necesita a menudo una visión rápida del comportamiento de las variables (ventas. quien presente un gráfico aporta su imaginación y temperamento para comunicar un mensaje a ser asimilado para quien vaya destinado.3 Forma Gráfica Una vez que la información estadística está expuesta en forma tabular. La forma de presentar cualquier idea a través de gráficos dependerá del nivel del destinatario. Los gráficos se clasifican en dos grupos. La utilidad de los gráficos estriba en la ideal global que dan sobre la situación investigada. se definen los gráficos como representaciones visuales de la información procesada estadísticamente y que permiten generar apreciaciones que también son visuales y estadísticas. Por tanto.

Descripción del gráfico. el 45 . Una regla práctica segura es evitar más de 3 gráficos en un mismo espacio. 3. Región de datos y símbolos. Título Secundario o Subtítulo. es preciso aplicar las siguientes reglas:  En el eje donde se ubiquen las frecuencias. Las presentaciones detalladas se deben reservar para las tablas. el cero siempre debe colocarse explícitamente.  Gráficos Simbólicos: Son los que hacen uso de mapas geográficos. Deben evitarse elementos superfluos que lo recarguen exageradamente.  No se debe tratar de abarcar demasiada información en un solo gráfico. Pictógrafos o Diagramas Pictóricos. Cuando las variables se inician con valores muy altos. El contenido de un gráfico deberá ser tan completo como sea posible. Es mejor hacer varios gráficos en distintos espacios que comprimir toda la información en uno solo. además de representar eficientemente las distribuciones de datos y de frecuencias. los Diagramas de Barra y los Diagramas a Doble Columna. y los Diagramas o Gráficos Circulares (o Sectoriales o de Pastel). de Frecuencia Relativa. Los elementos de estos gráficos deben ser consistentes con los de otros gráficos anteriormente usados. los Polígonos (de Frecuencia. Para ambos tipos de gráficos antes definidos son válidos los siguientes principios generales:  Los gráficos se han de explicar enteramente por sí mismos. Los elementos componentes de todo gráfico son: 1) 2) 3) 4) 5) 6) 7) Título Principal. los Pictogramas.  Los gráficos tienen que dar una visión general y no una imagen detallada de un conjunto de datos.  Los elementos del gráfico deben ser claramente distinguibles y visualmente prominentes.  En caso de agregarse notas. Descriptores o indicadores de señales y marcas.Gráficos de Línea o Diagramas Lineales. Los más usados vienen siendo los Cartogramas. Región a ser ocupada por el gráfico. y en ese caso deben ser visualmente discernibles.1 Gráficos Cartesianos Para cada uno de los gráficos que describiremos a continuación. Acumulativos u Ojivas.3. Notas. dibujos y figuras geométricas. estas deben estar fuera del área del gráfico. y de Frecuencia Relativa Acumulada u Ojivas Porcentuales).

      eje donde se coloquen estos se puede comenzar el mismo valor por donde inicia la variable o por un valor cercano. Los ejes. estos deben indicarse con notas al pie. Las unidades de medición de las variables deben destacarse claramente. y de ser necesario se dibujan líneas de fondo para facilitar la lectura de los valores. títulos. Debe mencionarse la fuente de información. La curva debe trazarse más gruesa que las coordenadas para que resalte. Los intervalos de clase se dibujan consecutivamente de igual tamaño y sin separación (juntos). Si en cualquiera de los ejes se hace necesario interrumpir la escala de los números. 46 . Una de las maneras más fáciles de engañar al lector es hacer. y los números que indican valores de la misma característica se han de dar con el mismo número de decimales. Otra manera de crear percepciones gráficas equivocadas es empezar sin indicación previa y explícita en cualquier otro valor distinto de cero en el eje donde aparezcan las frecuencias. Si estas reglas no se aplican adecuadamente. letreros y notas deben ser claros. El Histograma proporciona una presentación visual fácil de interpretar de la Distribución de Frecuencias ya mencionada. teniendo cada uno en el Eje X como base un intervalo de clase y en el Eje Y como altura la respectiva Frecuencia Absoluta (Histograma de Frecuencia o Histograma propiamente dicho) o la Frecuencia Relativa (Histograma de Frecuencia Relativa). Todos los puntos de un intervalo de clase tienen una misma altura dada por la respectiva frecuencia en el Eje Y. y el área de cada uno es proporcional a la frecuencia a la cual está asociada. y colocarse horizontal o verticalmente de acuerdo al eje. el rango muy pequeño en términos de las proporciones de las unidades de medición que se usan para estos ejes coordenados. por lo que los rectángulos son adyacentes. esto debe hacerse en forma clara con una línea en zigzag. componiéndose aquel gráfico por una sucesión de rectángulos o barras. se incurre en un mal uso de los gráficos. y en general debe evitarse el recargamiento del gráfico. 1) Histograma: Es la reproducción gráfica de una Distribución de Frecuencias para Datos Agrupados en un sistema de coordenadas cartesianas. Si es necesario mencionar puntos particulares de la curva. en el eje donde se ubiquen las frecuencias. La longitud de los ejes y la equivalencia entre las unidades de medición deben seleccionarse de modo que la gráfica resulte balanceada a lo largo y ancho.

en un sistema de coordenadas cartesianas se ubican los datos en el Eje X y se colocan las Frecuencias Absolutas en el Eje Y. Después de dibujarse los pares ordenados. Además.885 – 2. 2. 2.517 1.885 y Bs.7 del Unidad II.150 – 1.987 2. con segmentos de línea recta estos se unen en forma consecutiva siguiendo las abscisas en orden creciente.252 están localizados los precios del grupo más numeroso de enlatados. 2) Gráfico de Línea o Diagrama Lineal: Partiendo de una Distribución de Frecuencias para Datos Agrupados de una variable cuantitativa discreta.884 1.253 – 2.252 2. 47 .620 2.353. Ejemplo: Veamos este gráfico sobre la vacunación de niños. CANTIDAD DE ENLATADOS POR VARIACIÓN DE PRECIOS 9 8 7 6 5 4 3 2 1 0 CANTIDAD DE ENLATADO S 1.068 el precio promedio de los límites de precios de ese grupo. Luego se definen pares ordenados donde la abscisa (componente horizontal) es un dato y la ordenada (componente vertical) del par en cuestión es la respectiva frecuencia absoluta de ese dato discreto.518 – 1.353 PRECIO S Interpretación: Entre Bs. 2.621 – 2. siendo Bs.Ejemplo: El siguiente Histograma de Frecuencia proviene de la Distribución de Datos Agrupados del problema tratado en el problema de la Sección 2. 3.988 – 3.988 y Bs. existe otro grupo importante de productos cuyos precios están ubicados entre Bs. 1.

La curva obtenida se denomina Ojiva. el par ubicado sobre el primer intervalo de clase se une con un segmento al límite inferior Li1 en el Eje X. aquellos en los que la secuencia de sus segmentos no encierra área alguna por sí misma a menos que la pueda encerrar con el Eje X.3) 48 . 3. La primera ojiva es creciente y la otra es decreciente. Así obtenemos un área cerrada por el polígono y el eje nombrado. Es pertinente referirnos a la Ojiva hacia Arriba (u ojiva propiamente dicha) y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la Frecuencia Absoluta Acumulada hacia → ← Arriba ( Fa ) y hacia Abajo ( Fa ). y lo mismo se hace entre el par que se encuentra sobre el último intervalo de clase y su límite superior Lik en dicho eje.7.2) 3. pero en el Eje Y usaremos los valores de la Frecuencia Absoluta Acumulada. Por otra parte. es decir. y ambas se pueden dibujar simultáneamente. Generalmente. pero en el Eje Y usaremos los valores de la Frecuencia Relativa. el Polígono de Frecuencia se puede dibujar en el mismo sistema de coordenadas donde aparece el correspondiente Histograma de Frecuencia.1) 3. La escala en el Eje X corresponde a las marcas de clase y la escala en el Eje Y corresponde a la Frecuencia Absoluta. nos interesan los polígonos abiertos. Polígono de Frecuencia Relativa: Es semejante a los polígonos anteriores.3) Polígono: Es una sucesión de diferentes segmentos consecutivos que comparten de a dos un mismo extremo común. teniéndose dos gráficos a la vez. pues cada par ordenado que conecta a dos segmentos lineales tiene como abscisa a una marca de clase de un intervalo de clase sobre el cual están los segmentos referidos. Polígono de Frecuencia Absoluta Acumulada o Polígono Acumulativo: Es semejante a los anteriores. En un sistema de coordenadas cartesianas. Polígono de Frecuencia: Es semejante a un histograma y a un gráfico de líneas. Ejemplo: Consideremos el problema de la Sección 2.

33 27.78 69. Aquí es válido referirnos a la Ojiva Porcentual hacia Arriba y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la → ← Frecuencia Relativa Acumulada hacia Arriba ( Ha ) y hacia Abajo ( Ha ).45 16.4) Polígono de Frecuencia Relativa Acumulada: Es semejante a los polígonos anteriores.78 77.33 8.78 100 1150 – 1516 1517 – 1883 1884 – 2251 2252 – 2619 2620 – 2986 2987 – 3353 PREC IOS PR OM EDIOS Gráfico de Barra: En uno de los ejes de un sistema de coordenadas cartesianas cada intervalo representa una categoría asumida por una variable cualitativa. La primera ojiva es creciente y la otra es decreciente. o un 4) 49 . Ejemplo: De nuevo consideremos el problema de la Sección 2.33 PRECIOS PROMEDIOS 3. estas se interceptan en un par ordenado tal que su abscisa se denomina Mediana.45 52.7.PORCENTAJE DE ENLATADOS POR PRECIOS PROMEDIOS PORCENTAJE DE ENLATODS 30 25 20 15 10 5 0 1150 – 1516 1517 – 1883 1884 – 2251 2252 – 2619 2620 – 2986 2987 – 3353 19. un valor numérico de una variable discreta. pero en el Eje Y usaremos los valores de la Frecuencia Relativa Acumulada.22 8. Este gráfico también es conocido como Ojiva Porcentual. Si ambas ojivas se grafican a la vez en un mismo sistema de coordenadas. concepto que estudiaremos en el siguiente Unidad. PO RC ENTAJE DE C REC IMIENTO DE LO S ENLATADO S PO R PREC IO S PRO MEDIO 120 100 80 60 40 20 0 8. y ambas se pueden dibujar en un mismo sistema de coordenadas cartesianas.67 25 22.

1. Muchas veces estos se ubican separados a igual distancia para mejor efecto visual en caso de tenerse numerosas barras.7. además que entre Bs. siendo el Histograma de Frecuencia un caso particular al respecto. Ejemplo: Tomemos el diagrama de barras del problema de la Sección 2. 2. los valores o los intervalos de clase.355 se concentran un segundo grupo de precios de enlatados. Ejemplo: La siguiente gráfica es tomada de un estudio hecho a un grupo de 25 varones para determinar su grupo sanguíneo 50 .intervalo de clase de una Distribución de Frecuencias para Datos Agrupados de cualquier variable cuantitativa.885 y Bs. Tal como dijimos anteriormente.252. En el otro eje se ubican las respectivas frecuencias asociadas a las categorías. Las barras pueden ser simples cuando representan una sola variable. y compuestas cuando en cada intervalo hay tantas columnas como variables a considerar. y verticales si están en el Eje X. Los intervalos deben ser de igual tamaño. podemos representar una distribución de frecuencias asociada a una variable cualitativa dibujando cada cualidad como un intervalo. 2. teniendo cada una a un intervalo como uno de sus lados y a la frecuencia como la longitud del otro lado. 3.988 y Bs. Las barras son horizontales si los intervalos están en el Eje Y. Luego se dibuja una serie de rectángulos o barras. PRECIOS PROMEDIO DE LOS ENLATADOS POR TIPO PRECIOS 2620 – 2986 1884 – 2251 1150 – 1516 0 1 2 3 4 5 6 7 8 9 CANTIDAD DE ENLATADOS Interpretación: Se puede observar que la mayor concentración de precios de enlatados se encuentra entre Bs.

o izquierda y derecha en dirección horizontal).Igualmente. 4) Gráfico a Doble Columna: Lo tenemos cuando a ambos lados de uno de los ejes se ubican columnas que parten de intervalos definidos en ese eje. dirigidas cada una en sentido inverso o contrario con respecto a la otra con la que comparte el mismo intervalo (arriba y abajo en dirección vertical. 51 . siguiéndose las mismas indicaciones dadas para los Diagramas de Barras. En pocas palabras. A cada intervalo parten dos barras en sentido contrario. Ejemplo: Tomemos el siguiente gráfico de barras donde se expresan las calificaciones de un ejercicio evaluado en la escala de 1 a 10 puntos. un Diagrama a Doble Columna está formado por dos diagramas de barras que están asociados a un mismo eje. Ejemplo: Tomamos una Pirámide Poblacional por años y sexo de una determinada región geográfica. cada intervalo del Gráfico de Barras puede representar cada uno de los valores asumidos por una variable discreta. compartiendo el mismo intervalo aunque ambas barras aparezcan dibujadas en forma separada.

Del Gráfico a Doble Columna se puede hacer un Diagrama de Barras Compuestas para dos variables. 52 .

Este tipo de gráfico es propio de la ciencia de la Cartografía.TEMA 3 3.  Sobre el mapa se superpone determinada figura que representa los valores relacionados con el fenómeno a presentar. y cada sector se identifica a través de un color o sombreado. Sin embargo. estos últimos proporcionan más información y permiten una apreciación estadística más rigurosa. 53 . y comparándolos con los anteriormente expuestos. el uso de Diagramas Simbólicos una manera fácil de transmitir una visión general de la información para el entendimiento del público cualquiera sea su nivel. Tiene la ventaja de exponer ciertos aspectos geográficos y relaciones espaciales que no se pueden revelar por cualquier otra forma de presentación.3. Al respecto.2 Diagramas Simbólicos Tal como se puede deducir sobre los diagramas que veremos a continuación. Las diferentes maneras de presentar un cartograma son las siguientes:  Cada punto o mancha colocada sobre el mapa representa un valor. Ejemplo: En el siguiente cartograma observamos la urbanización en el mundo atendiendo a la industrialización. la información numérica debe aparecer en el gráfico y guardar la correspondiente proporción con el dato numérico. 1) Cartograma: Es un mapa de una región geográfica a ser usado para presentar información estadística sobre características consideradas acerca de dicha región.  El mapa se divide por sectores.

por lo que se requiere asociar la frecuencia a reflejar con las medidas de la figura. sugerente o representativo de la naturaleza del dato del fenómeno que se quiere representar.2) Pictograma. perdidos o empatados de un equipo. sino otra distinta: el tamaño del pictograma suele ser proporcional a la frecuencia que representa. Ejemplo: Representamos el número de partidos ganados. siendo medidas en colones (¢). siendo este equivalente a una determinada cantidad de observaciones que se debe indicar con claridad en su encabezamiento. A veces no se usa la regla anterior. puesto que un observador siempre muestra indecisión en la comparación de alturas. La frecuencia absoluta de cada modalidad se representa por unidades y/o fracciones de un mismo pictograma.985 hasta 1. La repetición de un mismo pictograma debe hacerse de igual forma y proporción.988. lo que requiere cierto cuidado. 3) Diagrama o Gráfico Circular (o Diagrama Sectorial o de Pastel): Consiste en considerar el área completa del círculo como equivalente al 54 . áreas y volúmenes si el pictograma se presenta de dos o más maneras diferentes. Pictógrafo o Diagrama Pictórico: Es un gráfico consistente en un dibujo o símbolo que por su forma es alegórico. El inconveniente que se puede dar es cuando se busca de dibujar una fracción del pictograma. Ejemplo: Consideremos las exportaciones de frutas que ha efectuado El Salvador desde 1.

partiendo de la siguiente interpolación proporcional o regla de tres: 100 % H 360 º g 360º ×H 100% g= Aplicamos este procedimiento tantas veces como cantidades de frecuencias relativas existan en una Distribución de Frecuencias consideradas para una variable cualitativa o para Datos Agrupados de una variable cuantitativa.44% 25. obtenemos el siguiente diagrama circular. determinado luego el área cubierta por el sector circular correspondiente a cada frecuencia relativa parcial H de esa misma población o muestra. 35.7.251 2. 8. 55 . y después dibujar en el círculo. y construye una distribución de frecuencia relativa con los siguientes datos: 15. 20.100% o frecuencia relativa total de la población o muestra a representar.1.884 .883 1.67% 8. Ejemplo: Usando las frecuencias relativas calculadas para el problema de la Sección 2. siendo que la proporción entre 100% y H es igual a la existente entre los 360º del círculo y el ángulo g limitado por los radios del sector circular mencionado. 3.33% 22.22% 22% 8% 17% 8% 19% 26% Trace una circunferencia.150 .354 Nº DE ENLATA DO S 3 7 9 6 3 8 % 8. 12.517 .987 . Por tanto.516 1.4 ACTIVIDADES Individual  Lea con cuidado los contenidos presentados en este Unidad y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.1.2. y mediante el uso de un transportador. a g lo podemos hallar.33% 19.986 2.620 .3.619 2. 10. Resuelve e interprete.2.252 .00% 16. PORCENTAJE DE ENLATADOS POR NIVELES PRECIOS INTERVA LOS DE PRECIOS 1.2.

Grupal Cooperativa A los problemas resueltos propuestos en el unidad anterior así como a los datos tomados en campo.  Usa los gráficos de torta para presentar la distribución de frecuencia relativa de los ejercicios anteriores.  Comunitaria  Con los datos recolectados en campo (durante las actividades de Proyecto I o II) y ya ordenados. 56 . represéntelos utilizando tantos cuadros como los respectivos gráficos. constrúyale los histogramas de frecuencia y los polígonos aquí estudiados.

tendencia central y variación) y sus mediciones descriptivas de resumen. Los respectivos estadísticos a estudiarse aquí son las Medidas de Posición.UNIDAD IV: MEDIDAS DE POSICIÓN. Interpretar las diferencias entre las diversas Medidas de Dispersión para un conjunto de datos agrupados o no agrupados. 7. Comprender las propiedades de la posición y la tendencia central. Interpretar las diferencias entre las diversas Medidas de Tendencia Central para un conjunto de datos simples o agrupados. Estas dificultades descriptivas de los métodos gráficos pueden superarse mediante medidas descriptivas numéricas. 6. 2. de Tendencia Central y de Dispersión. Usar paquetes computacionales (Excel.1 Necesidad del uso de medidas numéricas descriptivas Los métodos gráficos son útiles para obtener una descripción general rápida de las observaciones y datos recolectados para su presentación. Por eso se desea usar los datos de una muestra para calcular un grupo de esas medidas (estadísticos) con el fin de transmitir una adecuada imagen mental de la distribución de frecuencias en cuanto a su ubicación. y que sean útiles para hacer inferencia estadística respecto a la población. 3. Entender la importancia de analizar la dispersión de un grupo de datos. 5. Calcular diversas Medidas de Dispersión para un conjunto de datos simples o agrupados. SPSS. COMPETENCIAS A LOGRAR: 1. Calcular diversas Medidas de Posición y de Tendencia Central para un conjunto de datos simples o agrupados. 4. y por otro lado es difícil usarlos para hacer inferencia estadística pues en particular el histograma de una muestra no necesariamente va a ser idéntico al de la población. y si lo fuesen sería necesario medir el grado de similitud o diferencia entre ambos histogramas. DE TENDENCIA CENTRAL Y DE DISPERSIÓN OBJETIVO: Analizar e interpretar las características o propiedades de los datos numéricos (posición. entre otros) para calcular las medidas de tendencia central y de dispersión. CONTENIDO: TEMA 1 4. harán falta otras técnicas descriptivas para transmitir una idea de la información contenida en aquellos. Hay limitaciones en el uso de esos métodos pues en caso de no poderse presentar los gráficos. 57 . concentración y variabilidad.

4. y el (100 – i × 10) % son mayores que Di. 2 . 99. P99.2 Medidas de Posición Consideraremos un tipo especial de medida que determina cualquier posición intermedia o lejana dentro de una distribución de datos. Los Deciles son 9 valores que dividen al conjunto de datos en 10 partes cada una con igual cantidad de observaciones ordenadas ascendentemente. aquí los estadísticos están solamente referidos para cualquier variable cuantitativa X. en base a los planteamientos expuestos al comienzo.Obviamente. Tenemos los Centiles o Percentiles. Por debajo de Di se encuentra el (i × 10) % de las observaciones.…. para una distribución de datos simples los procedimientos para el cálculo de estas medidas no son los mismos a emplearse en el caso de una distribución de datos agrupados. i = 1. o lo que es lo mismo. Se denominan Cuantiles o Fractiles. Por debajo de Qi se encuentra el (i × 25) % de las observaciones. 9. El Segundo Cuartil Q2 o Cuartil Medio es un valor tal que el 50% o las dos cuartas partes) de las observaciones son menores que ese valor. El Primer Cuartil Q1 o Cuartil Inferior es un valor tal que el 25% o la cuarta parte de las observaciones son menores que ese valor. D2. 58 . P2.….…. el 75% o las tres cuartas partes de las observaciones son mayores que ese valor. y se denotan en forma respectiva como P1. y se utilizan sobre todo para resumir o describir las propiedades de conjuntos grandes de observaciones ordenadas de menor a mayor. y se denotan en forma respectiva como D1. D9. Todas las medidas a estudiarse estarán referidas al estudio de muestras. Además.…. Por debajo de un valor Pi se encuentra el i % de las observaciones. Q2 y Q3. pero se pueden generalizar para poblaciones. Deciles y Cuartiles.3. y el (100 – i × 25) % de estas son mayores que Qi. y el (100 – i) % son mayores que Pi. o lo que es lo mismo. Los Centiles o Percentiles son 99 valores que dividen al conjunto de datos en 100 partes cada una con igual cantidad de observaciones ordenadas ascendentemente. el 30% de las observaciones son menores que D3 y el 70% de estos son mayores que D30. y se denotan en forma respectiva como Q1. i = 1. Por ejemplo. el 50% o las dos cuartas partes de las observaciones son mayores que ese valor. i = 1. Los Cuartiles son 3 valores que dividen al conjunto de datos en 4 partes cada una con igual cantidad de observaciones ordenadas ascendentemente.

2. Entonces Qi = xj. Regla 2: Si el valor obtenido para j se encuentra en el justo medio de dos números enteros (es decir. Entonces Q i = x j + x j +1 2 . 2. si ese valor es un número fraccionario cuya parte decimal sólo consta del dígito 5). o lo que es lo mismo. lo cual depende de la cantidad N de observaciones ordenadas. para el rendimiento que reciben los trabajadores por el fideicomiso de sus prestaciones sociales. se redondea a j por defecto y el cuartil es el promedio de los valores correspondientes a las observaciones xj y xj+1. sea xj la observación que le es más cercana de entre las que son menores a Qi. 3 4 El valor resultante de esa formulación para j no necesariamente va a dar un valor entero. Vemos que el valor de un cuartil no necesariamente va a coincidir con el de alguna observación. y el cuartel asume el valor numérico de la observación que ocupa esa posición. Regla 1: Si el valor obtenido para j es un número entero. 59 . se redondea a j por defecto o exceso al número entero más cercano. Para esta serie y un cuartil Qi dado. establecidas por el BCV. por lo que se hace necesario el uso de ciertas reglas al respecto. 3. se elige como cuartil al valor de la observación específica en esa posición. 1) Cuartiles para una Distribución de Datos Simples De una distribución de n datos simples. el 25% o la cuarta parte de las observaciones son mayores que ese valor. habiendo aproximadamente j observaciones con valores menores a Qi de acuerdo a esta expresión: i-ésimo Cuartil Qi: j= i × ( N + 1) .El Tercer Cuartil Q3 o Cuartil Superior es un valor tal que el 75% o las tres cuartas partes de las observaciones son menores que ese valor. obtenemos una serie de N observaciones ordenadas de menos a mayor. i = 1. Regla 3: Si el valor obtenido para j no es un número entero o el valor medio entre dos números enteros (es decir. Entonces Qi = xj. si ese valor es un número fraccionario cuya parte decimal no consta solamente con el dígito 5). La posición j de esa observación varía de acuerdo al tipo de cuartil. i = 1. Ejemplo: Suponga un conjunto de observaciones que corresponden a las tasas anuales de interés.

6 29. y en consecuencia: Q1 = x 4 + x 5 28.4 58 = = = 29 2 2 2 Interpretación: El 25% de las personas reciben una tasa de interés menor de 29% por el fideicomiso de sus prestaciones sociales.6 28.5 29. siendo N = 17 en este caso.2 32.6 28. o el 75% de las personas reciben una tasa de interés mayor a 29%.5 4 4 4 Por la Regla 2 tenemos j = 4.6 28. o lo que es igual.1 Vamos a ejecutar los siguientes pasos para hallar Q1 y Q3.5 4 4 4 Por la Regla 2 tenemos j = 13.4 = = = 32.1 32.6 + 29.9 b) 30.2 37.5 32.7% por el fideicomiso de sus prestaciones sociales. 60 .5 32. y en consecuencia: Q3 = x 13 + x 14 32.4 29.9 30. j= i × ( N + 1) 3 × (17 + 1) 54 = = = 13.2 32.4 35.4 35. 1) Se ordenan las observaciones de menor a mayor.4 29. definiendo la cantidad de estas.5 29.Orden Tasa de Interés (%) 1 10 2 3 4 5 6 7 8 30 9 10 11 12 13 14 33 15 16 17 38 20. x3 x4 x5 x6 x7 x8 30 x9 x10 x11 x12 x13 x14 33 x15 x16 x17 38 Orden Tasa de Interés (%) x1 10 x2 20. c) Se establece el valor de la posición j que está asociada al Tercer Cuartil Q3 (i = 3).5 30.5 30.6 28.1 Se establece el valor de la posición j que está asociada al Primer Cuartil Q1 (i = 1).1 32.7 2 2 2 Interpretación: El 75% de las personas reciben una tasa de interés menor de 32.4 + 33 65. j= i × ( N + 1) 1× (17 + 1) 18 = = = 4.7%.6 29. el 25% de las personas reciben una tasa de interés mayor a 32.2 37.

50% o 75%) se ubica en el Eje Y. y los demás serán resueltos por el estudiante de manera análoga al procedimiento que aplicaremos aquí. respectivamente). y desde allí trazamos una línea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser el cuartil buscado (Q1. construimos una distribución de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones. Q2 o Q3.2) Cuartiles para una Distribución de Datos Agrupados Dada una distribución de frecuencias para datos agrupados. y desde allí se traza una línea paralela al Eje X hasta tocar la ojiva en un punto de esta. Partiendo de la Tabla 1. En el próximo ejemplo se realizará el cálculo solamente para el caso de Q1. a través del correspondiente polígono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar gráficamente cualquiera de los cuartiles. Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueñas se distribuyeron en 6 grupos. a) Tabla 2 61 . El valor porcentual del cuartil (25%. Tabla 1 Edades (años) Nº de asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Para hallar el Primer Cuartil Q1 ejecutaremos los siguientes pasos.

vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta hallar el número j de clase tal que Fa j −1 ≤ N ≤ Fa j . estando contabilizadas tales observaciones en la Columna II (frecuencias absolutas). 4 N N < < Fa j . Entonces Q1 se encuentra en el intervalo Li3 – Ls3 = 40 – 49. y si su valor no resulta entero.Nº de clases 1 2 3 4 5 6 III Número de Edades Número de asistentes (años) asistentes acumulados 20-29 16 16 30-39 25 41 40-49 51 92 50-59 80 172 60-69 20 192 70-79 8 200 Totales N = 200 N de observaciones 4 I II b) Determinamos la cantidad aproximada menores a Q1. por lo que en este último hay N −Fa 4 j− 1 observaciones mayores que Lij y 62 . y 41 ≤ 50 ≤ 92. entonces parte de las 4 4 observaciones menores a Q1 se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij – Lsj. por lo que el Primer Cuartil Q1 está ubicado en 4 el intervalo de clase Lij – Lsj de la Columna I. se redondea con las mismas reglas aplicadas a la posición j es el cálculo de los cuarteles para observaciones ordenadas. a medida que avanzamos en la Columna III (frecuencias acumuladas) siguiendo el número de clase. entonces Q1 = Lij o Q1 = Lsj. El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase. c) Recordemos que Q1 siempre va a estar dentro del intervalo Lij N 4 – Lsj. Si Faj-1 = respectivamente. siendo menores a Q1 las observaciones de este y de los otros intervalos anteriores. Las condiciones anteriores se cumplen para la clase j = 3 pues Faj-1 = Fa2 = 41. N 200 = = 50 4 4 En la Tabla 2. o Faj = Si Fa j −1 N . Faj = Fa3 = 92.

El espacio ocupado en ese intervalo por cada una de las F3 = 51 observaciones es F = 51 = 0. existen aproximadamente i ×N observaciones 4 menores que el cuartil Qi. i = 1. Entonces la distancia entre Li3 y 3 Q1 es  N  Ic − Fa 2  × = 1. j Luego. la formulación para Q1 es: 4   Fj Ic N   − Fa j -1  4  × Ic Q1 = Li j +  Fj En general. en el intervalo Lij – Lsj de tamaño Ic = Lsj – Lij tenemos que cada una de las Fj observaciones contenidas en ese intervalo ocupa allí un espacio de tamaño F unidades de longitud. vemos que Fa 2 < cumple que 41 < 50 < 92. 3 Q i = Li j +  Fj Para nuestro ejemplo. Entonces hay N < Fa 3 pues se 4 N − Fa 2 = 50 – 41 = 9 4 observaciones entre Li3 y Q1.17. Por otra parte. cuya expresión correspondiente es:  i ×N  − Fa j -1   4  × Ic . las cuales se encuentran en el intervalo Li3 – Ls3 = 40 – 49 de tamaño Ic = Ls3 – Li3 = 49 – 40 = 9. y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij – Lsj. Por lo tanto. la distancia que separa a Lij y Q1 es el espacio que ocupan las N −Fa j −1 observaciones ubicadas entre ambos valores. o sea 4 N  Ic Q1 − Li j =  − Fa j -1  × . 2.menores que Q1.53. y así: 4   F3 Ic 9 N   − Fa 2  4  × Ic Q1 = Li 3 +  F3 63 .

la Moda.3 Medidas de Tendencia Central Al estudiarse la información estadística mediante los gráficos cartesianos. el Eje Medio y el Rango Medio. ¿Cuándo debe usarse los Cuantiles o Fractiles en cualquiera de los casos anteriores? Estas medidas brindan información acerca de la concentración y variación de una serie de observaciones y datos. y en general se aprecia una tendencia de agrupación en el vecindario de los valores más repetidos. 1) MEDIA ARITMÉTICA (MEDIA O PROMEDIO) 64 . en el comportamiento de los datos con respecto a sus respectivas frecuencias se observan valores más comunes que otros. TEMA 2 4. pero se necesitan varias mediciones de esa especie para tener una descripción adecuada de la serie. Ese valor lleva implícita la idea de variación. El problema es hallar el valor más representativo de una serie de valores. En función de tener la menor cantidad de mediciones posibles. Estas medidas son la Media Aritmética (y en particular la Media Ponderada).53 = 41. es decir. Las Medidas de Tendencia Central son los valores más representativos de una distribución de datos y frecuencias. ubicándoseles en su zona central. habiendo así mayor densidad de frecuencia en la parte central de los gráficos. si tenemos una cantidad que varía en el espacio o en el tiempo.53 ≈ 42 Q1 = 40 +  51 Interpretación: El 25% de las personas asistentes al ambulatorio de Barrio Adentro tienen una edad promedio menor de 42 años aproximadamente. Cada medida es un valor típico descriptivo en la que un conjunto de datos muestra una tendencia bien determinada a agruparse o aglomerarse alrededor de cierto punto central. la Mediana. representándose así una gran cantidad de valores unitarios por uno sólo. se necesita obtener su grado o nivel generalmente predominante. 200  − 41  4  × 9 = 40 + 1. pero esta se desprecia pues sólo interesa obtener el que más se impone. nombre que en general se reserva para la Media Aritmética. A veces cada una de estas medidas es denominada promedio. generalmente se usan los Cuartiles para tal propósito descriptivo.

x1 = 295 personas x2 = 768 personas x3 = 941personas Luego: x4 = 1. y 1.. La formulación de la Media es: X= ∑x i =1 N i N = x 1 + x 2 + .002 personas x5 = 1.002.289. el orden de las observaciones no altera el resultado para la Media.283 personas N = 5 observaciones o datos X= X = ∑x i =1 5 i 5 = x 1 + x 2 + .8 ≈ 858 5 5 Interpretación: Esto significa que en promedio aproximadamente 858 personas diariamente en esos cinco días. entraron 65 . La Media o promedio de personas que diariamente entraron en la tienda es de 4.1. Identificaremos los valores a emplear en la formulación.. 1. + x 5 5 295 + 768 + 941 + 1.283 = 4.002 + 941 + 768 + 1. + x N N La Media es un valor que equilibra los valores de las observaciones que le son mayores y menores.289 = = 857. El total de personas que entró al Mercal durante los cinco días anteriores es de 295 + 1.002 + 1. 768.283 4..1) Media para una Distribución de Datos Simples Partiendo de una serie de observaciones asociada a esa distribución.. definimos la Media como la suma de todas las observaciones dividida entre la cantidad N de estas. En virtud de las propiedades de la suma. y es sensible a mediciones extremas que no estén equilibradas a su alrededor.8.289 ÷ 5 = 857. Ejemplo: El gerente de un local de Mercal desea estudiar la concurrencia a la tienda. y encuentra que 295. 941.283 personas entraron a la tienda durante los pasados cinco días. que es aproximadamente 858 personas.

00 Para k = 3 categorías. identificamos los valores señalados. los de segundo el 36% y los de tercero el 24% del total existente.Diga si en el ejemplo de Mercal la media está afectada por los valores extremos.24 ⋅ 12) = 17. ¿cuántos estudiantes hay en promedio en los tres salones de clase? Cursos Primer Grado Segundo Grado Tercer Grado Total Alumnos Porcentajes 20 40%=0. F3 = 12 alumnos. La formulación es: XP = ∑p j =1 k j =1 k j ⋅ Fj j ∑p = ∑ p j ⋅ F j pues j =1 k ∑p j =1 k j = 100% = 1 Ejemplo: En una clase de un colegio público hay 20 alumnos de primer grado.40 p2 = 36% = 0.36 12 24%=0. F1 = 20 alumnos.40 ⋅ 20) + ( 0.36 ≈ 17 j =1 3 p1 = 40% = 0.24 50 100%=1.36 p3 = 24% = 0. Las ponderaciones pueden ser las k frecuencias relativas asociadas a las frecuencias absolutas de las clases de una variable cualitativa. Media Ponderada: Es la suma de los productos obtenidos de cada valor ponderado por su respectiva ponderación de acuerdo al fenómeno estudiado. dividido entre la suma de todas las ponderaciones. Si los estudiantes de primero representan el 40%. La Media Ponderada es: X P = ∑ p j ⋅ F j = ( 0. 66 .24 Interpretación: Aproximadamente un promedio de 17 alumnos estudian en cada uno de los tres primeros grados. 18 de segundo y 12 de tercero.40 18 36%=0. F2 = 18 alumnos.36 ⋅ 18) + ( 0.

Estos son las N = 20 observaciones ordenadas crecientemente por fila.. x1 = 18 x6 = 23 x11 = 30 x16 = 37 x2 = 18 x7 = 26 x12 = 34 x17 = 37 x3 = 21 x8 = 26 x13 = 34 x18 = 37 x4 = 23 x9 = 26 x14 = 37 x19 = 37 x5 = 23 x10 = 26 x15 = 37 x20 = 40 La Media Aritmética es: X = X = ∑x j =1 20 j 20 = x 1 + x 2 + . Esta última es ventajosa utilizarla cuando abundan numerosas observaciones reflejadas en datos con frecuencias elevadas. + 40 590 = = 29. La formulación es: X = ∑f j ⋅ X j j =1 n ∑f j =1 n = ∑f j =1 n j ⋅X j pues N ∑f j =1 n j =N j La Media Aritmética de una serie de N observaciones es la misma Media Ponderada de la distribución de frecuencias para n datos simples obtenidos de la serie mencionada. Ejemplo: Las edades de los integrantes de una sección de 20 estudiantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta. X f X1 18 2 f1 X2 21 1 f2 X3 23 3 f3 X4 26 4 f4 X5 30 1 f5 X6 34 2 f6 X7 37 6 f7 X8 40 1 f8 La Media Ponderada es: 67 .En una distribución de frecuencias para n datos simples obtenidos de N observaciones asociadas a una variable cuantitativa. + x 20 20 18 + 18 + .. las ponderaciones vienen siendo sus respectivas frecuencias absolutas...5 ≈ 30 20 20 De esta serie de observaciones obtenemos la siguiente distribución de frecuencias absolutas para n = 8 datos simples.

X =
X =

∑f
j =1

8

j

⋅Xj =

20

f1 ⋅ X 1 + f 2 ⋅ X 2 + ... + f8 ⋅ X 8 20

( 2 ⋅ 18) + (1⋅ 21) + ... + (1⋅ 40) = 590
20 20

= 29,5 ≈ 30

Interpretación: La edad promedio de cada estudiante de la sección es de aproximadamente 30 años. Nota: En el ejemplo de la concurrencia de personas a Mercal, si aplicamos la fórmula de la Media Ponderada resulta que fj = 1, j = 1,…, 5.
1.2)

Media para datos agrupados en k clases Se calcula de manera similar a la Media Ponderada, estando las N observaciones distribuidas en k intervalos de clase, para los cuales las correspondientes marcas de clase son los valores a ser ponderados con las respectivas frecuencias absolutas. La formulación es:

X =

∑F
j =1

k

j k

⋅ Xm j =
j

∑F
j =1

k

j

⋅ Xm j N pues

∑f
j =1

∑F
j =1

k

j

=N

Ejemplo: A partir de la Tabla 1 (las edades de los asistentes a un centro ambulatorio de Barrio Adentro) construimos la Tabla 3 de la siguiente manera: a) Calculamos la edad promedio (marca de clase) de los límites de edades de cada grupo (Columna II). Calculamos el número de asistentes acumulados (frecuencias acumuladas) en cada clase de edades (Columna IV).
b)

Calculamos el producto de la edad promedio de cada clase (Columna II) por el número de asistentes de dichas clases (Columna III), se suman esos valores obtenidos para cada clase (Columna V), y tal resultado se divide entre el total de asistentes, obteniéndose el resultado de la Media. Tabla 3
c)

Nº de clases

I Edades (años)

II Edad Promedio

III Número de

IV Número de

V Edad Promedio

68

asistentes 1 2 3 4 5 6 20-29 30-39 40-49 50-59 60-69 70-79 Totales 24,5 34,5 44,5 54,5 64,5 74,5 16 25 51 80 20 8 N = 200

asistentes acumulados 16 41 92 172 192 200

× Número de asistentes 392 862,5 2.269,5 4.360 1.290 596 9.770

La Media es:

X=
X=
X =

∑F ⋅X
i i =1

6

i

200

=

F1 ⋅ X 1 + F2 ⋅ X 2 + ... + F6 ⋅ X 6 200
200

(16 ⋅ 24,5) + ( 25 ⋅ 34,5) + ( 51⋅ 44,5) + ( 80 ⋅ 54,5) + ( 20 ⋅ 64,5) + ( 8 ⋅ 74,5)

392 + 862,5 + 2.269,5 + 4.360 + 1.290 + 596 9.770 = = 48,85 ≈ 49 200 200

Interpretación: Cada uno de los 200 pacientes que asistieron al ambulatorio de Barrio Adentro tiene una edad promedio aproximada de 49 años. Nota: No se puede calcular la Media Aritmética donde existen clases abiertas (ejemplo: 70 años y más). Lo recomendable es usar la Mediana. En cualquier caso, la Media Aritmética para datos agrupados puede asumir un valor igual o muy cercano al de la Media Aritmética para la serie de observaciones de donde se extrajeron los datos agrupados. Por otra parte, se redondean esos valores para tal medida de tendencia central según la variable empleada, como en los anteriores ejemplos sobre edades. ¿Cuándo debe usarse la Media Aritmética en cualquiera de los casos anteriores? Debido a que su cálculo se basa en todas las observaciones, cualquier valor extremo afecta mucho la media aritmética. Se debe usar cuando no este afectada por los valores extremos. 2) MEDIANA

Es un valor MD que divide en dos grupos a una distribución de datos, de tal manera que uno de los grupos tiene 50% de las observaciones menores a MD

69

y el otro grupo posee 50% de las que son mayores a dicho valor. Es decir, ambos grupos tienen igual cantidad de observaciones. Esta Medida de Tendencia Central es también una Medida de Posición pues por su definición coincide con el Segundo Cuartil Q2, o sea, MD = Q2. 2.1)Mediana para una Distribución de Datos Simples De una distribución de n datos simples obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie, sea xj la observación más cercana a la Mediana MD de entre las que son menores a dicho valor. Dependiendo de N, el valor de MD puede o no puede coincidir con el de xj, existiendo reglas que permiten clarificar este hecho. Regla 1: Si la cantidad N de observaciones es impar, entonces la Mediana está representada por el valor numérico de la observación correspondiente a la posición j =
N +1 . Entonces MD = xj. 2

Ejemplo: En un hospital público de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 120. ¿Cuál es la Mediana de los tiempos? Procederemos a ejecutar los siguientes pasos: a. Se ordenan e identifican las observaciones de menor a mayor. x1 50
b.

x2 50

x3 50

x4 52

x5 57

x6 x7 x8 x9 78 120 135 212

Se establece la posición de la Mediana de acuerdo a la cantidad de observaciones. En nuestro caso, N = 9, y por la Regla 1 tenemos que
j= N + 1 9 + 1 10 = = =5 2 2 2

MD = xj = x5 = 57 Interpretación: El 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio menor a 57 minutos, o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio mayor a 57 minutos. Regla 2: Si la cantidad N de observaciones es par, entonces consideramos que la Mediana está entre las dos observaciones xj y xj+1 que

70

x2 50 x3 50 x4 52 x5 57 x6 60 x7 x8 x9 x10 78 120 135 212 Se establece la posición de la Mediana de acuerdo a la cantidad de observaciones. 52. Ese valor viene siendo la abscisa del punto de intersección de la ojiva porcentual hacia arriba con la ojiva porcentual hacia abajo. 212. En nuestro caso. los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50. o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo mayor a 58. 78.2)Mediana para una Distribución de Datos Agrupados Dada una distribución de frecuencias para datos agrupados en k clases. a través del correspondiente polígono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar gráficamente la Mediana. ¿Cuál es la Mediana de los tiempos? Interprete. cuyo valor porcentual (que es 50%) se ubica en el Eje Y. desde allí se traza una línea paralela al Eje X hasta tocar la ojiva en un punto de esta. asociadas respectivamente a las → ← frecuencias relativas acumuladas hacia arriba ( Ha ) y hacia abajo ( Ha ). N = 10. 2. 50. 60.5 minutos en promedio. y por la Regla 2 tenemos que j= N 10 = =5 2 2 MD = x j + x j +1 2 = x 5 + x 6 57 + 60 117 = = = 58. Procederemos a ejecutar los siguientes pasos: a) x1 50 b) Se ordenan e identifican las observaciones de menor a mayor. 71 .5 2 2 2 Interpretación: Esto significa que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo menor a 58. Entonces MD = . La Mediana es la semisuma de los valores numéricos de estas dos 2 x j + x j +1 observaciones. y luego partiendo de ese punto trazamos una línea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser la Mediana.están en las posiciones centrales las observaciones ordenadas. 50.5 minutos en promedio. 57. 2 j = Ejemplo: En un hospital público de la ciudad de Caracas. siendo N . 135. 120.

Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueñas se distribuyeron en 6 grupos.La manera como calcularemos a MD es similar al procedimiento efectuado para el Primer Cuartil Q1. construimos una distribución de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones. a) Nº de clases 1 2 3 4 5 6 III Número de Edades Número de asistentes (años) asistentes acumulados 20-29 16 16 30-39 25 41 40-49 51 92 50-59 80 172 60-69 20 192 70-79 8 200 Totales N = 200 N 2 I Tabla 2 II b) Determinamos la cantidad aproximada o N +1 2 de observaciones menores a MD si N es par o impar. Partiendo de la Tabla 1. N 200 = = 100 2 2 72 . respectivamente. Tabla 1 Edades (años) Nº de asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Para hallar la Mediana ejecutaremos los siguientes pasos. pues ya dijimos que la Mediana es igual al Segundo Cuartil Q2.

en el intervalo Lij – Lsj de tamaño Ic = Lsj – Lij tenemos que cada una de las Fj observaciones contenidas en ese intervalo ocupa allí un espacio de tamaño F unidades de longitud. c) Recordemos que MD siempre va a estar dentro del intervalo N N o Faj = . 2 2 N N Si Fa j −1 < < Fa j . y 92 ≤100 ≤ 172. Por lo tanto. por lo que la 2 Mediana MD está ubicada en el intervalo de clase Lij – Lsj de la Columna I. Las condiciones anteriores se cumplen para la clase j = 4 pues Faj-1 = Fa3 = 92. El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase. como parte de las 2 2 Lij – Lsj. estando contabilizadas tales observaciones en la Columna II. Por otra parte. siendo menores a MD las observaciones de este y de los otros intervalos anteriores. la formulación para MD   j es: N N   − Fa j -1  Md = Li +  2  × Ic j Fj 73 . Faj = Fa4 = 172. y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij – Lsj. o sea Ic   MD – Lij =  2 − Fa j -1  × F .En la Tabla 2. j Luego. la distancia que separa a Lij y MD es el espacio que ocupan las N −Fa 2 j− 1 Ic observaciones ubicadas entre ambos valores. observaciones menores a MD se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij – Lsj. entonces MD = Lij o MD = Lsj. vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta hallar el número j de clase tal que Fa j −1 ≤ N ≤ Fa j . a medida que avanzamos en la Columna III siguiendo el número de clase. Si Faj-1 = respectivamente. por lo que en este último hay N −Fa 2 j− 1 observaciones mayores que Lij y menores que MD. Entonces MD se encuentra en el intervalo Li4 – Ls4 = 40 – 49.

9 = 50. la cual no depende del orden de las observaciones. la Moda Mo es el valor de aquella observación que aparece con mayor frecuencia (el que más se repite o el más típico). es adecuado usar la mediana en lugar de la media para describir el conjunto de observaciones o de datos agrupados. la cual no se ve influenciada por los valores extremos existentes en aquellas. y así: 2  F4 N   − Fa 3  2  × Ic MD = Li 4 +  F4  200  − 92   2  × 9 = 50 + 0. 74 . Entonces hay N < Fa 4 pues se 2 N − Fa 3 = 100 – 92 = 8 2 observaciones entre Li4 y MD. Si son varios valores distintos los que se repiten a la vez con una misma frecuencia mayor que las de otras observaciones. Se requiere tener ordenadas las observaciones al tratar de hallar la Mediana. ¿Cuándo debe usarse la Mediana en cualquiera de los casos anteriores? Siempre que una observación extrema esté presente.1)Moda para una Distribución de Datos Simples De una distribución de n datos simples. y se puede calcular en distribuciones abiertas. las cuales se encuentran en el intervalo Li4 – Ls4 = 50 – 59 de tamaño Ic = Ls4 – Li4 = 59 – 50 = 9. El espacio ocupado en ese intervalo por cada una de las F4 = 80 observaciones es MD es  Ic 9 = = 0.9 ≈ 51 MD = 50 +  80 Interpretación de la Mediana: El 50% de las personas que asistieron al ambulatorio de Barrio Adentro tienen una edad promedio aproximadamente menor a 51 años. vemos que Fa 3 < cumple que 92 <100 < 172.11.Para nuestro ejemplo. entonces la serie aquí dada es pluri-modal. 3) MODA 3. obtenemos una serie de N observaciones ordenadas de menos a mayor. Entonces la distancia entre Li4 y F4 80 N  Ic − Fa 3  × = 0.9. donde no se puede encontrar la Media. Para esta serie.

50. Interpretación: El mayor tiempo de espera de los pacientes es un promedio de aproximadamente 50 minutos. 50. 135. x2 y x3. 57. Para nuestro ejemplo. los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50. 52. construimos la respectiva distribución de frecuencias absolutas para n datos simples. 212.Ejemplo: En un hospital público de la ciudad de Caracas. 75 . x1 = 18 x6 = 23 x11 = 30 x16 = 37 x2 = 18 x7 = 26 x12 = 34 x17 = 37 x3 = 21 x8 = 26 x13 = 34 x18 = 37 x4 = 23 x9 = 26 x14 = 37 x19 = 37 x5 = 23 x10 = 26 x15 = 37 x20 = 40 40 37 30 26 37 23 26 34 18 37 37 21 18 37 26 37 26 23 Estos son las N = 20 observaciones ordenadas crecientemente por De esta serie de observaciones obtenemos la siguiente distribución de frecuencias absolutas para n = 8 datos simples. Para hallar la Moda. Si en la serie de N observaciones estas son numerosas y se repiten muchos valores. x2 50 x3 50 x4 52 x5 57 x6 60 x7 x8 x9 x10 78 120 135 212 Se observa la observación que más se repite y ese valor es la Moda. 60. procederemos a ejecutar los siguientes pasos: a) x1 50 b) Se ordenan e identifican las observaciones de menor a mayor. X f X1 18 2 f1 X2 21 1 f2 X3 23 3 f3 X4 26 4 f4 X5 30 1 f5 X6 34 2 f6 X7 37 6 f7 X8 40 1 f8 Vemos que Mo = X7 = 37 pues ese es el dato cuya frecuencia f7 = 6 es la mayor de todas. y la moda será el valor del dato que tenga la mayor frecuencia. Ejemplo: Las edades de los 20 integrantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta. 34 23 fila. 78. la Moda es Mo = 50 pues ese valor es repetido tres veces por las observaciones x1. 120.

3.Interpretación: El grupo de 6 estudiantes de 37 años cada uno es por edad el más numeroso de la sección. Está localizada en el intervalo de clase de mayor frecuencia. para la Moda no siempre se tiene un valor exacto sino aproximado. Tabla 4 I II Edades Número de (años) asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Totales N = 200 Nº de clases 1 2 3 4 5 6 Procederemos a ejecutar los siguientes pasos. la Clase Modal es j = 4 pues la mayor frecuencia viene dada por Fj = F4 = 80 (Columna II). Ejemplo: Construimos la Tabla 4 de la Tabla 1 donde aparecen contabilizados los pacientes por edades atendidos en un Unidad de Barrio Adentro. el cual será más exacto a medida que disminuya el tamaño del intervalo de clase y aumente la cantidad de observaciones O datos.2)Moda para una Distribución de Datos Agrupados La Moda Mo es el valor alrededor del cual los datos tienden a concentrarse más densamente. Primero hay que encontrar EL Intervalo Modal en el cual esta situada la Moda. en algunos textos se le toma como la marca de clase con mayor ordenada en un polígono de frecuencia (absoluta). y también determinamos el valor d2 que se obtiene como la diferencia entre la frecuencia absoluta del Intervalo Modal y la frecuencia b) 76 . Sin embargo. a) A partir de la Columna II calculamos el valor d1 como la diferencia entre la frecuencia absoluta Fj del Intervalo Modal y la frecuencia absoluta Fj-1 que le antecede (o sea. Es posible que la distribución que los agrupe sea pluri-modal. siendo aquel que tiene la máxima frecuencia absoluta. y el Intervalo Modal (Columna I) es Lij – Lsj = Li4 – Ls4 = 50 – 59. En nuestro ejemplo representado por la Tabla 4. y se le denomina Intervalo Modal. d1 = Fj – Fj-1). Aunque ahora veremos una formulación para la Moda.

resulta: Mo = Li 4 + d1 × Ic d1 + d 2 Mo = 50 + 31 × 9 = 50 + 0. Fj+1 = F5 = 20. La formulación es: EM = Q1 + Q 3 2 Ejemplo: Calcularemos el Eje Medio para las tasas de interés del BCV estudiadas cuando se calcularon el Primer y Tercer Cuartil cuando 77 .34 × 9 = 50 + 3. 4) EJE MEDIO Es una medida de resumen que se usa para superar posibles problemas que introducen los valores extremos de las observaciones o datos. y con el resto de los valores mencionados anteriormente hallamos la Moda Mo con la siguiente formulación: c) Mo = Li j + d1 × Ic d1 + d 2 Como Ic = Ls4 – Li4 = 59 – 50 = 9.06 = 53. La ocurrencia de algún valor extremo no afecta a la Moda al igual que la Mediana. ¿Cuándo debe usarse la Moda en cualquiera de los casos anteriores? Cuando queremos conformarnos con tener una idea superficial de la concentración de la distribución.06≈ 53 31 + 60 Interpretación de la Moda: Gran parte de los asistentes al centro ambulatorio tienen una edad promedio de aproximadamente 53 años. tenemos Fj-1 = F3 = 51. la Moda se usa sólo para fines descriptivos porque varía más entre distintas muestras que otras medidas de tendencia central. y por tanto d1 = 80 – 51= 31 y d2 = 80 – 20 = 60. procedimiento idéntico tanto para datos simples o agrupados. El Eje Medio EM se obtiene con la semisuma del Primer y Tercer Cuartil.absoluta Fj+1 que le sucede (o sea. A Intervalo Modal Lij – Lsj le calculamos su longitud Ic = Lsj – Lij. En particular. d2 = Fj – Fj+1).

entonces: EM = Q1 + Q3 29 + 32.7 61. En el primer caso. 5) RANGO MEDIO El Rango Medio RM se obtiene con la semisuma del valor más pequeño y el valor más grande de un conjunto de N observaciones ordenadas ascendentemente. respectivamente. 670. 690. b) c) Se obtiene el Rango Medio.7%. 610. Las correspondientes formulaciones son: Para N observaciones ordenadas o n datos simples: Para datos agrupados en k clases: RM = x1 + x N X 1 + X n = 2 2 Li + Ls k RM = 1 2 Ejemplo: Los números de visitantes durante los últimos 10 años a la cueva del Guácharo fueron los que se presentan a continuación.85 2 2 2 Interpretación: Todas las personas reciben por el fideicomiso de sus prestaciones sociales una tasa promedio aproximada de 30. a) Se ordenan e identifican las observaciones de menor a mayor. 690. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 540 560 610 630 670 670 690 690 690 690 Se busca el menor y el mayor valor del conjunto observaciones.tenemos una serie ordenada de observaciones. tenemos que x1 = 540 y xN = x10 = 690. o como la semisuma del límite inferior y el límite superior del primer y último intervalo de clase. 540. x + x 10 540 + 690 RM = 1 = = 615 2 2 ¿Cuándo debe usarse el Rango Medio en cualquiera de los casos anteriores? 78 . Como Q1 = 29% y Q3= 32. 560. 690. tenemos que X1 = x1 y Xn = xN. 670.85%.630. Determine el Rango Medio del número de visitantes: 690. Para las N = 10 observaciones ya ordenadas. cuando tenemos datos agrupados en k clases. al comparar la serie de N observaciones con los n datos simples.7 = = = 30.

4 ACTIVIDADES (PARA OBSERVACIONES O DATOS SIMPLES) Individual  Lea con cuidado los contenidos presentados en relación a medidas de tendencia central para observaciones o datos no agrupados.930. 1.651 423. Entidades Federales Zulia Carabobo Miranda Lara Aragua Bolívar Distrito Capital Sucre Táchira Portuguesa Anzoátegui Mérida Falcón Barinas Guárico Trujillo Monagas Apure Yaracuy Cojedes Vargas Personas en pobreza extrema 905.Cuando se procesan datos donde no se presente un valor extremo. Interprete cada una de las medidas.650. 1.250 Calcule la Mediana.126 196. 1. 1.510. 2.149 166.004.590.517 242.670.222 198.540. 1. 1. 1. 1.286 299.408  79 . El siguiente cuadro muestra a las personas en pobreza extrema por entidad federal correspondientes al primer semestre del año 2.831 211.345. 1.495.884 479.597 212. 3. Grupal Cooperativo  Del análisis de las evolución de enfermedades endémicas de una región del país se encontró que los casos de dengue hemorrágico en los últimos quince años varió: 1. el Rango Medio y El Eje Medio. 2.845 199.034 350.300.549 252. 1.757 282.890. 1.500.024 179.332 504.287 440.470 641.510.629. y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.257 75.327 315. lo que hace que se utilice poco este promedio 4.633 82.475.

Agrúpelos ordenados de mayor a menor. siga el siguiente tratamiento: 1. Revíselos. Calcule Media.5 ACTIVIDADES (PARA DATOS AGRUPADOS) Individual  Lea con cuidado los contenidos presentados en relación a las medidas de posición y de tendencia central para datos agrupados. y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.201 40.293 Nota: Ordenada por el total de pobres Fuente: INE / Unidad de Medición de Condiciones de Vida 1. Interprete los resultados y agréguelo a su portafolio. ¿Cuál es la cantidad media de personas pobres por entidad federal: la Mediana. Grupal Cooperativo 80 . el Eje Medio? 2. se aplicó una encuesta con el fin de conocer la edad de los habitantes de una comunidad y encontraron los siguientes datos 77 34 18 44 63 41 84 58 38 58 54 53 52 51 59 62 54 63 56 62 36 62 26 50 Calcule el Primer Cuartil e interprete. Tercer Cuartil y Eje Medio. 3. Comunitaria  Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II).Nueva Esparta Delta Amacuro Amazonas 49. 4. De acuerdo a los valores descritos en el cuadro. Rango Medio. ¿Qué medidas tomaría para ir disminuyendo el número de personas en pobreza extrema que se encuentran en las grandes entidades federales?  Durante un diagnóstico realizado en una comunidad de los paramos del Estado Mérida.713 27. Diga cuál de las promedios refleja la realidad de las personas pobres extremos. Mediana. ¿la Media de las personas en pobreza extrema está afectada por algunas entidades federales? ¿Es la mejor medida? 4. 2. el Rango Medio. Primer Cuartil.

Mediana y Moda. Tiempo (en minutos) 1-3 4-6 7-9 10-12 13-15 16-18 Número de personas 4 8 16 9 5 2 Determine e interprete la Media Aritmética. TEMA 3 4. Mediana. y diga algunas conclusiones. Tercer Cuartil. la Mediana. organizados en una distribución de frecuencias. Primer Cuartil. Los sueldos de una muestra de la población de Caracas revelaron los siguientes datos.) 100-199 200-299 300-399 400-499 500-599 600-699 700-799 800-899 900-999 • • • • Número de personas 616 125 151 80 20 48 25 7 2 Determine Media Aritmética. Moda. Sueldo (Miles de Bs. Interprete las medidas anteriores.6 Medidas de Dispersión Las Medidas de Tendencia Central carecen de significación por sí solas pues de nada vale conocer únicamente el comportamiento central de una serie de valores si se desconoce la manera como se alejan o se acercan esos valores con 81 .  Se tiene de una muestra de los tiempos que necesitaron 42 personas de una cooperativa para ensamblar un armario. la Moda y el Primer Cuartil. ¿Qué sueldo menor en promedio gana el 50% de la población? Compare Media Aritmética.

y como ambas vienen expresadas en las mismas unidades de medición. La dispersión será mayor o menor de acuerdo a la magnitud de esas diferencias. Las respectivas formulaciones son: Para N observaciones ordenadas o n datos simples: R = xN – x1 = Xn – X1 82 . o restando el límite inferior de la ultima clase menos el límite superior de la primera clase cuando tenemos datos agrupados en k clases. RECORRIDO U OSCILACIÓN TOTAL AMPLITUD TOTAL. La más importante entre las medidas de dispersión relativa es la del Coeficiente de Variación. Controlándola Se obtiene restando el valor más bajo del valor más alto de un conjunto de N observaciones. o que tengan un mismo valor para una medida de dispersión absoluta pero habiendo a la vez distinta variabilidad de sus respectivas observaciones o datos con respecto a una medida de tendencia central. domesticamos al azar y aprendemos a vivir bajo incertidumbre. los resultados que obtenemos por las Medidas de Tendencia Central tienen mayor significado con la ayuda de las Medidas de Dispersión o Variabilidad. Las Medidas de Dispersión se dividen en dos grupos. la Varianza y la Desviación Estándar. Este hecho nos permite comparar la dispersión en dos o más conjuntos de datos para determinar el que tiene mayor o menor dispersión. En el primer caso. la comparación sería imposible en caso de haber dos conjuntos con distintas unidades de medición. Lo anterior implica la necesidad de caracterizar numéricamente la dispersión. las cuales son complemento de aquellas y determinan la homogeneidad o heterogeneidad de los conjuntos de datos referidos a un valor de tendencia central tomado como referencia. al comparar la serie de N observaciones con los n datos simples. y sólo hacen referencia al conjunto en cuestión.respecto a un valor representativo de estos y obtenido calculando la apropiada medida de tendencia central. Sin estas medidas de dispersión relativa.  Medidas de Dispersión Absoluta: sus valores vienen expresados en las mismas unidades de medición del conjunto de observaciones o datos a ser estudiado. Por lo tanto. las medidas de dispersión relativa asumen valores abstractos o porcentuales. la cual se entiende como la manera en que los valores de una serie difieren unos de otros.  Medidas de Dispersión Relativa: sus valores se obtienen de los cocientes fraccionales entre medidas de dispersión absoluta y de tendencia central. La variabilidad no se puede eliminar pero sí reducir. Las medidas más importantes son el Rango. tenemos que X1 = x1 y Xn = xN. 1) RANGO.

y por otra parte para un mismo problema el Rango aumenta o queda igual con el número de observaciones pero no disminuye en ningún caso. Las desventajas de esta medida están en que no utiliza todas las observaciones sino dos de estas. 101. ¿Cuándo debe usarse el Rango en cualquiera de los casos anteriores? El Rango se usa cuando las observaciones o datos son muy escasos o demasiado dispersos. 2) O TÍPICA VARIANZA Y DESVIACIÓN ESTÁNDAR 83 . tenemos que x1 = 97 y xN = x5 = 106. Con el Rango la variabilidad se puede expresar en un sólo número. No da una idea verdadera de la concentración de los valores. 106. se puede ver muy afectada por alguna observación extrema hasta el punto de perder importancia como medida de dispersión cuando los valores extremos son muy lejanos. listas para embarcarse a Francia son: 102. Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa.Para datos agrupados en k clases: R = Lsk – Li1 Vemos que el Rango representa la medida del mayor espacio en que se encuentran todos los valores de una distribución. a) Se ordenan e identifican las observaciones de menor a mayor. y por tanto estos difieren mucho de los valores extremos. x1 97 b) x2 x3 x4 x5 101 102 103 106 Se busca el menor y el mayor valor del conjunto observaciones. Para las N = 5 observaciones ya ordenadas. Determine el Rango. 97. R = xN – x1 = x5 – x1 = 106 – 97 = 9 Interpretación: La variación de los pesos con respecto a todos los pesos de la caja es de 9 Kg. además que esa medida es útil para conocer los valores extremos o la dispersión total. c) Se obtiene el Rango. y 103. habiendo casos en los que se obtienen intervalos exagerados cuando la distribución tiene una concentración en un espacio reducido.

es necesaria pero no suficiente la concepción del rango como una sola diferencia o distancia de dos valores. S2 = ∑ (x N j =1 j − X) 2 N . Todas esas diferencias o desvíos se promedian en su totalidad mediante expresiones cuadráticas cuya justificación matemática escapa al alcance de los objetivos de este Unidad. son más exactas que el simple promedio de esas diferencias. j =1 n 84 . también ocurre lo mismo entre las formulaciones anteriores y las siguientes para tales datos.Para medir mejor la dispersión de los datos en términos de su totalidad. es más práctico y razonable considerar las diferencias o desvíos entre cada uno de estos valores y una medida de tendencia central que sirva de referencia. esas expresiones son numéricamente muy precisas y útiles para representar la dispersión y para su posterior uso en Estadística Inferencial. y por eso se le aplica la operación matemática de la raíz cuadrada para obtener la Desviación Estándar. Tal como veremos ahora. Sin embargo. siendo pertinente ampliar el alcance de esta idea a los valores restantes para que todos (y no dos) se vean reflejados o influyan en una medida de dispersión. siendo este un valor medido en las mismas unidades simples en que los datos vienen dados. la Varianza viene dada en unidades cuadráticas. obviando sus verdaderos signos) para las observaciones o datos. Se escoge la Media Aritmética pues es aquella medida de tendencia central que equilibra a todas las observaciones y no solamente a dos. Además. teniendo en cuenta que N = ∑f j . y que aparece en cualquier libro de Estadística pero no lo estudiaremos en la presente Guía Didáctica. Como no tendría sentido tomar en cuenta todas las diferencias posibles (aunque sean tomadas positivamente como distancias. 2. el cual es un valor que se denomina Desviación Media.1) Varianza y Desviación Estándar para una Distribución de Datos Simples Para una serie de N observaciones ordenadas tenemos las respectivas formulaciones para la Varianza S2 y la Desviación Estándar S que daremos a continuación. S = S2 = ∑ (x N j =1 j − X) 2 N Así como coinciden la Media de una serie de N observaciones y la Media de una distribución de frecuencias para n datos simples asociados a dichas observaciones.

S = S2 = ∑ f ⋅ (X n j =1 j j − X) 2 N Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa.8 ≈ 102 Kg.. Para el cálculo de esas medidas. Determinemos la Varianza y la Desviación Estándar. 97. b) La Columna II contiene las desviaciones respecto a la Media. 5 5 La Columna III se obtiene elevando al cuadrado cada valor de la columna II. de las cajas de frutas. y 103. listas para embarcarse a Francia son: 102. 106. 101. realizaremos los siguientes pasos con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarán la obtención de estas medidas. + x 5 5 97 + 101 + 102 + 103 + 106 509 = = 101. La Media es: a) X = X = c) ∑x j =1 5 j 5 = x 1 + x 2 + .S2 = ∑ fj ⋅(Xi − X ) j =1 n 2 N . que se obtienen restando de la columna I el valor de la Media o promedio para cada valor de la columna I.. La Columna I representa los N = 5 pesos en Kg. I x x1 = 97 x2 = 101 x3 = 102 x4 = 103 x5 = 106 Total: 509 II x −X x 1 − X = -5 x 2 − X = -1 x3 − X = 0 x4 − X = 1 x5 − X = 4 ( x1 − X ) 2 ( x2 − X )2 (x − X ) ( x4 − X )2 (x − X ) 2 3 2 5 (x − X ) III 2 = 23 =1 =0 =1 = 18 Total: 43 d) La Varianza S2 es el resultado de dividir el total de la Columna III entre el número N de observaciones. 85 .

escogidos al azar. y la Varianza S2 y la Desviación j =1 k Estándar S tienen las respectivas formulaciones: S2 = ∑ F ⋅ ( Xm j =1 j k i − X) 2 N . 5 e) Ahora hallaremos la Desviación Estándar S. recordemos que N = ∑F j . Estancia en el hospital (en días) 1-3 4-6 Número de pacientes 18 90 86 . Interpretación: La diferencia con respecto al peso promedio de 102 Kg.S2 = ∑(x 5 j =1 j − X) 2 5 S2 = ( 97 − 102) 2 + (101− 102) 2 + (102 − 102) 2 + (103 − 102) 2 + (106 − 102) 2 5 S2 = 43 = 8. S = S2 = ∑ (x 5 j =1 j − X) 2 N = 8. 2.6 ≈ 9 Kg2.2) Varianza y Desviación Estándar para una Distribución de Datos Agrupados Si tenemos una distribución de frecuencias para datos agrupados en k clases.6 = 2.93 Kg. ≈ 3 Kg. se quedaron en el hospital después de una operación. S = S2 = ∑ F ⋅ ( Xm k j =1 j j − X) 2 N Ejemplo: El administrador del un hospital público hizo una investigación acerca del número de días que 200 pacientes. correspondientes a las 5 cajas es de aproximadamente 3 Kg.

c) La Columna III se obtiene restando el valor de la Media o promedio con cada valor de la Columna I. X = d) ∑F j =1 8 j ⋅ Xm j = 200 F1 ⋅ Xm1 + F2 ⋅ Xm2 + .7-9 10-12 13-15 16-18 19-21 22-24 44 21 9 9 4 5 Para el cálculo de la Varianza y la Desviación Estándar realizaremos los siguientes pasos.125 200 4. IV V I II III 2 2 ( Xm − X ) Xm F F ⋅ ( Xm − X ) Xm − X Xm 1 − X = -6 Xm1 = 2 F1 = 18 36 648 Xm 2 − X = -3 Xm2 = 5 F2 = 90 9 810 Xm 3 − X = 0 Xm3 = 8 F3 = 44 0 0 Xm 4 − X = 3 Xm4 = 11 F4 = 21 9 189 Xm 5 − X = 6 Xm5 = 14 F5 = 9 36 324 Xm 6 − X = 9 Xm6 = 17 F6 = 9 81 729 Xm 7 − X = 12 Xm7 = 20 F7 = 4 144 576 Xm 8 − X = 15 Xm8 = 23 F8 = 5 225 1...71 ≈ 8 días 5 La Columna IV se obtiene elevando al cuadrado cada valor de la Columna III. e) Intervalos de Clases 1–3 4–6 7–9 10 – 12 13 – 15 16 – 18 19 – 21 22 – 24 Total f) 87 . con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarán la obtención de estas medidas. b) La Columna II contiene la cantidad de pacientes atendidos según la cantidad de días que permanecieron en el hospital. + F8 ⋅ Xm8 = 7. La Columna V se obtiene multiplicando la Columna IV por la Columna II.401 La Varianza S2 es el resultado de dividir el total de la Columna V entre el número total de pacientes. a) La Columna I representa el número promedio de días de estancia en el hospital por cada una de las k = 8 clases.

y para un conjunto de n datos X1.. Además. respectivamente. ….401 = = 22 días2.. por lo menos t = intervalo ( X – m⋅ S. es de aproximadamente 5 días. también válida para distribuciones de datos agrupados pues sólo se requiere conocer la Media y la Desviación Estándar para su aplicación. En consecuencia. 2. y ambas se basan en los desvíos de los datos con respecto a la Media. son muy sensibles ante la presencia de datos extremos pues en esencia son medias o promedios de otra especie. entonces S2 y S tomarán valores muy elevados. S = S2 = ∑ F ⋅ ( Xm 8 j =1 j j − X) 2 200 = 22 = 4. el valor de la Desviación Estándar está en relación directa con la dispersión de los datos. entonces todos los datos coinciden con la Media y S2 = S = 0. Xn. La utilidad de esta regla radica en que permite determinar unos límites para acotar o enmarcar una parte de los datos en su dispersión con respecto a la Media. correspondientes a las 200 estadías de los pacientes. Ejemplo: 1    1 − 2  × 100% de los datos se encuentran en el  m  88 . pues a mayor o menor dispersión de estos hay mayor o menor Desviación Estándar.3) Regla de Tchebishev Esta regla dice que para m = 2. + F j ⋅ ( Xm8 − X ) 2 2 2 200 S2 = g) 648 + 810 + 0 + 189 + 324 + 729 + 576 + 1. o sea. es decir.69 ≈ 5 días Interpretación: La diferencia respecto al número promedio de 8 días.125 4. dentro de m desviaciones de la Desviación Estándar S con respecto de la Media X . Nota: La Varianza S2 sirve para hallar la Desviación Estándar S. Si algunos datos están muy alejados de la Media. Si no existe variabilidad.S = 2 ∑ F ⋅ ( Xm 8 j =1 j j −X) 2 200 = F1 ⋅ ( Xm1 − X ) + F2 ⋅ ( Xm2 − X ) + . 3. y en otro caso S2 > 0 y S > 0. 200 200 Ahora hallaremos la Desviación Estándar S. X + m⋅ S).

tenemos que los datos son: 102.. Ejemplo: En una fábrica venezolana X la Media y Desviación Estándar de los salarios es de Bs 102 y Bs 11. Siendo que n = 5. En una fábrica colombiana Y la Media y Desviación Estándar de los salarios es de $ 230 y $ 54. entonces tenemos que por lo menos n⋅ t = 3. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medición. 97.8 y su Desviación Estándar es S = 2.Para el problema de los pesos de las cajas de frutas.58. Para m = 2 tenemos que por lo menos t = intervalo (95. 3) 3  1 =  1 − 2  × 1 0 0 % × 100% 4  2  = 75% de los datos deben estar en el COEFICIENTE DE VARIACIÓN Tanto para datos simples como agrupados. Su Media es X = 101. como por ejemplo Kilogramos y Centímetros. La formulación es CV = S × 100%. SY = 54 CVY = SY 54 ×100% = × 100% = 23. y a su vez son menores que 106. lo cual se cumple con creces pues en realidad allí están todos los datos. Interpretación: Hay por lo menos 4 cajas de frutas cuyos respectivos pesos son mayores a 95.94 ≈ 96 Kg. respectivamente. el Coeficiente de Variación CV es igual al cociente entre la Desviación Estándar y la Media.47% Y 230 Interpretación: La fábrica colombiana Y tiene mayor variación en los salarios que la fábrica venezolana X. Entonces: Fábrica venezolana X X = 102.93. y 103. 106. y multiplicando ese cociente por cien para ser expresado en porcentaje. 101.94 y menores que 106. ser mayores que 95.58). respectivamente.94 . SX = 11 CVX = SX 11 ×100% = × 100% = 10.78% X 102 Fábrica colombiana Y Y = 230. es decir. 89 . 106.75 ≈ 4 datos están en ese intervalo.58 ≈ 107 Kg. X Esta medida se emplea fundamentalmente con el objeto de: 1.

Ejemplo: En una empresa X la Media de los salarios es de Bs. 14. 3. respectivamente. y SY = 2. Entonces: Empresa X = 3. En una empresa Y la Media de los salarios es de Bs.. ¿cuál de los dos cursos es más consistente y cuál tiene la Media más representativa? Tenemos que: Curso de Matemáticas X = 12.800 Empresa Y = 14.5 90 . pero ambos grupos pueden tener igual o similar grado de dispersión.800 y la Desviación Estándar es de Bs. aunque tienen similar dispersión. Por otra parte. Determinar si cierta Media es consistente u homogénea con cierta Desviación Estándar. lo cual expresaremos en la siguiente escala. y puesto que en un mismo curso hay dos puntuaciones de distinta especie. Comparar dos grupos de datos con iguales unidades de medición.. CV 0% a 10% 11% a 15% 16% a 25% 26% o más Interpretación Muy homogéneo Homogéneo Heterogéneo Muy heterogéneo Ejemplo: En una sección de educación básica.10% X 3. SY = 130 Y CVY = SY 130 ×100% = × 100% = 0.500 con una Desviación Estándar de Bs. 42. y en los que la Media y Desviación Estándar de uno de los grupos son diferentes para el otro. Igualmente. SY = 2. SX = 2 Curso de Física Y = 14. 130.5 Pts.2.89% Y 14. sea X la variable que indica las notas del curso de Matemáticas.500. cuya Media y Desviación Estándar son Y = 14 Pts.500 Interpretación: La empresa Y tiene menor variación en los salarios que la empresa X.800. cuya Media y Desviación Estándar son X = 12 Pts y SX = 2 Pts. SX = 42 X CVX = SX 42 ×100% = × 100% = 1. sea Y la variable que indica las notas del curso de Física. pueden haber valores similares para el par de Medias y el par de Desviaciones. pero los grupos tienen muy alejados grados de dispersión. y entre SX y SY. 3. respectivamente. Dada la similitud entre X y Y .

Grupal Cooperativo  Para cada uno de los ejercicios siguientes. Índice 100-119 120-139 140-159 160-179 180-199 200-219 Número de productos 5 7 9 16 10 3 3. 6. por lo que la Media más representativa es la del curso de Matemáticas. determine e interprete el Rango.CVX = SX 2 ×100 = × 100 = 16. 3.7 ACTIVIDADES Individual  Lea con cuidado los contenidos presentados en relación a las medidas de dispersión para datos simples (no agrupados) y agrupados. Resuelve los siguientes ejercicios: 1. Consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema. Los datos se organizaron en la tabla siguiente. 10.85% Y 14 Interpretación: El curso de Matemáticas es más homogéneo que el curso de Física. la Desviación Estándar y el Coeficiente de Variación. 0. A continuación tenemos las ganancias semanales de un grupo de 20 taxistas (expresadas en miles de bolívares).67% X 12 CVY = SY 2. 91 . Como es mayor la dispersión relativa CVY de los datos en el curso de Física. 1 y 2. El Departamento de Control de Calidad de una afamada marca de atún mide con un índice la calidad de su producto. 2. Se observa que CVX = CVY. 4. la Varianza. Una muestra de archivos personales de ocho empleados de una alcaldía indicó que durante un período de seis meses tuvieron el siguiente número de inasistencias: 2. esto quiere decir que las calificaciones en Matemáticas se haya más concentrada alrededor de la Media en comparación a las de la otra materia. 4.5 ×100 = × 100 = 17. Así mismo. establezca una conclusión al menos acerca de la dispersión.

147 185 95 92 93 115 127 126 143 157 101 93 123 133 83 51 135 125 129 132 92 .

COMPETENCIAS: 1) Definir el concepto de probabilidad. 7) Seleccionar el tamaño de la muestra requerido para la estimación de la media y de la proporción de una población. En todas las situaciones un elemento común a estas es la presencia de la incertidumbre. La probabilidad de una imposibilidad es 0. Ejemplo: La probabilidad de que el sol salga mañana es muy alta. La probabilidad de un evento es medida por valores comprendidos entre 0 y 1. 2) Calcular el tamaño de un espacio muestral dado. es decir. muy cercana a 1. la probabilidad de que apruebes este curso sin estudiar está al otro extremo. 6) Construir intervalos de confianza para estimar la media y la proporción de una población. 5) Mencionar y explicar los métodos de muestreo probabilística. está cercana a 0.UNIDAD V: INTRODUCCIÒN ESTIMACIÓN A LA PROBABILIDAD. 93 . Mientras mayor sea la probabilidad de que ocurra un evento. su valor asignado estará más próximo a 1. 3) Mencionar y explicar cómo se calculan probabilidades de acuerdo a cada uno de los tres planteamientos de probabilidad. La noción de azar se presenta cuando no se puede predecir con certeza el resultado de un determinado Fenómeno Aleatorio. MUESTREO Y OBJETIVO: Calcular e interpretar probabilidades asociadas a un evento aleatorio dado y seleccionar una muestra de una población dada como medio para estimar ciertos parámetros poblacionales.1 ¿Qué es Probabilidad? La Probabilidad es la posibilidad numérica de que ocurra un evento. 4) Definir población y muestra. CONTENIDO: TEMA 1 5. 8) Uso del paquete computacional SPSS (entre otros) para el cálculo de estimadores. siendo aquel hecho que bajo ciertas condiciones puede ocurrir o dejar de suceder. lo que conduce al estudio profundo de las ideas anteriores a través de un área de las Matemáticas denominada Teoría de la Probabilidad.

la Teoría de la Probabilidad actúa desde la población hacia la muestra.2 Experimento Aleatorio Un Experimento es un proceso por medio del cual se obtiene una observación. Supone un mayor o menor grado de incertidumbre. ambos serían los puntos maestrales y podríamos tomar Ω = {B. El proceso de lanzamiento de la moneda es un experimento aleatorio. el resultado puede ser cara o sello. jamás se podrá predecir el resultado que se va a obtener ya que puede ocurrir más de uno que sea posible. Así. 5.Esta rama del conocimiento es el vehículo que le permite al investigador en Estadística usar la información contenida en una muestra para hacer inferencia o para describir la población de la cual se ha obtenido la muestra. Cada resultado del experimento (o elemento del Espacio Muestral) se denomina Punto Muestral. dato o medición. y lo que deseamos es hacer inferencias acerca de la población. Un Experimento Aleatorio es aquel que se caracteriza por dar resultados inciertos porque al repetirlo bajo análogas condiciones. Si denotamos por B cuando es artículo es bueno y por D cuando es defectuoso. Supongamos que la población es conocida y nos interesa calcular la probabilidad de observar una muestra particular. Exactamente lo opuesto es cierto en los problemas estadísticos cuando asumimos que la población es desconocida y la muestra es conocida. y lo podemos denotar con la letra griega “Ω” (omega) o con la letra mayúscula E. Ejemplo: Si lanzamos una moneda al aire. 94 .3 Espacio Muestral (de un experimento aleatorio) Es el conjunto de todos los resultados posibles del experimento. Ejemplo: En un proceso de fabricación extraemos un artículo elegido entre los artículos fabricados y observamos si es o no es defectuoso. moviéndose de la muestra hacia la población. pero no sabemos de antemano cual de ello va a salir. D}. 5. mientras que la Estadística actúa opuestamente. En el caso contrario al antes descrito estamos en presencia de un Experimento Determinista.

Luego. Por lo tanto. 2. tal como veremos luego. esta es igualmente válida para poblaciones y muestras. el resto de los planteamientos a estudiarse en la Unidad III estarán referidos a poblaciones. S = {1. Debido a las múltiples aplicaciones que tiene la Teoría de la Probabilidad en la vida cotidiana.5 Los Modelos de Probabilidad En la antigüedad se denominaba probable a lo que según las apariencias puede ser declarado verdadero o cierto. 6} Cada uno de los seis posibles resultados del lanzamiento viene siendo un punto muestral. por lo que la probabilidad posee grados según su acercamiento o alejamiento de la certidumbre (certeza). 3. el cálculo de Probabilidades es útil para la Estadística Inferencial. 5. existen cuatro modelos para su cálculo: 95 . un suceso particular ocurrirá si ocurre cualquier punto muestral de dicho suceso. Recordando las consideraciones hechas sobre ambos conceptos en el Módulo I de la Unidad I. La Probabilidad ocupa un lugar importante en la toma de decisiones puesto que permite proyectar (inferir) resultados de un evento determinado. 5. Como un suceso es una colección específica de puntos maestrales. 5. Así cómo existen espacios maestrales finitos.Otro ejemplo: El espacio muestral S del experimento de lanzar un dado está dado por las seis caras de este. Por ejemplo. también existen los que son infinitos. En el campo de la Estadística. la Probabilidad puede ser Subjetiva (un juicio probable) u Objetiva (un acontecimiento probable). lanzamos un dardo hacia un tablero y hay una extensión continua de puntos donde puede caer. Estas ideas de probabilidad y azar dieron origen a la Teoría de la Probabilidad como disciplina de carácter matemático.4.4 Suceso o Evento de un Experimento Aleatorio Es un subconjunto del espacio muestral que se caracteriza por ser resultado de un experimento aleatorio. Se representa por una letra mayúscula. debido al carácter amplio y general de la Probabilidad. Esto permitió dar un valor numérico a la probabilidad de ocurrencia o no ocurrencia de un acontecimiento o resultado.

se utiliza la siguiente fórmula: P(A) = Ejemplo: Número de veces que ha ocurrido el evento en el pasado Número total de observacio nes 96 . La probabilidad clásica de un evento A se determina mediante la Regla de Laplace.33%. expresada así: P(A) = Número de casos posibles para el Espacio Muestral Ω El numerador de esa expresión es la cantidad de elementos o puntos maestrales que conforman al suceso A. y estima la probabilidad de que el evento ocurra nuevamente con base a su comportamiento histórico ya investigado. Ejemplo: Sea el experimento aleatorio de lanzar un dado una vez.2 El Modelo Empírico o de Frecuencia Relativa Utiliza datos que se han observado empíricamente en una investigación estadística. 3. tenemos P(A) =  2 1 = = 0. 4}. Para calcular la probabilidad de un evento A aplicando este modelo. 4. el cual tiene éxito si el resultado del experimento es la cara 3 y 4. 2.5.3333… = 33.5. 6} y el evento A = {3. Aquí se supone que los sucesos elementales son equiprobables. 5. Se relaciona con los juegos de azar y las apuestas. Tomando el espacio muestral Ω = {1. Modelo Clásico (a priori)  Modelo Empírico o de Frecuencia Relativa (a posteriori)  Modelo Subjetivo 5. 6 3 Número de casos favorables para el Evento A 5.3 =0. registra la frecuencia con que ha ocurrido un evento en el pasado. y el denominador es la cantidad total de elementos pertenecientes al espacio muestral Ω .1 El Modelo Clásico Fija la probabilidad sin depender de ninguna experiencia y por lo tanto no está apoyada en ninguna inferencia inductiva.

66% 30 Este modelo se usa esencialmente en distribuciones de frecuencias para datos estudiados en Estadística. por lo que es útil el siguiente resumen comparativo de conceptos estadísticos y probabilísticas.3 El Modelo Subjetivo Se utiliza cuando no hay datos históricos disponibles y sólo se cuenta con opiniones o criterios subjetivos. Es una relación cuasilógica y el valor numérico asociado a ella representa un grado de creencia subjetiva expresada en un juicio probable. Conceptos Empíricos (Estadísticos) Población Muestra Frecuencia relativa Variable Estadística Histograma de Frecuencia Relativa Histograma de Frecuencia Relativa Acumulada Características Estadísticas (Estadísticos) 5. y su Conceptos Teóricos (Probabilísticos) Espacio Muestral Suceso Probabilidad Variable Aleatoria Curva de Probabilidad Curva de Distribución Características (Parámetros) Probabilísticas 97 . Por otra parte.5. en base a ciertas reglas el individuo asigna probabilidades a los sucesos elementales. ¿Cuál es la probabilidad de que una mujer sea elegida a la Presidencia de la República Bolivariana de Venezuela? En cierto modo se puede considerar el enfoque de este modelo como una generalización de la probabilidad obtenida a partir de una frecuencia en una serie larga de pruebas. Aquí la probabilidad representa una relación entre una proposición y un cuerpo de evidencia. siendo que algunos de estos últimos serán estudiados más adelante en los próximos módulos.16 = 0. Por ejemplo. y aquellas servirán para hallar las probabilidades de otros sucesos en base a las mismas reglas. ¿Cuál es la probabilidad de que falte este mes que tiene 30 días? P (Falta) = 5  = 0.1666… = 16. más que pensar en la repetición de un experimento y en su frecuencia. el individuo hace comparaciones entre la situación en que se encuentra (que no necesariamente se va a repetir) y las situaciones típicas caracterizadas por el azar. En esa interpretación personal de la probabilidad. en un gran número de aplicaciones usuales de las probabilidades. pero no es una relación puramente lógica.Alicia faltó 5 veces a clases el mes pasado. y también a partir de situaciones en que la información que dispone un individuo es más incompleta y precaria.

garantizándose que la muestra seleccionada sea representativa de la población de origen para no tener que trabajar con la totalidad de esta y controlar los errores cometidos en su estudio. una población infinita contiene una infinidad de elementos. 5. A menos que se indique lo contrario. Una población es finita si consta de un número finito o fijo de elementos.6 Muestreo El Muestreo es el conjunto de procedimientos que nos permite diseñar la muestra más apropiada para un experimento o investigación. etc. esta debe ser representativa de la población de la cual se obtuvo.5. medidas u observaciones. Los objetivos del muestreo son:  Realizar estimaciones de valores de una población a partir de las medidas obtenidas de la muestra.3 del Unidad I de la Unidad I. Para que una muestra sea aceptable.  Interpretar las estimaciones de manera precisa. porcentajes. A diferencia de las poblaciones finitas. Todo esto es objeto de estudio de la Teoría de Muestreo.). TEMA 2 5. y también debe existir la posibilidad de medir la confiabilidad de las estimaciones obtenidas de la muestra (totales. tenemos el conjunto de calificaciones obtenidas en una sección de estudiantes de la UBV que cursan Análisis del Dato Estadístico.  Calcular medidas de confiabilidad de esas estimaciones. Por ejemplo. al menos hipotéticamente.2 y 1.6 Población y Muestra Los conceptos de Población y Muestra fueron estudiados en las Secciones 1. Se aconseja el muestreo en los siguientes casos: 98 . Por ejemplo. las poblaciones a ser estudiadas aquí son finitas. al igual que las razones que justifican el uso de las muestras se analizaron en la Sección 1.interpretación se hace planteando la analogía o comparación entre ambos tipos de sucesos. La muestra es representativa si posee todas las características de la población en la misma proporción en que se encuentran manifiestan en el seno de esta. promedios. cuando medimos el peso de los habitantes de una comunidad.

Las ventajas del muestreo son:  Economía y rapidez en su realización.  Existe la creencia de que las investigaciones sobre la población ofrecen un margen más sólido y eficiente de exactitud que los resultados obtenidos de una muestra. Algunas veces se hace uso de la Teoría Combinatoria para obtener determinado tipo de muestras.  Mayor rapidez de procesamiento y presentación de resultados. antes de recopilar cualquier dato.  Presenta el error de muestreo y otros ajenos a ese proceso.  Ahorro de dinero si la muestra es representativa pues en tal caso no hay necesidad de trabajar con todos los elementos de la población. formación y control de personal. Las limitaciones del muestreo son:  No permite hacer cálculos. 1) Muestreo Probabilístico y no Probabilístico 99 .  Más alcance en la investigación.  Dificultad de la tabulación cruzada de algunas características.  Cuando el proceso de investigación de las características de una población sea destructivo. el tipo de muestreo a desarrollar se clasifica en función de las características de la población y del criterio de selección previamente determinado en una investigación. Cuando la población es infinita o muy grande de tal forma que resulte muy difícil su enumeración total.  Más confiabilidad de los datos obtenidos en base a la posibilidad de controlar más fácilmente las informaciones recopiladas. 5.  Se requiere una alta preparación estadístico-matemática de muestrista. un Diseño de una Muestra es un plan definitivo determinado por completo.6 Clasificación del Muestreo En Estadística. Enmarcado dentro del proceso del diseño.  Más entrenamiento.  Menos personal y recursos.  En poblaciones muy homogéneas tales que la muestra represente con fidelidad a la población. con el fin de tomar posteriormente una muestra de una población de referencia.  Fácil verificación posterior en base al diseño utilizado. tabulaciones o proyecciones con respecto a áreas o pequeños grupos.

Este tipo de muestreo es el más sencillo y usado. el cual es mucho más confiable. N! M   maneras de obtener una muestra de tamaño M de una  N  3) Muestreo Aleatorio Simple Es un procedimiento de muestreo probabilístico mediante el cual extraemos de una población una muestra representativa de la misma. y donde cada elemento de la población tiene la misma posibilidad de ser incluido en la muestra. si la selección de los elementos de la muestra se realiza aleatoriamente. 2) Muestreo con y sin Reemplazo Tenemos un Muestreo con Reemplazo cuando cada elemento de la población puede elegirse más de una vez. Aleatorio Simple y Sistemático. N Un muestro probabilística o aleatorio puede ser sin Reemplazo. en una Muestra sin Reemplazo el elemento seleccionado para integrar la muestra deja de ser seleccionable al no poder elegirse más de una vez. En cambio. Esto ocurre cuando cada elemento seleccionado se vuelve a regresar a la población de la cual se extrajo después de anotar sus características en un instrumento al aplicarle alguna técnica de recolección de información. Al contrario. y la probabilidad de elegir así una muestra es = N! ⋅( M − N )! . Por lo tanto la población es agotable y por supuesto finita. será 1/N la probabilidad de ser escogido cada elemento para formar parte de la muestra sin importar el tamaño de esta. si la población tiene N elementos y la muestra es de M elementos. la probabilidad que tiene cada elemento de la población de integrar esa muestra es M .El Muestreo no Probabilístico es aquel donde la selección no se hace al azar sino el criterio del investigador. A menudo suele presentar grandes sesgos y por esa razón es poco fiable. entonces se está haciendo un Muestreo Probabilístico o Aleatorio. y se aplica para poblaciones que en la práctica se consideran infinitas o inagotables. independientemente de la opinión del investigador. Es decir. es decir. una vez extraído no se regresa a la población. Aquí cambia la probabilidad de selección de cada elemento que formará la muestra. Para este caso. Este tipo de muestreo no es probabilístico. de ser N el tamaño de la población. A este tipo de muestreo se le suele llamar Irrestrictamente Aleatorio. 100 . En este caso. En términos de probabilidad. hay   M    N    −1 población de tamaño N.

se mantendrá la misma proporción en la muestra. Si para cada estrato se obtiene una muestra aleatoria simple. Esencialmente. El verdadero riesgo del muestreo sistemático yace en la posible presencia de periodicidades ocultas y la obtención de resultados sesgados o parcializados. el muestreo sistemático tiende a ser más preciso que el aleatorio simple al cubrir más homogéneamente toda la población. procedimiento que consiste en dividir a la población en una cantidad de sub-poblaciones o estratos que no se mezclen y en la que en cada uno sus elementos sean los más parecidos entre sí. podemos mejorar el muestreo aleatorio por medio de la estratificación. 6) Muestreo por Conglomerados Se divide la población total en un número determinado de subdivisiones relativamente pequeñas y se seleccionar al azar algunos 101 . y que en cada uno de los estrato separados haya tanta homogeneidad como sea posible. y luego de hacer esa distribución se toma una muestra de cada estrato. el objetivo de la estratificación es formar estratos de tal forma que haya una relación entre un estrato particular y la respuesta que se busca en el estudio estadístico.4) Muestreo Sistemático Es cuando los elementos de la población están ordenados por listas. Esto último se hace a fin de disminuir la variabilidad de la población y de buscar mayor homogeneidad dentro de cada estrato. Se elige un individuo al azar y a continuación se eligen todos los demás a intervalos constantes hasta completar la muestra. y siendo esa información importante para nuestra investigación. Si el orden de los elementos es tal que los individuos próximos tienden a ser más semejantes que los alejados. A veces este tipo de muestreo no es necesariamente aleatorio. Si tenemos información acerca de la constitución o composición de una población. 5) Muestreo Estratificado Es cuando nos interesa que la muestra tenga la misma composición a la de la población cuando esta se divide en clases o estratos. el procedimiento completo (primero la estratificación y luego el muestreo aleatorio) se conoce como Muestreo Aleatorio Simple Estratificado. Ejemplo: Si en una población el 20% son mujeres y el 80% hombres.

102 . este también se llama Muestreo por Áreas.elementos de esas subdivisiones o conglomerados para incluirlos en la muestra general. Si los conglomerados son subdivisiones geográficas.

Caracas. 5. 9. Apuntes de Estadística para Biólogos. LIND. F. ARIAS. SENIGNI. J. 11. N. Bogotá. Métodos Estadísticos en Educación. Mérida. México.BIBLIOGRAFÍA BÁSICA 1. P. R. 3. Madrid. Probabilidad y Estadística. 2. J. S. McGraw-Hill Interamericana. 4. Estadística. Caracas. Ediciones del Vicerrectorado Académico de la Universidad Central de Venezuela.998. G. Métodos de Graficación. Y MARSHALL. 1. Editorial Espasa-Calpe SA. 2. Editorial Prentice-Hall Hispanoamericana. R. Caracas.994. D. México. J. Elementos de Demografía. Elementos de Probabilidad. 2. 2. TAPINOS..003. G. Estadística Aplicada: Problemario. SCHILLER Y SRINIVASAN. McGraw-Hill Interamericana. Caracas. Irwin MacGraw Hill. D. 1. México. 2. El proyecto de Investigación. 12. 1. Caracas.000. México. HAMDAM. A. MASON. COMPLEMENTARIA 1.001.004. Estadística Elemental. 1. ORTEGA. Volumen I y II. Caracas. S.994. G.004. Estadística para Administración y Economía. ANDERSON.001. CENAMEC.999. 103 . Sociedad Fondo Editorial Dirección de 2. 2. BAUCE. 8. 2.001. Ediciones de la Biblioteca de la Universidad Central de Venezuela.982. SOTO. FREUND. FUENLABRADA DE LA VEGA. 1. 10. W. Probabilidad y Estadística. Y SIMON. A. ALSON. SPIEGEL. Iniciación a la Estadística. Editorial José Martí.. International Thomson. 7. Editorial Erro. 6. Publicaciones ULA. 1.998.

Editora Principios. México. MCCOLLOUGH.bcv.973. J. Introducción a la Estadística. 1. SALAMA. 11. Estadística Social. 13. WALPOLE.html http://www. McGraw Hill Interamericana.982. Ediciones. 1.ve http://www.euler. Bogotá. C. Métodos Estadísticos Aplicados a las Ciencias Sociales. Estadística General. 9.net/cursecon/2/dem. 1. Y STANLEY.2. VIRTUAL Adicionalmente a los libros antes mencionados. 1.968. 1.asp 104 . 6. México. y RAYMOND. O. CRÁMER. WAYNE.968. Fondo de Cultura Económica.A. A Y RICHARD. W. Estadística con aplicaciones a las Ciencias Sociales y la Educación. 10.005). Caracas. McGraw Hill Interamericana. Ediciones de la Biblioteca de la Universidad Central de Venezuela.eclac.ve/ine/indexine. McGraw-Hill Interamericana.987. 8. G. 1. Fondo Educativo 5. M. Caracas.998. 1.996. D. GLASS. Estadística: Metodología y aplicaciones. 4. Ediciones de la Biblioteca de la Universidad Central de Venezuela. Aguilar 3. Madrid. R. H. Estadística General. McGraw Interamericana. R. 1.cl/celade http://www.ciens. Madrid. 7. Análisis Estadístico para la Educación y las Ciencias Sociales. H.ve/gl-autor. 1.ucv. Probabilidad y Estadística. E. Elementos de la Teoría de Probabilidades. Introducción a la Probabilidad y la Estadística. S. Editorial Prentice-Hall Internacional.faces.eumed.972.org. 1. Caracas.974. LINCOYÁN. RIVAS. California. HABER. 1. GONZÁLEZ. México. Wadsworth Internacional Iberoamericana. México.966. Interamericano.htm http://www.ucv. se recomiendan las siguientes páginas web de Internet (año 2. Introducción a la Geoestadística. México. D.ine. 12.992. R. MENDENHALL. 1. BLALOCK.981.ve http://www.gov. http://www.

platino.gov.uned.htm 105 .ve http://www.http://www.es/111044/p104a.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->