Está en la página 1de 41

Estadística y Probabilidad

Ing. Cinthia Flores 0


Estadística y Probabilidad
UNIDAD 1: ESTADÍSTICA
Introducción
En la vida cotidiana se presentan fenómenos que requieren del empleo de una serie de tablas, medidas,
gráficas, de su análisis e interpretación para comprenderlos, lo cual nos lleva a plantearnos una serie de
interrogantes. Para poder responder esos interrogantes es necesaria la Estadística, la cual día a día va ganando
mayores adeptos, convirtiéndose en un método efectivo para describir con exactitud los valores y datos de
situaciones problemáticas de las distintas ciencias agrícolas, biológicas, de salud, económicas, educativas, físicas,
políticas, psicológicas, sociales, etcétera.
Se llama Estadística a la rama de las matemáticas que se sirve de un conjunto de métodos, normas, reglas y
principios para la observación, toma, organización, descripción, presentación y análisis del comportamiento de
un grupo de datos para la conclusión sobre un experimento o fenómeno.
¿En qué áreas se aplica la estadística?
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología,
Administración, Economía, Medicina, Ciencias Políticas entre otras.
Ejemplos de su aplicación son:
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos
de los consumidores a través de encuestas de presupuestos familiares.
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante
sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por
ejemplo los test que se aplican a los candidatos para un cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la
población.
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer
predicciones sobre ellas.
La informática tiene un papel fundamental en las ciencias de la estadística, las computadoras han facilitado
el trabajo en este campo ya que han mostrado su capacidad para ejecutar cálculos rápidos y mucho más precisos
de los que puede realizar un técnico humano. Con el uso de la informática se hace posible que los investigadores
dediquen más tiempo a mejorar la calidad de los datos originales y la interpretación de los resultados.

Estadística. Conceptos.
La Estadística es una colección de métodos para planear experimentos, obtener datos, y después organizar,
resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004).
Otra definición considera a la Estadística como una disciplina perteneciente a la Matemática Aplicada que
se dedica al estudio cuantitativo de fenómenos colectivos. Proporciona los métodos para:
 La recolección de datos
 Su ordenamiento, resumen y presentación,
 Su análisis e interpretación y
 Posterior enunciado de conclusiones.
Los cuatro pasos que se han enumerado constituyen las etapas del trabajo estadístico.

Página 1 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
La primera etapa tiene como objetivo recolectar datos proveniente de medición, conteo u observación
efectuado sobre el material objeto de estudio en base a un plan formulado según los principios del diseño
experimental y las técnicas de muestreo.
La segunda etapa consiste en ordenar los datos en tablas estadísticas, presentarlos mediante gráficos y
diagramas y resumirlos a través del cálculo de promedios, porcentajes e índices.
En la tercera etapa se analizan los resultados obtenidos en la etapa anterior, y comienzan a distinguirse las
características del fenómeno, lo que permite utilizar diferentes métodos para analizarlos e interpretarlos.
En la última etapa se debe concluir acerca del estudio realizado.
Si las conclusiones, se refieren exclusivamente a los datos de los que se dispone (una parte de la población
que se desea estudiar), se dice que la Estadística es Descriptiva.
Si por el contrario, las conclusiones van más allá de los datos que se dispone y se refieren a un conjunto
mayor (población), del cual se extrajeron, se dice que la Estadística es Inferencial; las conclusiones van de lo
particular (muestra) a lo general (la población).Esta se basa en el estudio de la teoría de probabilidades que nos
permite medir el error de nuestras afirmaciones.
Las estadísticas (en plural) se obtienen como resultado del trabajo estadístico y están constituidas por
porcentajes, promedios, tablas, gráficos y otros elementos que describen un fenómeno y ayudan a su
comprensión (Ej.: estadísticas demográficas, estadísticas del fútbol, estadísticas de accidentes de tránsito,
estadísticas universitarias, etc.).

Veamos dos ejemplos que nos aclaren estos dos tipos de Estadística:
Ejemplo 1: Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las elecciones generales, es muy frecuente que
los medios de comunicación, nos adelanten los resultados de encuestas o sondeos en los que se nos indica el resultado final
de dichas elecciones con una precisión y con un error determinado. Estos sondeos son realizados por distintas técnicas sobre
un grupo (muestra) más o menos numeroso de personas. Naturalmente, cuanto mayor sea el número de argentinos con
derecho a voto encuestados, mayor será la fiabilidad de la encuesta, pero también mayor será el coste del sondeo. El estudio
de esta muestra se haría mediante estadística descriptiva, pero lo que nos interesa no es el resultado de este estudio
reducido sino el resultado final de las elecciones. El paso de generalizar los resultados de la muestra a toda la población, se
hace mediante técnicas de Estadística inferencial. La elección de la muestra debe hacerse mediante métodos de muestreo
para que el estudio resulte lo más fiable posible.
Ejemplo 2. Supongamos que estamos en un instituto con un número muy elevado de alumnos y alumnas, por ejemplo
1500, y queremos hacer un estudio estadístico sobre su altura.
Un método sería pasar clase por clase y medirlos a todos, esto nos podría llevar un tiempo considerable pero sería la
forma más exacta de hacer dicho estudio, aunque es fácil encontrarnos con ausencias y tendríamos que volver varios días y
pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos todos los datos en nuestro poder los
resultados los obtendríamos mediante Estadística descriptiva.
Otra posibilidad podría ser pasar clase por clase, decirles a los alumnos y alumnas que anoten su estatura en un papel y
recogerlos todos. También así tendríamos un estudio de Estadística descriptiva, aunque seguramente menos fiable que con
el método anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos alumnos escriban su estatura a cálculo
y otros, con ganas de bromas, muy por encima o muy por debajo de la realidad.
Y otra posibilidad sería escoger una muestra, es decir un grupo de por ejemplo 50 personas, hacer el estudio descriptivo
sobre ellas y después generalizarlo a todo el instituto con Estadística inferencial. En este caso, comprobaríamos por una
parte que cuanto mayor sea la muestra más trabajo tendremos, pero más fiable será el resultado final y por otra, que la
elección de la muestra debe hacerse de manera que permita también fiarnos del resultado obtenido. Si estamos en segundo
de bachillerato, ¿podríamos coger como muestra los 50 alumnos de este curso? ¿Por qué? ¿Qué forma de elegir la muestra
se te ocurre?

Página 2 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
A lo largo de esta materia abordaremos la ESTADÍSTICA DESCRIPTIVA

Método Estadístico
El Método Estadístico es un conjunto de procedimientos que se emplean para describir y determinar las
características de las series de datos, relativas a los fenómenos reales.
El método estadístico contempla los siguientes pasos:

PLANIFICACIÓN Y DEFINICIÓN DEL PROBLEMA

RECOPILACIÓN DE LOS DATOS

ORGANIZACIÓN DE LOS DATOS

ANÁLISIS DE LAS SERIES DE DATOS

PRESENTACIÓN DE RESULTADOS

FORMULACIÓN DE CONCLUSIONES

ETAPAS DEL ESTUDIO ESTADÍSTICO


Un estudio estadístico se lleva a cabo siguiendo las etapas del método estadístico, estas etapas son:

Página 3 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
1) Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o
población.
2) Recolección de la información: consiste en obtener los datos necesarios relacionados al problema de
investigación.
3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en
el estudio.
4) Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos
analizados para obtener conclusiones generales.
5) Formular conclusiones: consiste en verificar la validez de los supuestos del modelo que nos han
permitido interpretar los datos y llegar a conclusiones sobre la población

Desarrollo de cada etapa:


Etapa 1: Planteamiento del problema:
El primer paso de la investigación es definir claramente los objetivos del estudio relacionar este objetivo con los
valores numéricos de las variables observables. La investigación científica es una actividad con propósito, y como
tal, para quedar enteramente caracterizado, debe dar respuesta a las siguientes interrogantes:
a) ¿Qué se quiere conocer?
b) ¿Por qué se plantea la investigación?
c) ¿Cómo se va a investigar?
d) ¿Dónde se va a realizar la investigación?
e) ¿Cuándo se va a realizar la investigación?
Definición de objetivos:
Tareas:
 Identificación de las características cualitativas o cuantitativas que se desean estudiar.

Página 4 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
 Fijación de la población portadora de las características a investigar.
 Identificación del marco o listado de unidades poblacionales, especificando sus soportes (magnético,
papel, documento, etc.) y su accesibilidad.
 Decisión de si la investigación va a ser censal o muestral, determinando el tamaño de la muestra y el
presupuesto necesario (ver SISTEMAS DE RECOLECCIÓN).
 Especificación del ámbito de estudio y la forma de recoger los datos: entrevistas personales, por correo,
por teléfono y mixtas.
Etapa 2: Recolección de la información:
La recolección correcta de datos, es de extrema importancia, comprende la recolección de información y
fundamentalmente los principales métodos y procedimientos que se usan para recolectar información necesaria para el
estudio determinado. Es el momento en el cual el investigador se pone en contacto con los sujetos, objetos o elementos
sometidos a estudios con el propósito de obtener los datos o respuestas de las variables consideradas; a partir de estos
datos se prepara la información estadística y se calcula las medidas de resumen e indicadores para el análisis estadístico.

Para recoger la información se toma los siguientes datos:


1. Las fuentes de información.
2. Los sistemas de recolección.
3. Y las técnicas de recolección
1. Fuente de Información.-
Es el lugar, la institución o persona donde están los datos que se necesitan para cada una de las variables o
aspectos de la investigación .Las fuentes de información son:
1.1- Fuentes Primarias:
Cuando los datos se obtienen directamente de la misma persona o entidad utilizando ciertas técnicas.
Ejemplo: Llevar a cabo una encuesta para conocer el grado de satisfacción laboral en los trabajadores
de una empresa.
1.2- Fuentes Secundarias:
Cuando los datos ya han sido elaborados y procesados por otras personas o instituciones.
Ejemplo: La información estadística que publica el INDEC.
2. Sistema de recolección.
Son procedimientos que se utilizan para recoger información son:
2.1- Los Registros:
Son libros, padrones en donde se anotan en forma regular permanente y obligatorio los hechos ocurridos.
Ejemplo: Registros Civiles, Registros públicos, etc.
2.2- Las Encuestas:
Son procedimientos de obtención de información estructurada según criterios previos de sistematiza-ción
que se efectúan con un propósito específico en la población o en un sector de ella. Pueden se:
2.2.1- Encuesta Censal:
Cuando abarca toda la población en estudio.
Ejemplo: Censos de población y vivienda de una localidad o país.
2.2.2- Encuesta Muestral:
Cuando abarca una parte de la población en estudio.
Ejemplo: Llevar a cabo una encuesta de preferencia electoral.
3. Técnicas de Recolección.-

Página 5 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Son procedimientos que se utilizan para recolectar información según la naturaleza del trabajo de investigación
y son:
3.1- La Observación:
Es la acción de mirar con rigor, en forma sistemática y profunda, con el interés de descubrir la importancia
de aquello que se observa.
3.2- El Cuestionario:
Es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas que se
formulan al encuestado o entrevistado con el propósito de obtener datos de las variables consideradas en
estudio.

Como se construye un cuestionario.-


Se toman los siguientes puntos:
a) Introducción.
¿Quién nos encargó el estudio, el carácter anónimo de las respuestas, etc.?
b) Preguntas
Aquí se ponen las siguientes palabras:
- Preguntas de identificación (sexo, edad, etc.)
- Preguntas sencillas para introducir las más complejas y luego terminar con las sencillas.
- Facilitar la transición de un tema a otro en el cuestionario.
- Evitar muchas preguntas abiertas.
c) Elaborar o decidir sobre los aspectos formales
d) Preparar determinados elementos decisorios.
- Carta de presentación o currículum de los encuestadores
e) Formar a los encuestadores y elaborar una guía de instrucciones para realizar el cuestionario.
f) Hacer un PRETEST.- prueba del cuestionario antes de su lanzamiento definitivo, tiene por objeto ver si
se entiende las preguntas, si hay problemas en la redacción, y siempre tiene que hacerse. No interesan
los resultados de este PRETEST.
g) Codificar el cuestionario.

Tipos de preguntas de un cuestionario.-


Cualquiera que sea el método por el que se decida el investigador para recabar información, es necesario
elaborar un estudio de preguntas.
Los cuestionarios en general, constan de las siguientes partes:
a.- La identificación del cuestionario: nombre de la encuesta, número del cuestionario, nombre del
encuestador, lugar y fecha de la entrevista.
b.- Datos de identificación: apellidos, nombres, cédula de identidad, nacionalidad, sexo, edad o fecha de
nacimiento, estado civil, grado de instrucción, ocupación actual, ingresos, etc.
c.- Datos propios de la investigación: son los datos que interesa conocer para construir el propósito de la
investigación.
También se pueden hacer las siguientes preguntas:
- Preguntas abiertas.
- Preguntas cerradas.
- Preguntas mixtas.

Página 6 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
3.3- La Entrevista:
Es un dialogo entre personas, es una técnica donde una persona llamada
entrevistador, encuestador o empadronador solicita al entrevistado le proporcione
algunos datos e información.
Tipos de entrevistas:
 Entrevista cerrada
 Entrevista con profundidad
 Entrevista semiestructurada.
3.3- La Encuesta:
 Las encuestas son una de las escasas técnicas de que se dispone para el estudio
de las actitudes, valores, creencia y motivos.
 Las técnicas de encuesta se adaptan a todo tipo de información y a cualquier
población.
 Las encuestas permiten recuperar información sobre sucesos acontecidos a los
entrevistados.
 Las encuestas permiten estandarizar los datos para un análisis posterior, obteniendo gran cantidad de datos
a un precio bajo y en un período de tiempo corto.
Tipo de encuestas:
 Encuestas exhaustivas y parciales.
 Encuestas directas e indirectas.
 Encuestas de opinión.
 Encuesta sobre hechos.
Diferencia entre cuestionario, entrevista y encuesta:

CUESTIONARIO ENTREVISTA ENCUESTA

•Es una serie de preguntas que •Es un serie de preguntas que •Es una pregunta específica
se le hacen a cualquier se le hace a una sola persona y sobre cualquier tema que se le
persona y pueden tratar uno o que casi siempre se relacionan hace a mucha gente con el fin
varios temas dentro de un con un hecho o de obtener alguna estadística
mismo cuestionario. acontecimiento. o para saber la opinión de la
gente sobre algún tema.

Los errores que se pueden presentar en la recolección de datos son:


• En el observador
• En el método de observación
• En el objeto o individuo observado
ETAPA 3: Análisis descriptivo
Los métodos de Análisis Exploratorio o Estadística Descriptiva ayudan a comprender la estructura de los
datos, de manera de detectar tanto un patrón de comportamiento general como apartamientos del mismo. Una
forma de realizar esto es mediante gráficos de sencilla realización e interpretación.
Otra forma de describir los datos es resumiendo los datos en uno, dos o más números que caractericen al
conjunto de datos con fidelidad. Explorar los datos permitirá detectar datos erróneos o inesperados y nos
ayudará a decidir qué métodos estadísticos pueden ser empleados en etapas posteriores del análisis de manera
de obtener conclusiones válidas.
Página 7 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Organización y presentación de datos:
En el trabajo estadístico, siempre se dispone de muchos datos que, definitivamente tienen que ser clasificados,
ordenados y presentados adecuadamente, de tal manera que facilite la comprensión, descripción y análisis del
fenómeno estudiado, y obtener conclusiones válidas para la toma de decisiones.
Pasos para la organización y presentación de los datos:
La organización y presentación de los datos estadísticos, supone realizar los siguientes pasos:

1) Evaluación y crítica:
Consiste en inspeccionar la validez y confiabilidad de los datos, para corregir los errores y omisiones de
acuerdo a ciertas reglas fijas.
2) Codificación:
Técnica mediante la cual los datos se convierten en un número y que permite su procesamiento
electrónico.
3) Clasificación:
Consiste en establecer las categorías de las variables.
4) Procesamiento o tabulación de datos
Es la contabilización o registro del número de casos en cada una de las categorías de la variable.
El plan de tabulación es el primer ordenamiento de los datos, son para construir las llamadas “tablas
estadísticas”.
5) Presentación de los datos
Donde los resultados de la tabulación, una vez evaluados, se presentan en cuadros y gráficos
estadísticos. La presentación implica tener la información estadística organizada para proceder al análisis e
interpretación de los resultados y de los aspectos considerados de la población en estudio.
ETAPA 4: Inferencia estadística:
Finalmente, la Inferencia Estadística nos permite tanto hacer predicciones y estimaciones como decidir entre
dos hipótesis opuestas relativas a la población de la cual provienen los datos (test de hipótesis).
La calidad de las estimaciones puede ser muy variada y están afectadas por errores.
La ventaja de los métodos estadísticos es que, aplicados sobre datos obtenidos a partir de muestras aleatorias,
permiten cuantificar el error que podemos cometer en una estimación o calcular la probabilidad de cometer un
error al tomar una decisión en un test de hipótesis.
ETAPA 5: Formular conclusiones
Como vimos anteriormente la Estadística es una ciencia matemática que se utiliza para describir, analizar e
interpretar ciertas características de un conjunto de individuos llamado población. Cuando nos referimos a
muestra y población hablamos de conceptos relativos pero estrechamente ligados (ver conceptos básicos). Una
población es un todo y una muestra es una fracción o segmento de ese todo.
Podemos dividir la estadística en dos ramas; la estadística descriptiva, que se dedica a los métodos de
recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio; y la
estadística inferencial, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión.
La estadística trata en primer lugar, de acumular la masa de datos numéricos provenientes de la observación
de multitud de fenómenos, procesándolos de forma razonable. Mediante la teoría de la probabilidad analiza y

Página 8 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
explora la estructura matemática subyacente al fenómeno del que estos datos provienen y, trata de sacar
conclusiones y predicciones que ayuden al mejor aprovechamiento del fenómeno.

Página 9 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
CONCEPTOS BÁSICOS:
Individuo
Son las entidades acerca de las que se reúnen datos. Es cada uno de los elementos que forman parte de la
población o de la muestra.
Por ejemplo:
1) si se evalúa la memoria de los aspirantes a un puesto de
mozo en el restaurante X, las unidades son cada uno de los
aspirantes.
2) Si se estudia el fenómeno de deserción escolar de las
escuelas primarias públicas de Lomas de Zamora, las
unidades son cada una de las escuelas de dicha región.
3) Si a un comerciante le interesa el volumen de ventas
semanal de su comercio durante el último año, las
unidades son cada una de las semanas de ese año.

Población:
Se le llama Población a la cantidad total de cualquier conjunto completo de datos, objetos, individuos o
resultados que tengan alguna característica en común que se va a observar o analizar en un problema o
experimento.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cárdenas
(1974).
Ejemplos:
1) el conjunto de aspirantes al empleo del restaurante X,
2) el conjunto de escuelas primarias públicas de Salta Capital
3) el conjunto de semanas a lo largo del último año.

Una Población puede ser:


 Finita: cuando existe una cantidad determinada de elementos por analizar; esto es, una cantidad de
elementos, numerable y que en determinado momento finaliza.
Ejemplo:

a) Los habitantes del municipio de Chicoana.


 Infinita cuando existe una cantidad indeterminada de elementos por analizar; es decir, una cantidad de
elementos que aunque los enumeráramos nunca terminaríamos de hacerlo.
Ejemplo:
1. Los valores de temperatura durante un día.
2. Todos los puntos de una línea.
3. Número de alumnos del Instituto del Milagro del presente y en el futuro.

Muestra:
Cualquier subconjunto de la población. Este subconjunto es muy importante que sea representativo de la
población.
Ejemplos:
1) los cinco primeros aspirantes entrevistados;
2) las escuelas nro. 12, 16, 17, 23, 34, 55, 62, 70, 84 y 97 de Salta Capital;

Página 10 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
3) las semanas 1, 6, 12, 19, 27, 36 y 46 del último año.

Muestreo:
Se llama Muestreo al estudio que se hace de una población por medio de muestras representativas,
debidamente elegidas de manera que posea todas las características de una población y de tamaño determinado
según la precisión que de ella se quiere obtener en las decisiones y conclusiones estadísticas posteriores.
Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a
la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.

Experimento:
Se le llama Experimento a toda acción o prueba que se realiza con el fin de observar su resultado.
Datos estadísticos:
Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en las personas y
objetos en los cuales se produce el fenómeno que queremos estudiar. Dicho en otras palabras, son los
antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias
de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es muy difícil en general, obtener
conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rápida información
con propósitos de descripción o análisis, estos deben organizarse de una manera sistemática; es decir, se
requiere que los datos sean clasificados. Esta clasificación u organización puede muy bien hacerse antes de la
recopilación
Clasificación de los datos
Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos.

 Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad.

 Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son
datos cuantitativos.
 Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los
datos son reconocidos como cronológicos.
 Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen que son datos
geográficos.

Variables definición y clasificación


Al hacer un estudio de una determinada población, observamos una característica o propiedad de sus
elementos o individuos. Por ejemplo, con los alumnos y alumnas de nuestra clase, podemos estudiar el lugar de
residencia, el número de hermanos, la estatura, etc. Cada una de estas características estudiadas se llama
variable estadística. Aunque este es el concepto que vamos a utilizar, también reciben el nombre de carácter
estadístico.

Página 11 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad

Ejemplos
 Número de hijos en cada familia de un barrio de la ciudad
 Número de PCs de la sala de cómputo
CUANTITIVAS

DISCRETAS
VARIABLES

 La cantidad de alumnos por grupo


 El peso de una persona
CONTINUA  La cantidad de azúcar para endulzar un café
 La temperatura ambiental durante un día
NOMINALES  La nacionalidad de una persona, idioma, sexo, himnos nacionales.
 El estado de salud de una persona; que podemos ordenarla según la
CUALITATIVAS
VARIABLES

urgencia del caso.


 El color de algún objeto según la tonalidad desde muy clara a más oscuro;
ORDINALES
que podemos ordenarlo de acuerdo a la intensidad del color
 El grado militar
 Puesto en la empresa
Ejemplo de Tipo de Variables y sus datos:
VARIABLES TIPO DATOS
Edad (años) Cuantitativa 18; 30; 50
Sexo Cualitativa nominal M; F; M
Nivel educacional Cualitativa ordinal Primaria, Universitario; Secundario
Nª de cargas familiares Cuantitativa discreta 1; 2; 3
Ingreso ($) Cuantitativa continua $ 10.000; $19.500; $ 13.000
Peso (kg) Cuantitativa continua 75,3; 68,4; 79,5

Página 12 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Distribución de frecuencias
La distribución de frecuencias es un método para organizar y resumir datos en una tabla estadística.
TABLAS DE FRCUENCIAS
DISTRIBUCIÓN
Una distribución de frecuencias constituye una tabla en el ámbito de investigación
La distribución de frecuencias puede ser simple o agrupada.
La distribución de frecuencias simple es una tabla que se construye con base en los siguientes datos: clase o
variable (valores numéricos) en orden descendente o ascendente, tabulaciones o marcas de recuento y
frecuencia.
La distribución de frecuencias agrupadas o acumulada es una tabla que contiene las columnas siguientes:
intervalo de clase, puntos medios, tabulación frecuencias y frecuencias agrupadas.
DITRIBUCIÓN DE FRECUENCIAS SIMPLE

EJEMPLO A:
Se preguntó a un grupo de 50 alumnos de Ingeniería Industrial su materia preferida.

EJEMPLO B:

Se preguntó a un grupo de 35 alumnos su


estatura en cm.

Página 13 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
DITRIBUCIÓN DE FRECUENCIAS AGRUPADAS

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman
un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase
se le asigna su frecuencia correspondiente.
Definiciones a tener en cuenta:
Rango o recorrido de datos:
Es la diferencia entre el mayor y el menor de los datos.
Tamaño de la muestra
Representa la cantidad de datos recolectados.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo
para el cálculo de algunos parámetros. Una de las maneras de calcularla es promediando los valores límite
de cada intervalo, su fórmula es:

Construcción de una tabla de datos agrupados


Ejemplo: se ha recolectado los pesos (en Kg) de personas:
63 62 60 58 60 62 63 61 60 55
60 62 63 62 61 59 61 62 65 60
58 62 63 60 56 63 62 58 54 63
64 61 56 59 61 59 65 62 61 63
Elabora una tabla de distribución de frecuencia con intervalos
Paso 1: Ordenar los datos (este paso se puede obviar y directamente empezar por el paso 2)
54 55 56 56 58 58 58 59 59 59
60 60 60 60 60 60 61 61 61 61
61 61 62 62 62 62 62 62 62 62
63 63 63 63 63 63 63 64 65 65
Paso 2: Obtener el dato menor y el dato mayor
Xmin = 54 (valor mínimo)
Xmax = 65(valor máximo)
Paso 3: Determinar el tamaño de la muestra, que sería la cantidad de datos de la muestra. En este caso sería:
Tamaño de la muestra = 40
Paso 4: Calcular el Rango o Recorrido

Página 14 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Rango = Xmax - Xmin
Rango = 65 – 54 = 11
Rango = 11
Paso 5: Determinar el Número de clases o la Cantidad de Intervalos
Para determinar el número de clases existen diferentes formas. En nuestro caso utilizaremos la Regla de
Sturgess.
Para calcular la cantidad de clases necesarias en nuestra distribución se utiliza la siguiente fórmula

k = 1 + 3.322 log n
Donde n es el tamaño de la muestra, el valor de k debe ser un número entero, por lo tanto, siempre se debe
redondear al número entero próximo.
En nuestro ejemplo sería:
𝑘 = 1 + 3.322 𝑙𝑜𝑔 𝟒𝟎
𝑘 = 6,3220
En base a esto determinamos que el número de intervalos más conveniente es
𝒌=𝟔
Paso 6: Calcular la amplitud de cada clase (A).
Para la amplitud se realiza lo siguiente:

𝑅𝑎𝑛𝑔𝑜
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑐𝑙𝑎𝑠𝑒 =
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠

𝑹
𝑨=
𝒌
Ejemplo:
𝟏𝟏
𝑨= → 𝑨 = 𝟏, 𝟖𝟑𝟑𝟑 …
𝟔
Nuevamente redondeamos el número a su entero más próximo:
𝑨=𝟐
Paso 7: Construir la Tabla de Distribución de Frecuencia Agrupadas

 Repasemos los datos que tenemos hasta ahora:


Formación del intervalo
Li= 54
Número de Clases = 6 Amplitud de la clase = 2 Ls = 54 + 2 = 56
(2 es la amplitud)
 Debemos formar los intervalos de cada clase para ello algunos autores
sugieren que:
CLASE INTERVALO
• Límite inferior de la clase es el menor valor de cada intervalo se denota por
Li. Este límite se sugiere sea cerrado (símbolo que se utiliza corchetes), lo 1 [54;56)
que significa que dicho valor pertenece al intervalo. 2 [56;58)
• Límite superior de la clase es el mayor valor de cada intervalo se denota
por LS. Se sugiere que sea abierto (símbolo que se utiliza paréntesis); el 3 [58;60)

valor indica un límite pero no pertenece al intervalo. 4 [60;62)

Distribución de frecuencias para datos agrupados en intervalos 5 [62;64)

Hasta aquí hemos construido la Tabla de distribución de frecuencia con los 6 [64;66)

intervalos. Faltaría completar esta tabla con los distintos tipos de frecuencias, que pueden ser:
Los tipos de frecuencia pueden ser:

Página 15 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
- Frecuencia Absoluta (f).- Es el número de veces que se repite el de cada variable. La suma de frecuencias
absolutas es siempre al total de datos observados.
- Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre la frecuencia
absoluta y el número total de datos. La suma de las frecuencias relativas es siempre 1

- Frecuencia Acumulada (fa).- Indica el número de que son menores o iguales que el valor dado. Es la suma de
la frecuencia absoluta primera con la segunda, este valor con la tercera, y así sucesivamente.
- Frecuencia Relativa Acumulada (fra).- Es la suma de la frecuencia relativa primera con la segunda, este valor
con la tercera, y así sucesivamente.
- Frecuencia Relativa Porcentual (f%).- Llamada también frecuencia porcentual. Se obtiene multiplicando la
frecuencia relativa por 100. La suma de las frecuencias porcentuales es siempre 100%. Se calcula así:

- Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores que son menores o iguales
que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada por 100. Se calcula así:

+
=
𝟐

Frecuencia
Frecuencia Frecuencia
Frecuencia Frecuencia Frecuencia Relativa
Relativa Relativa
Absoluta Relativa Acumulada Acumulada
Acumulada Porcentual
CLASE INTERVALO MARCA DE CLASE Porcentual

fr f% fra,%
f fa fra
(f/n) (fr * 100) (fra * 100)

1 [54;56) 55 2 0,05 2 0,05 5 5

2 [56;58) 57 2 0,05 4 0,1 5 10

3 [58;60) 59 6 0,15 10 0,25 15 25

4 [60;62) 61 12 0,3 22 0,55 30 55

5 [62;64) 63 15 0,375 37 0,925 37,5 92,5

6 [64;66) 65 3 0,075 40 1 7,5 100

TOTAL 40 1 100

REPRESENTACIÓN GRÁFICA DE LOS DATOS


En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias de las tablas que
resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la finalidad informativa
que se persigue, se transmiten los resultados de los análisis de forma rápida, directa y comprensible para un
conjunto amplio de personas.
Un gráfico estadístico es una representación visual de una serie de datos estadísticos. Es una herramienta
muy eficaz, ya que un buen gráfico:
 Capta la atención del lector;
 Presenta la información de forma sencilla, clara y precisa;
Página 16 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
 No induce a error;
 Facilita la comparación de datos y destaca las tendencias y las diferencias;
 Ilustra el mensaje, tema o trama del texto al que acompaña.
Después de la Organización de los datos y su presentación en Tablas Estadísticas, la información contenida
en una tabla estadística también se puede presentar mediante gráficas, siendo las más comunes:
Para variables discretas (datos no agrupados) se utilizan:
o Gráfico de Barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes
cartesianos.
o Gráfico Circular o de pastel: dividen un círculo en porciones proporcionales según el valor de las
frecuencias relativas.
Para variables continuas (datos agrupados) se utilizan:
o Histograma: formas especiales de diagramas de barras para distribuciones cuantitativas continuas.
o Polígono de frecuencias: formados por líneas poligonales abiertas sobre un sistema de ejes
cartesianos.
o Ojiva: es el polígono frecuencial acumulado, es decir, que permite ver cuántas observaciones se
encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a
cada intervalo.
Estos gráficos no son los únicos para la presentación y análisis de datos estadísticos, pero si los más comunes
y utilizados.
Gráfico de Barras

Es un método gráfico que consta de:


Un Eje horizontal, en el que se representan los valores (Eje de los datos) utilizando barras verticales en
forma rectangular y de la misma amplitud,
Un Eje vertical, en el cual la frecuencia representa la altitud que tendrá la barra rectangular (Eje de las
frecuencias), las barras van separadas la misma distancia unas de otras y para distinguirlas puede
utilizarse distintos colores o entramados según se considere.
En un gráfico de barras se debe tener en cuenta:
 El empleo de sombreado o colores facilita la diferenciación de las barras.
 El punto cero se indica en el eje de ordenadas.
 En la rotulación de los ejes se utiliza tipografía legible.
 La leyenda se ubica dentro de los límites de la gráfica.
 La longitud de los ejes debe ser suficiente para acomodar la extensión de la barra.
 El pie de figura explica las bandas de error y los tamaños de las muestras.
Ejemplo:
Cierta universidad realizó un experimento sobre el coeficiente intelectual (C.I.) de sus alumnos, para lo cual aplicó
un examen de C.I. a un grupo de 20 alumnos escogidos al azar, obteniendo los siguientes resultados:

Página 17 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112,
112,106.
Toda vez que se tienen los datos, se ordenan de menor a mayor o viceversa.
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124,
124, 124
En base a estos datos construimos la Tabla de frecuencias

Luego realizamos el gráfico de barras:


1- En el Eje horizontal colocamos los datos.
2- En el Eje vertical se indica la frecuencia (repeticiones)

Gráfica Circular o de Pastel o también llamada del 100%

Este gráfico se utiliza fundamentalmente, para representar distribuciones de frecuencias relativas (es decir,
porcentajes % o proporciones) haciendo corresponder la medida de la frecuencia relativa con la medida del
ángulo en grados; es decir, si el 100 % de los datos son 360º de la circunferencia, a cada 1% le corresponderán
3.6º; así, para obtener la medida del ángulo del sector, multiplicamos la frecuencia correspondiente por 3.6º. Al
utilizar este gráfico se aconseja no sobrepasar los 10 elementos, y ordenar los sectores de acuerdo a una de dos
formas, ya sea siguiendo el orden que se les dé a los datos o empezando del mayor al menor segmento, iniciando
a partir de las 12 horas y en el sentido de las manecillas del reloj. Por último, si el texto que representa cada
sector no puede colocarse dentro del mismo, se elabora una leyenda que se coloca fuera del segmento, unidos
por una flecha.
Ejemplo: Usaremos el ejercicio de coeficiente intelectual
Página 18 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad

Histograma
Los histogramas son herramientas estadísticas que nos permiten visualizar gráficamente y rápidamente la
distribución de un estudio realizado, los histogramas son representaciones gráficas por medio de barras
verticales, de una distribución de frecuencias de una variable continua. Cada una de las barras refleja un
intervalo o clase y la altura de las barras representadas es proporcional a la frecuencia (número de veces) con
que aparecen los valores en cada uno de los intervalos.
Los histogramas también se le conocen con el nombre de "Diagramas de distribución de frecuencias".
Los Histogramas, son utilizados como una herramienta que ayuda en la toma de decisión para la resolución
de problemas, mediante el histograma se puede identificar las pautas de comportamiento del conjunto de los
datos y extraer conclusiones, así los histogramas la cual nos permite:
 Realizar un análisis de distribución de datos.
 Comprobar el grado de cumplimiento de las especificaciones.
 Evaluar la eficacia de las soluciones.
Se estima que por el tipo de información brindada y por la manera en que ésta es dispuesta, los histogramas
son de especial utilidad y eficacia para las ciencias sociales ya que permiten comparar datos sociales como los
resultados de un censo, la cantidad de mujeres y/o hombres en una comunidad, el nivel de analfabetismo o
mortandad infantil, etc.
Es una gráfica en forma de barras que consta de:
Un Eje Horizontal, llamado eje de la variable en observación, en donde situamos la base de una serie
de rectángulos o barras contiguas; es decir, que no van separadas, y que se rotula con los límites
inferiores de cada clase o intervalo excepto el último que deberá llevar también el límite superior,
centradas en la marca de clase.
Un eje vertical llamado eje de las frecuencias, en donde se miden las alturas que vienen dadas por la
frecuencia del intervalo que representa. Todos los intervalos deben tener la misma longitud.
Veámoslo a través de un ejemplo, cuando las amplitudes de los intervalos son iguales. Para ello construiremos
primero el cuadro de distribución de frecuencia correspondiente.

Página 19 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
EJEMPLO: Un grupo de investigadores pertenecientes a la secretaría de seguridad pública, tomó una muestra
aleatoria de las velocidades (km/h) registradas por 30 vehículos en el trayecto Salta – Güemes, con el fin de
establecer nuevos límites máximos de velocidad para una carretera. La muestra arrojo los datos siguientes:
90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108,
98, 118, 100, 106, 114, 100, 112, 106, 100, 115, 111, 105, 114, 97
Paso 1: Toda vez que se tienen los datos, se recomienda ordenarlos de menor a mayor o viceversa
90 90 95 95 96 97 98 98 99 99
100 100 100 100 104 105 106 106 108 111
112 112 114 114 114 115 116 118 119 120
A partir de allí obteneos el dato menor y el dato mayor
Xmin = 90 (valor mínimo) Xmax = 120(valor máximo)
Paso 2: Determinar el tamaño de la muestra, que sería la cantidad de datos de la muestra. En este caso sería:
Tamaño de la muestra = 30
Paso 3: Calcular el Rango o Recorrido
Rango = Xmax - Xmin
Rango = 120 – 90 = 11
Rango = 30
Paso 4: Determinar el Número de clases o la Cantidad de Intervalos.
En este caso utilizaremos la Regla de Sturgess. Recordemos que para calcular la cantidad de clases necesarias
en nuestra distribución se utiliza la siguiente fórmula
k = 1 + 3.322 log n
K = 1 + 3.3Log (30)
K =1+ 4.87 = 5.87
K≈6
Paso 5: Calcular la amplitud de cada clase (A).
𝟑𝟎
𝑨= = 𝟓
𝟔
Paso 6: Construir la Tabla de Distribución de Frecuencia Agrupadas
 Construimos los intervalos de cada clase, el primero de ellos inicia con 90 que es el extremo inferior que,
sumado a 5 obtenemos 95, que será el extremo superior; este extremo será el inferior del segundo intervalo;
y al sumar nuevamente la amplitud tendremos 100 que será el extremo superior y así sucesivamente hasta
completar los 6 intervalos., que se muestran en la tabla.
Nota: Los corchetes expresan que el valor extremo se incluye en el intervalo y los paréntesis dan a entender que
el valor extremo del intervalo no se incluye en el.
Para la construcción de distribuciones de frecuencias, contamos el número de datos que le corresponden a cada
intervalo; es decir obtenemos las frecuencias absolutas y de estas podemos generar los demás tipos de
frecuencias y presentarlas en una tabla de resumen como la que a continuación se muestra:

Página 20 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
MARCA DE fr f% fra %
CLASE INTERVALO f fa fra
CLASE (f/n) (fr * 100) (fra * 100)
1 [90;95) 92,5 2 0,07 2 0,07 7 7
2 [95;100) 97,5 8 0,27 10 0,34 27 34
3 [100;105) 102,5 5 0,17 15 0,51 17 51
4 [105;110) 107,5 4 0,13 19 0,64 13 64
5 [110;115) 112,5 6 0,20 25 0,84 20 84
6 [115;120) 117,5 5 0,17 30 1,00 17 100
TOTAL 30 1
Paso 7: Construir el gráfico
1. Construir los ejes del histograma, para construirlos seguiremos los siguientes criterios, en el eje horizontal
se colocan los valores de las marcas de clase y sobre el eje vertical se colocan los valores de las frecuencias.
2. Trazar los rectángulos correspondientes, una vez se hayan determinado los intervalos y sepamos cuántas
mediciones caen dentro de cada intervalo, deberemos poner los rectángulos en función de los ejes del
histograma.

Polígono de Frecuencias

Polígono de frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de un histograma
de frecuencia. Estos histogramas emplean columnas verticales para reflejar; el polígono de frecuencia es
realizado uniendo los puntos de mayor altura de estas columnas (punto donde se encuentra la Marca de Clase)
Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel que se forma a partir de
la unión de los distintos puntos medios (marca de clase) de las cimas de las columnas que configuran lo que
es un histograma de frecuencia. Este se caracteriza porque utiliza siempre lo que son columnas de tipo vertical
y porque nunca debe haber espacios entre lo
que son unas y otras. Histograma y Polígono de Frecuencia:
Velocidades en una carretera
9
Ejemplo: Graficamos el Polígono de frecuencia
8
de las Velocidades en una carretera:
7
6
5
4
3
2
1
0
87,5 92,5 97,5 102,5 107,5 112,5 117,5 122,5

Página 21 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad

Polígono de Frecuencia: Velocidades en una


9
carretera
8
7
6
5
4
3
2
1
0
87,5 92,5 97,5 102,5 107,5 112,5 117,5 122,5

Gráfico de Ojiva
Es un gráfico que igual al histograma y polígono de frecuencias se utiliza para el análisis y representación de
variables continuas, sólo que en vez de utilizar las frecuencias absolutas, por sus características se construye
uniendo con segmentos de recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar
como abscisa los límites superiores de cada intervalo (eje horizontal) y como ordenada las frecuencias
relativas acumuladas hasta cada intervalo representado (eje vertical). Existen dos tipos de ojivas, las llamadas
de mayor que, iniciando en la frecuencia más alta 1 hacia la más baja 0 y las llamadas de menor que, iniciando
en la frecuencia más baja 0 hacia la más alta
El gráfico ojiva representa mayor importancia cuando se trata de comparar las observaciones de una misma
característica en dos experimentos distintos, ya que no se puede ejecutar comparaciones sobre frecuencias
absolutas, es necesario una comparación sobre frecuencias relativa; además permite ver cuántas observaciones
se hallan por arriba o debajo de ciertos valores establecidos.
Ejemplo: Gráfico de Ojiva de las velocidades de una carretera

Gráfico de Ojiva: Velocidades en una


carretera
35
30
25
20
15
10
5
0
95 100 105 110 115 120

Sumatoria
La sumatoria o sumatorio es una operación matemática se emplea para representar la suma de muchos
o infinitos sumandos.

Página 22 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad

La expresión se lee: "sumatoria de Xi, donde i toma los valores de 1 a n".


La operación sumatoria se expresa con la letra griega sigma mayúscula Σ.
i es el valor inicial llamado límite inferior.
n es el valor final llamado límite superior.
Si la sumatoria abarca la totalidad de los valores, su expresión se puede simplificar:

Es frecuente el uso del operador sumatoria en Estadística.


La suma de las frecuencias absolutas se puede expresar como:

1.
Ejemplo
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla.

xi fi xi * fi
[10 ; 20) 15 1 15

[20 ; 30) 25 8 200

[30 ; 40) 35 10 350

[40 ; 50) 45 9 405

[50 ; 60) 55 8 440

[60 ; 70) 65 4 260

[70 ; 80) 75 2 150

∑fi = 42 ∑xi * fi = 1820

Medidas de centralización
Habitualmente necesitamos disponer de un valor numérico que represente la disparidad de datos de una
distribución de frecuencias. Estos valores son los llamados parámetros centrales o medidas de centralización, ya
que son valores "intermedios" que se sitúan alrededor del centro de la distribución.
El objetivo principal de las medidas de centralización es poder representar por medio de un solo número al
conjunto de datos, es decir, dan valores representativos de la distribución de frecuencias, situados en algún
lugar intermedio, alrededor del cual, se encuentran los otros valores. Nos indican dónde tienden a concentrarse
los valores.
Existen tres medidas de tendencia central generales, que son:
Media aritmética,

Página 23 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Mediana
Moda

MEDIDAS DE CENTRALIZACIÓN PARA DATOS NO AGRUPADOS

̅)
MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS (𝒙
∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖 Es
𝑥̅ = el
𝑛
Donde:
̅ = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑎
𝒙
∑= Sumatoria
x: es cada uno de los datos obtenidos de la muestra.
f: frecuencia absoluta
n: Número total de datos
cociente entre la suma de los valores y la cantidad de valores sumados.
Para calcular la media se suman todos los valores de los datos y se divide por el número total.

Ejemplo 1: Calcular la media aritmética de los números 10, 12, 36, 25, 58
Ejemplo 2: Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La
media de edad de estas personas será de:
21 + 32 + 15 + 59 + 60 + 61 + 64 + 60 + 71 + 80
𝑥̅ =
10
̅ = 𝟓𝟐 ñ𝒐
𝒙

VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMÉTICA


Ventajas
Es de fácil cálculo e interpretación sencilla. Es la más utilizada y es útil en muchos desarrollos
matemáticos.
Desventajas
La principal desventaja se presenta cuando alguno o los dos valores extremos de la muestra son
desproporcionados respecto al resto de los datos, sobre todo cuando éstos son poco
numerosos. En este caso la media se aleja de la realidad; es decir, deja de ser representativa de
los datos.

MEDIANA PARA DATOS NO AGRUPADOS (𝒙 ̃)


Es el “valor central” de la distribución ordenada de menor a mayor.
En esta medida, los datos u observaciones equidistantes o que se encuentran más en medio de todo el conjunto
de datos.
La mediana sería el valor que deja a la mitad de los datos por encima de dicho valor, y a la otra mitad por debajo,
es decir el 50 % por arriba y el 50% por debajo del conjunto de datos.
Cómo calcular la MEDIANA:
En los datos ordenados se aplica la siguiente relación, para encontrar la posición de los datos.
Página 24 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
𝑁
𝑀𝑒𝑡 =
2
En donde N = número total de datos

Entonces podemos tener sólo dos alternativas


a) El valor de la posición puede ser entero y lo único que debemos hacer es contar el número de lugares
que nos indica esta fórmula.
b) El valor de la posición nos da un valor decimal (.5) y entonces debemos: sumar los valores involucrados
y dividirlos entre 2. Por ejemplo; si tenemos los valores 5, 7, 8, 13 entonces la posición nos da 2.5 por que
tendremos que seleccionar a los números 7 y 8 para luego sumarlos (15) y dividirlos entre 2 (7.5)
Ejemplo 1: dado estos números:
3, 13, 7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29
Si los ordenamos queda:
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40, 56
Hay quince números. El del medio es el octavo número:
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40, 56
La mediana de este conjunto de valores es 23.
Ejemplo 2: PERO si hay una cantidad par de números la cosa cambia un poco.
En ese caso tenemos que encontrar el par central de números, y después calcular su valor medio. Esto se
hace simplemente sumándolos y dividiendo entre dos.
Lo vemos mejor con un ejemplo:
3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12, 56, 23, 29
Si ordenamos los números nos queda:
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56
Ahora hay catorce números así que no tenemos sólo uno en el medio, sino un par:
3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56
En este ejemplo los números intermedios son 21 y 23.
Para calcular el valor en medio de ellos, sumamos y dividimos entre 2:
21 + 23 = 44
44 ÷ 2 = 22 Así que la mediana en este ejemplo es 22.

VENTAJAS Y DESVENTAJAS DE LA MEDIANA


Ventajas
a) La Mediana no se ve afectada por los valores extremos, por lo que la podemos utilizar en
aquellos casos en que la media aritmética no es útil.
Ejemplo: Calculamos la mediana y la media de las siguientes series datos:

2 – 5 – 7 – 9 – 12 Md= 7 ̅= 7
𝒙

2 – 5 – 7 – 9 – 125 Md= 7 ̅= 29,6


𝒙

Desventajas
a) La más importante, es que no podemos hacer cálculos adicionales con la mediana.
b) No utiliza mucha información de un conjunto de datos.
c) Finalmente, al menos que dispongamos de una computadora o unos esclavos, no es fácil
ordenar un conjunto grande de números. En este caso, la mediana no es fácil de calcular.

Página 25 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
MODA PARA DATOS NO AGRUPADOS (𝑥 ̂)
Es el valor más frecuente.
En el caso de una variable no agrupada, es el valor de la variable que más se repite.
Ejemplo 1: Consideremos los siguientes datos
5, 21, 32, 59, 60, 60, 61, 64, 71, 80
̂ = 60 años. (Unimodal)
La moda será: 𝒙
Ejemplo 2: Determinar la moda del siguiente conjunto de datos
1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, 3, 4, 6, 3, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 6.
̂ = 3y4 (Bimodal)
𝒙
Ejemplo 2: Determinar la moda del siguiente conjunto de datos

1, 2, 3, 4, 5, 6, 7, 8, 9

En este caso, como ningún dato se repite será amodal. Gráficamente eso se puede reflejar mediante el análisis
de un histograma de frecuencias

En el caso de que la distribución o conjunto de datos tenga una moda, se dirá que el conjunto de datos es
unimodal; si tiene dos modas, se llamara bimodal; más de dos modas, se le llamará polimodal; y en caso que no
tenga ninguna moda se denominará amodal.

VENTAJAS
Es la que más fácilmente se determina, puesto que la obtenemos por inspección y no por
cómputo.

POSICIONES RELATIVAS DE LA MEDIA, LA MEDIANA Y LA MODA.


Si la Media, Mediana y Moda se localizan en el centro y son siempre iguales, la distribución es simétrica.

Ello significa que si se doblara por la mitad al polígono de frecuencia, ambos lados tienen la misma forma. El
punto más alto de la curva, corresponde a la moda. Como la curva es simétrica, la mediana corresponde al punto
en que la distribución se parte a la mitad. Las frecuencias más altas se compensan con las más bajas; y así, la
Media, Mediana y Moda coinciden, lo que significa que cualquiera de las tres medidas es adecuada para
representar una distribución. Conforme la distribución se hace menos simétrica o sesgada, la relación entre los
tres promedios cambia.
En una distribución positivamente sesgada, la Media aritmética es el mayor de los tres promedios. ¿Por qué?
Porque la media es más influida, que la Moda o la Mediana, por valores extremadamente altos. La Mediana
suele ser el siguiente promedio en una distribución de frecuencias positivamente sesgada; y la Moda el menor
de los tres. Si la distribución es muy sesgada, no sería bueno emplear a la Media como promedio. La Mediana y
la Moda serían más representativas.
Inversamente, en una distribución negativamente sesgada, la Media aritmética es el menor de los tres
promedios. Es evidente que la Media se ve influida por unas cuantas observaciones extremadamente bajas. La
Mediana es mayor que la Media Aritmética y la Moda es el mayor de los tres promedios. Aquí también si la
distribución es muy sesgada, no se debe emplear la Media para representar a los datos.

Página 26 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad

MEDIDAS DE CENTRALIZACIÓN PARA DATOS AGRUPADOS


MEDIA ARITMÉTICA PARA DATOS AGRUPADOS ̅)
(𝒙
Para calcular esta medida de centralización o tendencia central se tomaran en cuenta las frecuencias absolutas
y la marca de clase de cada clase; mediante la siguiente fórmula:
∑𝑛𝑖=1 𝑀𝐶𝑖 × 𝑓𝑖
𝑥̅ =
𝑛
Donde:
̅ = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑎
𝒙
∑= Sumatoria
MC: marca de clase
f: frecuencia absoluta
n: número de datos (frecuencias absolutas) de la distribución.

Ejemplo: Consideremos la siguiente tabla

Calcular la Media aritmética para datos agrupados; aplicando la fórmula tendremos lo siguiente:

Página 27 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad

CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA


 Es muy sensible a la variación de las puntuaciones. Basta con que varíe una sola puntuación,
para que varíe la media.
 Con los datos agrupados, la media depende del número de intervalos elegidos, de su amplitud
y de los límites de los mismos.
Edades ni
 No se puede calcular la media si alguno de sus intervalos carece de límites.
0-4 45
Ejemplo: edades de aparición del sarampión en un grupo de 100 individuos.
5-9 40
Al no conocer el límite superior del último intervalo, no podemos calcular su punto
medio y, en consecuencia no podemos calcular la media. 10-14 10
 No es recomendable calcular la media cuando la distribución de 15 o más 5
frecuencias tiene puntuaciones muy extremas, porque se verá afectada 100
por las mismas.
MEDIANA PARA DATOS AGRUPADOS
Para determinar la mediana nos apoyaremos en la siguiente fórmula:
𝑛
− 𝐹𝑖𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
̃ = 𝐿𝑖 + [2
𝒙 ]∗𝐴
𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎

Donde:
Li: límite inferior de la clase donde se encuentra la mediana (ver mediana datos no agrupados).
n: número total de datos
𝐹𝑖𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎∶ Frecuencia acumulada anterior a la clase de la mediana.
𝒎 : Frecuencia absoluta de la mediana.
A = amplitud del intervalo de clase.

Ejemplo: De la tabla que se muestra a continuación calcularemos la mediana para esta distribución.
Intervalos de Frecuencia Frecuencia
Clase Absoluta acumulada
f F
[49 , 53) 10 10
[53 , 57) 7 17
[57 , 61) 5 22 CLASE DE LA MEDIANA
[61 , 65) 3 25
[65 , 69) 7 32
[69 , 73) 8 40
Total n = 40
Determinaremos primero la Mediana teórica (que indica la posición donde encontramos la mediana)

Página 28 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
𝑛 40
𝑀𝑒𝑡 =
= = 20
2 2
Luego ubicamos en la columna de Frecuencia acumulada la posición 20, en este caso sería el intervalo
𝑭 𝒕 𝒐 𝒎 = 𝟏𝟕
𝒎 =𝟓
= 𝟓7
𝑨 = 𝟔𝟏 − 𝟓𝟕 = 𝟒
Sustituyendo los valores encontrados en la fórmula para la mediana, tendremos:

20 − 17
̃ = 57 + [
𝒙 ]∗4
5
3
̃ = 57 + ( ) ∗ 4
𝒙
5
̃ = 57 + 2,4
𝒙
̃ = 59,4
𝒙

MODA PARA DATOS AGRUPADOS (𝑥 ̂)


Es el valor más frecuente.
Para calcular la moda, en una distribución de frecuencias absolutas, observaremos la columna de las
frecuencias absolutas, después escogeremos la frecuencia mayor de todas ellas.
1°: De la columna de frecuencias absolutas seleccionar la mayor frecuencia.
2°: Aplicar la siguiente fórmula

𝑑𝑎
𝑥̂ = 𝐿̂𝑖 + [ ]∗𝐴
𝑑𝑎 + 𝑑𝑝
Donde
̂: Moda para datos agrupados
𝒙
̂𝒊 : Límite inferior de la clase modal (intervalo de clase que tienen MAYOR FRECUENCIA)
: Diferencia de las frecuencias de la clase modal y pre modal (clase anterior a la modal)
: Diferencia de las frecuencias de la clase modal y post modal (clase posterior a la modal)

Ejemplo: Teniendo en cuenta la misma tabla del ejemplo anterior


Intervalos de Frecuencia Frecuencia
Clase Absoluta acumulada
f F
[49 , 53) 10 10 Clase modal
[53 , 57) 7 17
[57 , 61) 5 22
[61 , 65) 3 25
[65 , 69) 7 32
[69 , 73) 8 40
Total n = 40
En este caso específico será 10 la frecuencia mayor de todas las frecuencias absolutas. Después procederemos
a determinarla los datos siguientes:
Página 29 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
= 𝟏𝟎 − 𝟎 = 𝟏𝟎
= 𝟏𝟎 − 𝟕 = 𝟑
= 𝟒𝟗
𝑨=𝟒
Si sustituimos los datos tendremos:
10
𝑥̂ = 49 + [ ]∗4
10 + 3
𝑥̂ = 49 + 3,07
𝑥̂ = 52,07
Medidas de Dispersión
Se llaman medidas de dispersión o variabilidad aquellas que permiten retratar la distancia de los valores de
la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector
del rango de la variable.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las
medidas de dispersión nos dicen hasta qué punto estas medidas de tendencia central son representativas como
síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, y la variabilidad de
los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que
no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.
En nuestro curso abordaremos las siguientes medidas de dispersión:
Rango Deciles.
Varianza Percentiles.
Desviación típica.

RANGO (R)
Es una medida de Variabilidad llamada también en algunas ocasiones amplitud. Se calcula como la diferencia
entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:

R = x(n) - x(1)
Donde:
x(n): Es el mayor valor de la variable.
x(n): Es el menor valor de la variable.

Ventajas y desventajas del Rango


Ventajas
a) Es fácil de calcular y es comúnmente usado como una medida burda pero eficaz de
variabilidad
b) Es comprensible para cualquier persona; aun cuando no conozca de Estadística.
Desventajas
a) No utiliza todas las observaciones (sólo dos de ellas) los extremos, ignorando los valores
intermedios

Página 30 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
b) Se puede ver muy afectado por algunas observaciones o datos extremos
c) El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier
caso nunca disminuye.
d) No es aconsejable para muestras grandes sólo para muestras pequeñas

VARIANZA (S2)
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media.
Mide la distancia existente entre los valores de la serie y la media.
Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el
número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
Fórmula simplificada para el cálculo de la varianza para datos NO AGRUPADOS:
̅ )𝟐
∑ =𝟏(𝒙 − 𝒙
𝟐
𝑺 =
𝑵
Donde:
𝑆 2 : varianza
𝑥: es cada uno de los datos obtenidos de la muestra.
𝑥̅ : Media aritmética.
N: tamaño de la muestra.
Fórmula simplificada para el cálculo de la varianza para datos AGRUPADOS:

𝟐
∑ =𝟏( ̅ )𝟐
− 𝒙
𝑺 =
𝑵
Donde:
𝑺𝟐 : varianza
: frecuencia absoluta de cada clase.
𝑀𝐶: es la MARCA DE CLASE de cada intervalo
̅: media aritmética
𝒙
N: tamaño de la muestra.
Ejemplo de varianza para datos NO agrupados:
Dada la siguiente distribución calcular la varianza de la misma:
9 – 3 – 8 – 8 – 9 -8 – 9 -18
9 + 2 + 8 + 8 + 9 + 8 + 18
𝑥̅ = =𝟗
8
( 9 − 9)2 + ( 2 − 9 )2 + ( 8 − 9 )2 + ( 8 − 9)2 + ( 9 − 9)2 + ( 8 − 9)2 + (18 − 9)2
𝑆2 = = 15
8
𝑺𝟐 = 𝟏𝟓
Ejemplo de varianza para datos agrupados
∑𝑛
𝑖=1 𝑀𝐶𝑖 ×𝑓𝑖
Antes recordemos la fórmula de la Media para datos agrupados 𝑥̅ = 𝑛
Intervalo MC f MC * f (MCi - Media)2 (MCi - Media)2*fi
[18 , 21] 19,5 13 253,5 42,25 549,25
[22 , 25] 23,5 24 564 6,25 150
[26 , 29] 27,5 6 165 2,25 13,5
[30 , 33] 31,5 9 283,5 30,25 272,25

Página 1 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
[34 , 37] 35,5 3 106,5 90,25 270,75
[38 , 41] 39,5 5 197,5 182,25 911,25
TOTALES 60 1570 353,5 2167
𝟏𝟓𝟕𝟎 2167
̅=
𝒙 𝟔𝟎
= 𝟐𝟔 𝑆2 = = 36,
60

DESVIACIÓN TÍPICA O STANDARD (S)


Es la raíz cuadrada de la varianza.

Ejemplo de desviación típica para datos NO agrupados:


Considerando el ejemplo de varianza para datos no agrupados, el cálculo de la desviación típica sería:
𝟐
𝟐
𝑺 = √𝑺𝟐 = √𝟏𝟓 = 𝟑. 𝟖𝟕
Ejemplo de desviación típica para datos agrupados:
Considerando el ejemplo de varianza para datos agrupados, el cálculo de la desviación típica sería:
𝟐 𝟐
𝑺 = √𝑺𝟐 = √36,11 = 𝟔, 𝟎𝟏
Medidas de posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
Las medidas de posición son:
 Cuartiles  Deciles  Percentiles
CUARTILES
Series no agrupadas
Son medidas de posición que dividen en cuatro partes porcentuales iguales a una distribución ordenada de
datos.
Cuando la distribución de datos contiene un número determinado de datos y se requiere obtener un porcentaje
o una parte de la distribución de datos, se puede dividir la distribución en cuatro partes iguales, cada parte tiene
la misma cantidad de datos y cada una de las partes representa un 25% de la totalidad de datos. Es decir:

Cuartil 1 Cuartil 2 Cuartil 3 Cuartil 4


25 % 25 % 25 % 25 %
Formula General:
Para calcular el valor de uno de los cuatro Cuartiles, se utiliza la fórmula:
𝑘×𝑁
𝑄𝑘 = Donde: k=1,2,3 N: número total de datos
4
Para cada cuartil, su ecuación se establece así:
Q1 = 1 (N / 4) Q2 = 2 (N / 4) Q3 = 3 (N / 4) Q4 = 4 (N / 4)

Página 2 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Cada cuartil tiene un significado estadístico particular o representa de la distribución de datos un porcentaje
establecido; por ejemplo:
a) Q1 = 1 (N/4)
El valor obtenido al realizar el cálculo en una serie de datos nos proporciona el valor que representa el 25 % de
esa serie de datos. También, nos indica que el 25% de de la serie de datos está bajo él y sobre él, se encuentra
el 75% de los datos de la serie.
b) Q2 = 2 (N/4)
Para el cuartil 2, se tiene como caso especial, primero porque su valor representa la mitad de la serie de datos,
igual que la mediana. Segundo, bajo esté valor se encuentra el 50% de la serie de datos y tercero, sobre ese
valor calculado se encuentra el otro 50% de la serie de datos.
c) Q3 = 3 (N/4)
El cuartil 3, nos indica que el valor obtenido representa bajo sí el 75 % de la distribución de los datos y sobre sí,
se encuentra el 25 % de la distribución de datos.
d) Q4 = 4 (N/4)
El cuartil 4, nos indica que el valor obtenido tiene bajo sí el 100% de la distribución de datos. Por lo general no
se calcula, ya que es un hecho que el último valor de la distribución él lo representa.
Representación gráfica: en una escala que va del 0 al 100.
- Cuartil 1:
25 50 75 100
25% de los valores
están incluidos en el
cuartil 1.
Q1 Q2 Q3 Q4
- Cuartil 2:

25 50 75 100

EL 50 % de los valores están incluidos en el


cuartil 2.
Q1 Q2 Q3 Q4
- Cuartil 3:
25 50 75 100

El 75 % valores están incluidos en el cuartil 3.

Q1 Q2 Q3 Q4
- Cuartil 4:

25 50 75 100
EL 100% de los valores están incluidos en el cuartil 4.

Q1 Q2 Q3 Q4
Ejemplos resueltos sobre Cuartiles.
1. En 20 pruebas de evaporación, de la sustancia MW008, se registran las siguientes variaciones de temperaturas
a presión atmosférica: 41°, 50°, 29°, 33°, 40°, 42°, 53°, 35°, 28°, 39°, 37°, 43°, 34°, 31°, 44°, 57°, 32°, 45°, 46°, 48°.
Calculando el valor del cuartil 1:
Paso 1: Ordenar los datos de menor a mayor.
28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°, 50°, 53°, 57°.
Página 1 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Paso 2: Ubicar la posición del valor que le corresponde al Q1:
Q1 = k (N/4) = 1 (20/4) = 1(5) = 5
Al revisar la serie de datos la posición 5 le corresponde a 33°
Paso 3: El valor para el Q1 es 33°
Nos dice: que los valores entre 28° y 33° representan el 25 % de la serie de datos.
Calculando el valor del cuartil 2:
Paso 1: Ordenar los datos de menor a mayor.
28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°, 50°, 53°, 57°.
Paso 2: Ubicar la posición del valor que le corresponde al Q2:
Q2 = k (N/4) = 2 (20/4) = 2 (5) = 10
Al revisar la serie de datos la posición 10 le corresponde a 33°
Paso 3: El valor para el Q2 es 40°
Nos dice: que la temperatura que deja bajo si el 50 % de la serie de datos es 40°.
Calculando el valor del cuartil 3:
Paso 1: Ordenar los datos de menor a mayor.
28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°, 50°, 53°, 57°.
Paso 2: Ubicar la posición del valor que le corresponde al Q3:
Q3 = k(N/4) = 3 (20/4) = 3 (5) = 15
Al revisar la serie de datos la posición 15 le corresponde a 45°
Paso 3: El valor para el Q3 es 45°
Nos dice: que los valores entre 28° y 45 representan el 75 % de la serie de datos.
Calculando el valor del cuartil 4:
Paso 1: Ordenar los datos de menor a mayor.
28°, 29°, 31°, 32°, 33°, 34°, 35°, 37°, 39°, 40°, 41°, 42°, 43°, 44°, 45°, 46°, 48°, 50°, 53°, 57°.
Paso 2: Ubicar la posición del valor que le corresponde al Q4:
Q4 = k (N/4) = 4(20/4) = 4(5) = 20
Al revisar la serie de datos la posición 20 le corresponde a 57°
Paso 3: El valor para el Q4 es 57°
Nos dice: la temperatura que deja bajo si el 100 % de la serie de datos es 57°.
Es de hacer notar que el Q4 coincide con el último valor de la serie de datos, por ello, su cálculo no se efectúa,
se da por entendido que siempre el valor del cuartil 4 será el último valor de la serie de datos.
En conclusión:
La utilidad de los cuartiles se basa en determinar los valores en una serie de datos que dividen la serie en 4
partes iguales, estás partes se pueden expresar como rangos de valores o simplemente como porcentajes.
Cada parte tendrá un valor del 25 %.

Calculo de cuatriles para series agrupadas


𝑘×𝑁
1- Buscamos la clase donde se encuentra , k=1,2,3 en la tabla de frecuencias acumuladas.
4
𝑘𝑁
− 𝐹𝑎𝑖−1
𝑄𝑘 = 𝐿𝑖 + 4 × 𝑎𝑖
𝑓𝑖
Donde:
𝒌: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑢𝑎𝑡𝑟𝑖𝑙 1, 2, 3

Página 2 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
𝑘𝑁
: es el límite inferior de la clase donde se encuentra calculado
4
N: es la suma de las frecuencias absolutas.
𝑭 −𝟏: es la frecuencia acumulada anterior a la clase seleccionada.
𝑘𝑁
: frecuencia correspondiente a la clase seleccionada donde se encontró el 4
.
: amplitud de la clase seleccionada.
Ejercicio de cuartiles
Calcular los cuartiles de la distribución de la tabla:

fi Fi Cálculo del primer cuartil

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34 Cálculo del segundo cuartil

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63 Cálculo del tercer cuartil


[110, 120) 2 65

65

Deciles

 Lo deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
 Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
 D5 coincide con la mediana.
Deciles para datos NO AGRUPADOS

 Ordenamos los datos de menor a mayor.


 Buscamos el lugar que ocupa cada cuartil mediante la expresión

𝑘×𝑁
𝐷𝑘 =
10
Donde:
k=1,2,3,…,9
N: número total de datos

Deciles para datos AGRUPADOS


𝑘𝑁
− 𝐹𝑎𝑖−1
𝐷𝑘 = 𝐿𝑖 + 10 × 𝑎𝑖
𝑓𝑖

Página 3 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Donde:
𝐤: número de decil 1, 2, … ,9
𝑘𝑁
: es el límite inferior de la clase donde se encuentra el 10 calculado
N: es la suma de las frecuencias absolutas.
𝑭 −𝟏: es la frecuencia acumulada anterior a la clase seleccionada.
𝑘𝑁
: frecuencia correspondiente a la clase seleccionada donde se encontró el
10
: amplitud de la clase seleccionada.

Ejercicio de deciles
Calcular los dec iles de la distribución de la tabla:
Cálculo del primer decil
fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34 Cálculo del segundo decil

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63
Cálculo del tercer decil
[110, 120) 2 65

65

Cálculo del cuarto decil

Cálculo del quinto decil Cálculo del octavo decil

Cálculo del sexto decil Cálculo del noveno decil

Cálculo del séptimo decil

Página 4 de 40
Alvarado 951 (Salta) C.P. 4400 | Tel. Fax (0387) 4311519 | www.institutodelmilagro.com
Estadística y Probabilidad
Percentiles
 Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales.
 Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
 P50 coincide con la mediana.
Datos no agrupados Datos agrupados
𝑘×𝑁 𝑘𝑁
𝑃𝑘 = − 𝐹𝑎𝑖−1
100 𝑃𝑘 = 𝐿𝑖 + 100 × 𝑎𝑖
Donde: 𝑓𝑖
k=1,2,3,…,99 Donde:
N: número total de datos 𝐤: número de percentil 1, 2, … ,9
: es el límite inferior de la clase donde se
𝑘𝑁
encuentra el calculado
100
N: es la suma de las frecuencias absolutas.
𝑭: es la frecuencia acumulada anterior a la clase
seleccionada.
: frecuencia correspondiente a la clase
𝑘𝑁
seleccionada donde se encontró el
100
: amplitud de la clase seleccionada.
Ejercicio de percentiles
Calcular el percentil 35 y 60 de la distribución de la tabla:
Percentil 35
fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34 Percentil 60

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
𝑆
𝐶𝑉 =
𝑥̅
El coeficiente de variación se suele expresar en porcentajes:
𝑆
𝐶𝑉 = 100 %
𝑥̅
CV: coeficiente de Variación
S: Desviación Típica
̅: 𝒎
𝒙
El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que
sus medias sean positivas.

Ing. Cinthia Flores 40


Estadística y Probabilidad
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.
Ejemplo:
Una distribución tiene 𝑥̅ = 140 y S = 28.28 y otra 𝑥̅ = 150 y S = 24. ¿Cuál de las dos presenta mayor dispersión?

La primera distribución presenta mayor dispersión.


Medidas de forma
Son medidas que determinan numéricamente algunas características de la forma en que están distribuidos los
datos. Entre estas medidas se tiene: el coeficiente de asimetría o coeficiente de sesgo.
Coeficiente de Asimetría
La asimetría es la medida que indica la simetría de la distribución de una variable respecto a la media
aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si hay el mismo
número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
 Asimetría negativa: la cola de la distribución se alarga para valores inferiores a la media.
 Simétrica: hay el mismo número de elementos a izquierda y derecha de la media. En este caso, coinciden
lamedia, la mediana y la moda. La distribución se adapta a la forma de la campana de Gauss, o
distribución normal.
 Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media.

Coeficiente de asimetría de Fisher


El coeficiente de asimetría de Fisher As evalúa la proximidad de los datos a su media. La fórmula de la
asimetría de Fisher es:
DATOS NO ATRUPADOS DATOS AGRUPADOS
∑ (𝒙 − 𝒙̅ )𝟑 ∑ ( ̅ )𝟑
− 𝒙
𝑨 = 𝑨 =
𝑺𝟑 𝑺𝟑
Donde: Donde:
𝒙 = cada uno de los valores = marca de clase de cada intervalo
n = número de datos n = número de datos
̅= media aritmética
𝒙 ̅= media aritmética
𝒙
f = frecuencia absoluta f = frecuencia absoluta
𝑺𝟑 = cubo de la desviación estándar 𝑺𝟑 = cubo de la desviación estándar
poblacional poblacional

 Si As<0: la distribución tiene una asimetría negativa y se alarga a valores menores que la media.
 Si As =0: la distribución es simétrica.
 Si As >0: la distribución tiene una asimetría positiva y se alarga a valores mayores que la media.
Ing. Cinthia Flores 41
Estadística y Probabilidad

Coeficiente de asimetría de Pearson


El coeficiente de asimetría de Pearson CAP mide la diferencia entre la media y la mediana respecto a la
desviación estándar del conjunto X=(x1, x2,…, xN).

𝟑(𝒙̅ − )
𝑨 =
𝑺
Donde:
𝒙̅ : media aritmética
S: Desviación típica o estándar
NOTA:
El Coeficiente de Pearson varía entre -3 y 3.
Si A s < 0 → la distribución será asimétrica negativa
Si A s = 0 → la distribución será simétrica
Si A s > 0 → la distribución será asimétrica positiva

Ing. Cinthia Flores 42


Estadística y Probabilidad

Ing. Cinthia Flores 43

También podría gustarte