Está en la página 1de 98

Estadı́stica

Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

PROBABILIDAD Y ESTADÍSTICA
INTRODUCCIÓN

Carlos Eugenio Balseca Carrera MsC.

May 20, 2020

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Probabilidad y Estadı́stica

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Introducción

Tener conocimientos apropiados de Estadı́stica ası́ como del empleo


de métodos confiables y efectivos garantizan mejores resultados, en
la obtención, procesamiento, análisis e interpretación de resultados
de la gran cantidad de información, a la que en la actualidad tenemos
acceso tanto a nivel personal como organizacional.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Introducción

• Recordar que administrar o gestionar información basados


en una revisión parcial de los datos, tomar decisiones
basadas en la intuición o en simples congeturas, sin análisis
previos estadı́sticos o de probabilidades, son sólo algunos
de los problemas más apremiantes que afectan a cualquier
organización y más aún en el ámbito de la ingenierı́a.
• Carecer de datos estadı́sticos que den sentido a nuestras
decisiones en muchos casos puede ser la causa de graves daños
o serios problemas que deban enfrentar las instituciones u
organizaciones, en las que formemos parte.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Introducción

• No se podrá administrar lo que no se mide, las mediciones son


la clave.
• Si no se puede medir, no se podrá controlar.
• Si no se puede controlar, no se podrá gestionar y
• Si no puede gestionar, no será posible mejorar.
• La ausencia o falta sistemática del manejo estadı́stico de
datos en cualquier organización, dificulta una adecuada
administración de las mismas.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Introducción

• Es preciso recordar también que se debe tener cuidado con el


uso de los datos estadı́sticos, pues incluso, cuando la Estadı́stica
es correctamente aplicada, los resultados pueden ser difı́cil o
erróneamente interpretados por inexpertos.

• El conjunto de habilidades y conocimientos estadı́sticos, ası́


como el escepticismo que uno debe tener para manejar
información en el dı́a a dı́a, se lo conoce como Cultura
Estadı́stica.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Qué es la Estadı́stica?

Definición:
Es una ciencia formal que permite observar los hechos, recolectar
datos, organizar y expresarlos cuantitativamente para procesarlos,
y finalmente interpretar sus resultados para tomar decisiones,
tendientes a explicar condiciones regulares o irregulares en los
fenómeno de estudio o para hacer inferencias (predicciones) lo más
acertadas posibles de fenómenos o situaciones que aún no han
ocurrido.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

División de la Estadı́stica
La Estadı́stica en su forma más general, se divide en dos grandes
áreas:
* Estadı́stica Descriptiva o Deductiva:
* Estadı́stica Inferencial o Inductiva:

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

División de la Estadı́stica
Estadı́stica Descriptiva o Deductiva:
Consiste en observar, registrar y procesar datos, para obtener
información con respecto a un evento en particular, a través de
la apreciación de sus caracterı́sticas. Analiza metódicamente los
datos, simplificándolos y presentándolos en forma clara; eliminando
la confusión presente en datos preliminares.

La elaboración de cuadros, gráficos e ı́ndices correctamente


calculados y suficientemente claros, permitirán encontrar patrones
de comportamiento.

Se limita a describir los datos que se analizan, sin hacer inferencias


en cuanto a datos no incluidos en la muestra).
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

División de la Estadı́stica

Estadı́stica Inferencial o Inductiva:


Cuando a partir del conocimiento obtenido de una muestra se
caracteriza a toda su población.

Permite la generación de modelos, la realización de inferencias y/o


predicciones de los fenómenos que se investigan.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

División de la Estadı́stica

Estadı́stica Inferencial o Inductiva:


Las inferencias pueden considerarse como:
1 La forma de respuesta a preguntas si/no (prueba de hipótesis),
2 Estimaciones de caracterı́sticas numéricas (estimación),
3 Pronósticos de futuras observaciones,
4 Descripciones de asociación (correlación), o
5 Modelamiento de relaciones entre variables (análisis de
regresión).
Ambas ramas (Descriptiva e Inferencial), comprenden la
Estadı́stica Aplicada.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

• Valoración: La Estadı́stica establece una relación objetiva


entre el observador y un hecho bajo investigación, a partir de la
expresión numérica del mismo o por una simple caracterización
del evento.

• Caracterı́stica: Es el rasgo, propiedad, cualidad o atributo que


presentan los hechos y permite la identificación y diferenciación
de un elemento respecto de los demás.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

• Medición: Medición es la valoración o contrastación de una


caracterı́stica por medio de un estándar.

• Apreciación: Es el reconocimiento de una caracterı́stica a


través de un criterio predefinido por el observador.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

• Escala: Es la estructura numérica en la cual se establece


la jerarquı́a correspondiente para definir y diferenciar
cada elemento valorado y, adicionalmente, posibilitar la
interpretación y comprensión de los resultados obtenidos.

• Unidad elemental: Es el objeto o sujeto que posee o ejecuta


la caracterı́stica que ha de ser observada, en un hecho definido
y constituye la fuente primaria o directa de información.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

• Población: Es el conjunto de individuos, elementos o eventos


con caracterı́sticas similares que serán analizados y que definen
un hecho en particular. Puede entenderse también como
el conjunto de un número de mediciones u observaciones o
simplemente una gran colección de datos acerca de algo de
interés.
Cualquier valor obtenido de datos una población toma el
nombre de PARÁMETRO.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

• Población Finita: Cuando el conjunto de elementos son


numerablemente contables y esta cantidad se limita a una cifra
en particular.

• Población Infinita: Cuando el conjunto de elementos son


numerablemente contables pero no se puede expresar una cifra
referencial para la totalidad de los elementos que la conforman.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

Muestra: Es un subconjunto representativo, obtenido de forma


aleatoria de la población de interés. Cualquier valor obtenido de
datos de una muestra, toma el nombre de ESTADÍSTICO.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

• Variable: Es el resultado de valorar una caracterı́stica en un


conjunto de individuos o elementos (muestra o población), que
se definen en un hecho particular.

• Dato: Es el valor especı́fico obtenido al observar y cuantificar


una caracterı́stica cualquiera, en una unidad elemental. Se
considera como el resultado individual de una observación.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Terminologı́a Estadı́stica

• Información: Es el resultado obtenido luego de procesar el


conjunto de datos, con la finalidad de resaltar la condición de
interés del evento investigado.

• Patrón: Es un tipo de sucesos u objetos recurrentes. Podrı́a


definirse también, como aquella serie de datos claramente
identificables dentro de un conjunto mayor de ellos.

• Modelo: Son modelos matemáticos, que describen


teóricamente el comportamiento de los datos.
Su éxito o fracaso depende de la precisión con la que se
construya esta representación numérica.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Tipos de variables

Existen dos tipos básicos de variables :

Cualitativas o categóricas

Cuantitativas o numéricas

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Cualitativas o categóricas:
• Cuando la caracterı́stica a estudiar es de tipo no numérico, se
la conoce como variable cualitativa, categórica o de atributos.

• Algunos ejemplos de variables cualitativas son: el género,


religión, estado civil, ciudad de nacimiento, color de ojos, etc.

• Cuando los datos son cualitativos, lo importante es la cantidad


o la proporción de ellos, que correspondan a cada categorı́a. Por
ejemplo, ¿qué cantidad o qué porcentaje de la población son
solteros?, ¿Cuántos creyentes o no creyentes hay en Ecuador?.

• Los datos cualitativos se resumen en tablas, gráficos de pastel


y/o gráficos de barras, entre otros.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Tipos de variables

Cuantitativas o numéricas:
• Cuando la variable que se estudia es de tipo numérico y sus
valores pueden variar dentro de un rango de números reales
(R).

• Algunas variables cuantitativas son por ejemplo: el saldo en su


cuenta bancaria, edades de los estudiantes de un aula, vida útil
de un celular, número de hijos, distancias entre ciudades, etc.

• Los datos cuantitativos se resumen en tablas, gráficos de


dispersión, histogramas, ojivas, de caja y bigote, entre otros.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Variables Cuantitativas

Las variables cuantitativas a su vez se subdividen en:


Variables Cuantitativas Discretas

Variables Cuantitativas Continuas

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Variables Cuantitativas Discretas

Discretas:
• Si toman sólo ciertos valores claramente separados entre sı́.
Generalmente son números enteros, que se obtienen de procesos
de contar algo.

• Ejemplos: número de camas en un hospital; número de


automóviles que pasan por la autopista en una hora, número
de estudiantes en un curso de Estadı́stica, etc.).

• No necesariamente deben ser valores enteros.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Continuas:
• Las variables continuas toman cualquier valor dentro de un
intervalo especı́fico de valores (recta numérica). Por lo general
las variables continuas son el resultado de procesos de medir
algo.

• Toma cualquier valor dependiendo de la precisión del


instrumento de medida.

• Ejemplos: presión de aire en una llanta, peso de una caja de


tomates, cantidad de cereal en una caja, duración de los vuelos
Quito - Guayaquil, nota promedio de grado (GPA), el GPA de
un determinado estudiante puede encontrarse como 8.256927.
Se acostumbra redondear a 3 decimales (8.257).

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Niveles o escalas de medición

Los datos se deben clasifican por niveles de medición. El nivel de


medición regirá los cálculos que se llevarán a cabo a fin de resumir
y presentar resultados coherentes.

Determinan además las pruebas estadı́sticas que se deben realizar.

Existen cuatro niveles de medición a saber:

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Niveles o escalas de medición


1 Nominal,

2 Ordinal,
3 de Intervalo y
4 de Razón.

La medición más baja, o más simple, corresponde a la escala


Nominal. Y la más alta, o la que proporciona la mayor información
relacionada a una variable de interés, es la escala de Razón.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala Nominal:
Son observaciones acerca de una variable cualitativa, que se
clasifican en forma aleatoria, donde NO importa el orden en el que
estén ubicadas en un registro (tablas) y sólo se las cuenta. No existe
una forma particular o un orden lógico o natural para ordenarlas, son
sólo etiquetas.

Deben ser mutuamente excluyentes pues permiten agrupar


individuos, observaciones u objetos en clases o categorias diferentes.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala Nominal

Se la emplea para procesar datos, tales como:


género, etnia, lugar de nacimiento, color de piel, tipo de empleo,
beneficios laborales, etc.

A menudo la información se codifica de forma numérica.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala Nominal

Ejemplo:
Si se asigna a los estudiantes de Quito el código 1, de Latacunga el
código 2, de Ambato el código 3, y ası́ sucesivamente.
Esta codificación facilita el conteo por computadora. Sin embargo,
y dado que se han asignado números a las diversas categorı́as, esto
no nos faculta para operar o manipular estos números. Para explicar
mejor, 1 + 2 no es igual a 3, en este tipo de análisis; es decir, Quito
+ Latacunga no da como resultado Ambato.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala Ordinal:
Es la escala inmediata superior a la anterior. Las medidas ordinales
tienen imprecisas diferencias entre valores consecutivos, existe un
orden intuitivo para sus valores. La escala ordinal, toma en cuenta
la propiedad de orden o jerarquı́as de los datos.

Para procesar datos tales como: nivel de educación, grado de los


militares, nivel jerárquico dentro de las instituciones o empresas,
grado de satisfacción, etc.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala Ordinal

Ejemplo:
Si se ha calificado el rendimiento académico de los cursos de
décimo año de un colegio en particular, como excelente, muy bueno,
bueno, regular y malo. Y si se codifican estas categorias, excelente
correspondiendo al número 5 y malo al número 1. Al sustituir 5
por excelente y 4 por muy bueno, se puede concluir que excelente
es mejor que muy bueno, pero si se suman estas dos calificaciones,
no se debe esperar que el resultado tenga significado. Tampoco se
debe concluir que la calificación de muy bueno (4) sea dos veces
más alta que regular (2). Sólo tendrá claro que la calificación de
muy bueno, es superior a la calificación de regular, pero no en qué
grado es superior.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala de Intervalo

De Intervalo:
Esta escala es superior a la ordinal. No sólo se distingue orden entre
categorias, sino que también se puede establecer diferencias, iguales,
entre observaciones. Se considerá además, las unidades de medida
(grados centı́grados, metros, kg, puntajes, etc.)

Con este tipo de variables se puede realizar comparaciones de


igualdad/desigualdad, establecer un orden dentro de sus valores y
medir la distancia existente entre cada valor de la escala.
Las variables de intervalo carecen de un cero absoluto, por lo que
operaciones como la multiplicación y la división no son permitidas.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala de Intervalo

Cero arbitrario,
El valor cero que se puede asignar en esta escala de medida, no
representa ausencia de valor, el cero en este caso es un valor
referencial, en otras palabras la caracterı́stica está presente pero vale
cero, algunos ejemplos son: la temperatura, pruebas de coeficiente
intelectual, altura sobre el nivel del mar, edades AC - DC, etc.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala de Intervalo

Ejemplo:
La temperatura, corresponde a este tipo de variable, pues se puede
decir que la distancia entre 10 ◦ C y 12 ◦ C, es la misma que la
existente entre −15◦ C y −17◦ C. Lo que no debemos afirmar, es
por ejemplo que una temperatura de +5 ◦ C en un lugar equivale al
doble de temperatura de −5 ◦ C, medido en otro lugar. Por tanto
una relación en este sentido no tiene significado. Recordar el cero
es relativo o arbitrario (no significa ausencia de medida).

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala de Razón

Razón:
Esta escala es superior a la de intervalo. Conserva las caracterı́sticas
de la escala de razón, es decir se distinguen orden entre categorias,
se establecen diferencias iguales entre observaciones, se considerán
unidades de medida y además operaciones como la multiplicación y
la división (comparación) son posibles.

Las variables a ser medidas con la escala de razón, deben tener


siempre un cero absoluto.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala de Razón

Cero Absoluto,
El valor cero en este caso representa efectivamente ausencia de valor,
no es referencial, algunos ejemplos son: peso, estatura, velocidad,
distancias, salarios, producción, etc.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Escala de Razón

Ejemplo:
El dinero ilustra bien este caso. Si se tiene cero dólares, entonces
no se tiene dinero.
El peso constituye otro ejemplo. Si la escala de una balanza
correctamente calibrada marca 0.00 en su pantalla, entonces hay
ausencia total de peso.
La razón (división) entre dos números también resulta significativa.
Si Carlos gana $ 30 000 USD anuales dando clases y Roberto gana
$ 60 000 USD al año en sus negocios, entonces se dede concluir
que Roberto gana el doble que Carlos.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica Introducción
Medidas Descriptivas División de la Estadı́stica
Fuente y representación de datos Terminologı́a Estadı́stica
Gráficos Estadı́sticos Tipos de variables
Referencias Niveles o escalas de medición

Niveles o escalas de medición

Fuente: Estadı́stica Aplicada a los Negocios y la Economı́a, Lind y Marchall

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Medidas Descriptivas

Son valores numéricos calculados a partir de una muestra y dan


información resumida acerca de ella. Se obtienen solo de variables
cuantitativas.

Es preciso hacer notar, que la mayorı́a de paquetes estadı́sticos,


consideran a los datos introducidos en ellos, como datos muestrales
por tanto los valores de ellos obtenidos serán valores denominados
(ESTADÍSTICOS), cuando se indique lo contarrio y en casos
especiales, se podrá cálcular (PARÁMETROS) poblacionales, que
generalmente se representan por letras del alfabeto griego o letras
mayúsculas.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Medidas Descriptivas

Principales medidas descriptivas.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Medidas de Tendencia Central

Medidas de Tendencia Central:


Son indicadores estadı́sticos que muestran hacia que valor o valores
se agrupan los datos. Buscan identificar un valor puntual que sea
el más representativo del conjunto de datos, y que generalmente se
ubica en la parte central de este grupo.

Las medidas de tendencia central, comunmente utilizadas son:

• Medias: (aritmética, ponderada, armónica y geométrica),


• Mediana y,
• Moda.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Media Aritmética
La media aritmética o simplemente promedio, es el cociente entre
la suma de todos los valores de los datos y el número total de ellos.
Propiedades de la media aritmética
• La media aritmética es considerada como el punto de equilibrio
de un conjunto de datos.
• Para su cálculo se deben considerar todos los valores presentes
en la muestra.
• la suma de las desviaciones de cada valor con respecto a la
media siempre será cero ni=1 (xi − x̄) = 0
P

• Su valor se ve afectado por valores atı́picos superiores o


inferiores, en tales casos la media pierde representatividad.
• No puede ser calculada cuando se tengan conjuntos de datos
con extremos abiertos.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Media aritmética poblacional (Parámetro: µ)


N
X
xi
i=1
µ= N ; µ:media poblacional, xi : valor de la variable correspondiente a cada observacion,
N: número de datos poblacionales

Media aritmética muestral (Estadı́stico: x̄)


n
X
xi
i=1
x̄ = n ; x̄:media muestral, n: número de datos muestrales

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Media Aritmética Ponderada


Ponderar significa considerar la cantidad de veces que se repite un
mismo valor (frecuencia), por lo que los valores que más se repiten
tendrán mayor peso en este cálculo.
X k
xi ∗ ni
i=1
x̄ = X ; xi : valores que toma la variable, ni : número de veces que se repite un valor,
ni
P
n= ni : número de datos.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Media Geométrica:
Es una medida de tendencia central y es útil cuando se trata de
encontrar el promedio de porcentajes, razones, ı́ndices o tasas, se
la emplea principalmente para determinar cambios porcentuales en
ventas, sueldos, producción, etc. a través del tiempo.

Se la utiliza con más frecuencia para calcular la tasa de crecimiento


porcentual promedio de series de datos a través del tiempo.

La media geométrica de los valores: x1 , x2 , · · · , xn , se define como


la raiz n-ésima del producto de los n valores de x.

mg = n
x1 ∗ x2 ∗ · · · ∗ xn

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Media Armónica:
Se define como el recı́proco de la media aritmética de los recı́procos
de los valores x1 , x2 , ... , xn .
n
ma =
1 1 1
+ + ··· +
x1 x2 xn

Se emplea generalmente para promediar variaciones tales


como: precios promedio de diferentes artı́culos, si para un
mismo valor asignado, se pueden adquirir diferentes cantidades de
cada uno de ellos, el promedio ası́ obtenido será de los precios por
unidad, o rendimientos promedio, si se considera las diferentes
velocidades de producción de los operarios y si todos laboran en un
mismo periodo de tiempo, el promedio obtenido será de productos
producidos, etc.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Mediana:
Su valor se ubica en la mitad de una tabla ordenada de datos, la
divide en dos partes iguales. Quedando el 50% de observaciones
sobre este valor y el otro 50% por debajo de él. No es necesariamente
un valor de la tabla. Esta medida no se ve afectada por datos
atı́picos, y es útil para conjuntos de datos con extremos abiertos.

Mediana para número de datos, (n) impar:


Cuando n es impar, el valor de la mediana está dada por:
me = X( n+1 ) ; valor X, de la tabla ordenada de datos, ubicado en la posición ( n+1
2
).
2

Mediana para número de datos, (n) par:


X( n ) +X( n +1)
me = 2
2
2
; valor promedio entre los valores ubicados en la posición media ( n2 ) y el valor
de la siguiente posición ( n2 + 1), de la tabla ordenada de datos.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Moda:
Es el valor que más se repite (dato con mayor frecuencia absoluta).

Se debe considerar como máximo dos datos que tengan la misma


mayor frecuencia absoluta, siendo en este caso bimodal.

Si se tienen más de dos modas, entonces se dice que es multimodal


y no se dispondrá de un valor modal.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Medidas de Posición

Medidas de Posición:
Llamadas también medidas de partición, dividen al conjunto
ordenado de datos en grupos, cada uno de los cuales debe contener
igual cantidad de ellos.

∗ Cuartiles,
∗ Deciles y
∗ Centiles.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Cuartiles (Q):
Son tres posiciones en la escala de valores de la variable que dividen
al grupo ordenado de datos, en cuatro partes iguales.

i
PQi = n ∗ ; i = 1, 2, 3
4
PQi : Posición en la tabla ordenada de datos, que ubica al valor
correspondiente al cuartil i.
Q1 : cuartil 1, valor hasta el cual se acumula el 25%, de los datos
Q2 : cuartil 2, valor hasta el cual se acumula el 50%, de los datos y
Q3 : cuartil 3, valor hasta el cual se acumula el 75%, de los datos

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Decı́les (D):
Son nueve posiciones en la escala de valores de la variable que dividen
al grupo ordenado de datos, en diez partes iguales.

i
PDi = n ∗ ; i = 1, 2, . . . , 9
10
PDi : Posición en la tabla ordenada de datos, que ubica el valor
correspondiente al decil i.
D1 : decil 1, valor hasta el cual se acumula el 10%, de los datos
D2 : decil 2, valor hasta el cual se acumula el 20%, de los datos
..
.
D9 : decil 9, valor hasta el cual se acumula el 90%, de los datos

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Percentiles o Centiles (P):


Son noventa y nueve posiciones en la escala de valores de la variable
que dividen al grupo ordenado de datos, en cien partes iguales.

i
PPi = n ∗ ; i = 1, 2, . . . , 99
100
PPi : Posición en la tabla ordenada de datos, que ubica el valor
correspondiente al percentil i.
P1 : percetil 1, valor hasta el cual se acumula el 1%, de los datos
P2 : percetil 2, valor hasta el cual se acumula el 2%, de los datos
..
.
P99 : percentil 99, valor hasta el cual se acumula el 99%, de los
datos

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Medidas de Dispersión:
Describen la dispersión o grado de distanciamiento entre valores de
una serie de datos en forma conjunta, es decir establecen que tan
distantes están unos de otros, o con respecto a algún valor especı́fico
que generalmente es la media.
Cuando sus valores sean pequeños indicarán que los datos se
acumulan alredeor de la media aritmética. Por el contario medidas
de dispersión grandes indicarán que la media aritmética no es del
todo confiable.

∗ Rango o Amplitud,
∗ Desviación Media,
∗ Varianza y Desviación Estándar,
∗ Coeficiente de Variación y
∗ Error Tı́pico.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Rango o Amplitud (r):


Representa el valor de la diferencia entre el mayor valor (Xmax ), y el
menor valor (Xmin ), del conjunto total de datos.

r = Xmax − Xmin

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Desviación Media Absoluta (dam):


O simplemente desviación media, es una medida que ayuda a tener
una idea de qué tan ”dispersos”, están los valores individuales
de un conjunto de datos, respecto de un valor de tendencia
central (generalmente la media aritmética), y se interpreta como
la desviación promedio de todos los valores de los datos respecto de
la media o promedio.

n
X
| xi − x̄ |
i=1
dam =
n−1

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Varianza
Es el promedio de las desviaciones de todos los valores de la variable
respecto de su media, elavadas al cuadrado. Su interpretación fı́sica
no tiene ningún sentido lógico, ya que sus unidades de medida
estarán elavadas al cuadrado y no corresponden a las unidades reales
de la variable.

La varianza siempre será positiva y solamente valdrá cero cuando


todos los datos sean iguales, es decir tengan un valor constante.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Varianza Poblacional (Parámetro: σ 2 )


N
X
(xi − µ)2
i=1
σ2 =
N
xi : cada valor de los datos de la variable
µ: media poblacional
N: número de datos de la variable en la población.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Varianza Muestral (Estadı́stico: S 2 )


X 2
n
X n
X xi
(xi − x̄)2 xi 2 −
n
i=1
S2 = ; S 2 = i=1
n−1 n−1
xi : cada valor de los datos de la variable
x̄: media muestral
n: número de datos de la variable en la muestra.

Notar que el valor de la varianza poblacional y la muestral siempre


serán diferentes.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Desviación Estándar
Para resolver el inconveniente de la interpretación de la varianza, se
extrae la raiz cuadrada de su valor, obteniéndose entonces el valor de
la desviación estándar, que tendrá las mismas unidades de la variable
en cuestión.

Parámetro(σ) Estadı́stico(S)
√ √
σ = σ2 ; S = S2

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Coeficiente de variación:
Es el cociente entre la desviación estándar y la media. Se interpreta
como el porcentaje de variabilidad de los datos con respecto a la
media.

Poblacional Muestral

σ S
CV = ∗ 100 ; cv = ∗ 100
µ x̄

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Error Tı́pico (et):


Es llamado también error estándar, es el cociente entre la desviación
estándar y la raiz cuadrada del número de datos.

S
et = √
n

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Medidas de Forma

Medidas de Forma:
Describen la forma que adoptan las distribuciones de frecuencias de
los datos.

∗ Asimetrı́a o Sesgo y
∗ Curtosis.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Coeficiente de Asimetrı́a (α3 ). Análisis Horizontal:


El coeficiente de ASIMETRÍA, indica el grado de uniformidad en
la distribución de los valores respecto de un valor central, o si
existe tendencia de los datos hacia la izquierda o derecha. En otras
palabras permite medir sesgos de los datos.

Si: α3 es igual o tiende a cero será simétrica,


Si: α3 es negativa tendrá asimetrı́a hacia la izquierda y
Si: α3 es positiva tendrá asimetrı́a hacia la derecha.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Asimetrı́a de Pearson (Skp = α3 ):


3(x̄ − mediana)
Skp =
S

Asimetrı́a Excel (α3 ):


" n  #
n X xi − x̄ 3
α3 = ∗
(n − 1) ∗ (n − 2) S
i=1

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Coeficiente de Asimetrı́a (α3 ):

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Curtosis (α4 ). Análisis Vertical:


Determina el grado de apuntamiento del gráfico de distribución
de frecuencias. Permite analizar el grado de concentración que
presentan los datos alrededor de la zona central de la distribución.

Por medio del Coeficiente de Curtosis, podemos identificar si existe


una gran concentración de valores (Leptocúrtica), una concentración
normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Curtosis (K = α4 ):
1
2 ∗ (Q3 − Q1 )
K=
(D9 − D1 )
Q : cuartil
D : Decil

Curtosis Excel (α4 ):


" n  #
n(n + 1) X xi − x̄ 4 3(n − 1)2
α4 = −
(n − 1)(n − 2)(n − 3) S (n − 2)(n − 3)
i=1

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas de Tendencia Central
Medidas Descriptivas
Medidas de Posición
Fuente y representación de datos
Medidas de Dispersión
Gráficos Estadı́sticos
Medidas de Forma
Referencias

Curtosis (α4 ):
Si: α4 es igual o tiende a cero será mesocúrtica,
Si: α4 es negativa será platicúrtica y
Si: α4 es positiva será leptocúrtica.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Fuente y representación de
datos

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

TABLA DE FRECUENCIAS: Son tablas que agrupan


ordenadamente los datos en categorias mutuamente excluyentes,
y que muestran el número de observaciones que corresponderán a
cada una de ellas.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Tabla de distribución de frecuencias

Donde:
∗ n : Número total de datos.
∗ xi : Cada valor diferente que toma la variable de interés
Ejem. Número de hijos; i = 0, 1, 2, · · · , k.
∗ ni : Frecuencia absoluta; representa el número de veces que se
repite un mismo valor de la variable.
k
X
ni = n
i=0

∗ Ni : Frecuencia absoluta acumulada; corresponde al número


de datos acumulados hasta la clase requerida.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Tabla de distribución de frecuencias


Donde:
Ni = n1 + n2 + · · · + nk

∗ fi : Frecuencia relativa; cociente entre la frecuencia absoluta y


el número total de datos.
ni
fi =
n
∗ Fi : Fecuencia relativa acumulada, cociente entre la frecuencia
relativa acumulada y el número total de datos.
Ni
Fi =
n
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Tabla de distribución de frecuencias por clases o intervalos

Ejemplo:

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Tabla de distribución de frecuencias por clases o intervalos

Cuando solo se disponga de información dada en una tabla


por clases, debe tenerse en cuenta que las medidas descriptivas
calculadas a partir de esos datos, solo serán estimaciones.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Tabla de distribución de frecuencias por clases o intervalos

n : Número total de datos.


xc : marca de clase; promedio entre los dos valores de cada clase.
nc : Frecuencia absolutaPkde clase; número de datos que caen
dentro de cada clase. c=1 nc = n
Nc : Frecuencia absoluta acumulada; corresponde al número de
datos acumulados hasta la clase requerida.
Nc = n1 + n2 + · · · + nk
fc : Frecuencia relativa de clase; cociente entre la frecuencia
absoluta de clase y el número total de datos. fc = nc /n
Fc : Fecuencia relativa acumulada, cociente entre la frecuencia
relativa de clase y el número total de datos. Fc = Nc /n

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Pasos para elaboración de tablas de distribución de


frecuencias por clases o intervalos:
1.- Calcular el rango: r = Xmax − Xmin
2.- Determinar el número de clases (K ).

a) K = n; máximo hasta 100 datos,
b) Menor valor de K, tal que: 2K ≥ n.
c) Según criterio de Sturgues:
log (n)
*K = 1 + log (2) ó *K = 1 + 3.32 ∗ log (n)

3.- Deteminar la amplitud o longitud de clase (L).


r
L≥ ∗ L, sólo debe contener el número de cifras significativas que tengan
K sentido de acuerdo a la unidad de medida de la variable.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Cont... Pasos:
4.- Una vez asignado el valor a la amplitud L, comprobar que:

L ∗ K ≥ rango

Si se cumple la igualdad, considerando el valor de L con sólo


sus cifras significativas, entonces el valor incial de la tabla,
corresponderá al menor valor que tengan los datos (Xmin ), y el
valor final será el mayor valor de ellos (Xmax ).

De no cumplirse esta desigualdad, se deberá incrementar, en una


unidad al último dı́gito significativo de L. Esto siempre genera
un pequeño exceso, al valor original del rango. Este exceso debe
dividirse en 2 partes iguales, la una se restará del menor valor de los
datos, y será el valor inicial de la tabla, la otra mitad se sumará al
mayor valor de los datos y se obtendrá el valor final de la tabla.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Cont... Pasos:
5.- Cada clase o intervalo constará de dos valores, el lı́mite inferior
(Linf ), y el lı́mite superior (Lsup ), de cada clase.
El valor inicial de la tabla, corresponderá al menor valor de los
datos restado la mitad del exceso y será el lı́mite inferior del primer
intervalo, que al ser sumado con el valor asignado a L, dará origen a
su lı́mite superior, ambos valores estarán incluidos en este intervalo.
El último valor ası́ obtenido pasará a su vez a ser el lı́mte inferior del
siguiente intervalo (valor no incluido), que al sumarse nuevamente
con L dará origen al lı́mite superior del segundo intervalo (valor
incluido). Este proceso se repetirá hasta obtener el último intervalo.
Pudiéndose verificar entonces, que el lı́mite superior del último
intervalo coincidirá exactamente con el valor obtenido de la suma
de la mitad del exceso con el mayor valor de los datos.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Media aritmética (estimada) para datos por clases :


Es un caso particular de la media aritmética ponderada.
Xk
x c ∗ nc
i=1
x̂ = n ; x̂: media estimada, xc : marca de cada clase, nc : frecuencia absoluta de clase,
n: número de datos; k: número de clases o intervalos

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Mediana (estimada) para datos agrupados por clases :


n
2 − N(c−1)

me
c = Linf + ∗L
nc

Donde:
Linf : valor del lı́mite inferior de la clase o intervalo que contiene a la mediana.
n : número total de datos.
N(c−1) : Frecuencia absoluta acumulada de la clase anterior a la clase que contiene a
la mediana.
nc : frecuencia absoluta de la clase que contiene a la mediana.
L : longitud o amplitud del intervalo o clase.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Moda (estimada) para datos agrupados por clases:


h i
d1
mo = Linf + d1 +d2 ∗ L ; Linf : lı́mite inferior de la clase modal
c

d1 = nc − n(c−1) ; d1 : diferencia entre la frecuencia absoluta modal nc y la


anterior a la modal n(c−1) .

d2 = nc − n(c+1) ; d2 : diferencia entre la frecuencia absoluta modal nc y la


posterior a la modal n(c+1) .

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Tabla de distribución de frecuencias
Fuente y representación de datos
Tabla de distribución de frecuencias por clases o intervalos
Gráficos Estadı́sticos
Referencias

Cuartiles (estimados) para datos agrupados por clases:


" #
q ∗ n4 − N(c−1)

Q
cq = Linf + ∗L ; q = 1, 2, 3
nc

Donde:
Linf : valor del lı́mite inferior de la clase o intervalo que contiene al cuartil q.
n : número total de datos.
N(c−1) : Frecuencia absoluta acumulada de la clase anterior a la clase que contiene al
cuartil q.
nc : frecuencia absoluta de la clase que contiene al cuartil q.
L : longitud o amplitud del intervalo o clase.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Gráficos Estadı́sticos

Son representaciones gráficas de la totalidad de los datos analizados,


que permiten apreciar tendencias, magnitudes, variaciones y
patrones de comportamiento.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Gráfico de barras:
Se emplean para variables generalmente cualitativas y para variables
cuantitativas discretas de pocos valores. Muestran los datos de una
distribucion de frecuencias, en el eje horizontal van las etiquetas de
la variable y en el eje vertical los valores de frecuencia absoluta o
relativa, que tenga cada etiqueta o cada valor. Se pueden alternar
los ejes dependiendo del criterio del investigador, de igual forma el
diseño del gráfico.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Gráfico de Pastel:
Se emplean generalmente para representar variables cualitativas en
porcentajes y proporciones. El ángulo de cada sector circular está
dividido de forma proporcional al valor de la frecuencia absoluta o
relativa respectiva de cada etiqueta o clase.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Gráfico de Tallo y hoja:


Es un semi gráfico que permite presentar la distribución de una
variable cuantitativa. Consiste en separar cada dato en el último
dı́gito (que se denomina hoja) y las cifras delanteras restantes (que
forman el tallo).

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Es especialmente útil para conjuntos de datos de tamaño medio


(entre 20 y 50 elementos) y que sus datos no se agrupan alrededor de
un único tallo. Con él podemos hacernos la idea de qué distribución
tienen los datos, la asimetrı́a, etc.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Gráfico de Dispersión:
Se emplean para representar la relación entre dos variables
cuantitativas.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Histograma: Es la forma más común de representar la distribución


de frecuencias de una variable exclusivamente cuantitativa. Se
lo construye dibujando rectángulos cuyas bases corresponden a
cada intervalo de clase, y su altura está dada por el valor
de sus frecuencias, absolutas o relativas, la forma obtenida
será igual, únicamente cambiará la escala vertical.Representan el
comportamiento global de la variable en términos de concentración
y sesgo. Las barras siempre estarán juntas. Si las alturas de las
rectángulos son similares se tendrá una distribucion de tipo uniforme.
Si las alturas son mayores en cierta zona se tendrá una distribución
de tipo campana de Gauss, que a su vez puede ser simétrica o
asimétrica con sesgos positivos o negativos. Si hay rectángulos muy
alejados se dice que son datos atı́pidos. Probablemente estos datos
se deban a errores de medición y en ocaciones se los puede descartar
pues no pertenecerán al grupo que se desea caracterizar.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica
Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Polı́gono de frecuencias:
Se utiliza básicamente para mostrar la distribución de frecuencias
de variables cuantitativas. Para construir el polı́gono de frecuencia
se toma la marca de clase que coincide con el punto medio de
cada rectángulo de un histograma y puede estar representado
conjuntamente con el histograma o de manera independiente.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Ojiva:
Este gráfico sirve para representar, frecuencias acumuladas ya sean,
absolutas Ni , o relativas Fi . Se la utiliza principalmente para
responder a preguntas del tipo: ¿Cuántos valores son menores
que. . . ?

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Diagrama de caja:
Es la expresión gráfica de ciertos indicadores que determinan
el comportamiento de la variable, se emplea para establecer
comparaciones entre 2 o más grupos de datos.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Estructura del Diagrama de caja: El Lı́mite inferior = Q1 −1.5(RIC )


y el Lı́mite superior = Q3 + 1.5(RIC ), forman los denominados bigotes.
Q1 y Q3 son los valores de los cuartiles 1 y 3. RIC = Q3 − Q1 ,
representa el rango intercuartı́lico (longitud de la caja). Cualquier
valor fuera de los lı́mites inferior y superior debe ser considerado
como valor atı́pico.

Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica


Estadı́stica
Medidas Descriptivas
Fuente y representación de datos
Gráficos Estadı́sticos
Referencias

Referencias Bibliográficas:

Anderson, D. Sweeney, D. y Williams, T. (2009). Estadı́stica


para Administración y Economı́a. CENGAGE Learning
Editores, SA. 10ma Ed.
Lind, D. Marchall, W. y Wathen, S. (2008). Estadı́stica
Aplicada a los Negocios y la Economı́a. Mc Graw Hill. 13va Ed.
Levin, Richard. (2010). Estadı́stica para la Administración y
Economı́a. Pearson Educación. 7ma Ed.
Mason, Robert, D. (1992). Estadı́stica Aplicada a los Negocios
y Economı́a. Mc Graw Hill. 1ra Ed.
Montgomery, D. Runger, G. (2010). Probabilidad y Estadı́stica
aplicadas a la Ingenierı́a. Mc Graw Hill. 5ta Ed.
Carlos E. Balseca C, MSc. Probabilidad y Estadı́stica

También podría gustarte