Está en la página 1de 71

ESTADISTICA GENERAL

Acompañamiento examen complexivo


Mariela Sánchez Alejandro
Tema: Estadística General

1. Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de datos

2. Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia
central

3. Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables de la realidad: Medidas de


dispersión, concentración, asimetría y curtosis.

4. Probabilidades: Concepto y enfoques de probabilidad, distribuciones de probabilidad discreta y continua

5. Inferencia estadística: Distribución muestral. Estimación. Concepto, formulación y prueba de hipótesis.

Bibliografía:
Lind, Marchal, Wathen, 2012, Estadística aplicada a los negocios y la economía, McGraw Hill.
Webster, Allen, 2001, Estadística aplicada a los negocios y la economía.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
Ladatos
estadística es una de las herramientas más ampliamente utilizadas; su aplicación en instituciones gubernamentales y
educativas, en los negocios, en la industria, en la banca y en otros quehaceres diarios hacen de la estadística una
herramienta indispensable.

Sin embargo el término “Estadística” tiene varios


significados para diferentes personas; para la gente
común y corriente la estadística solamente significa
números.
En el diario de la mañana se puede encontrar la
estadística más reciente sobre los delitos de la ciudad
que hayan sido denunciados en determinado periodo
de tiempo; de los nacimientos y muertes que han
ocurrido, o en relación con el deporte, el número de
partidos ganados y perdidos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Para otras personas es un método para obtener, presentar y
escribir grandes cantidades de datos, y para otras es un método
para tomar decisiones en situaciones difíciles.

La estadística también sirve para examinar el riesgo en el


análisis de inversiones, los estudios de probabilidad nos
permiten predecir, en cierta medida, los comportamientos de
las inversiones, o al menos, las posibles ganancias o pérdidas
en cualquier caso. Esto resulta muy útil para decidir cuándo
invertir o no y de qué manera hacerlo. La necesidad de valorar
algo que puede o no suceder ha llevado a aplicar conceptos
como el valor esperado o la varianza a las finanzas. Las
estadísticas de las finanzas públicas miden las actividades
financieras de un gobierno en una economía.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos

1.- La estadística como disciplina o área de estudio.


2. - La estadística o las estadísticas como resultados que presentan organismos de estadística oficiales.
3. - Un estadístico como un procedimiento para obtener un número a partir de valores de una encuesta.

Como área de estudio, la Estadística proporciona los métodos que ayudan a resolver los problemas correspondientes, para
ello es necesario conocer los conceptos básicos que conforman los contenidos de esta materia tales como:
a) Población.
b) Muestra.
c) Variable.
d) Datos u observaciones.
e) Parámetros.
f) Estadígrafos o Estadísticos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos

Población: es un conjunto de personas, entidades u objetos del cual se quiere saber algo que nos interesa para tomar una
determinación acertada.

La población puede ser finita o infinita.

Muestra: es un subconjunto de la población que se estudia para determinar el parámetro que describe la característica
deseada de la misma.

Muestra aleatoria es aquella que se obtiene de tal manera que cada posible observación disponible en la población, tiene
la misma probabilidad de ser seleccionada

Para poder obtener estas muestras es necesario que no intervenga la preferencia del investigador por algún elemento de
la población; es decir, cada elemento de la población deberá tener igual oportunidad de ser seleccionado
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos

Variable: característica observable de un suceso, objeto o hecho que es susceptible a medición.


Las variables se clasifican en cualitativas y cuantitativas.

Variable aleatoria: es una función que asocia un numero a cada resultado del espacio muestral.

Datos u observaciones: Es el elemento primario de la información, los datos reunidos pueden cobrar significación. Solo o
aislado el dato no posee relevancia, pero utilizado en las premisas de un razonamiento puede llevarnos a una conclusión.
Surgen de la observación o la experiencia.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos

Parámetros: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún
atributo.
Intenta resumir toda la información que hay en la población en unos pocos números.  

Estadígrafos o Estadísticos: Es la cantidad numérica calculada sobre una muestra que resume su información en algún
aspecto.

Los promedios y proporciones muestrales son características medibles de las muestras respectivas.

Los indicadores que permiten hallar un valor numérico, el mismo que representa a toda la población o muestra en estudio
se les denomina estadígrafos.
Si un estadístico se usa para aproximar un parámetro suele llamarse estimador.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos

“La Estadística Descriptiva es el estudio que incluye la obtención, organización, presentación y descripción de
información numérica”.

“La inferencia estadística es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a
una información obtenida mediante técnicas descriptivas”.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que pueden tomar las variables, la
primera tarea de la Estadística es la de ordenar y presentar los datos en tablas que permitan ver la tendencia de los
mismos. Ordenados los datos se facilita su representación en diagramas y gráficas de diferentes tipos.
Existen diferentes formas de describir, presentar, ordenar, resumir la información en tablas y su presentación en
diferentes tipos de gráficas.

Escalas de Medición.
La clasificación de las variables depende del nivel de medición de la característica deseada.
El nivel de medición también denominado escalas de medición, se lo puede clasificar en:
1. Nominal: es la que se usa para asignarle una etiqueta a las categorías que se construyen de la variable con el único fin
de distinguir unas de otras.
2. Ordinal: es la que permite ordenar o jerarquizar las categorías que se construyen de la variable que se evalúa.
3. Por intervalo: es la que permite clasificar, ordenar y cuantificar las categorías que se establecen de la variable.

En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20

Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.

Definición de variable:
Número de caballo
Lugar que ocupó
Tiempo que hizo
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20

Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.

Definición de variable: Tipo de variable:


Número de caballo Variable cualitativa nominal
Lugar que ocupó Variable cualitativa ordinal
Tiempo que hizo Variable cuantitativa continua
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20

Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.

Definición de variable: Tipo de variable: Escalas de medición:


Número de caballo Variable cualitativa nominal Nominal (numeración de los caballos).
Lugar que ocupó Variable cualitativa ordinal Ordinal (lugar ocupado en la carrera).
Tiempo que hizo Variable cuantitativa continua Por intervalos (tiempo durante el recorrido).

La escala de medición por intervalos es la de mayor nivel de medición e incluye las dos anteriores; para poder usarse
con la precisión deseada es necesario fijar un patrón de medida que cuantifique a la variable con la misma exactitud,
cuantas veces sea medida.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Distribución de Frecuencias
Los datos agrupados en tablas, nos permiten ver con facilidad el número de observaciones iguales o comprendidos en un
intervalo, a este número de repeticiones iguales de la variable se llama frecuencia y se denota por fi. Otros valores
relacionados con la frecuencia son:
 La frecuencia relativa que se denota por fr.
 La frecuencia acumulada que se denota por Fi.
 La frecuencia relativa acumulada que se denota Fr.

Distribución de Frecuencias Absolutas y Relativas


Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y resumir los
datos obtenidos en la investigación de campo, para ello se concentran en tablas de
frecuencia y éstas pueden ser:
 Absoluta.
 Relativa.
 Acumulada.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las características y bondades de las
carreras de Ingeniería, Química, Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario
donde especificaron además de los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados:

I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q

a) ¿Qué variable que se analiza?


b) ¿Qué tipo de variable es?
c) ¿Qué tipo de escala define la variable?
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
La maestra de orientación del Plantel 11 dio una conferencia al grupo 603 sobre las características y bondades de las
carreras de Ingeniería, Química, Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un cuestionario
donde especificaron además de los datos personales, la carrera de preferencia. Se obtuvieron los siguientes resultados:

I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q

a) ¿Qué variable que se analiza? Carrera de preferencia


b) ¿Qué tipo de variable es? Cualitativa nominal
c) ¿Qué tipo de escala define la variable? Nominal

NÚMERO DE Frecuencia absoluta es el número de


CATEGORÍAS ALUMNOS ( f ) veces que se repite la misma
I 8 observación. Se simboliza con ( f )
Q 14
M 13
A 10
Total 45
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
a) ¿Cuál categoría es la de mayor frecuencia?
b) ¿Qué información podemos determinar con la categoría de mayor frecuencia?
c) ¿Qué carrera es la menos solicitada?

NÚMERO DE
CATEGORÍAS ALUMNOS ( f )
I 8
Q 14
M 13
A 10
Total 45
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
a) ¿Cuál categoría es la de mayor frecuencia? Química
b) ¿Qué información podemos determinar con la categoría de mayor frecuencia? La carrera de Química es la mas
solicitada
c) ¿Qué carrera es la menos solicitada? Ingeniería

NÚMERO DE
CATEGORÍAS ALUMNOS ( f )
I 8
Q 14
M 13
A 10
Total 45
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
El gerente de una Empresa, Kimberly preocupado por el pago de energía consumida solicito al jefe de planta, un estudio
del consumo diario durante el mes de agosto. Los resultados obtenidos. KW/hr (kilowatts por hora) son los siguientes:

Consumo de energía en KW/hr de la empresa Kimberly correspondiente al mes de agosto de 2015

Consumo
(KW/hr) (f)
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
a) Define la variable del problema
b) ¿Qué tipo de variable es?
c) ¿Qué valores toma la variable?
d) ¿Qué tipo de escala define la variable?
e) ¿Cuál es la mayor frecuencia de la variable?
f) ¿Qué frecuencia tiene la variable cuya categoría es 10?

Consumo
(KW/hr) (f)
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
a) Define la variable del problema: Consumo en KW/hr
b) ¿Qué tipo de variable es? Cuantitativa contínua
c) ¿Qué valores toma la variable? Los valores de la variable se encuentran en un rango de 5 a 12 KW/hr
d) ¿Qué tipo de escala define la variable? Por intervalos
e) ¿Cuál es la mayor frecuencia de la variable? La mayor frecuencia es 6 y significa en 6 días del mes se tiene consumo
de 9 KW/hr.
f) ¿Qué frecuencia tiene la variable cuya categoría es 10? La frecuencia de la categoría 10 es 5 lo cual significa que en 5
días del mes hubo un consumo de 10 KW/hr.
Consumo
(KW/hr) (f)
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Otro parámetro importante es la frecuencia relativa que simbolizaremos con “fr”, ésta se obtiene dividiendo la
frecuencia absoluta (fi) entre el número de elementos de la muestra que simbolizaremos con (n).
La frecuencia relativa se puede expresar como una razón, como una proporción o como un porcentaje.

( fr )
Consumo
(KW/hr) (f) Razón Proporción Porcentaje
5 2 2/5 0,07 7% Frecuencia relativa (fr) es la proporción de
6 3 3/30 0,10 10% elementos que pertenecen a una categoría y
7 4 4/30 0,13 13% ésta se obtiene dividiendo su frecuencia
8 5 5/30 0,17 17% absoluta entre el número total de elementos
9 6 6/30 0,20 20% de la muestra.
10 5 5/30 0,17 17%
11 3 3/30 0,10 10%
12 2 2/30 0,07 7%
Total 30 30/30 1,00 100%
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas
Al representar en una gráfica la información concentrada en la tabla de frecuencias, ésta es un recurso visual que nos
permite tener una idea clara, precisa, global y rápida acerca de las observaciones de una muestra o población.
Existen muchos tipos de gráficas en las que se pueden representar la frecuencia absoluta (fi), relativa (fr) y acumulada
(Fi) y con ellas podemos estimar algunos valores con la simple observación.

Los diferentes tipos de gráfica que podemos usar para representar las observaciones de un determinado problema y la
selección de este tipo, dependen de la variable en estudio.

Si la variable en estudio es del tipo cualitativo, los gráficos pueden ser:


a) De barras; horizontales o verticales
b) Circulares
c) Pictogramas

Si la variable en estudio es de tipo cuantitativo, los gráficos que podemos usar para su representación gráfica son:
a) Histogramas
b) Polígonos de frecuencias
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de
frecuencias de una variable continua.

Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo
que le indica al gerente de personal que realice un análisis del problema.

El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad:

13, 19, 22, 14, 13, 16, 19, 21


23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
21, 17, 18, 24, 21, 20, 19, 26
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de
frecuencias de una variable continua.

Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo
que le indica al gerente de personal que realice un análisis del problema.

El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad:

13, 19, 22, 14, 13, 16, 19, 21


23, 11, 27, 25, 17, 17, 13, 20
23, 17, 26, 20, 24, 15, 20, 21
23, 17, 29, 17, 19, 14, 20, 20
10, 22, 18, 25, 16, 23, 19, 20
21, 17, 18, 24, 21, 20, 19, 26
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
 La mayor frecuencia es f4 = 16
 Los años de antigüedad no inician desde cero
 Las líneas verticales punteadas corresponden al punto medio o marca de clase y éste nos indica el promedio de las
puntuaciones en cada clase. Frecuencia (numero
 Para la tercera barra, el promedio en años de obreros)
cumplidos de los obreros de la empresa
ubicados en esa clase es de M3 =17 años
y como la frecuencia es f3 = 10 obreros con
la misma antigüedad.

Años de servicio
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Polígono de Frecuencia
El polígono de frecuencia se construye a partir de los datos de la tabla de frecuencias.
Sobre el eje horizontal se levanta por el punto medio segmentos verticales punteados que terminan a la altura de su
frecuencia de clase, se unen los puntos superiores con un segmento de recta que empieza medio punto antes del límite
superior de la última clase.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Polígono de Frecuencia acumulada relativa
Si en la escala vertical en lugar de representar las frecuencias absolutas, se representa la frecuencia relativa, se obtiene
un polígono de frecuencia acumulada
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Polígono de Frecuencia acumulada (Ojiva)
La gráfica de la frecuencia acumulada es muy útil porque en ella podemos determinar cuántas observaciones hay por
arriba o por debajo de algún valor que nos interese.
La gráfica que se obtiene de la frecuencia acumulada también se conoce con el nombre de ojiva.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas

Gráficas Circulares.
Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. es un
recurso estadístico que se utiliza para representar porcentajes y proporciones. Consisten en subgrupos que son
combinados para formar una unidad entera.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas

Diagrama de barras.
Los gráficos de barras, que también llamados gráficos de columnas, muestran observaciones hechas a lo largo del
tiempo. Son principalmente utilizados para mostrar el cambio de una variable en el tiempo.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas

Pictograma
Es otra forma de representación gráfica de la información de un determinado problema.
En este tipo de gráfica se usa la imagen de la variable, por ejemplo:
a) Árboles: si la variable representa árboles.
b) Libros: si la variable representa libros.
c) Casas: si la variable representa casas.
d) Figuras de personas: si la variable son personas, etcétera.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
En Estadística Descriptiva el material de trabajo lo constituyen los datos, que son los resultados de las observaciones.
Una vez obtenidos los datos hay que ordenarlos y clasificarlos mediante algún criterio racional de modo que sea posible
una visión crítica de los mismos.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Medidas de tendencia central: se refieren a los valores de la variable que suelen estar en el centro de la distribución.

Análisis estadísticos sencillos que se usan para describir características, o elementos típicos, de la información que se
recoge con el fin de resumir los datos e indicar similitudes o diferencias entre ellos que permita comparar dos grupos de
datos.

Moda:
La moda de una muestra x1, x 2,…xn es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el
valor que más se repite, y se denota por Mo.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
EJEMPLO: Edad de jubilados encuestados

EDAD mi fi fri fri% Fi Fri Fri%


50-60 55 10 0,2 20% 10 0,2 20%
60-70 65 18 0,36 36% 28 0,56 56%
70-80 75 14 0,28 28% 42 0,84 84%
80-90 85 6 0,12 12% 48 0,96 96%
90-100 95 2 0,04 4% 50 1 100%
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central

Cálculo de la moda para datos agrupados


Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase que tiene mayor
frecuencia llamado clase modal.
Para determinar un solo valor de este intervalo para la moda utilizamos la siguiente ecuación:

Mo = Moda
LMo = Límite inferior de la clase modal
d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior a ella (d1 = fi – fi-1 )
d2 = frecuencia de la clase modal menos la frecuencia de la clase posterior a ella (d2 = fi – fi+1 )
h = amplitud del intervalo de clase
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
EJEMPLO: Edad de jubilados encuestados
EDAD mi fi fri fri% Fi Fri Fri%
50-60 55 10 0,2 20% 10 0,2 20%
60-70 65 18 0,36 36% 28 0,56 56%
70-80 75 14 0,28 28% 42 0,84 84%
80-90 85 6 0,12 12% 48 0,96 96%
90-100 95 2 0,04 4% 50 1 100%
La clase modal es 60-70 , ya que es la que presenta la mayor frecuencia

LMo = 60
fi = 18
fi-1= 10
fi+1 = 14
d1 = 18 – 10 =8
d2 = 18-14 = 4
h = 10
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Mediana: Dado un conjunto de n observaciones x1, x 2,…., xn, de la variable x, se define la mediana de este conjunto de
valores, como aquel valor que no es superado ni supera a más de la mitad de las n observaciones, arregladas en orden
de magnitud creciente o decreciente.

Cálculo de la Mediana: Ordenar los datos en orden de magnitud creciente, X(1) X(2) X(n) entonces la mediana esta
definida mediante la siguiente fórmula:

Nota: En general, la mediana no se ve afectada por valores muy grandes o por valores muy pequeños en los datos en
comparación a la media. Por ejemplo, si x 3= 40, la media es 1/3(1+2+40)=14.33, sin embargo la mediana es Me=2.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central

x1 2
x2 3
x3 5
x4 6
x5 8

La mitad de las observaciones son menores o iguales que 5 y la otra mitad son mayores o iguales que 5.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central

x1 2
x2 3
x3 5
x4 6
x5 8
x6 9

La mitad de las observaciones son menores o iguales que 5,5 y la otra mitad son mayores o iguales que 5,5.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Cálculo de la mediana para datos agrupados
Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase que contiene a la
mediana llamado clase mediana. Para ello, debemos determinar la frecuencia acumulada absoluta que contenga al
elemento número

El valor de este intervalo para la mediana se calcula utilizando la siguiente ecuación:

Me = Mediana
Lm = Límite inferior de la clase mediana
n = cantidad de datos
Fi-1 = frecuencia acumulada absoluta de la clase anterior al intervalo mediana
fi = frecuencia absoluta de la clase mediana
h = amplitud del intervalo de clase
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central

EDAD mi fi fri fri% Fi Fri Fri%


50-60 55 10 0,2 20% 10 0,2 20%
60-70 65 18 0,36 36% 28 0,56 56%
70-80 75 14 0,28 28% 42 0,84 84%
80-90 85 6 0,12 12% 48 0,96 96%
90-100 95 2 0,04 4% 50 1 100%

La clase mediana es la que contenga el elemento en la posición (50+1)/2 =25,5 es el intervalo 60-70
Buscamos en la frecuencia acumulada Fi y vemos que se halla en el intervalo [60, 70)
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Media:
La media (o promedio) de una muestra x1, x 2,…xn de tamaño n de una variable x, se define como la suma de todos los
valores observados en la muestra, dividida por el número total de observaciones n, es decir:

Por ejemplo si los datos son x1 = 1, x 2 =2, x3=3, entonces la media es 1/3(1+2+3)=2.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
El Departamento de Acción Social ofrece un estímulo especial a aquellas agrupaciones en las que la edad promedio de
los niños que asisten está por debajo de 9 años. Si los siguientes datos corresponden a las edades de los niños que
acuden de manera regular al Centro ¿calificará éste para el estímulo?

8
5
9
10
9
12
7
12
13
7
8
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central

Cálculo de la media para datos agrupados


Para calcular la media para datos agrupados, primero calculamos el punto medio de cada clase (marca de clase mi ).
Después se multiplica cada punto medio por la frecuencia absoluta de cada intervalo
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central

COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Entre las medidas de tendencia central, la media requiere variables cuantitativas (de intervalo, aunque también suele
calcularse con datos ordinales).

La mediana es un estadístico típicamente ordinal (requiere valores ordinales al menos). Al contrario de lo que ocurre con
la media, la mediana es insensible a la presencia de valores extremos, por lo tanto es preferible a la media cuando la
distribución es asimétrica.

La moda sirve para todo tipo de variables, pero es mas apropiada para caracterizar datos categóricos porque es un
estadístico que aprovecha información nominal.

Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central

COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

En una distribución con sesgo positivo, la moda se halla en el punto más alto de la distribución, la mediana está hacia la
derecha de la moda y la media más a la derecha. Es decir Mo < Me < x

En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la izquierda de la moda y la
media está a la izquierda de la mediana. Es decir, x < Me < Mo

Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser la mejor medida de posición,
debido a que está siempre entre la media y la moda.

La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.

- Variables cualitativas: Solo podremos calcular la moda


- Variables ordinales: moda y mediana
- Variables cuantitativas: Podemos calcular las 3
El salario medio es de 34419,57 dólares ( media).

La mitad de los encuestados tienen salarios por debajo de


28875 dólares (mediana, percentil 50).

La diferencia entre en encuestado de mayor sueldo y el que


menos gana es 119250 dólares (rango).

El 50% de los encuestados tienen salarios comprendidos entre


24000 y 37162,5 dólares. (percentiles 25 y 75)
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Medidas de posición: en ocasiones es necesario saber que ocurre no solo en el centro sino también en otros puntos de la
población. Las medidas de posición no ayudarán a encontrar otros puntos dentro de la distribución de datos y desde ahí
poder tomar decisiones.

Cuartiles: divide la población en 4 partes iguales, calcula los percentiles 25, 50 y 75, es decir los valores por debajo de los
cuales se encuentra el 25%, el 50% y el 75% de los casos.

Deciles: divide la población en 10 partes iguales

Percentiles: divide la población en 100 partes iguales, se usa también como genérico para dividir en valores concretos
(valores que acumulan un determinado porcentaje de casos)

Medidas de tendencia central: Nota media de un examen en una clase de 30 niños


Medidas de posición: ¿Qué nota debe sacar un alumno para superar al 50% de compañeros?
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones  por
parte de una clínica,  de reportes clínicos  para realizar estudios de glucosa.

Promedio de Número de Frecuencia ¿Cuál es el numero de datos a considerar?


Intervalos días  pacientes  acumulada  
¿En que intervalo se ubica el primer cuartil?
1 día a 9 días 5 5 5
¿En que intervalo se ubica el segundo cuartil?
10 día a 19 días 14.5 6 11
¿En que intervalo se ubica el tercer cuartil?
20 día a 29 días 24.5 8 19
30 día a 39 días 34.5 8 27
40 día a 49 días 44.5 4 31
50 día a 59 días 54.5 5 36
60 día a 69 días 64.5 7 43
70 día a 79 días 74.5 8 51
80 día a 89 días 84.5 4 55
90día a 100 días 94.5 8 63
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones  por
parte de una clínica,  de reportes clínicos  para realizar estudios de glucosa.

Promedio de Número de Frecuencia ¿Cuál es el numero de datos a considerar? 63


Intervalos días  pacientes  acumulada  
¿En que intervalo se ubica el primer cuartil? 3
1 día a 9 días 5 5 5
¿En que intervalo se ubica el segundo cuartil? 6
10 día a 19 días 14.5 6 11
¿En que intervalo se ubica el tercer cuartil? 8
20 día a 29 días 24.5 8 19
30 día a 39 días 34.5 8 27 Si el primer cuartil es 15,75 y representa 25,34
40 día a 49 días 44.5 4 31 días ¿qué significa esto?
50 día a 59 días 54.5 5 36
60 día a 69 días 64.5 7 43 Si el segundo cuartil es 31,5 y representa 50,9
70 día a 79 días 74.5 8 51 días ¿a que conclusiones se puede llegar?
80 día a 89 días 84.5 4 55
90día a 100 días 94.5 8 63 Si el tercer cuartil es 47,25 y representa 74,78
días ¿Qué puede concluir?
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones  por
parte de una clínica,  de reportes clínicos  para realizar estudios de glucosa.

Promedio de Número de Frecuencia Si el primer cuartil es 15,75 y representa 25,34 días ¿qué
Intervalos días  pacientes  acumulada  
significa esto?
1 día a 9 días 5 5 5
El 25% de los pacientes fueron mandados a valoración en
10 día a 19 días 14.5 6 11
25,34 días y el 75% de los pacientes lo hicieron después
20 día a 29 días 24.5 8 19
de 25,34 días
30 día a 39 días 34.5 8 27
40 día a 49 días 44.5 4 31 Si el segundo cuartil es 31,5 y representa 50,9 días ¿a
50 día a 59 días 54.5 5 36 que conclusiones se puede llegar?
60 día a 69 días 64.5 7 43 Que en  50,9 días se habían atendido al 50 % de los
70 día a 79 días 74.5 8 51 pacientes a ser valorados de los niveles de glucosa
80 día a 89 días 84.5 4 55
90día a 100 días 94.5 8 63 Si el tercer cuartil es 47,25 y representa 74,78 días ¿Qué
puede concluir?
El 75% de pacientes que envió la clínica a realizarse
estudios de glucosa lo realizo en 74,78días y el resto en
los otros días restantes
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Las medidas de dispersión estudian la distribución de los valores de la serie, analizando si estos se encuentran más o
menos concentrados, o más o menos dispersos.

Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor
más bajo.

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media.


La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la
serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.

4.- Coeficiente de variación de Pearson: Se calcula como cociente entre la desviación típica y la media.
El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de dispersión de dos
muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra
serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene vienes expresada en cm y la
otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En
concreto, podemos estudiar las siguientes características de la curva:

a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la
muestra. Para medir el nivel de concentración de una distribución de frecuencia se pueden utilizar distintos indicadores,
entre ellos el Indice de Gini.
El Indice Gini (IG) puede tomar valores entre 0 y 1
IG = 0 : concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango.
IG = 1 : concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados.

b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría)
los segmentos de curva que quedan a derecha e izquierda son similares.

c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la
muestra.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos).
1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno).

Ejemplo 1: vamos a calcular el índice de Gini de una serie de datos con los sueldos de los empleados de una
empresa. Datos: Calculamos los valores que necesitamos para aplicar la fórmula:

Sueldos Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi
Empleados
(miles de €)
20 10 10 25,0 200 200 13,8 11,2
20 10
27 12 22 55,0 324 524 36,3 18,7
27 12
36 8 30 75,0 288 812 56,3 18,7
36 8
48 5 35 87,5 240 1052 73,0 14,5
48 5
60 3 38 95,0 180 1232 85,4 9,6
60 3
90 1 39 97,5 90 1322 91,7 5,8
90 1
120 1 40 100,0 120 1442 100,0 0
120 1
X x x x x x x x
Σpi (entre 1 y n-1) = 435,0 Σ(pi - qi) (entre 1 y n-1 )= 78,5

Por lo tanto:

G=78,5/435,0=0,18 (18%)

Un coeficiente de Gini de 0,18 indica que la muestra está bastante uniformemente repartida, es decir, su nivel de
concentración no es excesivamente alto.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos).
1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno).

Ejemplo 2: el mismo ejemplo pero considerando que hay más personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor
concentración de renta en unas pocas personas.

Datos: Calculamos los valores que necesitamos para aplicar la fórmula:

Sueldos Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi
Empleados
(miles de €)
20 10 10 25,0 200 200 10,9 14,1
20 10
27 10 20 50,0 270 470 25,6 24,4
27 10
36 8 28 70,0 288 758 41,2 28,8
36 8
48 5 33 82,5 240 998 54,3 28,2
48 5
60 0 33 82,5 0 998 54,3 28,2
60 3
90 0 33 82,5 0 998 54,3 28,2
90 0
120 7 40 100,0 840 1838 100,0 0,00
120 4
x x x x x x x x

Por tanto: Σpi (entre 1 y n-1) = 392,5 Σ(pi - qi) (entre 1 y n-1 ) = 151,9

G=151,9/392,5=0,39 (39%)

El coeficiente de Gini se ha elevado considerablemente, reflejando la mayor concentración de rentas en la empresa.


3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Ejemplo 3: INDICE DE GINI DE LA UNIÓN EUROPEA (2001, 15 países)
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Ejemplo 3: INDICE DE GINI DE LA UNIÓN EUROPEA (2001, 15 países)

CONCLUSIÓN: se puede observar que Portugal, España y Grecia son los países con mayores desigualdades.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Asimetría o sesgo
Es un estadístico  que describe la simetría de la distribución alrededor de la media.

Si el sesgo es igual a cero, la distribución es simétrica (normal), ambas colas será iguales.
Si no existe una cola o sesgo, la asimetría tendrá un valor de cero.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.

Existe asimetría negativa (o a la izquierda) si


la "cola" a la izquierda de la media es más
larga que la de la derecha, es decir, si hay
valores más separados de la media a la
izquierda.

Decimos que hay asimetría positiva (o


a la derecha) si la "cola" a la derecha
de la media es más larga que la de la
izquierda, es decir, si hay valores más
separados de la media a la derecha.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
La siguiente afirmación es verdadera o falsa:
Una curva asimétrica con skewness (sesgo) positivo, indica que los valores tienden a reunirse en la zona de los valores
menores a la media.
Si los valores los valores están más reunidos en niveles superiores a la media ¿qué tipo de sesgo tenemos?

Curtosis, es un estadístico que describe el grado de “punta” o “achatamiento” de la distribución de una variable con
relación a la distribución normal.

El uso del coeficiente de la Curtosis es muy importante para establecer el grado en el que la distribución de los valores se
acerca o aleja de la curva normal.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Si el coeficiente es positivo, quiere decir que
La curtosis positiva indica una distribución hay una mayor concentración de los datos en
que perfila un gráfico “más en punta”, tal torno a la media. (Leptocurtica)
como vemos en la curva del centro, con Si el coeficiente es negativo, la distribución se
relación a la normal; será Leptocúrtica. llama Platicúrtica y muestra que hay una menor
concentración de datos en torno a la media;
sería más achatada.

Una curtosis negativa indica una


distribución relativamente más
achatada, como la que vemos a la
derecha; será Platicúrtica.

En una distribución normal la curtosis es igual a 3; es sobre ese valor que se


determina el nivel de Curtosis de una distribución. En esta distribución, la media,
la mediana y la moda son iguales entre sí.
El Error típico es una disposición de ajuste, la cual nos informa
que estas medidas pueden variar entre el rango de más o
menos el error típico.
Entre mayor sea el valor de error, mayor será la variación de los
datos.

Por ejemplo para la Asimetría = -0.179 el error es 0.141, es


decir, la asimetría va desde -0.320 hasta -0.038.

De igual manera, se puede emplear el valor del error típico con


la Curtosis y la Media.
N = 70 significa que se tomó en cuenta 70 valores de la muestra; no
hay valores perdidos

La Media, da el promedio de las ventas en todos los departamentos


de la firma; en este caso, el promedio es de $54.

La Mediana, es de $24; de inmediato se nota la diferencia que hay


con la media.

La Desviación Típica, $103.9394; muestra la dispersión media de las


ventas.

El valor que nos da la tabla para el análisis sobre las ventas es de


5,325; el error típico de la Asimetría es 0,287
Es un valor positivo, por lo tanto las ventas en general, en los
departamentos, se reúnen en valores menores a la media,
mostrando un desempeño no eficiente.

El valor de la curtosis en la tabla es 34,2920, lo que indica que los


valores están concentrados alrededor de la media.

El Rango es la diferencia entre el valor mínimo y máximo; el Mínimo


es$6; el Máximo es 776.50

El Rango es 770.5

También podría gustarte