Está en la página 1de 78

ESPECIALIZACIÓN EN ESTADÍSTICA

ESTADÍSTICA
Profesor: CARLOS CAMACHO CASTRO
Especialista en Estadística Aplicada
Magister en Estadística Aplicada
Doctor en Ciencias de la Educación

Celular: 3013868083
carloscamacho@mail.uniatlantico.edu.co
Referencia: Llinas Humberto, Estadística Inferencial.
Canavo George, Probabilidad y Estadística Aplicaciones y Métodos.
Montgomery Douglas. Probabilidad y Estadística para Ingeniería.
STADÍSTICA DESCRIPTIVA
ESTADISTICA DESCRIPTIVA E INFERENCIAL
CO NT E NID O
• Introducción.
• Estadística descriptiva.
• Distribución de frecuencia.
• Medidas de tendencia Central y variabilidad.
• Estadística inferencial.
• Muestras aleatorias y distribuciones
muéstrales
• Teoría de estimación.
• Prueba de hipótesis.
• Prueba de bondad de ajuste
• Tablas de contingencias.
• Métodos no paramétricos
INTRODUCCIÓN

En la vida diaria los diversos fenómenos de orden económico, social,


político, educacional, e incluso biológico, nos induce a tener un registro
ordenado y continuo de los datos necesarios para un estudio de lo que ha
sucedido, sucede o puede suceder. Para ello se requiere contar con un
método, con un conjunto de reglas o principios, que nos permita la
observación, el ordenamiento, la cuantificación y el análisis de dichos
fenómenos.
CONCEPTO DE ESTADISTICA.
ESTADISTICA: La Estadística se considera como la técnica o método científico
usado para recolectar, organizar, resumir, presentar, analizar, interpretar,
generalizar y contrastar los resultados de las observaciones de los fenómenos
reales.

Estadística: no es más que una colección de datos numéricos y categóricos


ordenados y clasificados según un determinado criterio .
DFINICIÓN DE ESTADISTICA DESCRIPTIVA
.
La Estadística se considera como la técnica o método científico usado para
recolectar, organizar, resumir, presentar, analizar e interpretar un fenómeno
en estudio.
DEFINICIÓN DE ESTADISTICA INFERENCIAL.
La estadística inferencial abarca aquellos métodos y conjuntos de técnicas que
se utilizan para obtener conclusiones sobre las leyes de comportamiento de
una población basándose en los datos de muestras tomadas de esa población.
DEFINICIÓN DE ESTADISTICA MATEMATICA.
Estadística, es la ciencia que, utilizando como instrumento a las matemáticas y
al cálculo de probabilidades, estudia las leyes de comportamiento de aquellos
fenómenos que, no estando sometidos a las leyes físicas y basándose en ellas
predecir y realizar inferencias de los resultados.
APLICACIÓN DE
.
LA ESTADISTICA.
En general, el problema que enfrentan las empresas e industrias no es la escasez de
información, sino como utilizar la información disponible para tomar las decisiones
más adecuadas. Por esta razón, desde la perspectiva de una toma de decisiones
informada, cabe preguntarse por qué un ingeniero, un administrador, un
economista, etc, necesita saber estadística. Para dar respuesta a esta inquietud
podemos decir que estos deben comprender la estadística, básicamente, por tres
razones fundamentales:
1. Presentar y describir la información en forma adecuada.
2. Inferir conclusiones sobre poblaciones grandes basándose solamente en la
información obtenida de subconjuntos de ellas.
3. Utilizar modelos para obtener pronósticos confiables.
DEFINICION .DE POBLACIÓN.
Una población es el conjunto total de objetos que son de interés para un problema
dado. Los objetos pueden ser personas, animales, productos fabricados, etc. Cada
uno de ellos recibe el nombre de elemento o individuo de la población.
Ejemplo: población estudiantil de la Universidad del atlántico, los niños de una
ciudad, enfermos de un hospital, etc.
DEFINICIÓN DE MUESTRA.
Una muestra es un subconjunto de la población. Ejemplo: Si todos los estudiantes
de la Universidad del Atlántico es una población, los estudiantes nacidos en
determinado mes del año pueden constituir una muestra.
TIPOS DE
. DATOS:
Existen dos tipos de datos: Numéricos (cuantitativos) y Categóricos o
(cualitativos).
DATOS NUMERICOS (CUANTITATIVOS)
Los datos numéricos o cuantitativos producen respuestas numéricas como el peso
en kilogramos o el número de universidades que hay en la Costa Atlántica.
Estos datos son de dos tipos: discretos y continuos.
DATOS DISCRETOS:
Producen respuestas numéricas de enteros que surgen de un conteo. Ejemplos de
datos discretos son la cantidad de universidades que hay en la Costa Atlántica, el
número de estudiantes en la Universidad del Atlántico en el año 2018, número de
hijos en una familia, etc.
DATOS CONTINUOS
.

Producen respuestas numéricas que surgen de un proceso de medición, donde la


característica de que se mide puede tomar cualquier valor numérico en un
intervalo. Ejemplos datos continuos son el peso (en kilogramos) de una persona, su
estatura (en metros), el tiempo que usted tarda en llegar a la Universidad del
Atlántico, etc.

DATOS CATEGORICOS O CUALITATIVOS.


Representan categorías o atributos (Ejemplo, si o no) que pueden clasificarse como
un criterio o cualidad.
.

ORGANIZACIÓN DE DATOS SEGÚN ESCALAS DE MEDIDAS.


Los datos también se pueden clasificar según la escala de medición o el
procedimiento que los genero. Cuatro tipos de escalas de medición usados en
estadística son:
Las escalas nominal.
Las escala Ordinal.
Las escalas de intervalo.
Las escalas de razón.
.

DATO DE NIVEL NOMINAL: (Solo permite asignarle un nombre al elemento


medido)
Un dato nominal se crea cuando se utilizan nombres para establecer categorías
con la condición de que cada dato pertenezca única y exclusivamente a una de
estas categorías. Existen escalas nominales tanto para los datos numéricos
como categóricos. Una escala nominal para datos numéricos asigna números a
las categorías. Por ejemplo, entre los datos numéricos que son nominales se
incluyen los números en las camisetas deportivas, los números telefónicos, etc
.
DATOS DE NIVEL ORDINAL: (Permiten establecer un orden entre los elementos
medidos).
Los datos medidos en una escala nominal ordenada de alguna manera se
denominan datos ordinales. Una escala ordinal coloca las medidas en categorías,
cada una de las cuales indica un nivel distinto respecto a un atributo que se está
midiendo. La lista de datos ordinales comprende:
Ejemplo: Clasificaciones por letra: A, B, C y D; estos grados indican categorías de
perfeccionamiento, así como los niveles alcanzados. La evaluación de un docente:
insuficiente, aceptable, bueno y excelente. Etc.
.
DATOS POR INTERVALOS: (Calcular diferencias entres las mediciones).

Los datos medidos en una escala ordinal para los cuales pueden clasificarse las
distancias entre valores, se llaman datos de intervalos. Ejemplo, temperatura de
una persona, sobrepeso respecto a un patrón de comparación.
DATOS DE RAZÓN: (Comparar mediciones mediante un cociente)
Los datos medidos en una escala de intervalo con un punto cero que significa
“ninguno”, se llaman datos de razón. Las escalas de razón incluyen salarios,
unidades de producción, peso, altura, etc.
 
DEFINICION DE ESTADÍSTICOS Y PARÁMETROS.
Definición de estadístico: Son valores que se obtienen de una muestra, y se
consideran como estimadores de los parámetros.
Media aritmética muestral
Desviación estándar muestral: S
Varianza muestral: S2
Proporción muestral:  

Definición de parámetros: Son valores que se obtienen de una población.


Media aritmética poblacional: µ
Desviación estándar poblacional: σ
Varianza poblacional: σ2
Proporción poblacional: P
ORGANIZACIÓN DE DATOS MEDIANTE TABLAS.
Consiste en la tabulación de los datos para facilitar su estudio.
Definición de frecuencia absoluta:
Simbolizado con la letra f, es el número de veces que aparece ese dato en una
colección de datos.
Ejemplo:
En el conjunto de datos 4, 5, 5, 3, 2, 6, 7, 7, 7, y 2, el cuatro solo aparece una
vez (por lo tanto, tiene frecuencia f = 1), el cinco aparece dos veces (o sea,
frecuencia f = 2), el 7 tiene frecuencia f = 3, etc.
TABLA DE FRECUENCIA NO AGRUPADA.

Son aquellas en donde cada dato tiene la frecuencia correspondiente. Los


datos que organizados en tablas de frecuencias no agrupadas se denominan
usualmente datos no agrupados.
Ejemplo: La tabla de frecuencias (no agrupada) para el conjunto de datos. 3, 5,
7, 6, 4, 3, 7, 6, 6, 7, 5, 7.
TABLAS DE FRECUENCIAS AGRUPADAS
Otra posibilidad de organizar datos es agruparlos en intervalos (llamados
intervalos de clase o, simplemente, clases).
Ejemplo 1. (Primer modelo: Los datos son enteros) Construya una tabla de
frecuencias agrupadas considerando los siguientes datos.
14, 21, 23, 21, 16, 19, 22, 25, 16, 16, 24, 24, 25, 19, 16, 19, 18, 19, 21, 12, 16, 17, 18, 23, 25,
20, 23, 16, 20, 19, 24, 28, 15, 22, 24, 20, 22, 24, 22 y 20.
Organización:
12, 14, 15, 16, 16, 16, 16, 16, 16, 17, 18, 18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 21, 21, 21, 22,
22, 22, 22, 23, 23, 23, 24, 24, 24, 24, 24, 25, 25, 25, 28.
 
•Rango: Diferencia entre el dato mayor y el dato menor.
R = XM - Xm = 28 – 12 = 16
•Numero de intervalos de clases.
c = 1 + 3.3 logn, (regla de Sturges).
Donde n: número de datos o tamaño de la muestra.
Entonces: c = 1 + 3.3 log 40 = 6.287
Otra regla c = = = 6.2867 se aproxima a 6.0
• Amplitud de clase: denotado con w, considerado como el ancho del intervalo de
clase se define:
W = R/ c = 16/ 6 = 2,666 como la variable del estudio es discreta; es decir; la unidad de
precisión es 1, se toma escogemos el mínimo entero mayor que 2,666 como el valor de
la amplitud. Entonces: w = 3.
• Punto medio de cada unidad de medida:
 Como la variable es discreta,
El punto medio de la unidad de medida es 1/2 = 0.5.
Nota: si la variable es continua entonces el punto medio de la unidad de medida es
0.1/2 = 0,05.
• Intervalo inferior: es la diferencia entre el dato menor y el punto medio de la
unidad de medida.
Iinf = Xm - punto medio de la unidad de medida = 12 - 0.5 = 11.5.
• Intervalo superior:
Es la sumatoria entre el intervalo inferior y la amplitud.
Isup = Iinf + w = 11.5 + 3.0 = 14.5
TABLA DE DISTRIBUCION DE FRECUENCIA
INTERVALOS F FR FA XI

11.5 - 14.5 2 0.05 2 13

14.5 - 17.5 8 0.20 10 16

17.5 - 20.5 11 0.275 21 19

20.5 - 23.5 10 0.25 31 21

23.5 - 26.5 8 0.20 39 24

26.5 - 29.5 1 0.025 40 27


Definición de frecuencia acumulada:
La frecuencia acumulada de cualquier dato o clase, es la suma de la
frecuencia de ese mismo dato o clase con las frecuencias de todos los demás
datos o clases anteriores. A la tabla se le llama tabla de frecuencias
acumuladas.
Definición de marca de clase Xi
Esla sumatoria entres el intervalo inferior y el intervalo superior divididos
entre dos.
XI = ( Iinf + Isup) / 2
Definición de tablas bivariadas

Una tabla de frecuencias bivariadas es un arreglo de datos clasificados en dos


categorías con sus respectivas frecuencias. Las categorías pueden ser números
discretos, intervalos numéricos o valores cualitativos como género, color de
cabello o religión.
Ejemplo: Una encuesta sobre el deporte preferido tuvo los resultados en
hombres y mujeres que se muestran en la siguiente tabla bivariada .
Ejemplo:
Una encuesta sobre el deporte preferido tuvo los resultados en hombres y
mujeres que se muestran en la siguiente tabla bivariada.

ĞƉŽƌƚĞƐĨĂǀ ŽƌŝƚŽƐ
ĠŝƐďŽůĂƐƋƵĞƚďŽů&ƵƚďŽů
, Žŵ ďƌĞ ϭϵϭϱϮϰ ϱϴ
D ƵũĞƌ ϭϲ ϭϴϭϲ ϱϬ
dŽƚĂů ϯ ϱϯ ϯ ϰϬ ϭϬϴ
ORGANIZACIÓN DE DATOS MEDIANTES REPRESENTACIONES GRAFICAS.
Hay gráficas de varios tipos, entre los cuales se encuentran los siguientes:
 El diagrama circular.
 El diagrama de barras.
 El diagrama de caja y bigote,
 El histograma.
 El polígono de frecuencia o de frecuencia relativas.
 La ojiva o polígono de frecuencia acumulado.
 Diagrama de tallo y hojas. 
Diagrama circular:
Estos diagramas se utilizan para hacer representaciones porcentuales y se
utilizan generalmente para datos categóricos.
Ejemplo:
Encuesta realizados a una muestra de estudiantes de la Universidad del
Atlántico, sobre su deporte favorito:

DEPORTES FRECUENCIAS FRECUENCIAS RELATIVAS

FUTBOL 12 0,3

BEISBOL 9 0,4

TENIS 3 0,1

BASQUETBOL 6 0,2
Frecuencias

6; 20%
12; 40%
3; 10%

9; 30%

Futbol Beisbol
Tenis Basquetbol
Diagrama de barra:
Es una representación gráfica en la que cada una de las modalidades del aspecto de interés
se representa mediante una barra.

14 GRAFICA DE DEPORTES FAVORITOS

12

10

0
FU BEI T BASQUE...
Definición de Polígonos:
Estos gráficos se utilizan para representar series cronológicas y se construye usando una
tabla de frecuencias (absoluta o relativa) agrupadas con marcas de clase. Si se usan
frecuencias absolutas, se denomina polígono de frecuencias y si se utilizan frecuencias
relativas, polígono de frecuencias relativas.

POLIGONO DE FRECUENCIA
14
12
10
Frecuencias

8
6
4
2
0
FUTBOL BEISBOL TENIS BASQUETBOL
Deportes
Diagrama de tallo y hojas
El uso de una tabla de frecuencia agrupada tiene una desventaja bastante obvia: los
datos originales se pierden en el proceso de agrupamiento. Para salvar esta
limitación puede usarse el llamado diagrama de tallo y hojas. Estos diagramas fueron
creados por el estadístico John Tukey y ofrecen una forma novedosa y rápida de
exhibir información numérica: si un numeral tiene dos o más dígitos, entonces, se
puede descomponer en una rama y una hoja. Un tallo es el primer digito o parte del
numeral, mientras que una hoja está formada por ´el o los dígitos restantes. Por
ejemplo, el numeral 534 se puede descomponer en dos formas:
Ejemplo:
Los datos de abajo muestran el número de anuncios radiofónicos de 30 segundos
pagados el año pasado por cada uno de los 45 miembros de una empresa. Organice
los datos en un diagrama de tallo y hojas y determine la forma que toma este
diagrama. ¿Alrededor de qué valores tiende a acumularse el número de anuncios?
¿Cuál es el menor número de anuncios pagados por un comerciante? ¿El mayor
número pagado?
96, 93, 88, 117, 127, 95, 113, 96, 108, 94, 148, 156, 139, 142, 94, 107, 125, 155,
155, 103, 112, 127, 117, 120, 112, 135, 132, 111, 125, 104, 106, 139, 134, 119, 97, 89,
118, 136, 125, 143, 120, 103, 113, 124, 138.
Diafragma de tallo y hoja
8 8, 9
9 6, 3, 5, 6, 4, 4, 7
10 8, 7, 3, 4, 6, 3
11 7, 3, 2, 7, 2, 1, 9, 8, 3
12 7, 5, 7, 0, 5, 5, 0, 4
13 9, 5, 2, 9, 4, 6, 8
14 8, 2, 3
15 6, 5, 5
MEDIDAS
MEDIDAS DE TENDENCIAS CENTRAL O DE CENTRALIZACION.
MEDIDAS DE TENDENCIAS CENTRAL O DE CENTRALIZACION.
Al estudiar la información estadística mediante su representación gráfica, se puso en
evidencia un significativo comportamiento de los datos en cuanto a la frecuencia con
que se presentan los valores: algunos de estos valores son más frecuentes que otros.
Además, se observó´ una clara tendencia de agrupación en el vecindario de los valores
más frecuentes, de aquí deriva el nombre de medidas de tendencia central.
 La media aritmética
 La mediana.
 La moda.
 La media geométrica.
 La media armónica
 
La media aritmética
Definición: La media aritmética de cierto conjunto de números se encuentra sumando
los números y dividiendo después entre la cantidad de datos. En otras palabras, si
x1,...,xn son números, entonces, la media aritmética de este conjunto de números esta´
dada por
=
En estadística se habla de media aritmética poblacional, y se simboliza por µ, cuando el
conjunto de datos corresponden a los de la población; y de media aritmética muestral,
y se simboliza por , cuando se tienen en cuentan las muestras
Ejemplo:
Supongamos que tenemos la muestra siguiente de edades en año de principiantes de
una universidad: 18, 18, 18, 18, 19, 19, 19, 20, 20, 21. Entonces, la media aritmética de
estos datos es los datos de una muestra.
Media aritmética = (18+18+18+18+19+19+19+20+20+21) / 10 = 19
Media aritmética ponderada.
Generalmente, para calcular la media de un conjunto de datos, es más cómodo
utilizar la llamada media aritmética ponderada, la cual es un caso especial de la media
aritmética. Esta se puede utilizar cuando se tienen varias observaciones con un
mismo valor, lo que puede ocurrir si se han organizado los datos en una tabla de
frecuencias.
Del ejemplo anterior se tiene:

 
Entonces:
=

=19
X1 = 4,0 X2= 3,5 X3 = 4,2
Promedio =4*30%+3,5*40%+4,2*30% =1,2+1,4+1,26=3,9
Media para datos agrupados.
La media aritmética para datos agrupados = ∑ x i f / n.
Intervalos fj fr fa xi xif
11,5 - 14,5 2 0,05 2 13 26
14,5 - 17,5 8 0,2 10 16 128
17,5 - 20,5 11 0,275 21 19 209
20,5 - 23,5 10 0.25 31 22 220
23,5 - 26,5 8 0,2 39 25 〖 200 〗
26,5 - 29,5 1 0,025 40 28 28
40 1 ∑1▒ x_i f_j =811

 
= 811/40 = 20,3
Mediana:
Para datos medidos en al menos una escala de intervalo, la mediana es el
puntaje medio ordenado.
Si n es impar, entonces la mediana es el dato del centro, es decir, la mediana
es el dato que se encuentra en el lugar (n+1) /2
si n es par, entonces, la mediana es la media de los dos datos que ocupan
posiciones centrales, es decir, la mediana es el promedio de las datos que se
encuentran en los lugares n /2 y (n/ 2) + 1.
Ejemplo:
El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8 y 10 tiene mediana 6, puesto que ya
los datos están ordenados, el número de datos es 9 (impar) y, en este caso, el 6
está ubicado en el centro (en el cuarto lugar).
Ejemplo:
El conjunto de números 5, 5, 7, 9, 11, 12, 15 y 18 tiene mediana 8/2 =4 y (8/2) +1=
5, entonces la mediana es (9+11) = 10, puesto que ya los datos están
ordenados, el número de datos es 8 (par), el 9 y el 11 son los dos datos que
ocupan posiciones centrales y 10 es el promedio de estos dos datos.
 
Mediana = Iinf + * w
IINF : Intervalo inferior de la clase mediana
n: número de datos o tamaño de la muestra
fa : Frecuencia acumulada que antecede a la frecuencia acumulada de la clase
mediana.
fm : Frecuencia absoluta de la clase mediana.
w: amplitud. 
• En el intervalo de clase donde fa ≥ n/2 es la clase mediana.

Mediana = 17.5 + * 3 = 20.2


 
Moda.
Definición: La moda, si se da, es el dato con mayor frecuencia.
Ejemplo: El conjunto 2, 2, 5, 7, 9, 9, 9, 11 tiene moda 9 porque este valor es el dato
con mayor frecuencia.
Moda para datos agrupados.
Moda= Iinf + * w ; donde:
Iinf : Es el intervalo inferior de la clase mediana.
d1: Es la diferencia entre el la frecuencia absoluta de la clase modal y la frecuencia
que le antecede.
d2: Es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia
que le sigue.
w: Es la amplitud. Moda = 17.5 + * 3 = 19,75
La media geométrica
La media geométrica es útil para encontrar los cambios porcentuales en una
serie de números positivos, inclusive, para encontrar el promedio de
proporciones, índices, tasas de crecimiento. Tiene mucha aplicación en el
comercio y en la economía porque nos interesa encontrar el cambio
porcentual en las ventas, salarios o datos económicos, tales como el
producto nacional bruto.
Definición: La media geométrica de un conjunto de n datos x 1 + x2 + …….xn,
se define:
Media geométrica = ( x1.x2…..xn) 1/n

Ejemplo:
La media geométrica de los números 2; 4 y 8 es
Media geométrica = (2*4*8)1/3 = 4
〖 〗

Intervalos fj fr fa xi xifj Fjlogxi fj*1/xi fj( x_i-x ̅) ^2


11,5 - 14,5 2 0,05 2 13 26 2,228 0,154 106,58
14,5 - 17,5 8 0,2 10 16 128 9,633 0,5 147,92
17,5 - 20,5 11 0,275 21 19 209 14,066 0,579 18,59
20,5 - 23,5 10 0.25 31 22 220 13,424 0,4545 28,9
23,5 - 26,5 8 0,2 39 25 〖 200 〗 11,184 0,32 176,72
26,5 - 29,5 1 0,025 40 28 28 1,447 0,0357 59,29
40 1 ∑1▒ x_i f_j =811 51,982 2,0432 538

Para datos Agrupados la media geométrica se define:


Media geométrica = ∑f( log xi)/n.
Media geometrica = 51,982/40 = 1.29955 = 19,93
Media armónica:
Definición: La media armónica es el reciproco de la media aritmética de los
datos. Es decir, la media armo ‘nica de los datos x 1,x2,...,xn esta´ dada por:
Media armónica = n/ (1/x1+1/x2 +……….1/xn) 
 Ejemplo: Hallar la media armónica de los datos 2, 4 y 8
 Media armónica = 3/(1/2+1/4+1/8) = 3.43
Para datos agrupados la media armónica de define:
 Media armónica = ∑(f *1/xi)/n  
H-1 = 2.0432/40 = 0.05108 = 19.58
Medidas de colocación o de posición.
Definición: Una medida de colocación o de posición relativa para una
distribución de frecuencias es aquel valor para el cual una porción
específica de la distribución queda en o debajo de él.
La mediana.
Los percentiles.
Los cuartiles.
Los deciles
Percentil:
Definición: El p-ésimo (punto) percentil es un valor tal que por lo menos un p% de
los datos tienen dicho o menos de ese valor y, al menos, un (100 − p)% de los datos
tienen este valor o más.
Para calcular el p-ésimo (punto) percentil de un conjunto de n datos, es importante
tener en cuenta los siguientes pasos:
• Ordenar los datos de manera ascendente.
• Calcular un índice i a través de la formula i = np/100, siendo p el percentil de
interés y n, la cantidad de datos.
• Decidir de acuerdo a uno de los dos casos:
Si el índice i no es entero, se redondea al entero siguiente. Este valor aproximado
de i indica la posición del p-ésimo percentil.
• Si i es entero, el p-ésimo percentil es el promedio de los valores de los datos
ubicados en las posiciones i y i + 1
Ejemplo:
Calcule (a) el 85 ésimo punto percentil y (b) el 50 ésimo punto percentil de los
siguientes datos que representan los salarios (en millones de pesos) de 12
empleados en una empresa:
2,350; 2,450; 2,550; 2,380; 2,255; 2,210; 2,390; 2,630; 2,440; 2,825;
2,420; 2,380.
 Organización de datos.
Como primer paso fundamental, debemos ordenar los datos de manera
ascendente (preferiblemente, con ayuda de un diagrama de tallo y hojas):
2,210; 2,255; 2,350; 2,380; 2,380; 2,390; 2,420; 2,440; 2,450; 2,550;
2,630; 2,825.
Índice= n*p/100 = 12* 85/100 10.2; como el índice es entero se redondea al
entero siguiente 11.
Por lo tanto, el lugar del 85-ésimo percentil es el lugar 11. En nuestros datos
ordenados corresponde a 2,630. Esto quiere decir que el 85% de los empleados
de la empresa ganan $2.630.000 o menos de este valor y que el 15% de estos
empleados ganan $2.630.000 o más que este valor.
Cuartiles.
Como veremos en la siguiente definición, los cuartiles son casos particulares de
los percentiles.
Definición: Los cuartiles son las medidas de posición relativa correspondiente a
un conjunto ordenado de datos divididos en cuatro partes (iguales) y se define
como sigue:
• Q1 = primer cuartil o 25-ésimo percentil.
• Q2 = segundo cuartil o 50-ésimo percentil o también mediana.
• Q3 = tercer cuartil o 75-ésimo percentil.
Q1 = (2.350 + 2.380)/2 = 2.365; el 25% de los empleados de la empresa gana $
2.365.000 o menos y el 75% de estos empleados gana $2.365.000 o más que este
valor.
Q3 = (2.450 + 2.550)/2 = 2.500; el 25% de los empleados de la empresa gana $
2.500.000 o menos y el 75% de estos empleados gana $2.500.000 o más que este
valor.
Deciles:
Definición: Los deciles son las medidas de posición relativa correspondiente a
un conjunto de datos (ordenado ascendentemente) que esta´ dividido en
diez partes, de tal forma que cada parte contiene aproximadamente 10% de
las medidas.
Hay nueve deciles, denotados por D1, D2... y D9. Si Dn es el n-ésimo decil,
entonces, cada punto decil corresponde a un punto percentil. Por ejemplo,
D4 es el 40-´esimo punto percentil, D7 es 70-´esimo punto percentil, etc.
Una medida de dispersión o variabilidad es la desviación de cada uno de los
datos con respecto a la una medida de centralización.
Ejemplo:
La tabla nos muestra los salarios diarios de un empleado en una industria.

EMPRESA 1 34500 30700 32900 36000 34100 33800 32500

EMPRESA 2 34000 27500 31600 39700 35300 33800 32600

Se observa que la media en ambas muestras es $33500


Una medida de centralización, casi nunca es suficiente por sí sola, para
analizar adecuadamente las características de un conjunto de datos. Por lo
general, necesitaremos, además, una medida de la dispersión o variación de
los datos, entre las que analizaremos se encuentran el rango o recorrido, el
rango intercuartil, la desviación, la varianza y la desviación estándar .
Rango
Es la medida de dispersión más simple. Esta medida ya ha sido utilizada en secciones
anteriores.
Definición: El rango o recorrido de un conjunto de datos se define como la diferencia
entre el dato más alto y el más bajo.
R = xm - xm
Rango intercuartil
Una medida de dispersión que elimina la influencia de los valores extremos de los
datos es el rango intercuartil.
Definición: El rango intercuartil, simbolizado por R.I, es la diferencia entre el tercer y
el primer cuartil. Es decir,
R.I = Q3 − Q1.
DIAGRAMA DE CAJA Y BIGOTES:

Definición: El rango intercuartil, simbolizado por R.I, es la diferencia entre el tercer y


el primer cuartil. Es decir,
R.I = Q3 − Q1.
Varianza:
La varianza de un conjunto de n datos x 1, x2, ………xn, se define:

 
Ejemplo: calcular la varianza de los siguientes datos: 3, 5, 8 y 4.
 
La media aritmética = 5
S2 = = 4.66
Para datos agrupados la varianza se define:

La varianza para datos agrupados del ejemplo 1.


S = 10.831
2

Otra forma de calcular la varianza es: S = [∑xi - (∑xi) /n]/(n-1)


2 2 2
 
La desviación estándar desviación típica.
Definición: La desviación estándar de un conjunto de n datos x 1, x2, ………xn, se
define: 
S = , entonces S = = 3.29 
Desviación media.
Definición: La desviación media de un conjunto de datos es la media de las
desviaciones de cada dato. Es decir, la desviación media de los datos x 1,...,xn se
define como
DM =(|x1 − x| + |x2 − x| +···+ |xn − x|)/ n
La definición es análoga para datos poblacionales. Observemos que la desviación
media está medida en las mismas unidades que la de los datos.
Teorema: (Regla de Tchebychev) Para cualquier población con media µ y desviación
estándar σ, por lo menos el 100(1−1/k2)% de los valores de la población se
encuentran a una distancia de la media menor que k veces la desviación estándar,
para cualquier número k > 1. En otras palabras, dentro del intervalo que va desde µ
− kσ hasta µ + kσ se encuentra por lo menos el 100(1 − 1/k2)% de los valores de la
población.
Para ver cómo funciona la regla de Tchebychev en la práctica, hemos construido la
siguiente tabla:

k 1,5 2 2,5 3 3,5 4


100(1-1/k2)% 55,60% 75% 84% 88,90% 91,18% 93,70%
 
Ejemplo:
Un inspector de control de calidad selecciona aleatoriamente 14 clavos de una caja
de 100 clavos de 1 pulgada (una pulg.=2,54 cm). Las longitudes, en cm, son
2,36; 2,40; 2,50; 2,51; 2,51; 2,52; 2,52; 2,53; 2,54; 2,54; 2,55; 2,55; 2,60; 2,70
Si el inspector decide excluir los clavos que están fuera del intervalo ± 2s, ¿cuál es el
porcentaje de clavos excluidos? ¿Se verifica la regla de Tchebychev?
SOLUCION: Vemos que = 2,52 y s = 0,07. Como deseamos desechar los clavos que
están fuera del intervalo x ± 2s, es decir, [2,38;2,66], observamos que dos clavos no
pertenecen a ese intervalo (los de longitud 2,70 y 2,36) que corresponde al 14,28% de
la muestra. La regla de Tchebychev afirma que por lo menos el 75% de los clavos
deberán estar en el intervalo ±2s, es decir, a lo más el 25% estarán fuera de dicho
intervalo, lo cual verifica la regla de Tchebychev
El coeficiente de variación
Para comparar las dispersiones de dos o más conjuntos de valores no podemos
confrontar simplemente las varianzas o las desviaciones estándar respectivas,
puesto que estos coeficientes de dispersión vienen afectados por la escala de
medida del respectivo valor. Es necesario, por tanto, eliminar esa influencia
convirtiendo dichos valores en números sin unidades de medidas. Una medida que
cumple perfectamente con este cometido es el llamado coeficiente de variación de
Pearson.
Definición: El coeficiente de variación de Pearson de un conjunto de datos,
simbolizado por CV, es igual a la desviación estándar dividida entre la media,
multiplicada por 100 por ciento. Es decir,

CV = (S / media aritmética) * 100


MEDIDAS DE FORMAS.
MEDIDAS DE FORMAS.
Medida de Sesgo
Medidas de asimetría
.
Medidas de asimetría

https://www.youtube.com/watch?v=SNllIAeD1SI&feature=emb_logo
Medidas de asimetría
Problema:

.
Medidas de curtosis o apuntamiento
Las medidas de curtosis estudian la distribución de frecuencias en la zona
central de la misma. La mayor o menor concentración de frecuencias alrededor
de la media y en la zona central de la distribución dará lugar a una distribución
más o menos apuntada. Por esta razón, a las medidas de curtosis se aplican a
distribuciones campaniformes, es decir, unimodales simétricas o con ligera
asimetría.
LIDERAZGO REGIONAL
Estas son algunas de las gráficas que puedes usar
para mostrar datos.

10
25 25 20
30

40 20

10

15 35
40 30

Lorem Ipsum Lorem Ipsum Lorem Ipsum

Lorem ipsum dolor sit amet, quam id eros. Lorem ipsum dolor sit amet, quam id eros. Lorem ipsum dolor sit amet, quam id eros.
Vestibulum luctus velit. Pretium ante, integer a Vestibulum luctus velit. Pretium ante, integer a Vestibulum luctus velit. Pretium ante, integer a
blandit. Nullam nunc wisi, rutrum rhoncus. blandit. Nullam nunc wisi, rutrum rhoncus. blandit. Nullam nunc wisi, rutrum rhoncus.
Libero commodo. Libero commodo. Libero commodo.
TEXTO O CIFRA DESTACADA: VA EN COLOR
BLANCO, CANDARA 96 PUNTOS.
Esta diapositiva azul es para que destaques una frase, o una cifra significativa.
Tu presentación debe tener pocas de estas, porque de lo contrario ya no sería
destacado ni llamaría la atención.
En este espacio puedes usar Título
una gráfica o una imagen

Texto de corrido en la presentación va en gris oscuro,


Gráficas
fuente candara.
Cuerpo a 36 puntos. Máximo 25 palabras.

Recuerda no sobrecargar tus diapositivas con contenido.


Tu audiencia te escuchará o leerá el contenido, pero no hará las
dos cosas.

Series 1 Series 2 Series 3


Título

option 1 option 2 option 3


option 4
85 two
NOTIFICATION GREAT SUPPORT BE DESIGNER TAKE PICTURES

Investment generally results in acquiring an Investment generally results in acquiring an Investment generally results in acquiring an Investment generally results in acquiring an
asset, also called an investment. If the asset asset, also called an investment. If the asset asset, also called an investment. If the asset asset, also called an investment. If the asset
is available at a price worth investing is available at a price worth investing is available at a price worth investing is available at a price worth investing
Título Título
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 option 1 option 2 option 3 option 4

40 two 70 two 15 two 85 two


Título
Coloque su subtítulo aquí

Escribe algo aquí

Investment generally results in acquiring an asset, also called an investment. If the


asset is available at a price worth investing, it is normally expected

Escribe algo aquí


Investment generally results in acquiring an asset, also called an investment. If the
asset is available at a price worth investing, it is normally expected

Escribe algo aquí

Investment generally results in acquiring an asset, also called an investment. If the


asset is available at a price worth investing, it is normally expected

Escribe algo aquí

Investment generally results in acquiring an asset, also called an investment. If the


asset is available at a price worth investing, it is normally expected
Arrastra la imagen al marcador de posición o haga Clic en el icono para agregarla

Título
Coloque su subtítulo aquí

Texto de corrido en la presentación va en gris oscuro, fuente candara.


Cuerpo a 36 puntos. Máximo 25 palabras.
Título
Coloque su subtítulo aquí

Tu texto aquí
1 Tu texto aquí 4 Lorem ipsum dolor sit amet, consectetur
Lorem ipsum dolor sit amet, consectetur

. adipiscing elit. Nunc bibendum eleifend . adipiscing elit. Nunc bibendum eleifend
tortor, non porta justo gravida posuere.
tortor, non porta justo gravida posuere.

Tu texto aquí
2 Tu texto aquí 5 Lorem ipsum dolor sit amet, consectetur
Lorem ipsum dolor sit amet, consectetur
. adipiscing elit. Nunc bibendum eleifend . adipiscing elit. Nunc bibendum eleifend
tortor, non porta justo gravida posuere.
tortor, non porta justo gravida posuere.

Tu texto aquí
3 Tu texto aquí 6 Lorem ipsum dolor sit amet, consectetur
Lorem ipsum dolor sit amet, consectetur

. adipiscing elit. Nunc bibendum eleifend . adipiscing elit. Nunc bibendum eleifend
tortor, non porta justo gravida posuere.
tortor, non porta justo gravida posuere.
Título
Texto de corrido en la presentación va en gris oscuro, fuente
candara. Cuerpo a 36 puntos. Máximo 25 palabras.
Sales
Título

Tu texto aquí
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Nunc bibendum eleifend tortor, non porta justo gravida
posuere.

Tu texto aquí
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Nunc bibendum eleifend tortor, non porta justo gravida
posuere.

Tu texto aquí
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Nunc bibendum eleifend tortor, non porta justo gravida
posuere.

Tu texto aquí
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Nunc bibendum eleifend tortor, non porta justo gravida
posuere.

1st Qtr 2nd Qtr 3rd Qtr 4th Qtr


Diapositiva de cierre. No la debes modificar.

LIDERAZGO REGIONAL

También podría gustarte