Está en la página 1de 77

ESTADÍSTICA I

CURSO DE VACACIONES 2019


LADY MARIEBELIA ELÍAS ESTRADA
 Introducción a la estadística.

CONTENIDO  Presentación de datos de una sola


variable.
I UNIDAD
 Analisis descriptivo de datos de una sola
ESTADÍSTICA variable.
DESCRIPTIVA.
 Presentación de datos y analisis de datos
de dos variables.
INTRODUCCIÓN A LA ESTADÍSTICA.

CONCEPTOS BÁSICOS.
CLASIFICACIÓN DE LA ESTADÍSTICA.
TIPOS DE VARIABLES.
NIVELES DE MEDICIÓN.
RECOPILACIÓN DE DATOS.
CONCEPTOS ESTADÍSTICOS:

Definición de Estadística:
Ciencia que se ocupa de facilitar la toma de decisiones acertadas frente a una
incertidumbre y por lo tanto, desarrolla y utiliza técnicas para la recolección cuidadosa,
presentación efectiva y el análisis correcto de la información numérica.
RAMAS DE LA ESTADÍSTICA:

Estadística
Descriptiva o
deductiva: estudia las
características de un
conjunto de datos.

Inferencial o
inductiva: analiza los
datos para establecer
generalidades.

Error de estimación: diferencia entre el parámetro y estadístico.


POBLACIÓN Y MUESTRA:

Unidad de observación: también llamada


unidad de análisis, unidad elemental, unidad
estadística, caso o elemento. Es el objeto
sobre el cual se hace la medición.
Población (N): es el total de elementos de
un grupo que se estudia.
Muestra (n): es un subconjunto de
elementos extraídos de la población
objetivo, a fin de conocer las características
de ésta.
VENTAJAS DEL ESTUDIO DE LA POBLACIÓN Y DE UNA MUESTRA:

Estudio de una Estudio de una


población. muestra.

Conocimiento Conocimiento
exacto. aproximado.

Mucho tiempo
Rápido
requerido.

Alto costo. Económico.


CARACTERÍSTICAS DE LA POBLACIÓN Y DE LA MUESTRA:

Parámetro: es Estadístico: es
cualquier medida
descriptiva de la
Población Muestra cualquier medida
descriptiva de la
población completa. muestra y sirve
para estimar el
Grande (si parámetro de la
Finita tiene 30 o más
elementos) población.

Infinita Pequeña
OBTENCIÓN DE DATOS:
Muestreo: es el proceso estadístico que permite seleccionar algunos elementos de la población.
Técnica de muestreo: conocido también como diseño de experimento, son las técnicas para
realizar el muestreo y que dependerán cada caso, cual usar. Alguna de ellas son:

Muestreo • Todos los elementos de la población tienen


igual posibilidad de ser escogido y se eligen al
aleatorio simple. azar.

Muestreo • Los elementos se seleccionan a un intervalo


sistemático. uniforme en una lista ordenada.

Muestreo • Los elementos de la población son primeramente


clasificados en grupos o estratos según una
estratifico. característica importante.
MUESTREO CON Y SIN REEMPLAZO.

Muestreo

Con reemplazo: el elemento


Sin reemplazo: el elemento
elegido de la
seleccionado se analiza, pero
población/muestra se analiza y
no se devuelve a la población.
se devuelve a ésta. Pueden
No existen elementos
existir elementos repetidos.
repetidos. Confiable.
No muy confiable.
VARIABLES:

 Definición: es una forma de expresar una característica de un grupo de


elementos de estudio, como el peso de una persona, su estatura, el color
de sus ojos, etcétera.
TIPOS DE VARIABLES:

Clasificación de las variables.

Número de características. Tipo de datos

Unidimensionales. (una Cuantitativas (numéricas


característica) Cualitativas (o categóricas)
o escalares)

Bidimensionales (dos Discretas (para


Nominales
características) contar)

Pluridimensionales o Continuas (para Ordinales (o


multidimensionales. medir) jerarquizadas)
ESCALAS DE MEDICIÓN:
Nominal Ordinal Intervalo Razón

• Los datos sólo • En este nivel los • Cuando los datos • Éste es el nivel más
pueden contarse o datos presentan un son mutuamente completo de los
clasificarse. Deben orden o jerarquía. excluyentes y datos, son
ser mutuamente pueden agruparse perfectamente
excluyentes. en clasificaciones comparables entre
exhaustivas, sí.
además de que la • Se diferencia de la
unidad de medición escala por
es una constante. intervalos
• En esta escala el únicamente porque
cero es arbitrario, tiene un punto
es decir, no indica cero natural, es
la ausencia de la decir, ausencia de
característica de la característica de la
medida. medida.
EJEMPLO: ¿ESCALA DE MEDICIÓN?

 Género de una persona.


 Altura sobre el nivel del mar.
 Número de carné universitario.
 El tiempo para realizar la tarea de Estadística.
 Las medidas pequeño, mediano, grande.
 Número de identificación personal (DPI).
 La temperatura del día de hoy.
 Tiempo de vida de una bacteria.
 Punto de fusión de un compuesto químico.
EJEMPLO 2:
 Una compañía produce arandelas que se supone tengan un diámetro promedio de 2.5
centímetros, según requerido por el computador. Un equipo de ingenieros examina la
producción rutinaria para velar que se cumpla con las especificaciones. Si encuentra que las
arandelas no cumplen con las especificaciones establecidas, las máquinas que las producen
son ajustadas. Ellos seleccionan un grupo de 100 arandelas del lote producido en la fábrica
por máquina y calculan el diámetro promedio. De acuerdo al texto, indique:
 Población
 Todas las arandelas producidas por la compañía.
 Muestra
 Las 100 arandelas seleccionadas del lote.
 Unidad estadística.
 Una arandela producida por la compañía.
…CONTINUACIÓN

 Variables que se deben medir, tipo y escala de medición.


 Diámetro de la arandela.
 Cuantitativa continua, escala razón.

 Máquina que produce la arandela.


 Cualitativa, escala nominal.

 Parámetro
 Promedio de todas las arandelas producidas, 2.5 centímetros.

 Estadístico.
 Promedio de las arandelas de la muestra.
ESTADÍSTICA
DESCRIPTIVA.
RECOPILACIÓN DE DATOS:

 Fuentes para obtener datos:


 Investigación en registros administrativos.
 Mediante encuesta, entrevista, cuestionario u observación. (Técnicas para recopilar datos)
 Descripción de conjunto de datos:
 Tabular.
 Gráficamente.
 Análisis estadístico.
TABULACIÓN DE
DATOS:

 Una distribución de
frecuencia es una tabla que
presenta el número de
elementos que pertenecen a
cada una de las clases o
categorías en las que se
divide un grupo de datos
para estudiarlos.
DISTRIBUCIÓN DE FRECUENCIAS SIMPLES:

 n: el tamaño de la muestra, es el número de observaciones.


 Xi: la variable; es cada uno de los diferentes valores que se han observado.
 fi: la frecuencia absoluta o solo frecuencia, es el número de veces que se repite la variable Xi.
 Fa: la frecuencia acumulada; se obtiene acumulando la frecuencia absoluta.
 fr: frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por el tamaño de la
muestra.
 Fra: frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamaño de la
muestra.
 f%: frecuencia porcentual: es el resultado de multiplicar la frecuencia relativa por 100.
 F% : Frecuencia porcentual acumulada.
EJEMPLO 1: DATOS CUALITATIVOS.

 Al realizar un estudio del grado académico en una muestra de 120 trabajadores de


una Empresa, se obtuvieron los siguientes resultados:
 Superior 3, primaria 63, analfabetos 38 y secundaria 16.
 Ordene la información proporcionada en el cuadro de frecuencias.
 Interprete algunos de los valores de las frecuencias porcentuales.
EJEMPLO 2: DATOS SIMPLES

 A continuación se presenta el número de inspecciones que se realiza diariamente en


el área de producción de una empresa.
 0,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,5,5,5,5,6.
 Ordene la información proporcionada en el cuadro de frecuencias.
 Interprete algunos de los valores.
DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS O DE VALORES
AGRUPADOS.

 Ordenar los datos de menor a mayor o viceversa.


 Calcular el rango o recorrido. R=Xmax-Xmin
 Determinar el número de clases: k=1+3.3log(n) fórmula de Sturges
 Determinar el intervalo de clase i=R/k
 Formar los intervalos (límites aparentes).
 Formar los límites reales.
 Determinar las frecuencias de clase contando el número de observaciones
 Determinar marca de clase: media de los intervalos.
EJEMPLO 3: DATOS AGRUPADOS

 Estos datos corresponden a la producción mensual, en toneladas (ton) de una empacadora


de plátanos.
 Ordene la información proporcionada en el cuadro de frecuencias.
 Interprete algunos de los valores.

Datos ordenados
515 542 643 696 700
704 739 782 784 814
832 956 987 1 023 1 023
1 052 1 296 1 333 1 475 1 482
EJEMPLO 4: DATOS AGRUPADOS

 Del análisis de resistencia de 30 bloques de concreto se obtuvieron los resultados que se indican a
continuación.
 Ordene la información proporcionada en el cuadro de frecuencias.
 Interprete algunos de los valores.

Datos ordenados
22.7 22.7 23.1 26.3 26.4 29.4
29.8 30.3 30.5 35.1 37.7 39.2
39.4 42.9 43.6 45.6 48.3 48.4
52.3 52.9 56.3 58.2 58.9 60.4
62.8 64.9 65.3 68.1 68.4 70.4
REPRESENTACIÓN GRÁFICA:

 Es la manera de expresar los datos estadísticos, utilizando los medios de


representación que proporciona la Geometría.
 Componentes de una gráfica:
◦ Título general
◦ Elementos de referencia con expresión de la variable representada sobre cada
uno.
◦ Fuente de procedencia de los datos representados.
TIPOS DE GRÁFICOS: GRÁFICA DE BARRAS

 Barras rectangulares de igual ancho, conservando la misma distancia de


separación entre sí.
 Se utiliza básicamente para mostrar y comparar frecuencias de variables
cualitativas.
 Pueden ser verticales o en forma horizontal.
DIAGRAMA DE BARRAS
Quejas principales de los clientes.
Otros

Descortesía de personal
Quejas principales

Falta de retroalimentación

Repuestos caros

Horarios de atención inadecuados

No cumple plazos establecidos

Ubicación de local inadecuada

Servicio caro

0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% 35.00%


Porcentaje de quejas
DIAGRAMA DE COLUMNAS
Quejas principales de los clientes.
35.00%
Porcentaje de quejas

30.00%

25.00%

20.00%

15.00%

10.00%

5.00%

0.00%

Queja principal
GRÁFICA DE PASTEL, CIRCULARES O SECTORES

 Se usan para mostrar como una cantidad total se reparte en un grupo de categorías.
 Variables cualitativas en porcentajes o cifras absolutas.

PORCENTAJE DE QUEJAS

Servicio caro Ubicación de local inadecuada No cumple plazos establecidos


Horarios de atención inadecuados Repuestos caros Falta de retroalimentación
Descortesía de personal Otros
5% 3%

16% 19%

10%

31% 9%
7%
Límites Límites
aparentes reales Xi f F fr Fr f% F%
0.2-1.5 0.15-1.55 0.85 17 17 17/50 17/50 34 34
1.6-2.9 1.55-2.95 2.25 11 28 11/50 28/50 22 56
3.0-4.3 2.95-4.35 3.65 7 35 7/50 35/50 14 70
4.4-5.7 4.35-5.75 5.05 6 41 6/50 41/50 12 82
5.8-7.1 5.75-7.15 6.45 4 45 4/50 45/50 8 90
7.2-8.5 7.15-8.55 7.85 3 48 3/50 48/50 6 96
8.6-9.9 8.55-9.95 9.25 2 50 2/50 1 4 100

TABLA DE DISTRIBUCIÓN UTILIZADA PARA LAS SIGUIENTES 4 GRÁFICAS.


HISTOGRAMA

 Eje horizontal: intervalos de clase (límites reales)


 Eje vertical: frecuencias
 Rectángulos unidos cuyos anchos son los de los intervalos de clase.
 Variables cuantitativas.
 Datos agrupados
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS:
Histograma y polígono de frecuencias
Tiempo de transacción bancaria
18 17
número de clientes

16

14

12 11

10

8 7
6
6
4
4 3
2
2
0 0
0

0-0.15 0.15-1.55 1.55-2.95 2.95-4.35 4.35-5.75 5.75-7.15 7.15-8.55 8.55-9.95 9.95-11.25


Tiempo de transacción (min)
POLÍGONO DE FRECUENCIAS

 Es un gráfico de líneas trazado sobre las marcas de clase.


 El polígono empieza y termina en el eje horizontal.
POLÍGONO DE FRECUENCIAS
Polígono de frecuencias
Tiempo por transacción bancaria
18
17
fi Xi 16

17 0.85 14
Número de clientes

11 2.25 12
11
7 3.65 10

6 5.05 8
7
4 6.45 6 6
3 7.85 4 4
3
2 9.25
2 2
0 0 0
0.85 2.25 3.65 5.05 6.45 7.85 9.25
Tiempo promedio por transacción (min) Marcas de clase
FRECUENCIAS ACUMULADAS U OJIVA

 Eje horizontal: límites reales superiores


 Eje vertical: frecuencia acumulada
 Para el límite inferior de la primera clase la frecuencia acumulada es cero
y para el límite superior de la última clase es igual al total de datos.
OJIVA ASCENDENTE

Ojiva ascendente (menor que)


Tiempo por transacción bancaria
Límites reales Fa
0.15 0 50
48
No. de clientes

1.55 17 45
41
2.95 28
35
4.35 35
28
5.75 41
7.15 45 17
8.55 48
9.95 50
0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tíempo de transacción (min)
OJIVA DESCENDENTE
Ojiva descendente (mayor que)
Tiempo por transacción bancaria
60
Límites reales Fa
0.15 50 50 50
1.55 33
No. de clientes

40
2.95 22
30
33
4.35 15
5.75 9 20 22
7.15 5 15
10 9
8.55 2
5
9.95 0 0 2 0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tiempo de transacción (min)
GRÁFICAS LINEALES
 Sirven para representar las series de tiempo, porque reflejan la dirección del cambio.
 Eje horizontal: escala de tiempo
Proyecciones de crecimiento de población
25
Edad de 85 años o más (millones)

20

15

10

0
2010 2020 2030 2040 2050
Año
GRÁFICA DE PUNTOS
 Muestra pequeños conjunto de datos cuantitativos.
 Eje horizontal: valores de la variable estudiada.

 Eje vertical: la frecuencia de aparición de un valor en el conjunto de datos estudiados.

Pulsaciones por minuto de un grupo de 30 personas.


DIAGRAMA DE PARETO (80/20)

 Constituye un sencillo y gráfico método de análisis que permite ver entre las causas
más importantes de un problema (pocos vitales) y las que no lo son (muchos
triviales).
 Entre sus ventajas es que permite centrarse en los aspectos cuya mejora tendrá más
impacto, optimizando por tanto los esfuerzos.
 Es decir, este diagrama establece que un 20% de las fuentes causan el 80% de
cualquier problema.
EJEMPLO:
 En una empresa textil
se desea analizar el
número de defectos en
los tejidos que fabrica.
En la tabla siguiente se
muestran los factores
que se han identificado
como causantes de los
mismos así como el
número de defectos
asociado a ellos:
PASOS A SEGUIR:

 Primero debemos
ordenar los datos en
forma decreciente:
PASOS A SEGUIR:

 Segundo calcular los


porcentajes
relativos y
acumulados.
GRÁFICO
 Tercer Paso:: graficar
 En el gráfico
obtenido se observa
que un 20% de los
tejidos(Algodón y Tul)
representan
aproximadamente un
80% de los defectos,
por lo tanto
centrándose la
empresa solo en esos
2 productos reduciría
en un 80% el número
de defectos.
EJEMPLO 5:

 El hotel Brisas del mar, ha recibido en el último semestre numerosas quejas sobre el
servicio. Esto está afectando negativamente al desempeño del sistema de gestión de
calidad, repercutiendo negativamente en la satisfacción del cliente. Las quejas son
variadas, así que los responsables de procesos se reúnen y deciden hacer un diagrama
de Pareto para determinar la causa predominante y trabajar sobre ella.
 El equipo de trabajo recopila las posibles causas del problema a través de listas de
verificación, resultados de encuestas, quejas, etc. y también la frecuencia con la que
ocurren.
TABLA DE DATOS:

Posibles causas del problema Frecuencia con la que ocurre


Mala calidad del servicio de 10
recepción.
La comida está fría. 4
Las sábanas están sucias. 2
El personal del restaurante es 1
grosero.
La información sobre la 20
excursiones es insuficiente.
Subieron los precios. 5
GRÁFICA
ANÁLISIS DESCRIPTIVO

 Medidas de tendencia central:


 Media aritmética, media o promedio
 Mediana
 Moda
 Media ponderada
 Media geométrica
MEDIA ARITMÉTICA

 Medida de posición que proporciona una descripción compacta de cómo


están centrados los datos
 Todo conjunto de datos medido en escala de intervalo o razón tiene
media.
 Es sensible a los valores extremos.
MEDIANA

 Valor de la observación que ocupa la posición central de un conjunto de datos


ordenados según su magnitud.

 Es un valor que deja por debajo de él un número de casos igual al que deja por
arriba.

 No presenta el problema de estar influida por los valores extremos, pero no utiliza
en su cálculo todos los valores de la serie de datos.
MODA:

 La moda es el valor que tiene mayor frecuencia absoluta. Se puede hallar


la moda para variables cualitativas y cuantitativas. Si en un grupo hay dos
o varias puntuaciones con la misma frecuencia y esa frecuencia es la
máxima, la distribución es bimodal o multimodal, es decir, tiene varias
modas.
 Es la única que se puede calcular para cualquier escala de medición.
COMPARACIÓN ENTRE MEDIA, MEDIANA Y MODA.

 La media es la medida más común de tendencia central. Desafortunadamente, la media se ve


afectada por valores extremos, o valores atípicos, y a diferencia de la mediana, puede ser
sesgada por las observaciones que están muy por encima o muy por debajo de ésta.

 La moda también es menos afectada por los valores atípicos, pero si no hay moda o si el
conjunto de datos es bimodal su uso puede ser confuso.

 La medida que se seleccione depende de la naturaleza de los datos o de la forma en como se


utilicen los datos.
EJEMPLO 6:

 Datos simples
 Se tienen algunas características de un grupo de 12 personas. Estas características
son:
 Edad (años): 22,24,25,26,27,28,28,29,30,31,33,34
 Ingreso anual: 8000-8200-9000-10 000-11 000-12 000-12 300-12 500-13 000-13 500-
86 000-97 000
 Número de zapato: 8 ½-9- 9 ½ - 9 ½ - 9 ½ 9 ½ -10-10-10 ½-10 ½ -11-11 ½
 ¿Cuál es la edad promedio, ingreso anual promedio y número de zapato promedio
para este grupo?
EJEMPLO 7:
Temperatura (°C) Número de alambres
 Datos agrupados 27.5-32-5 1
 Los siguientes datos 32.5-37.5 2
corresponden a la 37.5-42.5 5
temperatura de secado 42.5-47.5 12
en la fabricación del
47.5-52.5 24
alambre barnizado al
horno: 52.5-57.5 7
57.5-62.5 3
 Calcule las tres
62.5-67.5 2
medidas de tendencia
central.
MEDIDAS DE TENDENCIA NO CENTRAL (FRACTILOS)

 Medidas de Posición (fractilos o cuantilos)


 Los fractilos permiten identificar valores ubicados en diferentes posiciones. Se
denomina fractilo a la localización del valor que corresponde al final de cada parte
en que se ha dividido la distribución de los datos.
 Cuartiles
 Deciles
 Centiles
EJEMPLO 8: DATOS SIMPLES

 Se tienen algunas características de un grupo de 12 personas. Estas características


son:
 Edad (años): 22,24,25,26,27,28,28,29,30,31,33,34
 Determine:
 El tercer cuartil
 El cuarto decil
 El decimoséptimo centil
EJEMPLO 9: DATOS
AGRUPADOS

tos agrupados Temperatura (°C) Número de alambres


 Calcule: 27.5-32-5 1
32.5-37.5 2
 El percentil 30.
37.5-42.5 5
 El percentil 55. 42.5-47.5 12
 El percentil 75. 47.5-52.5 24
52.5-57.5 7
 El percentil
57.5-62.5 3
90.tendencia central.
62.5-67.5 2
EJEMPLO 10
 Una empresa tenía a finales del año pasado mil seiscientos cincuenta accionistas distribuidos
de la siguiente forma:
No. de acciones No. de accionistas
0-40 1030
40-80 380
80-120 180
120-160 50
160-200 10

 ¿Cuál es el número medio de acciones por accionista?


 ¿Cuál es el número de acciones que como máximo posee la mitad del accionario?
 ¿Qué porcentaje del total de acciones poseen los accionistas mayoritarios? (accionistas
mayoritarios son aquellos que poseen más de 130 acciones)
 ¿Cuál es el número de acciones que como máximo posee el 45% de los accionistas?
MEDIA PONDERADA (DATOS SIMPLES)

 Se utiliza cuando algunos de los valores por promediar son más importantes que
otros, por lo que a cada uno de los valores de frecuencia se le asigna un valor de
peso, el cual depende de la importancia que el investigador quiera darle.
 Donde:
 w_ son las ponderaciones de cada valor X
 X_ son los valores observados 𝑤𝑖 𝑥𝑖
𝑋𝑝 =
𝑤𝑖
EJEMPLO 11:
 Al seleccionar a su personal, una empresa considera que los conocimientos tienen una importancia
relativa de 50, la puntualidad 30 y la presentación 20. Cinco solicitantes de empleo obtuvieron las
calificaciones que se presentan en la tabla siguiente:
¿Cuál de ellos obtuvo la mejor calificación global?

Solicitante Calificación Calificación Calificación por Promedio simple.


por por presentación.
conocimientos puntualidad.
1 10 6 7 7.667
2 6 10 8 8.000
3 8 9 8 8.333
4 9 8 6 7.667
5 7 9 10 8.667
EJEMPLO 12:

 Mario el fontanero vende cinco tipos de limpiadores para desagües. En la tabla


adjunta se muestra la utilidad y el número de latas vendidas por cada limpiador.
 ¿Cuál es el promedio de la utilidad recibida?
MEDIA GEOMÉTRICA:

 Proporciona una medida precisa de un cambio porcentual promedio en una serie de


números.
 Para determinar el incremento porcentual promedio en ventas, producción, u otras
actividades o series económicas de un período a otro.

𝑛
𝑋𝑔 = 𝑥1 . 𝑥2 … 𝑥𝑛
EJEMPLO 13:

 Si el crecimiento de las ventas en un negocio fue en los últimos tres años


de 3%, 18% y 25%. ¿Cuál ha sido el aumento anual de sus ventas?
MEDIDAS DE DISPERSIÓN:

 Estudia la distribución, analizando si los datos se encuentran más o menos


concentrados o más o menos dispersos.
 Proporciona información extra que permite juzgar la confiabilidad de las medidas de
tendencia central, debido a que cuando los datos están muy dispersos, la posición
central es menos representativa de la serie de datos.
 La dispersión se puede medir desde tres enfoques: la distancia, la dispersión
promedio y la dispersión relativa.
MEDIDAS DE DISTANCIA:

 Nos permiten medir la dispersión en términos de la diferencia entre dos valores seleccionados del
conjunto de datos.
 Rango: Es fácil de entender y calcular, pero su utilidad es limitada, pues sólo toma en cuenta el valor
más grande y el valor más pequeño y ninguna otra observación del conjunto de datos.
 Rango Intercuartílico: Mide qué tan lejos de la mediana se debe ir en cualquiera de las dos
direcciones, antes de recorrer una mitad de los valores del conjunto de datos. (Percentil 75 y
percentil 25)
 Rango Interpercentílico: Medida de dispersión que calcula la diferencia en los extremos de la
distribución (percentil 90 y percentil 10) .
MEDIDAS DE DESVIACIÓN PROMEDIO:

 Al realizar su cálculo, nos proporcionan una descripción más completa de la


dispersión respecto a alguna medida de tendencia central (promedio o media
aritmética).
 Varianza: Medida del cuadrado de la distancia promedio entre la media y cada
observación de la población
 Desviación Estándar: Es la raíz cuadrada positiva de la varianza. Tiene las mismas
dimensionales que los datos originales, a diferencia de la varianza en la cual las
dimensionales están expresadas por los cuadrados de las unidades.
EJEMPLO 14:

 Determine que proveedor parece más confiable por medio de la desviación estándar.

Compañía A Compañía B
Resistencia f Resistencia f
15.0-18.0 50 25.0-27.5 50
18.0-21-0 200 27.5-30.0 200
21.0-24.0 500 30.0-32.5 500
24.0-27.0 200 32.5-35.0 200
27.0-30.0 50 35.0-37.5 50
DISPERSIÓN RELATIVA (CV)

 Para medir la dispersión relativa utilizamos el coeficiente de


variación, el cual relaciona la desviación estándar y la media,
expresando la desviación estándar como porcentaje de la
media.

 La unidad de medida del coeficiente de variación es porcentaje, en lugar de


las dimensionales originales de la serie de datos .
EJEMPLO 15:

 En la siguiente tabla se muestra los estadísticos de la producción diaria de litros de


yogurt elaboradas por dos líneas de producción:A y B de la empresa Enigma.
 ¿En cuál línea la producción fue más homogénea?
MEDIDAS DE FORMA

 Características
La forma es la manera en que los datos se distribuyen, es decir, la forma
de la curva que representa a la serie de datos.

La forma se mide en dos aspectos: Sesgo o Asimetría y Curtosis o


Apuntamiento
SESGO O ASIMETRÍA

 Mide si la curva de la gráfica que representa a los datos es simétrica respecto al


eje vertical
 Si en la curva hay simetría, entonces la distribución es Simétrica o Insesgada
 Si en la curva no hay simetría, entonces la distribución es Asimétrica o Sesgada
El signo en los coeficientes de sesgo determina la asimetría:
+ Distribución asimétrica positiva
- Distribución asimétrica negativa
0 Distribución simétrica
CURTOSIS, AGUDEZ O APUNTAMIENTO

 Mide la altura o grado de apuntamiento de la curva que representa a los datos.


 Según su grado de curtosis, se definen 3 tipos de distribuciones:
 1. Mesocúrtica: Grado de concentración medio alrededor de los valores
centrales de la variable (distribución normal).
 2. Leptocúrtica: Grado de concentración elevado alrededor de los valores
centrales de la variable.
 3. Platicúrtica: Grado de concentración reducido alrededor de los valores
centrales de la variable.
 El signo en el coeficiente de curtosis determina el
grado de concentración:
EJEMPLO 16:
Temperatura (°C) Número de alambres
27.5-32-5 1
32.5-37.5 2
 Calcular SK2 37.5-42.5 5
(coeficientes de 42.5-47.5 12
sesgo) e interprete 47.5-52.5 24
su resultado. 52.5-57.5 7
57.5-62.5 3
 Calcule la curtosis.
62.5-67.5 2