Está en la página 1de 46

Unidad#4

Descripción de los datos.

OBJETIVO DEL MÓDULO:


Conocer las formas numéricas
de descripción de datos:
Medidas de ubicación,
medidas de dispersión y
medidas de formas.

06/10/2022 Estadística_ISemestre
Forma númerica de Descripción de datos:

Medidas de Ubicación ó Medidas de tendencia


central.
❖ Se conocen como promedios

❖ Su proposito es señalar el centro de un

conjunto de valores.
❖ Se esta familiarizado con el concepto de

promedio (medida de ubicación que muestra el


valor central de la información)
❖ Los promedios aparecen todos los días en

televisión, periódicos y revistas.


Medidas de Ubicación
Media aritmética
Media ponderada
La mediana
La moda

06/10/2022 Estadística_ISemestre
Media de la población: =X/N

Media de la muestra: X=X/n


Propiedades de la media : (X-X)=0
Media ponderada: XW=(wX)/ w

La Mediana: es el punto medio de los valores


después de que se ordenan.
La moda: valor de la observación que aparece
con mayor frecuencia.

06/10/2022 Estadística_ISemestre
MEDIA ARITMETICA

Media de la población: muchos estudios


comprenden todos los valores de una población.

Para la información en bruto, los datos que no


se han agrupado en una distribución de
frecuencia, la media de la población es:

Media de la población = suma de todos los valores en la población


número de valores en la población

=X/N
Cualquiera característica mensurable de la
población se conoce como parámetro. La media
de la población es un parámetro.

EJEMPLO:
Supongamos que hay 10 compañias fabricantes
de automóviles. Se presenta el número de
patentes que otorgo el gobierno a cada
compañía en un año.
Compañia Número de patentes
General motors 511
Nissan 385
Chrysler 275
Toyota 257
Honda 249
Ford 234
Mazda 210
Porsche 50
Mitsubishi 36
BMW 13
1. ¿Esta información es una muestra o población?
2. ¿Cuál es el número de la media aritmética de
patentes otorgadas?

Resolución:
X=X/N = 511+385+........+13 =2220/10 =222.
10

El número típico de patentes recibidas por


una compañía fabricante de automóviles es
222. Siendo éste valor un parámetro
poblacional
MEDIA ARITMETICA

Media de una muestra: para datos no agrupados,


la media es la suma de todos los valores de la
muestra divididos entre el número total de valores
de la muestra.
X=X/n

La media de una muestra o cualquiera otra medida


basada en los datos de una muestra se conoce como
estadístico.
Propiedades de la media aritmética
Cada conjunto de datos de intervalo o nivel
de razón tiene una media.
Todos los valores se incluyen al calcular una
media.
Un conjunto de datos sólo tiene una media.
La suma de las desviaciones de cada valor
de la media siempre será cero.
(X-X)=0
◼ Ejem.(la media de 3,8 y 4 es 5) =

(3-5)+(8-5)+(4-5)=0
MEDIA PONDERADA

La media ponderada es un caso especial de la


media aritmética. Ocurre cuando hay varias
observaciones del mismo valor.
XW=(wX)/ w

Ejemplo: Una compañía constructora paga a sus


empleados de acuerdo a la tarifa por hora así: 14
les paga $16.50, a 10 les paga $17.50 y a 2 les
paga $18.50. ¿cuál es la tarifa media por hora
que se le paga a los 26 empleados?
XW = 14 ($16.50) + 10 ($17.50) + 2($18.50)
14 + 10 + 2

= 443.00 /26 =$17.038

La media ponderada para el salario por hora se redondea a


$17.04.
MEDIANA

En el caso de la información que contiene uno o


dos valores muy altos o muy pequeños, la media
aritmética puede no ser representativa.

El centro de esa información se describe mejor


con una mediana.

Mediana: es el punto medio de los valores


después de que se ordenan desde el más bajo
hasta el más alto o desde el más alto hasta el
más bajo.
Ejemplo 1:
Los datos deben estar por lo menos en el nivel de
medición ordinal.
Precios ordenados Precios ordenados
del más bajo al del más alto al más
más alto bajo
$ 60,000 275,000
65,000 80,000
70,000 mediana 70,000
80,000 65,000
275, 000 60,000
Ejemplo 2:
Ganancias anuales totales de los seis fondos
accionistas con mejor desempeño: ¿Cuál es la
ganancia anual mediana?
Nombre del fondo Ganancias
totales al año
PBHG 17.2
DEAN 21.0
AIM 22.6 (22.6+25.4)/ 2
=24.0%(mediana)
CENTURY 25.4
ROBERTSON 28.5
SELIGMAN 28.6
Principales propiedades de la mediana

La mediana es única, hay sólo una mediana para un conjunto de datos.


No se ve afectada por valores muy altos o muy bajos.
Se pueden calcular para datos de nivel de razón, de intervalo o de
nivel ordinal.
MODA

La moda: Es otra medida de ubicación y es el valor de la


observación que aparece con mayor frecuencia.
No se ve afectada por valores ni muy altos ni muy bajos.
Sin embargo se utiliza menos que las anteriores medidas de ubicación
por que para muchos datos no hay moda. No aparece más de una vez.
POSICIONES RELATIVAS DE LA
MEDIA, LA MEDIANA Y LA MODA

Distribución con
sesgo positivo Distribución
con sesgo
negativo

Distribución
en forma de
campana
MEDIDAS DE DISPERSIÓN

RANGO
LA DESVIACIÓN MEDIA
LA VARIANZA Y DESVIACIÓN
ESTÁNDAR DE LA POBLACIÓN
LA VARIANZA Y DESVIACIÓN
ESTÁNDAR DE LA MUESTRA

06/10/2022 Estadística_ISemestre
¿Por qué estudiar la dispersión?

Una medida de ubicación sólo describe el


centro de la información, desde este punto de
vista es valiosa, pero no nos dice nada acerca
de la extensión de los datos (variación o
dispersión).
Consideraciones a tener en cuenta:

Un valor menor para una medida de dispersión indica que los


datos están agrupados de manera estrecha, digamos alrededor
de la media aritmética.
Por tanto la media se considera representativa de la
información.

Por el contrario una medida de dispersión alta indica que la


media no es confiable.
RANGO

Es la diferencia entre los valores más alto y más


bajo en el conjunto de datos.

Rango= valor más alto – valor más bajo.

Un defecto del rango es que se basa sólo en dos valores.


DM =  X-X
n
X es el valor de cada observación
X es la media aritmética de los valores
n es el número de observaciones en la
muestra.
indica el valor absoluto.

06/10/2022 Estadística_ISemestre
Varianza de la población
◼ 2 =  (X -  )2
N

◼ 2 es el símbolo de la varianza de la
población.
◼ X es el valor de la observación en la
población.
◼  es la media aritmética de la población.
◼ N es el número de observaciones en la
población.
06/10/2022 Estadística_ISemestre
Desviación estándar de la población
Es la raíz cuadrada de la varianza.

◼  =  (X-)2
N

06/10/2022 Estadística_ISemestre
Varianza muestral
◼ s2 =  (X - X )2
n-1
◼ s es la varianza de la muestra.
◼ X es el valor de cada observación en la
muestra.
◼ X es la media de la muestra.
◼ n es el número de observaciones en la
muestra.

06/10/2022 Estadística_ISemestre
Desviación estándar de la muestra
◼ Se utiliza como estimador de la desviación estándar de la
población.
◼ s=   (X - X )2
n-1

06/10/2022 Estadística_ISemestre
USO DE EXCEL_DESCRIPCIÓN DE DATOS

06/10/2022 Estadística_ISemestre
06/10/2022 Estadística_ISemestre
06/10/2022 Estadística_ISemestre
06/10/2022 Estadística_ISemestre
La Media y Desviación estándar de datos
agrupados

Media aritmética de
Datos agrupados

Desviación estándar
de datos agrupados

06/10/2022 Estadística_ISemestre
06/10/2022 Estadística_ISemestre
06/10/2022 Estadística_ISemestre
INTERPRETACIÓN Y USOS DE LA
DESVIACIÓN ESTÁNDAR

06/10/2022 Estadística_ISemestre
Medidas de Forma

• De Asimetría
• De Apuntamiento o curtosis

06/10/2022 Estadística_ISemestre
Coeficiente de Pearson Asimetría = 3(X – Me)
σ

Mide la desviación respecto de la simetría expresando


Medidas de la diferencia entre la media y la mediana
Asimetría

Simétrica
Coeficiente = 0
X = Me

Asimetría Negativa o a la Izquierda


Coeficiente = negativo
X < Me

Asimetría Positiva o a la Derecha Coeficiente = positivo


X > Me

06/10/2022 Estadística_ISemestre
POSICIONES RELATIVAS DE LA
MEDIA, LA MEDIANA Y LA MODA

Distribución con
sesgo positivo Distribución
con sesgo
negativo

Distribución
en forma de
campana

Estadística_ISemestre
• Teorema de Chebyshev
• Es un teorema que nos permite determinar la mínima porción
de valores que se encuentran a cierta cantidad de
desviaciones estándares de la media.

 Ejemplo
 La media aritmética de la suma quincenal que aportan los
empleados de una empresa para el plan de reparto de
utilidades de la compañía es de $51.54 y la desviación
estándar de $7.51.¿Por lo menos qué porcentaje de las
aportaciones se encuentran en más de 3.5 desviaciones
estándares y menos de 3.5 desviaciones de la media?

06/10/2022 Estadística_ISemestre
Es decir alrededor del 92%
En cualquier conjunto de observaciones, la proporción de valores que se encuentran a
k desviaciones estándares de la media es de por lo menos 1- 1/k, siendo k cualquier
constante mayor que 1.

06/10/2022 Estadística_ISemestre
06/10/2022 Estadística_ISemestre
La Regla Empírica o Normal
En cualquier distribución de frecuencias simétrica con forma de
campana, aproximadamente el 68% de las observaciones se
encontrarán entre más y menos una desviación estándar de la
media; cerca de 95% de las observaciones se encontrarán entre
más y menos dos desviaciones estándares de la media y, de hecho
todas 99.7%, estarán entre más y menos tres desviaciones
estándares de la media.

06/10/2022 Estadística_ISemestre
Curva simétrica que muestra la relación entre
la desviación estándar y las observaciones.

X± 1s
X± 2s
X± 3s

06/10/2022 Estadística_ISemestre
Ejemplo
• Una muestra de tarifas de renta de departamentos se asemeja
a una distribución simétrica con forma de campana. La x= $500
y la s=$20.
• ¿Entre que dos cantidades se encuentra aproximadamente 68%
de las observaciones ?

X± 1s = $500 ± 1($20) = $480 y $520

• Entre que dos cantidades se encuentran casi todas las


observaciones?

X± 3s = $500 ± 3($20) = $440 y $560

06/10/2022 Estadística_ISemestre
CURTOSIS
La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o achatada está una
curva o distribución

06/10/2022 Estadística_ISemestre

También podría gustarte