Está en la página 1de 21

Organización de Datos

• La manera de organizar los datos es mediante tablas de


distribución de frecuencias.
• Las tablas de distribución de frecuencia es una disposición
tabular de datos estadísticos, ordenados ascendente o
descendentemente, con la frecuencia (fi) de cada dato.
• Las distribuciones de frecuencias pueden ser para datos no
agrupados y para datos agrupados o de intervalos de clase.
• La distribución de frecuencias no agrupadas o tabla con
datos no agrupados se emplea si las variables toman un
número pequeño de valores o la variable es discreta
(siempre se asocia con valores enteros)

1
Distribución de frecuencia de datos agrupados
• Se emplea si las variables toman un número
grande de valores o la variable es continua
(se le puede asociar con un números
racionales e irracionales).
• No existen normas establecidas para
determinar cuándo es apropiado utilizar
datos agrupados o datos no agrupados; sin
embargo, se sugiere que cuando el número
total de datos (N) es igual o superior 40 se
utilizará la distribución de frecuencia para
datos agrupados
2
Descripción de Datos: Medidas de Tendencia Central.
“Valor Único que resume un conjunto de datos”.
Media Aritmética, Media ponderada, Mediana, Moda.

MEDIA POBLACIONAL:

Parámetro: Característica medible de una población.

3
Descripción de Datos: Medidas de Tendencia Central.
Ejemplo: Hay 12 empresas fabricantes de autos en EEUU, a
continuación se presenta el # de patentes otorgadas.

Empresa # Patentes Empresa # Patentes


General Motors 511 Mazda 210
Nissan 385 Chrysler 97
DaimlerChrysler 275 Porsche 50
Toyota 257 Mitsubishi 36
Honda 249 Volvo 23
Ford 234 BMW 13

Interpretación: El número típico de patentes recibido por una


empresa es 195 . Puesto que se considera a todas las empresas que
recibieron patentes, este valor es un parámetro poblacional.

4
Descripción de Datos: Medidas de Tendencia Central.

MEDIA MUESTRAL:

Dato Estadístico: Característica medible de una muestra.


Ejemplo: La empresa XY se especializa en obligaciones a LP de países
extranjeros. Interesa saber la tasa de interés de estas obligaciones. Una
muestra aleatoria de 6 bonos reveló lo siguiente:

Artículo – Bonos del Gobierno Tasa de Interés (%)


Australia 9.50
La tasa de
Bélgica 7.25
interés media
Canadá 6.50 (aritmética) en
Francia 4.75 la muestra de
Italia 12.00 obligaciones a
LP es 8.05%. 5
España 8.30
Descripción de Datos: Medidas de Tendencia Central.
• MEDIA PONDERADA: Se presenta cuando hay varias observaciones con
un mismo valor. Ejemplo: En 1 restaurante se venden refrescos
medianos, grandes y extragrandes y que sus precios en soles son: 0.90,
1.25, 1.50. De los últimos 10 refrescos que se vendieron, 3 eran
medianos, 4 grandes, 3 extragrandes.

6
Descripción de Datos: Medidas de Tendencia Central.

• MEDIANA: Es el valor que corresponde al punto medio de


los valores después de ordenarlos de menor a mayor, o de
mayor a menor. 50% de las observaciones son mayores
que la mediana, y 50% son menores que ella.

• Propiedades:
 Es única.
 No se ve afectada por valores extremamente grandes o
muy pequeños.

7
Descripción de Datos: Medidas de Tendencia Central.
Encontrar la mediana de los precios siguientes:
Precios ($) ordenados de > a < Precios ($) ordenados de < a >
60,000 275,000
65,000 80,000
70,000 MEDIANA 70,000
80,000 65,000
275,000 60,000

Rendimientos anuales de las 6 acciones de mejor desempeño de fondos comunes


de inversión con crecimiento dinámico, ¿Cuál es la ganancia mediana anual?
Nombre del Rendimiento Ordenado MEDIANA
Fondo Anual (%) >a<
PBHG Growth 28.5 17.2
Dean W Growth 17.2 21.0
AIM Growth 25.4 22.6 48.2/2 = 24%
Twentieth century 28.6 25.4
Robertson Growth 22.6 28.5
Seligman Frontier 21.0 28.6 8
Descripción de Datos: Medidas de Tendencia Central.
• LA MODA: Es el valor de la observación que aparece con
más frecuencia.

Propiedades:

 No se ve afectada por valores extremamente altos o bajos.

 Su desventaja es que en muchos conjuntos de datos no hay


moda, puesto que cada valor es diferente; en otros casos
hay más de 1 moda, si hay 2 modas se le llama bimodal.

9
Otras Medidas Descriptivas – Medidas de Dispersión
• AMPLITUD O INTERVALO DE VARIACIÓN:
= Valor más grande – Valor más pequeño

• DESVIACIÓN MEDIA: Mide el monto medio en que varían los


valores de una pob. O muestra, con respecto a su media.

10
Otras Medidas Descriptivas – Medidas de Dispersión
• Los pesos de un grupo de cajas que se van a enviar a Lima son (en kg): 95,
103, 105, 110, 104, 105, 112, 90.
 ¿Cuál es la amplitud de variación de los pesos? AV = 112 - 90 = 22
 Calcule la media aritmética de los valores.
 Determine la desviación media de los pesos.
X DA
95 -8 8 Total de Desv. Absoluta = 42
103 0 0
DM = 42/8 = 5.25 Kg.
105 +2 2

110 +7 7

104 +1 1

105 +2 2

112 +9 9

90 -13 13 11
Otras Medidas Descriptivas – Medidas de Dispersión
• VARIANZA: Media aritmética de las desviaciones cuadráticas
con respecto a la media. Es decir las unidades están al
cuadrado. Es positiva, y es cero solamente si todas las
observaciones son iguales.
• VARIANZA POBLACIONAL:

• VARIANZA MUESTRAL:

12
Otras Medidas Descriptivas – Medidas de Dispersión
• DESVIACIÓN ESTÁNDAR POBLACIONAL: La raíz cuadrada
positiva de la varianza.

• DESVIACIÓN ESTÁNDAR MUESTRAL:

La varianza y desviación estándar se basan en las desviaciones


cuadráticas con respecto a la media
13
Otras Medidas Descriptivas – Medida de Dispersión
Relativa
• COEFICIENTE DE VARIACIÓN: Medida muy útil cuando los
datos están en unidades diferentes (S/. y días), o cuando
los datos están en las mismas unidades pero los valores
medios están muy distantes (ingresos de ejecutivos
superiores y el de los empleados no calificados)

14
Covarianza
• Mide la relación lineal entre 2 variables numéricas (X y Y)
𝑛
𝑖=1 𝑋𝑖 − 𝑋 𝑌𝑖 − 𝑌
𝑐𝑜𝑣 =
𝑛−1
• Ejemplo: Considere los gastos y los rendimientos en 2013 de los fondos
de inversión de alto riesgo para pequeños capitales. Calcule la
covarianza.
Coeficiente de gastos Rendimiento en 2013
1.25 37.3
9.579 0.72 39.2
𝑐𝑜𝑣 𝑋, 𝑌 =
9−1 1.57 44.2
1.40 44.5
= 1.19738
1.33 53.8
1.61 56.6
1.68 59.3
1.42 62.4
1.20 66.5
15
Coeficiente de Correlación

• Mide la fortaleza relativa de una relación lineal


entre 2 variables numéricas. Los valores varían
entre -1 y +1.
• -1 = Correlación Negativa Perfecta
• +1 = Correlación Positiva Perfecta
• Perfecta (si trazamos los puntos de un diagrama
de dispersión, se unen por medio de una línea
recta )
• Para datos poblacionales: p 𝑐𝑜𝑣 𝑋, 𝑌
𝑟=
• Para datos muestrales: r 𝑠𝑥 𝑠𝑦

16
Coeficiente de Correlación

17
• Ejemplo: Los datos siguientes representan las calorías y grasas
en gramos que contienen las razones de las 16 onzas de
bebidas a base de café servidas en Dunkin`Donuts (DD) y en
Starbucks (S).
Producto Calorías Grasas
Batido de moka helado-DD (pura leche) 240 8.0
Capuchino frapé-S 260 3.5
Raspado de café (crema) – DD 350 22.0
Café moka expres helado- S (leche/crema batida) 350 20.0
Café moka batido helado- S (crema batida) 420 16.0
Capuchino helado de brownie de chocolate – S 510 22.0
(crema batida)
Crema de chocolate helado –S (crema batida) 530 19.0

18
• Calcule la covarianza: cov(X,Y) = 591.67

• Calcule el coeficiente de correlación:


r = 0.7196

• ¿Que conclusiones deduce acerca de la relación


entre calorías y grasa?
Existe una relación positiva fuerte entre calorías y
grasas.

19
Actividad Práctica
a) Se tienen 10 vendedores empleados en una de las agencias de
Ford. Las cantidades de autos nuevos vendidos el mes pasado
por cada vendedor fueron: 15, 23, 4, 19, 18, 10, 10, 8, 28, 19.
Calcule la media aritmética e indique si es 1 dato estadístico
muestral o un parámetro poblacional.

b) En Junio un inversionista compro 300 acciones de Oracle a un


precio de $20 por acción, en Agosto compró 400 acciones más a
S25 c/u, y en noviembre, 400 a $23 por acción. ¿Cuál es el precio
medio ponderado por acción?

c) El número de paros laborales en la industria automotriz en los


meses seleccionados es 6, 0, 10, 14, 8 y 0. Cuál es la mediana del
número de paros? Cuál es el valor modal del número de paros?

20
Actividad Práctica
d) Las siguientes son variaciones porcentuales en los ingresos
netos del año 2011 y 2012, en una muestra de 12 compañías
constructoras con sede en Lima. Determine la mediana y la
moda.

5 1 -10 -6 5 12 7 8 2 5 -1 11

21

También podría gustarte