Está en la página 1de 57

Matemáticas y Estadística para

Finanzas
Prof.: H. Ernesto Sheriff, PhD.

Sesión 4
INTRODUCCIÓN A LA ESTADÍSTICA
Estadística Aplicada a los Negocios

Motivación: usos de la estadística

Encuestas Estimación

Predicciones económicas Toma de decisiones


Estadística Aplicada a los Negocios

¿Qué es la estadística?

estadística.
(Del al. Statistik).
1. f. Estudio de los datos cuantitativos de la población, de los recursos
naturales e industriales, del tráfico o de cualquier otra manifestación de las
sociedades humanas.
2. f. Conjunto de estos datos.
3. f. Rama de la matemática que utiliza grandes conjuntos de datos numéricos
para obtener inferencias basadas en el cálculo de probabilidades.
Estadística Aplicada a los Negocios

Una estadística puede ser cualquier cifra o dato numérico sobre


cualquier realidad.

• Estadísticas económicas: número de parados, tasa de la inflación


• Estadísticas demográficas: tasa de nacimientos, edad media
• Estadísticas deportivas: goles marcados, tarjetas rojas
• Estadísticas meteorológicas: temperatura, lluvia
Estadística Aplicada a los negocios

Variables

Una variable es una característica de la población que se


quiere estudiar.

 La afiliación política de los bolivianos: MAS, PODEMOS, UN u otro


 La situación de trabajo de los paceños: desempleo, tiempo parcial,
tiempo completo.
 Número de diarios que compran los lectores de prensa diaria de
Santa Cruz
 Gastos de los municipios en Bolivia

Diferentes tipos de variables requieren distintos tratamientos.


Estadística Aplicada a los negocios

Tipos de variables

Una variable cualitativa o un atributo es una


característica o rasgo no cuantitativo de la población
que se quiere estudiar.

Una variable cuantitativa es aquella que podemos


medir y expresar numéricamente.
Estadística Aplicada a los negocios

Variables cualitativas o atributos

• Variables cualitativas pueden ser


nominales o ordinales.
– La afiliación política
– La situación de trabajo: desempleo, tiempo
parcial, tiempo completo.
Estadística Aplicada a los negocios

Variables cuantitativas

Variables cuantitativas pueden ser discretas o


continuas.
a) Discretas : aquellas cuyos valores se interrumpen o separan.
b) Continuas: aquellas cuyos valores posibles no tienen interrupción.

 Número de diarios que compran los lectores de prensa diaria


 Gastos de los municipios.
Estadística Aplicada a los negocios

Ejercicio

Clasificar las siguientes variables:

 Lugar de nacimiento
 Ingresos totales
 Número de miembros de la familia
 Grado escolar
 Número de camas en un hospital
 Número de teléfono
 Nivel de estudios
 Código Postal de su dirección
Estadística Aplicada a los negocios

Esquema general del planteamiento de un estudio

• Hipótesis de trabajo • Protocolo de recogida de datos


• Objetivos • Construcción de bases de datos
• Diseño de estudio • Depuración de los datos
• Selección de variables • Análisis
• Resultados
• Definición de variables
• Conclusiones
• Escala de medida

Estadística: Herramienta indispensable


Estadística Aplicada a los negocios

Esquema del OBJETIVO

proceso de Materia Prima


obtener DATOS
conclusiones a Procesamiento
partir de los ORGANIZACION Y
datos ANALISIS

Producto
CONCLUSIONES
Estadística Aplicada a los negocios

En la actualidad el conjunto de métodos que la estadística brinda para atender


todos los problemas hace que se la divida en 2 grandes campos, Estadística
Descriptiva e Inferencial.

Clasificación de la estadística moderna

Cuadros
representación de datos Tablas
Gráficos
Descriptiva
Promedios
Reducción de datos
Dispersiones

Predice, infiere
Inferencial Trabajo en base a
muestras
Decide sobre las poblaciones
Estadística Aplicada a los negocios

Definiciones básicas
“Población es un conjunto de elementos definidos en el
tiempo y en el espacio, sobre los cuales se realizarán
las observaciones en el caso de una encuesta
exhaustiva o censo, o a los cuales se referirán los
resultados de la investigación en el caso de un
estudio por muestreo”.
“Muestra es el subconjunto de unidades seleccionadas
de la población definida. En esta recae la realización
de las observaciones”.
“Valores poblacionales” Parámetros
“Estimadores” Estadísticos
El proceso de inferencia

POBLACION MUESTRA
• N (finita o infinita) • n (siempre finita)
• Media () • Media muestral (X)
• Dispersión () • Dispersión muestral (s)
• Proporciones () • Proporciones muestrales
• Otras características (p)
• Otros estimadores
La muestra
• El tamaño de la muestra
– A ser resuelto con la teoría del muestreo
– A veces el costo obliga a tomar muestras más chicas.
– A veces el problema de investigación determina adicionalmente
velocidad en la toma de datos u otros factores.
• La representatividad de la muestra
– El tamaño de la muestra no es el único factor que contribuye a hacer
una muestra representativa.
– También está el carácter aleatorio de la muestra
– Pueden ser las muestras siempre aleatorias?
• Los tipos de muestra
– Cortes transversales (censos, encuestas, experimentos)
– Series de tiempo
– Datos de panel
Los tipos de muestra
• Cortes transversales
– Lo más acercado a la teoría tradicional
– En ciencias sociales incluso un censo tiene márgenes de error.
• Series de tiempo
– Los datos ya vienen en un orden y tamaño predeterminados
– Podemos achicar la muestra pero no expandirla
– Las observaciones no son independientes
• Datos de panel
– Solamente se los usa para aumentar la muestra?
– Diferencias entre periodos y entre individuos.
– El sesgo de selectividad.
– Si los individuos son mayores que los periodos o viceversa es
indiferente?
Las variables
• La medición de las variables
– Reflejan realmente lo que se quiere medir?
• Maltrato infantil
• Calidad de las instituciones
• Riesgo
– El tipo de medición afecta el proceso de inferencia
• Los tipos de variables
– Variables discretas
– Variables continuas
– Variables no observables
– Variables latentes
– Variables dicotómicas
– Variables censuradas
– Variables truncadas
Hay otro mundo fuera de la
estadística?
• La existencia de información extra muestral
– La opinión de expertos
– Estudios especializados aplicados a otras geografías o en otros
periodos
– Es posible o recomendable incorporar esta información?
• La existencia de información a priori
– Hay algún estudio que empieza de la nada?
– Es posible incorporar esta información en el proceso?
– La evidencia sólo puede ser utilizada para modificar la
información inicial solamente?
• La inexistencia, ausencia, ambigüedad de datos
• La ausencia de distribuciones
– Sin distribución no se puede hacer un test de hipótesis clásico
ESTADÍSTICA DESCRIPTIVA
Estadística Aplicada a los negocios

Presentaciones visuales, reducción de datos


Tablas, Gráficos y Distribuciones

¿Qué representación mental le sugiere la palabra


estadística a la mayor parte de la gente ?

Una tabla es una ordenación de datos en filas y columnas


utilizada para documentar o comunicar información.
Desde este punto de vista de su uso, existen dos tipos de
tablas a saber : Tablas generales o de Referencia y Tablas
Específicas o de Resumen
Distribución de una variable
cuantitativa discreta
Veamos con un ejemplo la tabla de distribución de
frecuencias. En 13 cajones de huevos se contó la
cantidad de huevos desechables por cajón:

Huevos rotos Número de


por caja cajas (f)
1 2
2 4
3 1
4 3
5 2
6 1
DISTRIBUCIÓN DE FRECUENCIAS
• Es el estudio de datos ordenados a través de
los cuales se conoce información mas a fondo,
de una muestra de valores dados, basado en
la frecuencia de veces en que los valores caen
dentro de un intervalo dado.
Análisis de frecuencias
• Frecuencia simple (f)
• Frecuencia acumulada (F)
• Frecuencia relativa (fr)
• Frecuencia porcentual (fp)
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS

Polígono de
8
frecuencias
7
6
5
4
3
2
1
0
1793,5 1797,5 1801,5 1805,5 1809,5

histograma
DISTRIBUCIÓN DE FRECUENCIAS
• Determinamos que el rango en los que se
mueven los valores es: Ra = Xmax - Xmin
• El Numero de intervalos es arbitrario, pero se
recomienda que sea entre 4 y 12 dependiendo
del valor del rango (K).
• Determinando la amplitud que tendrán cada
uno de los intervalos, seria: A= R / K,
• El limite inferior del que se partirá, deberá ser
igual al valor menor menos un medio de la
unidad mínima de medición.
Huevos rotos Número de
por caja cajas (f) fr=f/n frp=fr*100 F

1 2 0.1538 15% 2

2 4 0.3077 31% 6

3 1 0.0769 8% 7

4 3 0.2308 23% 10

5 2 0.1538 15% 12

6 1 0.0769 8% 13

n 13 1.0000 100%
Distribución de una variable cuantitativa
continua
• Ahora si lo que nos interesa son los índices de
Productividad ponderado de 20 establecimientos
estamos frente a una variable cuantitativa continua.
• En este caso los valores individuales carecen de interés,
por la propia naturaleza de dicha variable, por lo tanto
se los agrupa en los llamados “intervalos de clase”.
• La cantidad de intervalos necesarios para construir una
distribución de frecuencias no se puede determinar
por alguna regla precisa, depende de la experiencia y el
sentido del investigador, generalmente se utilizan entre
5 -15.
Distribución de una variable cuantitativa continua

• El límite inferior del primer intervalo debe ser algo menor


que el valor más pequeño de la variable, y el límite superior
del último intervalo algo mayor al dato más grande.
• Definiendo:
• xmáx= valor extremo superior de la variable
• xmín= valor extremo inferior de la variable
• La diferencia entre estos dos valores nos da la “amplitud
total”
• A=xmáx-xmín
• Si creemos que la cantidad de intervalos conveniente es h
entonces la amplitud de los intervalos será
aproximadamente a=A/h
Distribución de una variable cuantitativa continua

Veamos por ejemplo... X= valor de índice de


Productividad de 20 establecimientos.

45,0 55,0 48,9 40,5 42,8


52,0 49,0 52,5 51,7 50,0
50,0 56,5 57,0 52,0 45,0
49,0 44,3 41,0 59,2 46,3

Vemos cuál es el valor extremo inferior xmín=40,5


y el extremo superior, xmáx=59,2
Para obtener a= amplitud del intervalo.
60  40 20
a  4
5 5

Los intervalos se construyen de tal forma que contienen


al extremo inferior pero no al superior.

Intervalo de clase fi Fi fri Fri


40,0 - 44,0 3 3 3/20=0,15 3/20=0,15
44,0 - 48,0 4 7 4/20=0,20 7/20=0,35
48,0 - 52,0 6 13 6/20=0,30 13/20=0,65
52,0 - 56,0 4 17 4/20=0,20 17/20=0,85
56,0 - 60,0 3 20 3/20=0,15 20/20=1,00
20 1,00
La representación HISTOGRAMA
gráfica que corresponde

FRECUENCIAS
7
a la distribución de
6
frecuencias simples o
relativas de una variable 5

cuantitativa continua es 4

el HISTOGRAMA 3

0
40,0 - 44,0 44,0 - 48,0 48,0 - 52,0 52,0 - 56,0 56,0 - 60,0
X
En Excel
Excel: cont.
Salida Excel
Salida Excel cont.
Medidas que resumen información
Promedios y Dispersión


Mediana
Medidas de tendencia Central 
Modo Media Aritmética

Promedios Media Geométrica
Media Armónica


Rango
Medidas de variabilidad y concentración 
Desvío medio-

Varianza

Desvío típico (estándar)

Rango intercuartilar

Coeficiente de Variación
Medidas descriptivas

• Las medidas descriptivas más comunes de


tendencia central o localización son: la
media aritmética y la mediana
• Existen otras medidas de tendencia central
que en ocasiones pueden resultar de interés:
– la moda, los cuartiles, los deciles, los percentiles,
la media armónica, la media geométrica y la
media ponderada.)
Media muestral
• La media aritmética o simplemente promedio
(también llamada media muestral ya que
generalmente se calcula en relación a una muestra)
• Se calcula de la siguiente forma: si las observaciones
de una muestra de tamaño n son x1, x2,…,xn
entonces

x
x 1  x 2  ...  x n i  1
i

X 
n n
Característica de la Media
• Es intuitiva y fácil de calcular.
• Su valor puede que no coincida con ninguno
de los valores de la muestra
• La suma de las diferencias de cada valor de la
muestra con la media su resultado es cero, es
decir,
n

 (x  x)  0
i 1
i
La mediana
• se suele definir como el valor “más intermedio” una
vez que los datos han sido ordenados en forma
creciente. Se suele denotar por Me.
• La forma más general de calcular la mediana es la
siguiente:

 x  n  1 2 si n es impar

Me   x
 n 2  x  ( n 2) 1
 si n es par
 2
Características de la mediana
• La mediana es aquel valor que deja el
cincuenta por ciento de los datos por debajo y
otro cincuenta por encima.
• Cabe destacar que es preferible el uso de la
mediana como medida descriptiva del centro
cuando se quiere reducir o eliminar el efecto
de valores extremos en un conjunto de datos
(muy grandes o muy pequeños).
Moda o valor modal
• Es una medida de tendencia central que se
puede utilizar sea cual sea el tipo de variable a
estudiar.
• La moda de un conjunto de observaciones es
el valor que más se repite, aquel cuya
frecuencia absoluta es máxima. Puede ser
única, que haya más de una, o que no exista
Media geométrica
• Se define como la raíz n-ésima del producto
de todos los valores numéricos, es decir,

n
X G  n x1.x2 ....xn  n ( xi )
i 1
Media armónica
• Se define como el número de observaciones
de la muestra dividido por la suma del inverso
de cada una de las observaciones, es decir,

n
XA  n

 (1 / x )
i 1
i
Algunas consideraciones
• La localización o tendencia central de un conjunto de
datos no necesariamente proporciona información
suficiente para describirlos adecuadamente.
• Debido a que no todos los valores son semejantes, la
variación entre ellos se considera importante.
• Se puede decir que un conjunto de datos tiene una
dispersión reducida si los mismos se aglomeran
estrechamente en torno a alguna medida de
localización de interés y se dice que tiene una
dispersión grande si se esparcen ampliamente
alrededor de alguna medida de localización de interés.
Medidas de variación
• Las medidas descriptivas más comunes de
dispersión son:
– el rango
– la varianza,
– la desviación estándar
– rango intercuartílico.
Rango
• El rango de la muestra es la medida de
variabilidad más sencilla entre todas las
mencionadas;
• Se define como la diferencia entre la
observación más grande y la más pequeña :

r  xmax  xmin
Alcances y limitaciones
• Aunque es una medida muy fácil de calcular,
ignora toda la información de la muestra entre
las observaciones más grande y más pequeña.
• Sin embargo, vale la pena resaltar que el
rango se utiliza mucho en aplicaciones
estadísticas al control de calidad, donde lo
común es emplear muestras con tamaños n =
4 o n = 5 ya que en estos casos la pérdida de
información no se considera relevante.
Varianza y Desviación estándar
• En general, se desea una medida de
variabilidad que dependa de todas las
observaciones y no sólo de unas pocas;
• así que parece razonable medir la variación en
términos de las desviaciones relativas a alguna
medida de localización (generalmente esta
medida es la media)
Para el conjunto de datos x1, x2,….,xn
Las diferencias ( x1  x ), ( x2  x ),....., ( xn  x )
Determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es
cero, se utiliza como medida de variabilidad el
promedio de los cuadrados de tales
desviaciones.
Varianza
• Sin embargo, como sólo hay n-1 desviaciones
independiente se conviene en dividir entre n-
1, es decir,

 (x  x )
i
2

s 
2 i 1

n 1
Características de la varianza
• Como S2 no tiene las mismas unidades que los
datos, se define la desviación estándar como la
raíz cuadrada (positiva) de la varianza a fin de
tener una medida en las mismas unidades de los
datos;
• La desviación estándar es útil para comparar
dispersión entre dos poblaciones, pero también
lo es para calcular el porcentaje de la población
que pueden localizarse a menos de una distancia
específica de la media.
Coeficiente de variación
• Si el CV  5% ----> datos muy homogéneos,
Media aritmética muy representativa
• Si el 5%  CV  20% ----> datos con
homogeneidad aceptable. La media
aritmética es representativa
• Si el CV  20% ----> datos heterogéneos, la
media aritmética es poco representativa
s
CV  __
X
Preguntas
• Para qué sirve la mediana si ya tenemos la media
aritmética
• Tiene alguna aplicación práctica la media
geométrica?
• Por qué calculamos la varianza con el cuadrado
de las diferencias en vez de su valor absoluto?
• En cuántos intervalos conviene dividir los datos
para construir un histograma?
• Qué hay que hacer cuando encontramos datos
atípicos?
Control 1 (jueves 5-3-15)
• Pedreros. Páginas 36-66

• Si σ41 𝑋 = 5 la media de X es mayor o igual a


1?
• Si la media de X=80 y multiplico todas las Xi
por 4, cual será la nueva media?
• Que entiende usted por muestra
representativa?
Control 2: viernes 6-3-15
• Webster. Páginas 142 – 152
• Cual es la distribución de la media de X, y por
què?
• Es necesario saber algo de la distribución de X
para saber la distribución de su media? Por
què?
• Con què distribución està relacionada la
distribución binomial y por què?

También podría gustarte