Court y Rengifo (2) - 28-35

capítulo 1 Estadística descriptiva
2.1.2. Muestreo sistemático

El muestreo sistemático se basa en determinar aleatoriamente un número (conocido como
semilla), que se usa para determinar los elementos u observaciones de una población que serán se-
leccionados. Por ejemplo, se selecciona un número al azar entre 1 y 10, por ejemplo 4. Este número
implica que las observaciones que se seleccionarán serán basadas en los múltiplos de este número.
Se seleccionarán las observaciones 4, 8, 12, etc.
El principal problema de este método es conocido como el de estacionalidad. El problema
de estacionalidad ocurre cuando en los datos existen ciertos patrones determinísticos que se repiten
de acuerdo a una determinada frecuencia. Un ejemplo clásico es el referido a la venta de helados.
Las mayores ventas de helados se producen durante todos los veranos, mientras que las ventas más
bajas se dan en el invierno. Si se desean determinar las ventas promedio en unidades de una empresa
dedicada a producir helados durante los 10 últimos años, usando datos trimestrales y usando un
muestreo sistemático, se puede correr el riesgo que el número semilla coincida exactamente o con el
verano (que generaría que el promedio sea inflado) o con el invierno (que haría que el promedio esté
subvaluado). De ahí la importancia de conocer los datos con los que se está trabajando para prever
todo tipo de problemas que pudieran aparecer y determinar la mejor manera de solucionarlos.
2.1.3. Muestreo estratificado simple

Muchas veces la población a estudiar tiene cierta estructura que puede ser identificada a priori.
Por ejemplo, si se desea hacer un análisis del nivel de ingresos de la población de un determinado
país, se pueden identificar distintos niveles de ingresos de acuerdo a determinados estudios sobre
los niveles socio-económicos.
Esta estructura de la población debe ser considerada al momento de recolectar los datos para
hacer que la muestra resultante sea representativa de la población. Es decir, lo que se trata de replicar
es la estructura (o estratos) existente en los datos para luego al interior de cada estrato aplicar un
muestreo aleatorio simple.
Se analiza el siguiente ejemplo desarrollado con valores hipotéticos:
Tabla 1
Muestra 2
Nivel socio-económico Población Ingresos (en miles de U.M.) Muestra 1
(muestreo estratificado)
A 1.000 (10%) 125 10 (10%) 10 (10%)
B 3.000 (30%) 70 80 (80%) 30 (30%)
C 6.000 (60%) 25 10 (10%) 60 (60%)
Esta tabla presenta la población y, en paréntesis, el porcentaje respecto al total. Por ejemplo, 10%
de la población pertenece al nivel socio-económico A. Asimismo, presenta valores de dos muestras
hipotéticas de 100 habitantes cada una. Entre paréntesis se encuentra el porcentaje de la misma
respecto al total de la muestra. Por ejemplo, en la muestra 1 se seleccionaron a 80 personas del nivel
B, lo que representa el 80% del total de la muestra.
5
Estadísticas y Econometría Financiera
La expresión U.M. se refiere a unidades monetarias.

Primero, se supone que el muestreo es completamente aleatorio y que, por azar, el resultado
de la selección resulta sesgado (por diversos motivos, como facilidad de acceso a las observaciones,
o simplemente por motivos aleatorios). Se supone que esos datos corresponden a la Muestra 1 en la
Tabla 1. Aquí se puede observar que el nivel socio-económico B está sobre representado mientras
que el nivel C está sub representado con respecto a la población. Si se desearan construir estadísticos
con esta muestra los resultados estarían sesgados hacia los valores de la clase B.
Por otro lado, la muestra hallada usando un muestreo estratificado simple, la estructura funda-
mental de la población se ha preservado, generándose de esta manera la representatividad necesaria
de la muestra. Es importante notar que en el muestreo estratificado simple, una vez que los estratos
han sido formados, para seleccionar a los elementos que comprenderán cada uno de los estratos se
aplica una muestra aleatoria simple.
2.2. El muestreo no probabilístico

En este caso no todos los elementos de la población tienen la probabilidad de ser seleccionados.
En este tipo de muestreo se utiliza bastante la intuición y la experiencia del analista y, por lo general,
es utilizado para realizar estudios exploratorios, cuyos resultados no son usados para realizar infe-
rencia acerca de los parámetros poblacionales.
Se pueden identificar los tipos de muestreos no probabilísticos que se citan a continuación.
2.2.1. Muestreo basado en el juicio del analista

Este tipo de muestreo depende de lo que el analista considere como importante para la cons-
trucción de la muestra. Por ejemplo, un auditor contable puede decidir no aplicar ningún muestreo
probabilístico como los mencionados anteriormente y, en vez de eso, determinar en base a su expe-
riencia, qué documentos solicitar para su análisis.
2.2.2. Muestreo basado en la facilidad de acceso a los elementos

que forman la base del estudio
Este muestreo se construye en base a la disponibilidad y facilidad de acceso a los elementos
que constituyen la población. Por ejemplo, si un grupo de estudiantes desea construir una muestra
para entender de manera preliminar (exploratoria) los hábitos de consumo de café de los clientes de
Starbucks; estos pueden concentrar sus esfuerzos en una determinada área geográfica que les sea
de fácil acceso.
2.2.3. Muestreo basado en un propósito específico

En este tipo de muestreo, los miembros de la muestra son seleccionados con el propósito explícito
de ayudar a responder alguna pregunta relevante en el estudio. Por ejemplo, si se desea determinar la
6
calidad de un libro básico de introducción a las finanzas, se puede seleccionar a un grupo de alum-
nos de pregrado con nociones mínimas de finanzas. Si estos estudiantes entienden los conceptos
presentados en el libro, esto será una señal que podrá ser fácilmente entendido por estudiantes con
cierto nivel de conocimientos de la materia.
3. Distribución de frecuencias
Si el analista cuenta con los datos necesarios para realizar su trabajo, lo primero a hacer será
entender los datos con los que se cuenta. Se supone que los datos se refieren a las ventas en unidades
de los últimos 10 años los que se muestran a continuación:
Tabla 2
Año Ventas (miles de unidades)

20X0 2.540
20X1 2.560
20X2 2.612
20X3 2.630
20X4 2.720
20X5 2.760
20X6 2.785
20X7 2.804
20X8 2.831
20X9 2.935
Una manera bastante fácil y útil para tener un mejor entendimiento de los datos es el crear una
tabla de frecuencias. Las tablas de frecuencias presentan la información agrupada de acuerdo a
rangos predeterminados. Una posible tabla de frecuencias tiene la siguiente forma:
Tabla 3: Tabla de frecuencias
Frecuencia relativa Frecuencia Frecuencia relativa

Clases Frecuencia
(%) acumulada acumulada
≤ 2.600 2 20% 2 20%
(2.600, 2.700] 2 20% 4 40%
(2.700, 2.800] 3 30% 7 70%
(2.800, 2.900] 2 20% 9 90%
(2.900, 3.000] 1 10% 10 100%
≥ 3.000 0 0% 10 100%
Total 10 100%
Los elementos característicos de una tabla de frecuencias son los siguientes:
a. Clases: son los rangos en los que se separan los datos. Por ejemplo, (2.600, 2.700] in-
dica que se deben seleccionar las observaciones mayores que 2.600 (no incluyendo
2.600) y menores o iguales a 2.700 (incluyendo 2.700).
7
b. Límites de las clases: son los valores que definen el mínimo y máximo valor a incluir
en una determinada clase. Por ejemplo, en la clase (2.600, 2.700], los límites son 2.600
y 2.700.
c. Rango de las clases: es la diferencia entre el límite máximo y el mínimo. Por ejemplo,
en (2.600, 2.700] el rango sería 2.700 - 2.600 = 100. Es importante notar que el rango
de todas las clases no tiene que ser necesariamente el mismo, aunque se sugiere que si lo
sea por motivos de presentación.
d. Marca de clases: Es el punto medio de cada clase. Se calcula sumando el límite infe-
rior al superior y dividiendo el resultado entre 2. Por ejemplo, el valor medio de la clase
(2.600, 2.700] es igual a (2.600 + 2.700)/2 = 2.650. Estos valores son importantes para
graficar el polígono de frecuencias que se detallará posteriormente.
Es importante notar que una tabla de frecuencias está bien estructurada si las clases satisfacen
las siguientes características:
a. Las clases deben ser mutuamente excluyentes, es decir, los límites entre clases jamás
deben pertenecer a más de una clase. Por ejemplo, las clases (2.600, 2.700] y (2.700,
2.800] son mutuamente excluyentes ya que los límites de una clase no están incluidas
en la otra: 2.700 está incluida en la primera clase pero no lo está en la segunda. Nótese
que “]” significa que el límite está incluido en una clase en particular y, “(” implica que
el límite no está incluido en una clase en particular.
b. Las clases deben ser exhaustivas, es decir, todas las observaciones en la muestra deben
estar incluidas en alguna de las clases. Como puede advertirse en la Tabla 3, todos los
valores de Tabla 2 han sido incluidos. La forma de verificar esto es simplemente verifi-
car que el total de la columna “frecuencia” corresponda al número de observaciones de
la muestra (en nuestro caso 10).
A continuación se describen los resultados presentados en la Tabla 3.
a. La primera columna (clases) contiene las clases en las que se dividirán las observacio-
nes.
b. La segunda columna (frecuencia) describe el número de observaciones que caen en
una determinada clase. Por ejemplo, se observan dos años con ventas entre (2.600,
2.700]. Nótese que la suma de esta columna debe ser igual al tamaño de la muestra.
c. La tercera columna (frecuencia relativa) describe el porcentaje de observaciones en
una determinada clase. Por ejemplo, el 20% de las ventas fueron entre (2.600, 2.700].
Adviértase que la suma de esta columna debe ser igual al 100%.
d. La cuarta columna (frecuencia acumulada) describe el número de observaciones que
son menores o iguales al límite superior de una determinada clase. Por ejemplo, se ob-
servan 7 años con ventas menores o iguales a 2.800.
8
e. La quinta columna (frecuencia relativa acumulada) describe el porcentaje de observa-

ciones que son menores o iguales al límite superior de una determinada clase. Por ejem-
plo, se observan que el 70% de las ventas fueron menores o iguales a 2.800.
Cuando se utilizan los valores de la Tabla 3, se pueden generar algunos gráficos que son de
bastante ayuda:
a. El histograma: muestra la información contenida en la primera columna de la Tabla 3,

es decir presenta las frecuencias.
b. El gráfico de las frecuencias relativas acumuladas: muestra la información de la
quinta columna de la Tabla 3. Nótese que el máximo valor de las frecuencias relativas
acumuladas es 100%.
Gráfico 2
Histograma y frecuencias
relativas acumuladas
4 100,00%
3 80,00%
Frequencia
60,00%
2
40,00%
1 20,00%
0 0,00%
2500 2600 2700 2800 2900 3000 More
Límites
Frequency Cumulative %
c. El polígono de frecuencias: muestra la misma información que el histograma, pero de

manera más intuitiva, en el sentido que supone que las frecuencias varían gradualmente
conforme las observaciones aumentan o disminuyen en el eje de los límites. Para reali-
zar este gráfico se usan los valores medios de las clases como puntos que se ponen en la
parte superior de cada rectángulo. El polígono de frecuencias se obtiene uniendo estos
puntos.
9
Gráfico 3
Histograma y polígono
de frecuencias
4
Frequencia
3
2
1
0
2500 2600 2700 2800 2900 3000 More
Límites
Frequency Frequency
A continuación se presenta la forma en que se pueden realizar estas tablas por medio de Excel.
Aplicación en Excel 2: Tabla de frecuencias
Una vez que se tiene un entendimiento de las características básicas de los datos obtenidos me-
diante el análisis presentado en esta sección, se procederá a analizar determinados estadísticos que
10
proporcionarán un mayor entendimiento de ciertas características claves de los datos en términos

11
de sus medidas de tendencia central, dispersión y asociación.
4. Medidas de tendencia central

4. Medidas de tendencia central
Las medidas de tendencia central permiten al analista determinar los valores típicos de los datos.
Las
En esta medidas
sección de tendencia
se analizarán central permiten
los estadísticos al analistaeldeterminar
más importantes: promedio,los valores típicos
el promedio ponderado,
de los datos. En esta sección se analizarán los estadísticos más importantes: el esto
la media y la moda. Se presentarán los estadísticos para las poblaciones y para las muestras. Para
promedio, el promedio ponderado, la media y la moda. Se presentarán los
se debe recordar que para el tamaño de la población se utilizará N y para el tamaño de la muestra n.
estadísticos para las poblaciones y para las muestras. Para esto se debe recordar
que para el tamaño de la población se utilizará N y para el tamaño de la muestra n.
4.1. El promedio o media
4.1. El promedio
El promedio o media eso también
media conocido como la media aritmética. La media poblacional,
que a El
partir del momento se identificará con la letra griega “µ” (mu), se calcula de la siguiente manera:
promedio o media es también conocido como la media aritmética. La media
poblacional, que a partir del momento se identificará
N con la letra griega “µ” (mu), se
calcula de la siguiente manera: xi ∑
µ= i =1 (1)
NN
x i
i 1
(1)
Por otra parte, si se trata de la media muestral, para
N una muestra de tamaño n, este estadístico
estará dado por:
Por otra parte, si se trata de la media muestral,
n
para una muestra de tamaño n, este
estadístico estará dado por:
∑x i
x= i =1
n (2)

n xi
x i 1
(2)
Donde: x representa el promedio muestral, xi la
n variable de interés, n el número de observa-
ciones en la muestra y ∑ el operador de suma.
Donde: x representa el promedio muestral, xi la variable de interés, n el número de
observaciones en la muestra y ∑ el operador de suma.
Ejemplo 1:
Ejemplo 1:
Se supone que se tienen los datos de las ventas anuales correspondientes a los 10 últimos años
Sedeterminada
de una supone que corporación
se tienen los(los
datos deselas
datos ventas anuales
encuentran correspondientes
en la Tabla a los
2) y que desea 10 las
conocer
últimos años de una
ventas anuales promedio: determinada corporación (los datos se encuentran en la Tabla
2) y que desea conocer las ventas anuales promedio:
ʹǤͷͶͲ ൅ ʹǤͷ͸Ͳ ൅ ʹǤ͸ͳʹ ൅ ʹǤ͸͵Ͳ ൅ ʹǤ͹ʹͲ ൅ ʹǤ͹͸Ͳ ൅ ʹǤ͹ͺͷ ൅ ʹǤͺͲͶ ൅ ʹǤͺ͵ͳ ൅ ʹǤͻ͵ͷ
‫ݔ‬ҧ ൌ
ͳͲ
Por lo tanto, x = 2.718. Es decir, que la venta anual promedio durante los últimos 10
Por lo tanto, x = 2.718. Es decir, que la venta anual promedio durante los últimos 10 años es
años es igual 2.718 U.M.
igual 2.718 U.M.
El principal
El principal problema
problemadede este
este estadístico
estadístico esesque
es que muyes muy susceptible
susceptible valores Para
a valores aextremos.
extremos. Para entender este problema, se supone que las ventas en unidades del
entender este problema, se supone que las ventas en unidades del año 20X9 han sido 5.450 en vez de
año 20X9 han sido 5.450 en vez de 2.935. El efecto de este cambio se puede notar
2.935.a El efecto de este cambio se puede notar a continuación:
continuación:
11
12
12
ʹǤͷͶͲ ൅ ʹǤͷ͸Ͳ ൅ ʹǤ͸ͳʹ ൅ ʹǤ͸͵Ͳ ൅ ʹǤ͹ʹͲ ൅ ʹǤ͹͸Ͳ ൅ ʹǤ͹ͺͷ ൅ ʹǤͺͲͶ ൅ ʹǤͺ͵ͳ ൅ ૞Ǥ ૝૞૙
‫ݔ‬ҧ ൌ
ʹǤͷͶͲ ൅ ʹǤͷ͸Ͳ ൅ ʹǤ͸ͳʹ ൅ ʹǤ͸͵Ͳ ൅ ʹǤ͹ʹͲ ͳͲ ൅ ʹǤ͹͸Ͳ ൅ ʹǤ͹ͺͷ ൅ ʹǤͺͲͶ ൅ ʹǤͺ͵ͳ ൅ ૞Ǥ ૝૞૙
‫ݔ‬ҧ ൌ
ͳͲ
Por
Por lo tanto, xx == 2.969.
lo tanto, 2.969. Como
Como se puedeapreciar,
se puede apreciar, la la existencia
existencia de valor
de un un valor extremo,
extremo, tiende a
tiende
Por lo a mover
tanto, x =el promedio
2.969. Comoen la
se dirección
puede de dicha
apreciar, la variable.
existenciaDicho
de de
un otra
valor manera,
extremo,
moverun elvalor
promedio
mucho en lamayor
dirección delas
queen dicha variable.
demás Dicho de otratiende
observaciones, manera, a un valor mucho
empujar mayor
el valor
tiende
que las demása mover el promedio
observaciones, tiende a la dirección
empujar el de dicha
valor promediovariable.
haciaDicho
la de otra
derecha, manera,
mientras que la
promedio
un valor muchohacia lamayor
derecha,
quemientras
las demás queobservaciones,
la existencia detiendeun valor extremoelmucho
a empujar valor
existencia
menor
promedio deque
unhacia
valor extremo
las laotras mucho
observaciones
derecha, menorque
mientras que
moverá lasexistencia
la otras observaciones
la media de hacia moverá
un valor la media
la extremo
izquierda. hacia la
Este
mucho
problema
izquierda. Estese acentúa
problema secuanto
acentúamás lejano
cuanto mássea el
lejano valor.
sea el valor.
menor que las otras observaciones moverá la media hacia la izquierda. Este
problema
formasede
Unaforma deacentúa cuanto problema
solucionar más lejano es sea el valor. los valores extremos en el cálculo del
Una solucionareste
este problema no no
es considerar
considerar los valores extremos en el
promedio
cálculoo utilizar
del otro
promedio estadístico
o utilizar como
otro la mediana.
estadístico como
Una forma de solucionar este problema es no considerar la mediana.
los valores extremos en el
cálculo del promedio o utilizar otro estadístico como la mediana.
4.2. El promedio
4.2. El promedio ponderado ponderado
4.2. El promedio ponderado
El promedio
El promedio considera
consideraqueque
todatoda
la información tiene latiene
la información mismalaponderación o importancia
misma ponderación o en
el cálculo del estadístico.
importancia el Sin embargo, muchas veces cada
Sin observación tiene diferente
vecespeso o pon-
El promedio en cálculo
considera que del
todaestadístico.
la información embargo, muchas
tiene la misma ponderación cadao
observación
deración. Es eso tiene diferente
exactamente lo quepeso o
consideraponderación.
el promedio Es eso
ponderado.exactamente
importancia en el cálculo del estadístico. Sin embargo, muchas veces cadaLa fórmula lo
del que
promedio
considera
ponderado es: el promedio
observación ponderado.
tiene diferente pesoLaofórmula del promedio
ponderación. ponderado
Es eso es:
exactamente lo que
considera el promedio ponderado. La fórmula
nn
del promedio ponderado es:
= ∑
xxω ωi i×xixi (3)
n
ii=11
(3)
x i xi (3)
i 1
Donde:
Donde:
Donde: n
∑
n
=11 (4)
ω
ii=n11
(4) ii

i 1
i 1 (4)
En
Enlala fórmula anterior, xxωrepresenta
fórmulaanterior, ponderado yy ω
representa el promedio ponderado la ponderación
ii la ponderaciónde
decada
observación.
cada observación.
En la fórmula anterior, x representa el promedio ponderado y i la ponderación de
cada observación.
Ejemplo 2:
Ejemplo
Ejemplo2: 2:
Un ejemplo típico en este caso es el cálculo de la rentabilidad de un portafolio. Si se
Un ejemplo
imagina quetípico en este
se tiene caso es el cálculo
la siguiente de la rentabilidad de un portafolio. Si se10%
imagina que
Un ejemplo típico en este caso escomposición
el cálculo dedela un determinado
rentabilidad portafolio:
de un portafolio. Si en
se
se tiene
rentala
imagina
siguiente
fija,que
70% composición
en acciones
se tiene
de un determinado
y 20%
la siguiente
portafolio:
en metales
composición como
de un
10% en renta fija, 70%
el oro. Siportafolio:
determinado
en
los rendimientos acciones
10% en
y 20%ganados
en metalespor cada
como clase
el oro. de
Si activo
los financiero
rendimientos son 2%,
ganados
renta fija, 70% en acciones y 20% en metales como el oro. Si los 10%
por caday 35%,
clase respectivamente,
de activo financiero son
rendimientos
2%, el promedio
10%
ganadosy 35%, porponderado
cada clasesería
respectivamente, calculado
el promedio
de activo deponderado
la siguiente
financiero son 2%, manera:
sería
10%calculado
y 35%,derespectivamente,
la siguiente manera:
el promedio ponderado sería calculado de la siguiente manera:
‫ݔ‬ҧ߱ ൌ ሺͲǡͳሻ ൈ ሺʹΨሻ ൅ ሺͲǡ͹ሻ ൈ ሺͳͲΨሻ ൅ ሺͲǡʹሻ ൈ ሺ͵ͷΨሻ ൌ ͳͶǡʹΨ
‫ݔ‬ҧ߱ ൌ ሺͲǡͳሻ ൈ ሺʹΨሻ ൅ ሺͲǡ͹ሻ ൈ ሺͳͲΨሻ ൅ ሺͲǡʹሻ ൈ ሺ͵ͷΨሻ ൌ ͳͶǡʹΨ
Es decir, que la rentabilidad promedio del portafolio es igual a 14,2%.
4.3. La mediana
4.3. La mediana
La mediana representa el valor medio de los datos debidamente ordenados ya sea
de
La manera
medianaascendente
representa oel descendente. Si los
valor medio de el número de observaciones
datos debidamente es impar,
ordenados la
ya sea
de manera ascendente o descendente. Si el número de observaciones es impar, la
12

Court y Rengifo (2) - 28-35

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Court y Rengifo (2) - 28-35

Cargado por

Copyright:

Formatos disponibles

capítulo 1 Estadística descriptiva

2.1.2. Muestreo sistemático

2.1.3. Muestreo estratificado simple

La expresión U.M. se refiere a unidades monetarias.

2.2. El muestreo no probabilístico

2.2.1. Muestreo basado en el juicio del analista

2.2.2. Muestreo basado en la facilidad de acceso a los elementos

2.2.3. Muestreo basado en un propósito específico

Año Ventas (miles de unidades)

Tabla 3: Tabla de frecuencias

Frecuencia relativa Frecuencia Frecuencia relativa

Los elementos característicos de una tabla de frecuencias son los siguientes:

e. La quinta columna (frecuencia relativa acumulada) describe el porcentaje de observa-

a. El histograma: muestra la información contenida en la primera columna de la Tabla 3,

c. El polígono de frecuencias: muestra la misma información que el histograma, pero de

Aplicación en Excel 2: Tabla de frecuencias

proporcionarán un mayor entendimiento de ciertas características claves de los datos en términos

4. Medidas de tendencia central

También podría gustarte