Lectura 2

Caracterización de Muestras
1.3.- ALGO MÁS FORMAL SOBRE MUESTRAS
1.3.1.- Caracterización de Muestras
Si representamos por X a una característica de interés de cierta Población Objetivo, a una

Muestra de tamaño n tomada de esta Población, la representaremos por,
{X1 , X2 , ... , Xn}
Es también válido representar esta Muestra por un vector X en Rn de la siguiente forma:
XT = (X1 X2 ... Xn) (1.1)
Donde XT representa al vector transpuesto de X. Un buen tratamiento sobre Matrices y

Vectores puede encontrarse en Freidberg y Spence [31] y Harville [38].
Ejemplo 1.2
A cinco estudiantes de educación superior se les pregunta en cuántos semestres, a partir del
momento de la entrevista, estiman que van a graduarse; especifique la Muestra si lo que se
obtiene como respuesta es: siete, cinco, ocho, cinco y cuatro semestres.
Desarrollo.
En este caso, n = 5 y además, X1 = 7; X2 = 5; X3 = 8; X4 = 5 y X5 = 4.
La Muestra igualmente puede ser escrita como:
xT = (7 5 8 5 4) i
Nótese que hasta el momento, una Muestra es solo un vector X de datos que no ha
recibido procesamiento alguno; nótese también que una muestra genérica la
representamos por X y una específica como la del Ejemplo 1.2 por x.
1.3.2.- Obtención de Información a partir de los Datos de una Muestra
Si bien el proceso de “toma de datos” es vital en Estadística, a tal punto que ha merecido
Información desarrollos teóricos importantes y la consecuente obtención de técnicas a ser aplicadas;
Conjunto de datos por el momento no nos preocuparemos de aquello y supondremos simplemente que
procesados que nos
permiten tomar contamos con los datos. Algo más, los datos, como tales, no son más que materia prima
decisiones racionales dispuesta a ser procesada, ellos por sí solos poco o nada pueden decirnos más allá de
cuántos son. Para que podamos tomar decisiones racionales, necesitamos procesarlos,
esto es, convertirlos en Información.
Si nos encontramos frente a una Muestra de tamaño n, ¿Qué es lo que nosotros

necesitamos hacer para que pase a ser material estadísticamente útil?, esto es, para que
pase a ser Información.
4
CAPÍTULO 1: Tratamiento Estadístico de Datos
Algo más Formal sobre Muestras
Cuatro son las acciones que a estas alturas, pueden tomarse, y estas son:
i) Ordenar los datos;

ii) Tabular los datos ordenados;
iii) Graficar los datos ordenados utilizando el concepto de Frecuencia Relativa; y,
iv) Calcular a partir de la Muestra, cantidades que representen “peculiaridades” siempre
presentes en las Muestras y que son relevantes para la toma de decisiones.
1.3.3.- Ordenamiento de Datos
La primera acción, esto es ordenar los valores constitutivos de una Muestra, es sencilla,
aunque pudiera ser tediosa, cuando se trabaja con Muestras de tamaño relativamente
grande y no disponemos de una máquina procesadora de datos. Para representar una
Muestra Ordenada debemos definir qué es lo que se entiende por un Estadístico de
Orden.
Dada una Muestra X de tamaño n, al Primer Estadístico de Orden lo denotamos por

X(1) y lo definimos como el mínimo valor entre los elementos que constituyen la Muestra,
Primer Estadístico de esto es,
Orden X(1) = min{X1 , X2 , ... , Xn} (1.2)
X(1) = min{X1 , X2,..., Xn}
El Estadístico de Orden n se lo denota como X(n) y lo definimos como el máximo valor
que constituye la Muestra, esto es,
Estadístico de Orden n
X(n) = max{X1, X2,..., Xn} X(n) = max{X1 , X2 , ... , Xn} (1.3)
De forma similar definimos Estadístico de Orden dos, tres, y así pasando por el i–ésimo
orden, llegamos al de orden (n – 1) y de orden n, esto significa que:
X(1) ≤ X(2) ≤ ... ≤ X(i) ≤ … ≤ X(n – 1) ≤ X(n) (1.4)
Ejemplo 1.3
A partir del Ejemplo 1.2 determine los Estadísticos de Orden que correspondan.
Desarrollo.
En el mencionado ejemplo, consideramos una Muestra de tamaño n = 5 en la que,
X1 = 7; X2 = 5; X3 = 8; X4 = 5 y X5 = 4
Concordante con las definiciones previas,
X(1) = min{7; 5; 8; 5; 4} = 4
X(n) = X(5) = max{7; 5; 8; 5; 4} = 8
Considerando ahora la Muestra Ordenada,
X (1) = 4; X (2) = 5; X (3) = 5; X (4) = 7; y X (5) = 8 i
5
Clases y Marcas de Clases
Nótese que el número cinco, como valor observado, tiene doble calidad; es el Estadístico
de Orden dos y de Orden tres al mismo tiempo, ya que este valor se encuentra repetido en
la Muestra y su valor sólo supera a X(1).
1.3.4.- Clases y Marcas de Clases
Para tabular datos cuantitativos, y así facilitar la exploración estadística de los mismos,
se requiere definir algunos términos y efectuar ciertos supuestos. Los términos que
necesariamente deben definirse son: Clase, Marca de Clase, Frecuencia Absoluta,
Frecuencia Relativa, Frecuencia Acumulada Absoluta, Frecuencia Acumulada
Relativa y Tabla de Frecuencias.
Cualquier dato en una Muestra es mayor o igual a su mínimo valor X (1) , pero menor o
igual a su máximo valor X(n) ; teniendo en cuenta esto, vamos a considerar un intervalo
cerrado de números reales al que denominaremos A y cuyo Extremo Inferior lo
denominaremos a1 y cuyo Extremo Superior es ak+1 , tal cual se lo bosqueja en la
Figura 1.1.
Figura 1.1
Intervalo A de Números Reales que incluye todos los datos en la Muestra
Intervalo de Números
Reales que incluye a1 X(1) X(n) ak + 1
todos los datos de la
Muestra
A = {xR | a1 ≤ x ≤ ak+1} A = {xR | a1 ≤ x ≤ ak + 1} = [a1 , ak + 1] (1.5)
= [a1, ak+1]
Necesariamente a1 debe
ser menor o igual que Necesariamente a1 debe ser menor o cuando mas igual que X(1) así como también ak + 1
X(1) así como también debe ser mayor o cuando menos igual que X(n).
ak+1 debe ser mayor o
igual que X(n) Particionamos ahora el intervalo A así definido, en k subintervalos semiabiertos y
ordenados de tal manera que dichos subintervalos,
Clases
a) tengan igual longitud;
Dada una muestra, son
intervalos de igual b) su unión sea igual al intervalo A; y,
longitud, que deben ser c) la intersección entre cualquiera de estos subintervalos sea vacía.
exhaustivos y
mutuamente excluyentes Diremos que estos intervalos son Exhaustivos y Mutuamente Excluyentes y a cada uno de
en la Muestra ellos lo denominaremos Clase.
Hemos definido entonces k clases para una Muestra de tamaño n. i
Obviamente k es mucho menor que n y dicho valor se lo escoge de acuerdo a las

instrucciones que nos dé el profesor en clase, o de acuerdo a la experiencia de la persona
que está haciendo el análisis de los datos. Quien no tiene experiencia, ni tiene cercano un
profesor pero sí una computadora, verá resuelto su problema consultando o dejando
funcionar libremente a paquetes computacionales especializados en Estadística, ya que
dichos paquetes, tales como MINITAB, SPSS, SAS o R, realizan automáticamente esta
tarea, si así lo requerimos. Un valor sugerido de partida es k t 7.
6
Algo más Formal sobre Muestras
Como lo estableciéramos previamente,
A = {xR | a1 ≤ x ≤ ak + 1} = [a1 , ak + 1]
Además tenemos las tres siguientes particularidades:
a) Se define:
Primera Clase primera Clase = [a1 , a2)
Se define como:
segunda Clase = [a2 , a3)
Primera Clase = [a1, a2)
.
.
.
k–ésima Clase = [ak , ak + 1]
Recuérdese que el intervalo semiabierto
[ai , ai + 1) = {xR ~ai ≤ x < ai + 1} (1.6)
es la i–ésima Clase.
k-ésima o última clase En tanto que:

Se define a la k–ésima o [ak , ak + 1) = {xR ~ak ≤ x < ak + 1}
última clase como:
[ak, ak + 1) = es la k–ésima o última Clase.
{xR | ak ≤ x < ak+1}
Además existe el supuesto de que la longitud L de cada una de las k clases es la misma,
esto es,
L = d(a1 , a2) = d(a2 , a3) = . . . = d(ak , ak + 1) (1.7)
Donde la expresión d(a,b) simboliza la “distancia euclideana” en R del número real a al

número real b, que no es mas, en este caso, que el valor absoluto de la diferencia entre a y
b. Esto es, d(4,5) = |4 – 5| = d(5,4) = |5 – 4| = 1; ó, d(–3,3) = |–3 – 3| = 6.
b) La unión de los k subintervalos es A; lo cual significa que:

k
[a1 , a 2 ) [a 2 , a 3 ) . . . [a k , a k +1 ) = A = *[a , a
i =1
i i +1 ) (1.8)
en realidad estamos excluyendo el punto ak + 1.
c) La intersección de los k subintervalos es vacía, esto es,

k
Marca de Clase
Valor central de cada [a1 , a 2 ) [a 2 , a 3 ) . . . [a k , a k +1 ) = = [a , a
i =1
i i+ 1) (1.9)
una de las Clases
Puesto que [ai , ai + 1) [aj , aj + 1) = , i z j. i
El valor central de cada una de las Clases, se lo obtiene sumando sus extremos y
dividiendo para dos; este valor central se denomina Marca de Clase, lo cual significa
que:
a + a2
la primera Marca de Clase = 1
2
7
Clases y Marcas de Clases
a2 + a3
k–ésima Marca de la segunda Marca de Clase =
Clase 2
Se define la k-ésima #
marca de Clase como:
a k +a k +1
(a k a k 1 ) y la k – ésima Marca de Clase = (1.10)
2 2
Ejemplo 1.4
Se tiene una Muestra de tamaño n = 50 datos y el mínimo X(1) es igual a 42 mientras que el
máximo X(50) es 106. Se requiere determinar Clases y Marcas de Clase para la Muestra.
Desarrollo.
Se nos sugiere tomar k = 7, de tal manera que consideramos pertinente tomar,
A = {xR | 40 ≤ x ≤ 110} = [40, 110]
Esto hace posible que:
la primera Clase = [40, 50);
la segunda Clase = [50, 60);
#
y, la séptima Clase = [100, 110]
Bajo estas condiciones, la primera Marca de Clase es (40 + 50)/2 = 45; la segunda Marca de
Clase es 55; la tercera es 65; y de esta manera hasta llegar a la séptima Marca de Clase que es
105. i
Así construida la resolución del problema, la misma goza de las siguientes

características:
Al intervalo A pertenecen todos los n = 50 valores que conforman la Muestra ya que X(1)
así como también X(50) son elementos de A.
Cada una de las siete Clases están perfectamente establecidas y tienen la misma longitud
(diez unidades);
El intervalo A es igual a la unión de las k = 7 clases (las Clases son exhaustivas); y,
Ninguna clase comparte elementos con otra (las Clases son mutuamente excluyentes);
Para tener una idea gráfica del contenido de este problema, imaginemos una figura como
la que denomináramos Figura 1.1 en líneas previas y ubique los valores a1 que es 40, a2
que es 50; hasta llegar a a8 = 110. Recuérdese que k = 7, pero que tenemos que llegar
hasta ak + 1 que en este caso es 110. Véase Figura 1.2. i
8
Tabulación de Datos
Figura 1.2
Intervalo A (unión de las siete Clases)
42 106
40 50 60 70 80 90 100 110
a1 ak + 1
A = {xR ~40 ≤ x ≤ 110} = [40, 110]
1.4.- TABULACIÓN DE DATOS
1.4.1.- Frecuencias Absolutas y Relativas
Los datos se tabulan con el propósito de hacer un Análisis Estadístico Exploratorio de los
mismos, pero aún necesitamos efectuar algunas definiciones que se relacionan con el
tamaño de la Muestra y el número de observaciones que la misma tiene en cada una de
las k clases que hayamos determinado.
Supóngase que ya hemos ordenado los datos y que además se han precisado cuales son
las k clases que creemos pertinentes construir; vamos a darle un tratamiento adicional a
esta Muestra Ordenada. Recordemos que “ordenada” o “no ordenada”, la Muestra tiene
n observaciones y que por la forma que se definen las clases, sin ambigüedad podemos
Frecuencia Absoluta afirmar que todos los elementos de la Muestra pertenecen a alguna de las k Clases.
Número de
observaciones en la Denotaremos por f1 al número de observaciones en la Muestra, que pertenecen a la
Muestra que pertenecen a primera Clase, esto es al intervalo [a1 , b1); a f1 lo denominaremos Frecuencia Absoluta de
cada una de las k Clases
la primera Clase o simplemente Primera Frecuencia Absoluta. En el mismo contexto f2,
será la Segunda Frecuencia Absoluta, y así sucesivamente hasta llegar a fk, que es la
Frecuencia Relativa de
k–ésima Frecuencia Absoluta o el número de observaciones en la Muestra y que al
la Primera Clase mismo tiempo se ubican en la k–ésima Clase.
La Frecuencia Relativa
de la Primera Clase La suma de las frecuencias absolutas de una Muestra es n, esto es,
resulta de dividir f1 para
el tamaño n de la k
Muestra f1 + f 2 + . . . + f k = n = ¦ fi (1.11)
i =1
Frecuencia Relativa Recuérdese que fi es un número mayor o igual que cero y menor o igual que n. Pasamos a
Toda Frecuencia Relativa definir Frecuencia Relativa de una Clase.
es un número mayor o
igual a cero pero menor o
igual que uno, esto es, La Frecuencia Relativa de la Primera Clase resulta de dividir f1 para el tamaño n de la
f Muestra; de manera similar la Frecuencia Relativa de la Segunda Clase se obtiene al
0 d ni d 1 ; siendo, dividir f2 para n. Y así pasando por la Frecuencia Relativa de la i–ésima Clase,
i = 1, 2,..., k llegamos a la Frecuencia Relativa de la k–ésima Clase que calculamos dividiendo fk
para n.
9
Tablas de Frecuencias
Toda frecuencia relativa es un número mayor o igual a cero pero menor o igual que uno,
esto es,
Frecuencia Acumulada fi
Absoluta de la Primera 0d d 1 ; siendo, i = 1, 2,..., k (1.12)
Clase n
F1, la Frecuencia
Acumulada Absoluta de F1, la Frecuencia Acumulada Absoluta de la Primera Clase, se la define igual a f1; la
la Primera Clase, se la de la segunda clase es F2 = f1 + f2; y así sucesivamente la Frecuencia Acumulada de la
define igual a f1 k–ésima Clase es:
Fk = f1 + f2 + . . . + fk – 1 + fk (1.13)
Es claro que Fk es igual a n. Véase Figura 1.3, donde k = 8.

Frecuencia Acumulada
de la i–ésima Clase Con estos antecedentes es evidente cómo definir la Frecuencia Acumulada Relativa de
La Frecuencia la i–ésima Clase, esto es, la misma resulta de dividir Fi para n, siendo i = 1; 2; ... ; k.
Acumulada de la iésima
Fk
Clase es: Ocurre por tanto que es igual a uno.
Fi = f1 + f2 + ... + fi-1 + fi n
Figura 1.3
Ilustración de la Definición de Frecuencia Acumulada
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
F4 = f1 + f2 + f3 + f4
F5 = f1 + f2 + f3 + f4 + f5
F6 = f1 + f2 + f3 + f4 + f5 + f6
F7 = f1 + f2 + f3 + f4 + f5 + f6 + f7
F8 = f1 + f2 + f3 + f4 + f5 + f6 + f7 + f8
Se ha tomado el valor de k = 8
1.4.2.- Tablas de Frecuencias
Dada una Muestra Ordenada de tamaño n, una Tabla de Frecuencias es un arreglo

Tabla de Frecuencias rectangular que tiene siete columnas y k filas, sin incluir la rotulación; la primera
Arreglo rectangular que columna es para el “ordinal de la clase”, la segunda para definir la Clase, luego la Marca
tiene siete columnas y k de Clase, Frecuencia Absoluta, Frecuencia Relativa, Frecuencia Absoluta Acumulada y la
filas, la primera columna séptima columna para la Frecuencia Relativa Acumulada. Véase la Figura 1.4.
es para el “ordinal de la
Clase”, la segunda para
definir la Clase, luego la Figura 1.4
Marca de Clase, Tabla Frecuencias
Frecuencia Absoluta,
Frecuencia Relativa, Marca de Frecuencia Frecuencia Frecuencia Absoluta Frecuencia Relativa
Ordinal Clase
Clase Absoluta Relativa Acumulada Acumulada
Frecuencia Absoluta
Acumulada y la séptima 1 [a1,a2) (a1 + a2)/2 f1 f1/n F1 F1/n
columna para la 2 [a2,a3) (a2 + a3)/2 f2 f2/n F2 F2/n
Frecuencia Relativa 3 [a3,a4) (a3 + a4)/2 f3 f3/n F3 F3/n
Acumulada
# # # # # # #
k [ak,ak+1) (ak + ak+1)/2 fk fk/n Fk= n Fk/n = 1
G. Zurita: Probabilidad y Estadística, Fundamentos y Aplicaciones
10
Tabulación de Datos
Téngase en cuenta que al multiplicar por cien cualquier tipo de frecuencia relativa se
obtiene un Porcentaje. i
Construida una Tabla de Frecuencias, estamos en capacidad de efectuar algunas

afirmaciones que no podríamos hacer si observáramos solamente al dato “puro” llegado
desde el campo u obtenido en el laboratorio. Podríamos decir por ejemplo cuál es la
proporción de observaciones que se encuentran en una clase, al utilizar la Frecuencia
Relativa; cuál es el porcentaje de observaciones que pertenecen a una clase y a todas las
previas, si utilizamos la Frecuencia Relativa Acumulada multiplicada por cien; o, qué
porcentaje de observaciones pertenecen a las clases posteriores a la i–ésima si utilizamos
§ Fi ·
¨ 1 n ¸ 100, etc., etc..
© ¹
Hemos ya dado un paso relevante en la Exploración Estadística de Datos, los

Recomendación
Las Frecuencias comenzamos a convertir en Información.
Absolutas deben ser
utilizadas como “valores Recomendamos siempre utilizar para efectos estadísticos, los valores de las Frecuencias
de paso”, cuya utilidad Relativas y no los de las Frecuencias Absolutas; la razón de esta sugerencia será obvia
es obtener finalmente cuando en capítulos subsiguientes hagamos inferencias estadísticas sustentadas en
“valores relativos” con
los que se puedan
principios probabilísticos. Las Frecuencias Absolutas deben ser utilizadas como “valores
efectuar comparaciones de paso”, cuya utilidad es obtener finalmente “valores relativos” con los que se puedan
y generalizaciones efectuar comparaciones y generalizaciones.
Ejemplo 1.5
Se tiene un conjunto de n = 50 datos que luego de ordenarlos, configuran la siguiente

Muestra:
1 2 4 4
5 6 7 7 9
10 12 12 13 14 14 14
15 15 16 16 17 17 17 18 18 19 19 19
20 21 23 23 23 23 24 24 24
27 28 28 29 29
31 32 33 35 35
36 38 39
Estos cincuenta datos representan “el número de fallas cosméticas y estructurales” detectadas
en los edificios de una comunidad urbana que va a ser regenerada por la municipalidad del
cantón. Construir la correspondiente Tabla de Frecuencias.
Desarrollo.
Dado el resultado del ordenamiento notamos que X (1)= 1 y X(50)= 39. Optamos por construir
k = 8 Clases, de longitud cinco unidades, siendo la primera definida por el intervalo [0, 5), su
Marca de Clase es 0+5 = 2.5 ; su Frecuencia Absoluta f1 es cuatro y la Frecuencia Relativa de
2
esta clase es 4 =0.080 ; la Frecuencia Acumulada Absoluta F1 es cuatro y la Frecuencia
50
Acumulada Relativa es también 0.080 por ser la Primera Clase y por tanto no existe clase
previa.
11
Gráficos de Frecuencias
Para la segunda clase, como puede verse en la Figura 1.5, la Frecuencia Absoluta f2 es cinco;
la Frecuencia Relativa es 0.10; la Frecuencia Acumulada Absoluta F2 es nueve y la Marca de
Clase 7.5. i
Figura 1.5
Tabla de Frecuencias
Marca de Frecuencia Frecuencia Frecuencia Absoluta Frecuencia Relativa

Ordinal Clase
Clase Absoluta Relativa Acumulada Acumulada
1 [0,5) 2.5 4 0.08 4 0.08

2 [5,10) 7.5 5 0.10 9 0.18
3 [10,15) 12.5 7 0.14 16 0.32
4 [15,20) 17.5 12 0.24 28 0.56
5 [20,25) 22.5 9 0.18 37 0.74
6 [25,30) 27.5 5 0.10 42 0.84
7 [30,35) 32.5 3 0.06 45 0.90
8 [35,40] 37.5 5 0.10 50 1.00
G. Zurita: Probabilidad y Estadística, Fundamentos y Aplicaciones
1.5.- GRÁFICOS DE FRECUENCIAS
A partir de una Tabla de Frecuencias obtenida para una Muestra X de tamaño n,

XT = (X1 X2 ... Xn) (1.14)
Histograma de
Frecuencia
Gráfico bidimensional
es posible construir representaciones gráficas que revelan de manera sencilla, mucho de
de “barras” en cuyo eje la Información contenida en la misma. Entre estas representaciones están los
horizontal están Histogramas de Frecuencia, Polígonos de Frecuencia, Ojivas y Diagramas de Caja, que
señaladas las k clases pasamos a describir a continuación.
que se hayan definido,
y en el eje vertical se Un Histograma de Frecuencia es un gráfico bidimensional de “barras” en cuyo eje
representan las
Frecuencias Relativas horizontal están señaladas las k clases que se han determinado para construir la Tabla de
de cada una de ellas Frecuencia; en el eje vertical se representan las Frecuencias Relativas de cada clase. El
gráfico consta de k barras, cuyo “ancho” coincide con la longitud de la clase y cuya
“altura” es igual a la Frecuencia Relativa de la Clase. El Histograma de Frecuencia, debe
ser graficado de tal manera que se respeten las escalas; nos presenta una imagen visual
acerca de la información relacionada con la proporción de observaciones en cada clase,
las comparaciones e interrelaciones que con ellas pueden hacerse. Véase Figura 1.6 la
misma que corresponde a los cincuenta datos presentados en el Ejemplo 1.5. Son ocho
Clases de longitud cinco, la primera de las cuales es [0,5) y la última (octava) es
[35,40].i
12
Figura 1.6
Histograma de Frecuencia
fi
n
0.300
0.250
0.200
0.150
0.100
0.500
0.000 X
[0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40]
Polígono de Frecuencia
Un gráfico derivado del correspondiente Histograma de Frecuencia, es el Polígono de
Gráfico derivado del Frecuencia, que resulta al determinar un polígono, utilizando como vértices del mismo,
Histograma de los puntos centrales superiores de las barras del Histograma. Para obtener intersección
Frecuencia que utiliza entre el polígono y el eje horizontal se crean artificialmente dos nuevas “clases”, una
como vértices los puntos antes de la primera, a la cual llamaremos “Clase cero” y otra luego de la última, que pasa
centrales superiores de a ser la “Clase (k + 1)–ésima”. De esta manera, el primer vértice del polígono lo situamos
las barras del Histograma
en la Marca de Clase de la “Clase cero” y el último vértice en la “marca” de la
(k + 1)–ésima Clase. Véase Figura 1.7 en la que se construye un Polígono de Frecuencia
con los datos del Ejemplo 1.5.
El Polígono de Frecuencia, en términos generales, contiene información similar que la

presentada por el Histograma de Frecuencias; sin embargo es recomendable construirlo si
la característica que se investiga en la Población Objetivo, es continua, peso ó estatura
por ejemplo.
Figura 1.7
Polígono de Frecuencia
fi
n
0.300
0.250
0.200
0.150
Distribución de 0.100
Frecuencia Acumulada
(Ojiva) 0.050
Gráfico que ubica
en el eje horizontal la
0.000
-2.5 [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40] 42.5
X
característica
cuantitativa X que se
está investigando y en
el eje vertical la Uno de los más útiles gráficos en Estadística es la Distribución de Frecuencia
Frecuencia Acumulada Acumulada o simplemente Ojiva. Este esquema gráfico, ubica en el eje horizontal la
Relativa característica cuantitativa X, que se está investigando y coloca sobre el mismo eje, las k
clases en que hemos decidido organizar la Muestra de tamaño n, o podríamos decir
también “la Muestra constituida por n observaciones”. En el eje vertical se ubica la
Frecuencia Acumulada Relativa.
13
Obviamente que los valores en el eje horizontal dependen de la característica X que se

mide; pueden ser dólares si en una “Encuesta de Hogares” investigamos los ingresos de n
hogares en una comunidad; pueden ser centímetros si medimos la estatura de n
estudiantes; gramos si lo que hacemos es pesar n langostinos que hemos tomado de una
granja acuícola, o, resistencia a fuerzas cortantes de un material si en un laboratorio de
Mecánica de Sólidos investigamos tal característica. En el eje vertical, no importa qué se
investigue, allí se ubica la Frecuencia Acumulada Relativa, esto significa que sólo se
utilizarán, en este eje, valores que comiencen en cero y llegan a un máximo de uno.
Gráfico de una Ojiva Recordando que la Muestra con la que tratamos ya ha sido ordenada y que además se
El gráfico de una Ojiva supone ya tenemos determinadas las k clases; el gráfico de una Ojiva se construye
se construye determinando (k + 1) puntos y luego conectándolos de manera sucesiva y con trazos
determinando (k + 1)
puntos y luego
continuos, de la siguiente manera:
conectándolos de
manera sucesiva y El primer punto tiene coordenadas (a1 , 0) donde a1 es el extremo inferior de la Primera
con trazos continuos F
Clase, el segundo punto tiene coordenadas §¨ a 2 , 1 ·¸ siendo a2 el extremo inferior de la
© n¹
F
Segunda Clase; el tercer punto tiene coordenadas §¨ a 3 , 2 ·¸ y así sucesivamente hasta
© n¹
§ F ·
llegar al penúltimo punto que tiene como coordenadas ¨ a k , k 1 ¸ ; siendo el último punto
© n ¹
§ Fk ·
el que tiene coordenadas ¨ a k +1 , ¸ .
© n¹
Fk
El gráfico de una Ojiva es continuo y creciente; recuérdese además que es igual a
n
uno. Obsérvese la Figura 1.8. i
Figura 1.8
Distribución de Frecuencia Acumulada (Ojiva)
Fi
1.00
Frecuencia Relativa Acumulada
0.75
A A’
0.50
0.25
0.00 X
Q1 Q2 Q3
La Ojiva es utilizada con profusión para comparar situaciones en las que bajo distintas
circunstancias o a distintos entes se mide una misma característica; por ejemplo, el
ingreso mensual de los jefes de hogares en dos distintas comunidades o las notas de dos
distintas materias que cursa un mismo grupo de estudiantes. Obsérvese en la Figura 1.9,
14
Cuantiles de una Muestra
las ojivas A y B. Si X representa los ingresos mensuales en dólares en dos comunidades,

¿En cuál de las dos quisiera usted vivir?.
Si se tratara de las notas obtenidas por un mismo grupo humano en dos cursos diferentes
que han tomado en una universidad ¿Cuál curso presenta mayor grado de dificultad para
aprobarlo?.
Figura 1.9
Ojivas A y B para una variable X
Fi
1.00
Frecuencia Acumulada Relativa
0.75
A A’
0.50
0.25
0.00 X
Q1 Q2 Q3 Q1 Q2 Q3
Ojiva A Ojiva B
Los temas considerados en esta sección se los encuentra tratados en Fantoni [28], que es
una obra seminal de la Estadística ecuatoriana.
1.6.- CUANTILES DE UNA MUESTRA
1.6.1.- Definiciones y Determinación Gráfica
Primer Cuartil (Q1) La Ojiva es además un excelente instrumento para ilustrar definiciones de orden
Valor de X tal que el cuantitativo que se efectúan cuando se exploran estadísticamente los datos de una
veinticinco por ciento de Muestra Ordenada.
las observaciones en la
Muestra Ordenada toman
valores menores o Como definición diremos que el Primer Cuartil o Cuartil Inferior de una Muestra de
iguales que Q1 una característica continua X, es un valor Q1 de X, tal que, no más del veinticinco por
ciento de las observaciones en la Muestra Ordenada toman valores menores o iguales que
Segundo Cuartil (Q2) Q1.
Valor de X tal que el
cincuenta por ciento de En tanto que el Segundo Cuartil o Cuartil Central de una Muestra se denota por Q2 y
las observaciones en la se lo define como el valor de X para el que se cumple que el cincuenta por ciento de los
Muestra son menores o
valores en la Muestra son menores o iguales que Q 2.
iguales que Q2
Al Tercer Cuartil o Cuartil Superior de una Muestra se lo identifica como Q3 y se lo

Tercer Cuartil (Q3)
define en términos del setenta y cinco por ciento de los elementos en la Muestra tomando
Valor de X tal que el
setenta y cinco por ciento valores menores o iguales que Q3, o equivalentemente el veinticinco por ciento de los
de los elementos en la valores en la Muestra son mayores o iguales que Q 3.
Muestra toman valores
menores o iguales que Q3 A los tres Cuartiles definidos se los puede representar en una Ojiva muy claramente como
se bosqueja en la Figura 1.8.
15

Lectura 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Lectura 2

Cargado por

Copyright:

Formatos disponibles

Caracterización de Muestras

1.3.- ALGO MÁS FORMAL SOBRE MUESTRAS

1.3.1.- Caracterización de Muestras

Si representamos por X a una característica de interés de cierta Población Objetivo, a una

{X1 , X2 , ... , Xn}

Es también válido representar esta Muestra por un vector X en Rn de la siguiente forma:

XT = (X1 X2 ... Xn) (1.1)

Donde XT representa al vector transpuesto de X. Un buen tratamiento sobre Matrices y

En este caso, n = 5 y además, X1 = 7; X2 = 5; X3 = 8; X4 = 5 y X5 = 4.

La Muestra igualmente puede ser escrita como:

1.3.2.- Obtención de Información a partir de los Datos de una Muestra

Si nos encontramos frente a una Muestra de tamaño n, ¿Qué es lo que nosotros

i) Ordenar los datos;

1.3.3.- Ordenamiento de Datos

Dada una Muestra X de tamaño n, al Primer Estadístico de Orden lo denotamos por

X(1) ≤ X(2) ≤ ... ≤ X(i) ≤ … ≤ X(n – 1) ≤ X(n) (1.4)

En el mencionado ejemplo, consideramos una Muestra de tamaño n = 5 en la que,

Concordante con las definiciones previas,

X(n) = X(5) = max{7; 5; 8; 5; 4} = 8

Considerando ahora la Muestra Ordenada,

X (1) = 4; X (2) = 5; X (3) = 5; X (4) = 7; y X (5) = 8 i

1.3.4.- Clases y Marcas de Clases

Hemos definido entonces k clases para una Muestra de tamaño n. i

Obviamente k es mucho menor que n y dicho valor se lo escoge de acuerdo a las

Como lo estableciéramos previamente,

Además tenemos las tres siguientes particularidades:

Recuérdese que el intervalo semiabierto

[ai , ai + 1) = {xR ~ai ≤ x < ai + 1} (1.6)

k-ésima o última clase En tanto que:

L = d(a1 , a2) = d(a2 , a3) = . . . = d(ak , ak + 1) (1.7)

Donde la expresión d(a,b) simboliza la “distancia euclideana” en R del número real a al

b) La unión de los k subintervalos es A; lo cual significa que:

en realidad estamos excluyendo el punto ak + 1.

c) La intersección de los k subintervalos es vacía, esto es,

Se nos sugiere tomar k = 7, de tal manera que consideramos pertinente tomar,

A = {xR | 40 ≤ x ≤ 110} = [40, 110]

Esto hace posible que:

la primera Clase = [40, 50);

la segunda Clase = [50, 60);

Así construida la resolución del problema, la misma goza de las siguientes

El intervalo A es igual a la unión de las k = 7 clases (las Clases son exhaustivas); y,

1.4.- TABULACIÓN DE DATOS

1.4.1.- Frecuencias Absolutas y Relativas

Es claro que Fk es igual a n. Véase Figura 1.3, donde k = 8.

1.4.2.- Tablas de Frecuencias

Dada una Muestra Ordenada de tamaño n, una Tabla de Frecuencias es un arreglo

G. Zurita: Probabilidad y Estadística, Fundamentos y Aplicaciones

Construida una Tabla de Frecuencias, estamos en capacidad de efectuar algunas

Hemos ya dado un paso relevante en la Exploración Estadística de Datos, los

Se tiene un conjunto de n = 50 datos que luego de ordenarlos, configuran la siguiente

Marca de Frecuencia Frecuencia Frecuencia Absoluta Frecuencia Relativa

1 [0,5) 2.5 4 0.08 4 0.08

G. Zurita: Probabilidad y Estadística, Fundamentos y Aplicaciones

1.5.- GRÁFICOS DE FRECUENCIAS

A partir de una Tabla de Frecuencias obtenida para una Muestra X de tamaño n,

El Polígono de Frecuencia, en términos generales, contiene información similar que la

Obviamente que los valores en el eje horizontal dependen de la característica X que se

las ojivas A y B. Si X representa los ingresos mensuales en dólares en dos comunidades,

1.6.- CUANTILES DE UNA MUESTRA

1.6.1.- Definiciones y Determinación Gráfica

Al Tercer Cuartil o Cuartil Superior de una Muestra se lo identifica como Q3 y se lo

También podría gustarte

[ai , ai + 1) = {xR ~ai ≤ x < ai + 1} (1.6)

A = {xR | 40 ≤ x ≤ 110} = [40, 110]