Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejemplo 1.2
A cinco estudiantes de educación superior se les pregunta en cuántos semestres, a partir del
momento de la entrevista, estiman que van a graduarse; especifique la Muestra si lo que se
obtiene como respuesta es: siete, cinco, ocho, cinco y cuatro semestres.
Desarrollo.
xT = (7 5 8 5 4) i
Nótese que hasta el momento, una Muestra es solo un vector X de datos que no ha
recibido procesamiento alguno; nótese también que una muestra genérica la
representamos por X y una específica como la del Ejemplo 1.2 por x.
Si bien el proceso de “toma de datos” es vital en Estadística, a tal punto que ha merecido
Información desarrollos teóricos importantes y la consecuente obtención de técnicas a ser aplicadas;
Conjunto de datos por el momento no nos preocuparemos de aquello y supondremos simplemente que
procesados que nos
permiten tomar contamos con los datos. Algo más, los datos, como tales, no son más que materia prima
decisiones racionales dispuesta a ser procesada, ellos por sí solos poco o nada pueden decirnos más allá de
cuántos son. Para que podamos tomar decisiones racionales, necesitamos procesarlos,
esto es, convertirlos en Información.
4
CAPÍTULO 1: Tratamiento Estadístico de Datos
Algo más Formal sobre Muestras
Cuatro son las acciones que a estas alturas, pueden tomarse, y estas son:
La primera acción, esto es ordenar los valores constitutivos de una Muestra, es sencilla,
aunque pudiera ser tediosa, cuando se trabaja con Muestras de tamaño relativamente
grande y no disponemos de una máquina procesadora de datos. Para representar una
Muestra Ordenada debemos definir qué es lo que se entiende por un Estadístico de
Orden.
De forma similar definimos Estadístico de Orden dos, tres, y así pasando por el i–ésimo
orden, llegamos al de orden (n – 1) y de orden n, esto significa que:
Ejemplo 1.3
A partir del Ejemplo 1.2 determine los Estadísticos de Orden que correspondan.
Desarrollo.
X1 = 7; X2 = 5; X3 = 8; X4 = 5 y X5 = 4
X(1) = min{7; 5; 8; 5; 4} = 4
5
Clases y Marcas de Clases
Nótese que el número cinco, como valor observado, tiene doble calidad; es el Estadístico
de Orden dos y de Orden tres al mismo tiempo, ya que este valor se encuentra repetido en
la Muestra y su valor sólo supera a X(1).
Para tabular datos cuantitativos, y así facilitar la exploración estadística de los mismos,
se requiere definir algunos términos y efectuar ciertos supuestos. Los términos que
necesariamente deben definirse son: Clase, Marca de Clase, Frecuencia Absoluta,
Frecuencia Relativa, Frecuencia Acumulada Absoluta, Frecuencia Acumulada
Relativa y Tabla de Frecuencias.
Cualquier dato en una Muestra es mayor o igual a su mínimo valor X (1) , pero menor o
igual a su máximo valor X(n) ; teniendo en cuenta esto, vamos a considerar un intervalo
cerrado de números reales al que denominaremos A y cuyo Extremo Inferior lo
denominaremos a1 y cuyo Extremo Superior es ak+1 , tal cual se lo bosqueja en la
Figura 1.1.
Figura 1.1
Intervalo A de Números Reales que incluye todos los datos en la Muestra
Intervalo de Números
Reales que incluye a1 X(1) X(n) ak + 1
todos los datos de la
Muestra
A = {xR | a1 ≤ x ≤ ak+1} A = {xR | a1 ≤ x ≤ ak + 1} = [a1 , ak + 1] (1.5)
= [a1, ak+1]
Necesariamente a1 debe
ser menor o igual que Necesariamente a1 debe ser menor o cuando mas igual que X(1) así como también ak + 1
X(1) así como también debe ser mayor o cuando menos igual que X(n).
ak+1 debe ser mayor o
igual que X(n) Particionamos ahora el intervalo A así definido, en k subintervalos semiabiertos y
ordenados de tal manera que dichos subintervalos,
Clases
a) tengan igual longitud;
Dada una muestra, son
intervalos de igual b) su unión sea igual al intervalo A; y,
longitud, que deben ser c) la intersección entre cualquiera de estos subintervalos sea vacía.
exhaustivos y
mutuamente excluyentes Diremos que estos intervalos son Exhaustivos y Mutuamente Excluyentes y a cada uno de
en la Muestra ellos lo denominaremos Clase.
6
CAPÍTULO 1: Tratamiento Estadístico de Datos
Algo más Formal sobre Muestras
A = {xR | a1 ≤ x ≤ ak + 1} = [a1 , ak + 1]
a) Se define:
Primera Clase primera Clase = [a1 , a2)
Se define como:
segunda Clase = [a2 , a3)
Primera Clase = [a1, a2)
.
.
.
k–ésima Clase = [ak , ak + 1]
es la i–ésima Clase.
El valor central de cada una de las Clases, se lo obtiene sumando sus extremos y
dividiendo para dos; este valor central se denomina Marca de Clase, lo cual significa
que:
a + a2
la primera Marca de Clase = 1
2
7
Clases y Marcas de Clases
a2 + a3
k–ésima Marca de la segunda Marca de Clase =
Clase 2
Se define la k-ésima #
marca de Clase como:
a k +a k +1
(a k a k 1 ) y la k – ésima Marca de Clase = (1.10)
2 2
Ejemplo 1.4
Se tiene una Muestra de tamaño n = 50 datos y el mínimo X(1) es igual a 42 mientras que el
máximo X(50) es 106. Se requiere determinar Clases y Marcas de Clase para la Muestra.
Desarrollo.
#
y, la séptima Clase = [100, 110]
Bajo estas condiciones, la primera Marca de Clase es (40 + 50)/2 = 45; la segunda Marca de
Clase es 55; la tercera es 65; y de esta manera hasta llegar a la séptima Marca de Clase que es
105. i
Al intervalo A pertenecen todos los n = 50 valores que conforman la Muestra ya que X(1)
así como también X(50) son elementos de A.
Cada una de las siete Clases están perfectamente establecidas y tienen la misma longitud
(diez unidades);
Ninguna clase comparte elementos con otra (las Clases son mutuamente excluyentes);
Para tener una idea gráfica del contenido de este problema, imaginemos una figura como
la que denomináramos Figura 1.1 en líneas previas y ubique los valores a1 que es 40, a2
que es 50; hasta llegar a a8 = 110. Recuérdese que k = 7, pero que tenemos que llegar
hasta ak + 1 que en este caso es 110. Véase Figura 1.2. i
8
CAPÍTULO 1: Tratamiento Estadístico de Datos
Tabulación de Datos
Figura 1.2
Intervalo A (unión de las siete Clases)
42 106
40 50 60 70 80 90 100 110
a1 ak + 1
A = {xR ~40 ≤ x ≤ 110} = [40, 110]
Los datos se tabulan con el propósito de hacer un Análisis Estadístico Exploratorio de los
mismos, pero aún necesitamos efectuar algunas definiciones que se relacionan con el
tamaño de la Muestra y el número de observaciones que la misma tiene en cada una de
las k clases que hayamos determinado.
Supóngase que ya hemos ordenado los datos y que además se han precisado cuales son
las k clases que creemos pertinentes construir; vamos a darle un tratamiento adicional a
esta Muestra Ordenada. Recordemos que “ordenada” o “no ordenada”, la Muestra tiene
n observaciones y que por la forma que se definen las clases, sin ambigüedad podemos
Frecuencia Absoluta afirmar que todos los elementos de la Muestra pertenecen a alguna de las k Clases.
Número de
observaciones en la Denotaremos por f1 al número de observaciones en la Muestra, que pertenecen a la
Muestra que pertenecen a primera Clase, esto es al intervalo [a1 , b1); a f1 lo denominaremos Frecuencia Absoluta de
cada una de las k Clases
la primera Clase o simplemente Primera Frecuencia Absoluta. En el mismo contexto f2,
será la Segunda Frecuencia Absoluta, y así sucesivamente hasta llegar a fk, que es la
Frecuencia Relativa de
k–ésima Frecuencia Absoluta o el número de observaciones en la Muestra y que al
la Primera Clase mismo tiempo se ubican en la k–ésima Clase.
La Frecuencia Relativa
de la Primera Clase La suma de las frecuencias absolutas de una Muestra es n, esto es,
resulta de dividir f1 para
el tamaño n de la k
Muestra f1 + f 2 + . . . + f k = n = ¦ fi (1.11)
i =1
Frecuencia Relativa Recuérdese que fi es un número mayor o igual que cero y menor o igual que n. Pasamos a
Toda Frecuencia Relativa definir Frecuencia Relativa de una Clase.
es un número mayor o
igual a cero pero menor o
igual que uno, esto es, La Frecuencia Relativa de la Primera Clase resulta de dividir f1 para el tamaño n de la
f Muestra; de manera similar la Frecuencia Relativa de la Segunda Clase se obtiene al
0 d ni d 1 ; siendo, dividir f2 para n. Y así pasando por la Frecuencia Relativa de la i–ésima Clase,
i = 1, 2,..., k llegamos a la Frecuencia Relativa de la k–ésima Clase que calculamos dividiendo fk
para n.
9
Tablas de Frecuencias
Toda frecuencia relativa es un número mayor o igual a cero pero menor o igual que uno,
esto es,
Frecuencia Acumulada fi
Absoluta de la Primera 0d d 1 ; siendo, i = 1, 2,..., k (1.12)
Clase n
F1, la Frecuencia
Acumulada Absoluta de F1, la Frecuencia Acumulada Absoluta de la Primera Clase, se la define igual a f1; la
la Primera Clase, se la de la segunda clase es F2 = f1 + f2; y así sucesivamente la Frecuencia Acumulada de la
define igual a f1 k–ésima Clase es:
Fk = f1 + f2 + . . . + fk – 1 + fk (1.13)
Figura 1.3
Ilustración de la Definición de Frecuencia Acumulada
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
F4 = f1 + f2 + f3 + f4
F5 = f1 + f2 + f3 + f4 + f5
F6 = f1 + f2 + f3 + f4 + f5 + f6
F7 = f1 + f2 + f3 + f4 + f5 + f6 + f7
F8 = f1 + f2 + f3 + f4 + f5 + f6 + f7 + f8
Se ha tomado el valor de k = 8
10
CAPÍTULO 1: Tratamiento Estadístico de Datos
Tabulación de Datos
Téngase en cuenta que al multiplicar por cien cualquier tipo de frecuencia relativa se
obtiene un Porcentaje. i
Ejemplo 1.5
Estos cincuenta datos representan “el número de fallas cosméticas y estructurales” detectadas
en los edificios de una comunidad urbana que va a ser regenerada por la municipalidad del
cantón. Construir la correspondiente Tabla de Frecuencias.
Desarrollo.
Dado el resultado del ordenamiento notamos que X (1)= 1 y X(50)= 39. Optamos por construir
k = 8 Clases, de longitud cinco unidades, siendo la primera definida por el intervalo [0, 5), su
Marca de Clase es 0+5 = 2.5 ; su Frecuencia Absoluta f1 es cuatro y la Frecuencia Relativa de
2
esta clase es 4 =0.080 ; la Frecuencia Acumulada Absoluta F1 es cuatro y la Frecuencia
50
Acumulada Relativa es también 0.080 por ser la Primera Clase y por tanto no existe clase
previa.
11
Gráficos de Frecuencias
Para la segunda clase, como puede verse en la Figura 1.5, la Frecuencia Absoluta f2 es cinco;
la Frecuencia Relativa es 0.10; la Frecuencia Acumulada Absoluta F2 es nueve y la Marca de
Clase 7.5. i
Figura 1.5
Tabla de Frecuencias
12
CAPÍTULO 1: Tratamiento Estadístico de Datos
Gráficos de Frecuencias
Figura 1.6
Histograma de Frecuencia
fi
n
0.300
0.250
0.200
0.150
0.100
0.500
0.000 X
[0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40]
Polígono de Frecuencia
Un gráfico derivado del correspondiente Histograma de Frecuencia, es el Polígono de
Gráfico derivado del Frecuencia, que resulta al determinar un polígono, utilizando como vértices del mismo,
Histograma de los puntos centrales superiores de las barras del Histograma. Para obtener intersección
Frecuencia que utiliza entre el polígono y el eje horizontal se crean artificialmente dos nuevas “clases”, una
como vértices los puntos antes de la primera, a la cual llamaremos “Clase cero” y otra luego de la última, que pasa
centrales superiores de a ser la “Clase (k + 1)–ésima”. De esta manera, el primer vértice del polígono lo situamos
las barras del Histograma
en la Marca de Clase de la “Clase cero” y el último vértice en la “marca” de la
(k + 1)–ésima Clase. Véase Figura 1.7 en la que se construye un Polígono de Frecuencia
con los datos del Ejemplo 1.5.
Figura 1.7
Polígono de Frecuencia
fi
n
0.300
0.250
0.200
0.150
Distribución de 0.100
Frecuencia Acumulada
(Ojiva) 0.050
Gráfico que ubica
en el eje horizontal la
0.000
-2.5 [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40] 42.5
X
característica
cuantitativa X que se
está investigando y en
el eje vertical la Uno de los más útiles gráficos en Estadística es la Distribución de Frecuencia
Frecuencia Acumulada Acumulada o simplemente Ojiva. Este esquema gráfico, ubica en el eje horizontal la
Relativa característica cuantitativa X, que se está investigando y coloca sobre el mismo eje, las k
clases en que hemos decidido organizar la Muestra de tamaño n, o podríamos decir
también “la Muestra constituida por n observaciones”. En el eje vertical se ubica la
Frecuencia Acumulada Relativa.
13
Gráficos de Frecuencias
Gráfico de una Ojiva Recordando que la Muestra con la que tratamos ya ha sido ordenada y que además se
El gráfico de una Ojiva supone ya tenemos determinadas las k clases; el gráfico de una Ojiva se construye
se construye determinando (k + 1) puntos y luego conectándolos de manera sucesiva y con trazos
determinando (k + 1)
puntos y luego
continuos, de la siguiente manera:
conectándolos de
manera sucesiva y El primer punto tiene coordenadas (a1 , 0) donde a1 es el extremo inferior de la Primera
con trazos continuos F
Clase, el segundo punto tiene coordenadas §¨ a 2 , 1 ·¸ siendo a2 el extremo inferior de la
© n¹
F
Segunda Clase; el tercer punto tiene coordenadas §¨ a 3 , 2 ·¸ y así sucesivamente hasta
© n¹
§ F ·
llegar al penúltimo punto que tiene como coordenadas ¨ a k , k 1 ¸ ; siendo el último punto
© n ¹
§ Fk ·
el que tiene coordenadas ¨ a k +1 , ¸ .
© n¹
Fk
El gráfico de una Ojiva es continuo y creciente; recuérdese además que es igual a
n
uno. Obsérvese la Figura 1.8. i
Figura 1.8
Distribución de Frecuencia Acumulada (Ojiva)
Fi
1.00
Frecuencia Relativa Acumulada
0.75
A A’
0.50
0.25
0.00 X
Q1 Q2 Q3
La Ojiva es utilizada con profusión para comparar situaciones en las que bajo distintas
circunstancias o a distintos entes se mide una misma característica; por ejemplo, el
ingreso mensual de los jefes de hogares en dos distintas comunidades o las notas de dos
distintas materias que cursa un mismo grupo de estudiantes. Obsérvese en la Figura 1.9,
14
CAPÍTULO 1: Tratamiento Estadístico de Datos
Cuantiles de una Muestra
Figura 1.9
Ojivas A y B para una variable X
Fi
1.00
Frecuencia Acumulada Relativa
0.75
A A’
0.50
0.25
0.00 X
Q1 Q2 Q3 Q1 Q2 Q3
Ojiva A Ojiva B
Los temas considerados en esta sección se los encuentra tratados en Fantoni [28], que es
una obra seminal de la Estadística ecuatoriana.
Primer Cuartil (Q1) La Ojiva es además un excelente instrumento para ilustrar definiciones de orden
Valor de X tal que el cuantitativo que se efectúan cuando se exploran estadísticamente los datos de una
veinticinco por ciento de Muestra Ordenada.
las observaciones en la
Muestra Ordenada toman
valores menores o Como definición diremos que el Primer Cuartil o Cuartil Inferior de una Muestra de
iguales que Q1 una característica continua X, es un valor Q1 de X, tal que, no más del veinticinco por
ciento de las observaciones en la Muestra Ordenada toman valores menores o iguales que
Segundo Cuartil (Q2) Q1.
Valor de X tal que el
cincuenta por ciento de En tanto que el Segundo Cuartil o Cuartil Central de una Muestra se denota por Q2 y
las observaciones en la se lo define como el valor de X para el que se cumple que el cincuenta por ciento de los
Muestra son menores o
valores en la Muestra son menores o iguales que Q 2.
iguales que Q2