Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Nos topamos con ella en el lenguaje cotidiano. En realidad en su significado más común, la
estadística se refiere a información numérica. Algunos ejemplos serán el sueldo inicial de los
graduados universitarios, el número de muertes que provocó el alcoholismo el año pasado, el
cambio en el promedio Dow Jones de ayer a hoy y la cantidad de cuadrangulares conectados por
los Cachorros de Chicago durante la temporada 2010. En estos ejemplos las estadísticas
refieren a un valor o un promedio.
A menudo la información estadística se presenta en forma gráfica, la cual es útil porque capta
la atención del lector e incluye una gran cantidad de información.
Como se verá la estadística tiene un significado mucho más amplio que la simple recolección y
publicación de información numérica. Definimos a la estadística como:
“Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin
de propiciar una toma de decisiones más eficaz”
Como lo sugiere la definición, el primer paso en el estudio de un problema consiste en recoger
datos relevantes. Estos deben organizarse de alguna forma y, tal vez representarse en una
gráfica. Sólo después de haber organizado los datos es posible analizarlos e interpretarlos.
CLASIFICACIÓN DE LA ESTADÍSTICAS
Los administradores aplican alguna técnica estadística a prácticamente todas las ramas de las
empresas públicas y privadas. Estas técnicas son tan diversas que los estadísticos, por lo
general, las dividen en dos grandes categorías: estadística descriptiva y estadística
inferencial. Algunos ejemplos nos serán de ayuda para entender la diferencia entre las dos.
1
generalización acerca de los diferentes grupos, podemos decir que el profesor está
utilizando estadística descriptiva. Las gráficas, tablas y diagramas que muestran los
datos de manera más clara y elocuente son ejemplos de estadística descriptiva.
Suponga ahora que el profesor de Matemáticas decide utilizar el promedio de
calificación obtenido por uno de sus grupos en una unidad para estimar la calificación
promedio del grupo en las diez unidades del curso. El proceso de estimación de tal
promedio sería un problema concerniente a la estadística inferencial. Los estadísticos se
refieren también a esta rama como inferencia estadística. Obviamente, cualquier
conclusión a la que llegue el profesor sobre el promedio del grupo en las diez unidades
del curso estará basada en una generalización que va más allá de los datos de la unidad
evaluada, y ésta puede no ser completamente válida, de modo que el profesor debe
establecer qué posibilidad hay de que sea cierta. De manera similar, la inferencia
estadística implica generalizaciones y afirmaciones con respecto a la probabilidad de su
validez.
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva, son los métodos utilizados para organizar, resumir y presentar
datos de manera informativa.
Una cantidad de datos desorganizados: como el censo de población, los salarios semanales de
miles de programadores de computadoras y las respuestas de 2000 votantes registrados para
elegir un presidente, resulta de poca utilidad. No, obstante las técnicas de la estadística
descriptiva permiten organizar esta clase de datos y darles significado. Los datos se ordenan
en una distribución de frecuencias. Se emplean diversas clases de gráficos para describir
datos.
ESTADÍSTICA INFERENCIAL
Por ejemplo, una encuesta reciente mostró que sólo 46% de los estudiantes del último grado de
secundaria podían resolver problemas que incluyeran fracciones y porcentajes. Además, sólo
77% de los alumnos de último año de secundaria pudo sumar correctamente el costo de una
ensalada, una hamburguesa, unas papas fritas y un refresco, que figuraban en el menú, de un
restaurante. Ya que estas son inferencias relacionadas con una población (todos los estudiantes
de último grado de secundaria), basadas en datos de la muestra, se trata de estadística
inferencial. Se podría considerar a la estadística inferencial como la mejor conjetura que
2
es posible obtener del valor de una población sobre la base de la información de una
muestra.
DEFINICIONES BÁSICAS
Población: Una población es un conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones
Con el objeto de inferir algo sobre una población, lo común es que se tome una muestra de ella.
Muestra: Porción o parte de población de interés. La toma de muestras para aprender algo
sobre una población es de uso frecuente en administración, agricultura, política y acciones del
gobierno.
Variables Estadística: Cada uno de los rasgos o características que se quieren estudiar de los
elementos de la población, susceptibles o no de medidas.
También la definiremos, como a cada una de las características capaces de proporcionar datos
de objetos sometidos a estudios estadísticos.
Ordinales
La estaura del estudiante es baja,
mediana o alta. Gravedad de un
infarto: leve, doderado o fuerte.
Cualitativas
Nominales
Color de los ojos, Genero,
color de la piel, grupo sanguineo
Tipos de Variables
Discretas
Número de hijos en una familia
Aparatos de televisión que poseen
Cantidad de materias a inscribir
Cuantitativas
Continuas
Peso y Estatura de un estudiante
Cantidad de impuesto a pagar
Diámetro de un anillo
3
VARIABLES CUALITATIVAS
Variables Cualitativas Ordinales: Serán aquellas variables de tipo cualitativo en el que las
posibles respuestas admiten una ordenación lógica.
Variables Cualitativas Nominales: Serán aquellas variables de tipo cualitativo en el que las
posibles respuestas NO admiten ningún tipo de ordenación lógica.
VARIABLES CUANTITATIVAS
Las variables discretas adoptan sólo ciertos valores y existen vacíos entre ellos. Ejemplos de
variables discretas son el número de camas en una casa (1, 2, 3 4, etc.), el número de
automóviles que en una hora usan la autopista Ciudad Bolívar – Puerto Ordaz y el número de
estudiantes en cada sección.
Observe que en una casa hay 3 o 4 camas, pero no 3,56. Por consiguiente, existe un vacío entre
los valores posibles. Los valores discretos son el resultado de una relación numérica.
Las observaciones de una variable continua toman cualquier valor dentro de un intervalo
específico. Ejemplo de varias continuas son la presión de aire en un caucho, el peso de un
cargamento de tomates, la cantidad de cereal con pasas que contiene una caja y la duración de
los vuelos de Puerto Ordaz a Maiquetía. El promedio de puntos al graduarse constituye una
variable continua. Se acostumbra a redondear a 3 lugares decimales (13,258).
4
Por lo general las variables continuas son el resultado de mediciones. Los datos cuantitativos se
resumen en tablas, histogramas, polígonos de frecuencias o polígonos de frecuencias
acumuladas (OJIVAS).
Datos: Consideramos como dato estadístico a las cifras o hechos numéricos, clasificaciones y
otras informaciones que pueden ser obtenidas mediante experimentos encuestas y
observaciones personales.
ESCALAS DE MEDICIÓN
Medir en el campo de las ciencias exactas es comparar una magnitud con otra, tomada de
manera arbitraria como referencia, denominada patrón y expresar cuántas veces la contiene.
En el campo de las ciencias sociales medir es “el proceso de vincular conceptos abstractos con
indicadores empíricos”. Al resultado de medir se le llama medida.
La medición de las variables puede realizarse por medio de cuatro escalas de medición: la
nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de las
variables, el diseño de las preguntas para medir variables, e incluso indican el tipo de análisis
estadístico apropiado para el tratamiento de los datos.
a) Medición Nominal.
Así, se pueden asignar números a estas categorías para su identificación: 1=M, 2=F o bien, se
pueden invertir los números sin que afecte la medición: 1=F y 2=M. En resumen en la escala
nominal se asignan números a eventos con el propósito de identificarlos.
b) Medición Ordinal.
Se establecen categorías con dos o más niveles que implican un orden inherente entre sí. La
escala de medición ordinal es cuantitativa porque permite ordenar a los eventos en función de la
mayor o menor posesión de un atributo o característica. Por ejemplo, en las instituciones
escolares de nivel básico suelen formar por estatura a los estudiantes, se desarrolla un orden
cuantitativo pero no suministra medidas de los sujetos. Estas escalas admiten la asignación de
números en función de un orden prescrito. Las formas más comunes de variables ordinales son
ítems (reactivos) actitudinales estableciendo una serie de niveles que expresan una actitud de
acuerdo o desacuerdo con respecto a algún referente. Por ejemplo, ante la pregunta: PDVSA
5
debe privatizarse, el que responde puede marcar su respuesta de acuerdo a las siguientes
alternativas:
a. Totalmente de acuerdo
b. De acuerdo
c. Indiferente
d. En desacuerdo
e. Totalmente en desacuerdo
Las anteriores alternativas de respuesta pueden codificarse con números que van del uno al
cinco que sugieren un orden preestablecido pero no implican una distancia entre un número y
otro.
c) Medición de Intervalo.
La medición de intervalo posee las características de la medición nominal y ordinal. Establece la
distancia entre una medida y otra. La escala de intervalo se aplica a variables continuas pero
carece de un punto cero absoluto. El ejemplo más representativo de este tipo de medición es un
termómetro, cuando registra cero grados centígrados de temperatura indica el nivel de
congelación del agua y cuando registra 100 grados centígrados indica el nivel de ebullición, el
punto cero es arbitrario no real, lo que significa que en este punto no hay ausencia de
temperatura.
d) Medición de Razón.
Una escala de medición de razón incluye las características de los tres anteriores niveles de
medición (nominal, ordinal e intervalo). Determina la distancia exacta entre los intervalos de una
categoría.
Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero no existe la
característica o atributo que se mide. Las variables de ingreso, edad, número de hijos, etc. son
ejemplos de este tipo de escala. El nivel de medición de razón se aplica tanto a variables
continuas como discretas.
DISTRIBUCIONES DE FRECUENCIAS
6
Existen tablas de distribución de frecuencias para variables aleatorias cualitativas y para
variables aleatorias cuantitativas.
A U U A A A U A S A U A U A S A A U S S
Leyenda: A: Alianza Lima, U: Universitario, S: Sport Boys
Por ejemplo, el 50% de los ingenieros que son favoritos al Alianza Lima, 30% al Universitario y
20% al Sport Boys.
Ejemplo:
marrón Verde verde azul marrón azul marrón marrón azul marrón
marrón verde marrón verde marrón azul verde marrón marrón azul
verde marrón marrón azul marrón verde marrón marrón verde verde
marrón verde verde marrón marrón marrón azul verde azul marrón
Construir la Tabla de frecuencias de clase y tabla de frecuencias relativas para la variable
color de los ojos. Represéntela gráficamente y concluya sobre los hallazgos.
El instrumento más común para representar una variable cualitativa en forma gráfica es la
gráfica de barras. En el eje horizontal se coloca la categoría o variable de interés y en el eje
vertical la frecuencia de clase o frecuencia relativa de clase de cada uno de los posibles
resultados. En esta gráfica existe una distancia o espacio entre las barras. Es decir por ser una
7
variable cualitativa, las barras no son adyacentes. La altura de las barras es proporcional a la
frecuencia de clase o frecuencia relativa de clase.
Gráfica de Barras
Equipos favoritos por parte de un grupo de 20 ingenieros
Frecuencias de Clase: Cantidad de
12
10
10
8
Ingenieros
6
6
4
4
0
A U S
Categorias: Equipo Favorito
La categoría “Equipo Favorito” es de escala nominal, así no importa el orden de los equipos
sobre el eje horizontal. También es apropiado enlistar esta categoría alfabéticamente o
mediante alguna categorización geográfica.
La distribución de frecuencias para las variables discretas es semejante a lo que hemos visto
para el caso de las variables cualitativas, ya que las categorías (x) en que se agrupan los datos
vienen dadas de forma natural por los valores que toma la variable.
Ejemplo:
Los siguientes datos corresponden al número de bibliotecarios en las bibliotecas públicas de las
diferentes provincias españolas:
4 7 5 2 4 5 6 4 7 3 7 4 3 4
4 3 4 3 2 4 4 1 10 2 5 3 2 2
5 3 3 8 12 3 2 2 5 4 1 1 5 8
6 6 3 15 16 6 7 12
8
c) ¿Qué proporción de provincias tiene más de 7 bibliotecarios?
a)
b) Representación Grafica
Diagrama de Barras
Distribucion del numero de bibliotecarios por biblioteca
12
fi: Cantidad de Bibliotecas
10
10 9
8 7
6
6
4 4
4 3
2 2
2 1 1 1
0 0 0 0
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
X: Nùmero de Bibliotecarios
9
DISTRIBUCIONES DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS
Los pasos para construir una distribución de frecuencias se entenderán mejor con un ejemplo.
A continuación se muestra el número de minutos que emplea un grupo de ejecutivos para viajar
en automóvil de su casa al trabajo.
28 25 48 36 41 19 32 26 16 23 23 29 36
31 26 21 32 25 31 43 35 42 38 33 28
Los datos del problema corresponden a una información desorganizada conocida como datos no
agrupados.
Permite visualizar rápidamente, cual es el valor mínimo, máximo y hacia donde se concentran la
mayoría de los datos.
16 19 21 23 23 25 25 26 26 28 28 29 31
31 32 32 33 35 36 36 38 41 42 43 48
Los datos no agrupados se interpretan con mayor facilidad si se ordenan y se organizan en una
distribución de frecuencias.
Una receta útil para determinar la cantidad de clases (C) es la regla 2 a la C. esta guía sugiere
que se elija el menor número (C) para el numero de clases de tal manera que 2C sea mayor o
igual que el número de observaciones (n).
En nuestro ejemplo, n = 25. Si se supone que C = 5, lo cual significa que se utilizaran cinco
clases, entonces:
2𝐶 ≥ 𝑛 ⟹ 25 > 25 ⟹ 32 ≥ 25 → 𝐶 = 5 𝑐𝑙𝑎𝑠𝑒𝑠
Debería ser el mismo para todas las clases. Todas las clases juntas deben cubrir por lo menos la
distancia del valor más bajo al más alto de los datos. Expresado esto en una fórmula seria:
(𝑉𝑎𝑙𝑜𝑟 𝑀𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑀𝑒𝑛𝑜𝑟)
𝐴=
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 (𝐶)
Este valor se aproxima a un valor, que viene en función de las características que presentan los
datos del problema.
Ejemplo:
Para este ejemplo: Valor Máximo = 48, Valor Mínimo = 16 y C = 5, entonces A es:
(48 − 16)
𝐴= = 6,4 ≅ 7 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
5
A se aproxima al entero más próximo, por ser los datos originales del problema números
enteros y se utiliza la técnica de redondeo Redondear. Más (redondea un número hacia arriba,
en dirección contraria a cero).
Dónde:
LCI: Limite de clase inferior = Valor mínimo = 16 (Sólo para la primera clase)
LCS: Limite de clase superior = LCI + A = 16 + 7 = 23 (Formula que se debe aplicar para todas
las clases)
(𝐋𝐂𝐈+𝐋𝐂𝐒)
Mi: Marca de clase o punto media de la clase = 𝐌𝐢 = (Este valor no se redondea)
𝟐
(16+23)
Para la primera clase: 𝑀1 = = 19,5 y así sucesivamente para todas las clases.
2
11
[37 44) 40,5 4 16% 24 96%
[44 51] 47,5 1 4% 25 100%
25 100%
Ahora que se ha organizado los datos en una distribución de frecuencias, se resume el patrón
de los tiempos que emplean un grupo de ejecutivas para viajar de su casa al trabajo. Observe lo
siguiente:
1. Los tiempos que emplean los ejecutivos de su casa al trabajo oscila entre 16 y 51
minutos
2. La mayor concentración de ejecutivos emplea entre 23 y 37 minutos para viajar en
automóvil de su casa al trabajo.
3. La clase que presenta más ejecutivos es la que oscila entre [23 y 30) minutos con 9
ejecutivos.
4. Solo un ejecutivo emplea entre 44 y 51 minutos para ir de su casa al trabajo.
HISTOGRAMA
Gráfica en la que las clases se señalan en el eje horizontal y las frecuencias de clase en el eje
vertical. Las frecuencias de clase se representan por medio de las alturas de las barras, que se
dibujan de manera adyacente. En el eje horizontal se marcan los límites de clase y su unidad de
medición.
Un histograma se puede construir empleando las frecuencias de clase (fi) o las frecuencias
relativas de clase (%fi) y las conclusiones y la forma del histograma serían las mismas. El
histograma para nuestro ejemplo seria:
12
"Histograma"
"Tiempo que emplea un grupo de ejecutivos para viajar en automóvil de
f: Cantidad de Ejecutivos su casa al trabajo"
12
8 9
8
4
4
3
1
0
16 - 23 23 - 30 30 - 37 37 - 44 44 - 51
Límites de Clase: Tiempo en minutos
1. Los tiempos que emplean los ejecutivos de su casa al trabajo oscila entre 16 y 51
minutos
2. La mayor concentración de ejecutivos emplea entre 23 y 37 minutos para viajar en
automóvil de su casa al trabajo.
3. La clase que presenta más ejecutivos es la que oscila entre [23 y 30) minutos con 9
ejecutivos.
4. Solo un ejecutivo emplea entre 44 y 51 minutos para ir de su casa al trabajo.
Ejercicios:
13
a) ¿Son los datos de naturaleza cuantitativa o
Cola-Plus 40
cualitativa? ¿Por qué razón?
b) ¿Qué nombre recibe la tabla? ¿Qué muestra la
Coca-Colla 25
tabla?
Pepsi 20 c) Diseñe una tabla de frecuencias relativas
d) Diseñe una gráfica de barras para describir la
Lima-Limón 15
información.
Total 100
14
d) Escriba cual es la variable y su clasificación.
e) Construya paso a paso una distribución de frecuencias para estos datos.
f) Diseñe la representación grafica
g) Que aspectos puede usted resaltar, al observar tanto la tabla como la gráfica.
9) Un estudio reciente de tecnologías domésticas informó el número de horas de uso
semanal de las computadoras personales en una muestra de 60 personas. Se excluyeron
del estudio personas que laboran fuera del hogar y empleaban la computadora como parte
de su trabajo.
9,3 5,3 6,3 8,8 6,5 0,6 5,2 6,6 9,3 4,3
6,3 2,1 2,7 0,4 3,7 3,3 1,1 2,7 6,7 6,5
4,3 9,7 7,7 5,2 1,7 8,5 4,2 5,5 5,1 5,6
5,4 4,8 2,1 10,1 1,3 5,6 2,4 2,4 4,7 1,7
2,0 6,7 1,1 6,7 2,2 2,6 9,8 6,4 4,9 5,2
4,5 9,3 7,9 4,6 4,3 4,5 9,2 8,5 6,0 8,1
15