Está en la página 1de 22

PROVINCIA DE BUENOS AIRES

DIRECCIÓN GENERAL DE CULTURA Y EDUCACIÓN


DIRECCIÓN DE EDUCACIÓN SUPERIOR

INSTITUTO SUPERIOR DE FORMACIÓN DOCENTE N° 102

CARRERA: Profesorado de Tercer Ciclo de la EGB y de la


Educación Polimodal en Física

ESPACIO CURRICULAR:

Matemática Aplicada

CURSO: Tercer Año CICLO LECTIVO: 2019

MÓDULO: Estadística

PROFESOR: Sergio R. STÜRTZ


1. ORIGEN Y CONCEPTO DE ESTADÍSTICA

El origen de la estadística se remonta a dos tipos de actividades humanas que aparentemente


tienen poco en común: La política y los juegos de azar. La estadística difícilmente se podrá
entender completamente sin el estudio aplicado de la probabilidad.
El estudio de la probabilidad a mediados del siglo XVIII, motivado enormemente por el interés de
los juegos de azar, condujo al tratamiento matemático de los errores de la medición y a la teoría
que hoy constituye la base de la Estadística.
En ese mismo siglo, la necesidad de la descripción numérica de entidades políticas como ciudades,
delegaciones, municipios, estados, países, etc., originó lo que ahora se denomina Estadística
Descriptiva. Al inicio esta disciplina consistió tan solo en presentar datos en tablas y gráficas; en la
actualidad incluye también la síntesis de ellos mediante descripciones numéricas.
Estadística descriptiva. Ciencia que estudia las técnicas mediante las cuales se recopilan,
coleccionan, y organizan datos e información los cuales pueden representarse gráficamente.
Probabilidad. Ciencia que estudia la posibilidad de que suceda un evento de interés, llamado
experimento, por ejemplo:
1. El lanzamiento de un par de dados y sus posibles resultados.
2. El lanzamiento de una moneda honrada.
3. La adquisición de un boleto para un determinado sorteo.
En los últimos años el estudio de la estadística ha revolucionado, lo cual ha dado vida a una nueva
rama: la Estadística Inferencial.
Estadística Inferencial. Ciencia que auxiliándose en la recolección de datos y gráficas de
la estadística descriptiva y las leyes de la probabilidad nos ayuda a tomar decisiones razonadas.
La industria, la salud, la agricultura, la ciencia política, la mercadotecnia y principalmente el control
de calidad, son algunas de las muchas aplicaciones de la estadística con sus dos ramas.
Simplificando podemos obtener la siguiente definición de Estadística:
La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así
como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.

2. TERMINOLOGÍA ESTADÍSTICA
Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o
cosas. Este conjunto de personas o cosas es lo que denominaremos población.
Las personas o cosas que forman parte de la población se denominan elementos o entidad. En
sentido estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa,
o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo.
En estadística se aplica la palabra entidad como termino general para referirnos a un miembro
individual de un grupo de personas, lugares o cosas. Por ejemplo un educador puede mostrar
interés por aquellos estudiantes que ha aprendido a leer empleando determinado método.
A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto
del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos
distinguir en ella los siguientes caracteres:
- Sexo - Edad - Nivel de estudios - Profesión
- Peso - Altura - Color de pelo - Etc.
Luego o tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades
o caracteres.
La población puede ser según su tamaño de dos tipos:
Población finita: cuando el número de elementos que la forman es finito, por ejemplo el número
de alumnos de un centro de enseñanza, o grupo clase.

Prof. Sergio R. STÜRTZ Página 2


Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que
pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos
que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse
infinita.
Ahora bien, normalmente en un estudio estadístico, no se puede trabajar con todos los elementos
de la población sino que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser
una muestra, cuando se toman un determinado número de elementos de la población, sin que en
principio tengan nada en común; o una subpoblación, que es el subconjunto de la población
formado por los elementos de la población que comparten una determinada característica, por
ejemplo de los alumnos del Instituto, la subpoblación formada por los alumnos de 2º del
profesorado de Ciencias Naturales, o la subpoblación de los varones.
Variable. Una variable es un símbolo, tal como x, y, z, o A, que puede tomar un conjunto
prefijado de valores llamado dominio de esa variable. Si la variable puede tomar un solo valor, se
llama constante.
Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que
los podemos clasificar en: dos grandes clases:
- Variables Cuantitativas. - Variables Cualitativas o Atributos.
Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el
peso, Altura, Edad, etc.
Variable aleatoria. Si los valores numéricos que toma una variable provienen de factores
reales y si un determinado valor no se puede predecir exactamente con anticipación, esa
variable se denomina variable aleatoria.
A su vez las variables cuantitativas se pueden dividir en dos subclases:
Variable discreta. Cuando los valores que puede tomar una variable están separados entre
sí por una determinada cantidad, la variable se denomina variable “discreta”. Esta variable
tiene la presencia de “vacíos” o “interrupciones” entre los valores que pueden tomar, por
ejemplo el número de consultas en un hospital durante un día, el total de entradas al cine
durante la primera función, etc.
Variable Continua. Una variable continua es aquella que teóricamente puede tomar
cualquier valor dentro de un intervalo de clases. En esta variable no importa que tan cerca
puedan estar dos valores de una variable por ejemplo los cambios de temperatura en una
ciudad, las estratosféricas tarifas eléctricas exclusivamente en Mexicali, entre otras.
Los atributos son aquellos carac teres que para su definición precisan de palabras, es decir, no le
podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc.
A su vez las podemos clasificar en:
- Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, El
nivel de estudios, etc.
- No ordenables: Aquellas que sólo admiten una mera ordenación alfabética pero no establece
orden por su naturaleza, por ejemplo el color de pelo, seco, estado civil, etc.

3. Método Estadístico
El conjunto de los métodos que se utilizan para medir las características de la información, para
resumir los valores individuales, y para analizar los datos a fin de extraerles el máximo de
información, es lo que se llama métodos estadísticos. Los métodos de análisis para la información
cuantitativa se pueden dividir en los siguientes seis pasos:

1. Definición del problema. 4. Clasificación.


2. Recopilación de la información existente. 5. Presentación.
3. Obtención de información original. 6. Análisis.

Prof. Sergio R. STÜRTZ Página 3


4. Errores Estadísticos Comunes
Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así
como durante los cómputos de los mismos. No obstante, hay otros errores que no tienen nada que
ver con la digitación y que no son tan fácilmente identificables.
Algunos de estos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de
comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado
mental pueda influir en la recopilación y en el análisis de la información. En estos casos se dice que
hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinión que a aquellos
que la contradicen. Un caso extremo de sesgo sería la situación donde primero se toma una
decisión y después se utiliza el análisis estadístico para justificar la decisión ya tomada.
Datos no comparables: el establecer comparaciones es una de las partes más importantes del
análisis estadístico, pero es extremadamente importante que tales comparaciones se hagan entre
datos que sean comparables.
Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el
futuro es uno de los errores que más ha desacreditado el uso del análisis estadístico.
Muestreo Incorrecto: en la mayoría de los estudios sucede que el volumen de información
disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones
acerca de la población a que pertenece la muestra. Si la muestra se selecciona correctamente,
tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el
muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen
nada.

5. TABLAS Y DATOS ORDENADOS.

A partir de este momento nos vamos a ocupar de las estadísticas de una sola variable,
“Estadísticas Unidimensionales”.
Las tablas estadísticas se confeccionan según el número de observaciones y según el recorrido de
la variable estadística, así tenemos los siguientes tipos de tablas estadísticas:
Tablas tipo I o Serie simple de datos:
Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si
tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer nada especial
simplemente anotarlas de manera ordenada en filas o columnas.
Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45
Tablas tipo II o Serie de frecuencias:
Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay
valores de la variable que se repiten. Por ejemplo, si preguntamos el número de personas activas
que hay en 50 familias obtenemos la siguiente tabla:

Personas Activas en 50 familias

2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos
una tabla en la que resumamos estos datos quedando la siguiente tabla:

Prof. Sergio R. STÜRTZ Página 4


Personas Número de
x f
Activas Familias
1 16
1 16 2 20
2 20 3 9
3 9 4 5
=>
4 5 Total 50
Total 50

Tablas tipo III o Intervalos de clase:


Se utiliza si el tamaño de la muestra y/o el recorrido de la variable son grandes, por lo que será
necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos
les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes
datos:
450 1152 250 300 175 80 25 2680 605 785 1595 2300 5000 1200 100
5 180 200 675 500 375 1500 205 985 185 125 315 425 560 1100
Evidentemente, la variable estadística tiene un recorrido muy grande, (5000 - 5 = 4995), por lo
que sí queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la
amplitud de los intervalos, necesitaremos decidir ¿cuántos intervalos queremos?. Normalmente se
suele trabajar con no más de 10 o 12 intervalos.
Amplitud =4995/10 = 499,5 Por lo que tomaremos intervalos IGUALES de amplitud 500
Debemos tener en cuenta las siguientes consideraciones:
Tomar pocos intervalos implica que la “pérdida de información” sea mayor.
Los intervalos serán siempre Cerrados por la izquierda y
Abiertos por la Derecha [Li, Ls), esto significa que [ Li , LS ) Frecuencia
incluye el valor menor y excluye el mayor en cada [ 0,500) 16
intervalo. [ 500, 1000) 6
[ 1000,1500) 3
[ 1500, 2000) 2
Procuraremos que en la decisión de intervalos los
valores observados no coincidan con los valores de los [ 2000, 2500) 1
extremos del intervalo y si esto ocurre que no sea en [ 2500, 3000) 1
más de un 5% del total de observaciones. [ 3000, 3500) 0
Con estas recomendaciones tendremos la siguiente tabla: [ 3500, 4000) 0
[ 4000, 4500) 0
[ 4500, 5000) 0
[ 5000,5500) 1
6. DISTINTOS TIPOS DE FRECUENCIA

Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de
resultados, es decir, recoger la información de la muestra resumida en una tabla. En ella a cada
valor de la variable se le asocian determinados números que representan el número de veces que
ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos números se
denominan frecuencias.
Así tenemos los siguientes tipos de frecuencia:

Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que aparece en la
muestra dicho valor de la variable, la representaremos por fa.

Prof. Sergio R. STÜRTZ Página 5


Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar
el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que
no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de
frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La
denotaremos por fr
fr = fa / N Donde N = Tamaño de la muestra

Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar
siempre en términos de tantos por ciento o porcentajes, por lo que esta medida resulta de
multiplicar la frecuencia relativa por 100. La denotaremos por pi.
pi = fr x 100%

Frecuencia Absoluta Acumulada:


Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha
de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta
frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces
que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos
por Fa.

Frecuencia Relativa Acumulada:


Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta
acumulada dividido por el tamaño de la muestra, y la denotaremos por Fr
Fr = Fa / N Donde N = Tamaño de la muestra
Porcentaje Acumulado:
Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pac como la frecuencia
relativa acumulada por 100.
Pac = Fr x 100%
Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.

Personas
Número Familias
Activas
x fa fr pi Fa Fi Pac
1 16 16/50=0,32 32% 16 16/50=0,32 32%
2 20 20/50 =0,40 40% 36 36/50=0,72 72%
3 9 9/50=0,18 18% 45 45/50=0,90 90%
4 5 5/50=0,10 10% 50 50/50 =1 100%
Total 50

En este ejemplo se puede ver fácilmente como se calculan estas frecuencias.

7. DISTRIBUCIONES DE FRECUENCIAS e INTERVALOS DE CLASES

Cuando la cantidad de datos es mucha, se los suele ordenar de modo tal que la variable se coloca
una sola vez junto con un valor que indica la cantidad de veces que ésta aparece, llamada
frecuencia. Como se mostró en la tabla de tipo II.
Serie de Intervalos de clase. Es una tabla en la cual se agrupa en clases los valores posibles para
una variable y se registra el número de valores observados que corresponde a cada clase.
Los datos organizados así se denominan datos agrupados; por el contrario, para los datos no
agrupados, se enumeran todos los valores observados de la variable aleatoria.

Prof. Sergio R. STÜRTZ Página 6


Número de clases o intervalos. El número de clases, es la división en la cual podemos ordenar la
toma de datos obtenidos en campo, es la cantidad de intervalos. Se aclaró anteriormente que los
intervalos deben ser iguales y de un tamaño razonable. Una fórmula de aproximación para calcular
el número de clases es la llamada Regla de Sturges, la cual matemáticamente se define como:
no = 1 + 3,32 log n
donde: no = total de clases
n = total de datos obtenidos en campo.
Amplitud de clase. Es el valor que se le aumenta a la cantidad menor de los datos o valores
obtenidos, para así elaborar las distribuciones de frecuencia, matemáticamente se expresa:
Vmax  Vmin
A donde: Vmax = valor máximo de los datos obtenidos en campo.
n0
Vmin = valor mínimo.
El resultado final de la amplitud de clase debe estrictamente obtenerse en número entero; en caso
contrario deberá redondearse, si el decimal es mayor a 0,5 se aumentara una unidad al resultado
obtenido.
Intervalos de clase. Indica el rango de los valores incluidos dentro de una clase y puede ser
determinado restando el límite exacto inferior de clase de su límite exacto superior.
Marca de clase. En las variables cuantitativas continuas, dado que la tabulación de los datos se
hace mediante intervalos, necesitaremos tomar un valor del intervalo para poder operar. Este valor
se denomina marca de clase y es el punto medio del intervalo. Se obtiene promediando los límites
inferior y superior de clase. La marca de clase se denomina también punto medio de la base.
Generalmente se representa por x.
Frecuencia. Se define como el número de veces en que se repite un suceso y se representa por la
letra f.
Histograma. Un Histograma o Histograma de frecuencias, consiste en un conjunto de rectángulos,
que pueden ser:
(a) Con bases en el eje x horizontal, centros en las marcas de clase y longitudes iguales a los
tamaños de los intervalos de clase.
(b) Áreas proporcionales a las frecuencias de clase.
Polígono de Frecuencias. Es un gráfico de trozos de la frecuencia de clase con relación a la marca
de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los
rectángulos del Histograma.
Distribuciones de Frecuencias Relativas. La frecuencia relativa de una clase es su frecuencia
dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje,
por lo tanto la suma de las frecuencias relativas de todas las clases es 100. Si se acumulan las
frecuencias relativas de varias clases, a la tabla obtenida, se le llama “tabla de frecuencia
relativas”.
Distribuciones de Frecuencias Acumuladas. La frecuencia total de todos los valores menores que la
frontera de clase superior de un intervalo de clase dado se llama frecuencia acumulada hasta ese
intervalo de clase. Una tabla que presenta varias frecuencias acumuladas se llama “tabla de
frecuencias acumuladas”. A las distribuciones de frecuencias acumuladas también se les conoce
como “ojivas”.
Curvas de Frecuencia. Los datos obtenidos pueden considerarse usualmente como pertenecientes
a una muestra de una población grande. Ya que son posibles muchas observaciones sobre esa
población, siendo posible escoger intervalos de clase muy pequeñas y tener todavía números
razonables en cada clase.
Ejemplo 1: Los siguientes datos representan el tiempo que tarda un autobús de la ruta 4 de la
línea “Transportes Modernos”. El tiempo se mide en minutos y en promedio se realiza 60 recorridos

Prof. Sergio R. STÜRTZ Página 7


por día. Elaborar una tabla de registro de datos, además, de construir el Histograma y polígonos
de frecuencias respectivos. El tiempo corresponde a un recorrido de dicha ruta.
75 74 62 67 64 71 68 66 65 79 80 77
73 74 78 82 71 71 72 67 82 80 70 67
72 78 81 74 70 76 75 64 66 74 69 68
64 65 75 78 70 77 63 69 75 64 70 66
67 76 71 73 71 69 62 77 72 69 65 68

Solución.
Primeramente se localizan los números mayor y menor.
Valor máximo=82 Valor mínimo=62
Calcula el número de intervalos: no = 1 + 3,32 log n n = número de datos
Sustituyendo: no = 1 + 3,32 log 60 = 6,9035
Vmax  Vmin 82  62
La Amplitud de clase: A   2,9
n0 6,9035
Por regla general no se utilizan menos de 5 ni más de 15 intervalos. Hay que recordar que por
definición el valor de la amplitud de clase debe representarse en números enteros, por lo tanto:
A=3
Tabla de Registro de Datos: Distribución de Frecuencias Relativas y Acumuladas.

Frecuencia
Marca de Frecuencia Frecuencia Frecuencia
Intervalos Relativa
clase de la clase Acumulada Relativa
de clase Acumulada
x fa Fa fr Fr
62 – 65 63,50 10 10 0,167 0,167
66 – 69 67,50 14 24 0,233 0,400
70 – 73 71,50 14 38 0,233 0,633
74 – 77 75,50 13 51 0,217 0,850
78 – 81 79,50 7 58 0,117 0,967
82 - 85 83,50 2 60 0,033 1,000

8. TIPOS DE CURVAS DE FRECUENCIA

Las curvas de frecuencia que aparecen, en la práctica adoptan ciertas formas características, como
se ilustra en las siguientes figuras.

1) SIMÉTRICA EN FORMA 2) ASIMÉTRICA A LA DERECHA 3) ASIMÉTRICA A LA IZQUIERDA


DE CAMPANA

Prof. Sergio R. STÜRTZ Página 8


4) EN FORMA DE 'J' 5) EN FORMA DE 'J' INVERSA 6) EN FORMA DE 'U'

6) BIMODAL 7) MULTIMODAL

a) Las curvas de frecuencias simétricas o en forma de campana (1), se caracterizan porque las
observaciones equidistantes del máximo central tienen la misma frecuencia. Un ejemplo
importante es la curva normal.
b) En las curvas de frecuencias poco asimétricas o sesgadas (2 y 3), la cola de la curva a un lado
del máximo central es más larga que al otro lado. El sesgo de la cola puede ser a la derecha o
hacia la izquierda.
c) En una curva en forma de “J” o de “J invertida” (4 y 5), hay un máximo en un extremo.
d) Una curva de frecuencia en forma de “U” tiene máximos en ambos extremos.
e) Una curva de frecuencia bimodal (6) tiene dos máximos.
f) Una curva de frecuencia multimodal (7) tiene más de dos máximos.

9. GRÁFICOS

CONTINENTE ÁREA
Un gráfico es una representación de la relación entre (millones km²)
variables. Muchos tipos de gráficos aparecen en
África 30,3
Estadística; según la naturaleza de los datos
involucrados y el propósito del gráfico. Entre ellos Asia 47,4
citemos por ejemplo los gráficos de barras, los gráficos Europa 4,9
de pastel, conocidos como “pie charts” y los gráficos a
base de pictogramas. América del norte 24,3

Ejemplo 2: Los siguientes datos representan las áreas Oceanía 8,5


de los continentes en millones de kilómetros cuadrados. América del sur 17,9
Al ser una variable discreta podemos graficar usando
Total 133,
barras.
3

Prof. Sergio R. STÜRTZ Página 9


Diagrama de barras.

50
45
40
35
Millones de km cuadrados

30
25
20
15
10
5
0
Continente África Asia Europa América del norte Oceanía
Continentes

Con los datos e información del problema anterior se puede construir un gráfico de torta o pie
chart.

Gráfico de Torta
Para representa porcentajes, podemos usar el gráfico circular o torta.

CONTINENTE ÁREA (millones km²) Porcentaje % Ángulo (◦)

África 30,3 22,73 82


Asia 47,4 35,56 128
Europa 4,9 3,68 13
América del norte 24,3 18,23 66
Oceanía 8,5 6,38 23
América del sur 17,9 13,43 48
Total 133,3 100 360

CÁLCULO DE PORCENTAJES: usando regla de tres simple.

África: 133,33 km2 es 100 %


30,3 x 100 / 133,3 = 22,73 %
2
30,3 km es x%

CÁLCULO DE ÁNGULOS

Para calcular los ángulos que representaran los porcentajes de la información en el gráfico de
torta, se realiza una regla de tres para relacionar los porcentajes con los ángulos que en su
totalidad forman el diagrama circular. Se recomienda “redondear” solo a números enteros.

África: 100 % es 360º


22,73 % x 360º / 100 % = 81,83º ≈ 82º
22,73 % es x

Prof. Sergio R. STÜRTZ Página 10


CONTINENTE ÁREA (millones km²) Porcentaje % Ángulo (◦)

África 30,3 22,73% 82


Asia 47,4 35,56% 128
Europa 4,9 3,68% 13
América del norte 24,3 18,23% 66
Oceanía 8,5 6,38% 23
América del sur 17,9 13,43% 48
Total 133,3 100% 360

Histogramas

Es una serie de rectángulos cuyo ancho es proporcional al rango de valores que se encuentran
dentro de la clase, y cuya altura es proporcional al número de elementos dentro de cada clase. Si
las clases son todas del mismo ancho, también lo será el ancho de cada rectángulo. La altura
representa las observaciones de cada clase. Como consecuencia, el área de cada rectángulo ocupa
un porcentaje del área total de todos los rectángulos, la cual es igual a la frecuencia absoluta de
esa clase respecto a todas las observaciones hechas. Se usa para variables continuas.

Polígonos de frecuencias

Aunque menos utilizados, también se usan parar representar distribuciones de frecuencias como
de frecuencias relativas.
Los histogramas y los polígonos de frecuencias son similares. ¿Por qué necesitamos ambos?.
Veamos las ventajas de cada uno.

Las ventajas del histograma son:


a. Los rectángulos muestran cada clase de la distribución por separado.
b. El área de cada rectángulo, en relación al resto, muestra la proporción del número total de
observaciones que se encuentran en cada clase.

Prof. Sergio R. STÜRTZ Página 11


Por su parte los polígonos, tienen las ventajas de:
a. Es más sencillo que el histograma.
b. Bosqueja con más claridad el perfil de un patrón de datos.
c. Se vuelve cada más suave y parecido a una curva a medida que se aumente el número de
clases y de observaciones.
En el siguiente gráfico se ven los datos del ejemplo 1. El histograma representando las clases y el
polígono que toma en cuenta las marcas. Ambos están graficados para las frecuencias absolutas,
pero podrían estarlo para frecuencias relativas.

f
Histograma
14

12
Polígono de
frecuencias
10

0
0 62 – 65 66 – 69 70 – 73 74 – 77 78 – 81 82 - 85 x

10. MEDIDAS ESTADÍSTICAS DESCRIPTIVAS


En el resto del tema nos ocuparemos exclusivamente de las variables cuantitativas, puesto que con
los atributos no se pueden realizar operaciones aritméticas. Como hemos estudiado, las variables
estadísticas cuantitativas se dividen o clasifican en discretas o continuas, por lo que necesitaremos
precisar cómo se calculan dichas medidas en cada caso.
Las medidas estadísticas pretenden “resumir” la información de la “muestra” para poder tener así
un mejor conocimiento de la población. Se clasifican en:
• Medidas de Centralización: Sirven para ver sobre qué valores se concentra la variable.
• Medidas de Dispersión: Dan una idea sobre la representatividad de las medidas centrales, a
mayor dispersión menor representatividad.
• Medidas de Localización: Útiles para encontrar determinados valores importantes, para una
“clasificación” de los elementos de la muestra.

Prof. Sergio R. STÜRTZ Página 12


• Medidas de la Simetría: Sirven para ver si la distribución tiene el mismo comportamiento por
encima y por debajo de los valores centrales.
• Medidas de la Forma: Comparan la forma de la distribución con la forma de la distribución
Normal, que es la distribución que se toma como referencia.
Por otra parte se han definido algunas propiedades deseables para una medida estadística:
o Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo
resultado numérico.
o Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna
observación la medida considerada debe reflejar esta variación.
o Tener un significado concreto: la interpretación debe ser inmediata y sencilla
o Ser sencilla de calcular.
o Prestarse fácilmente al cálculo algebraico: Lo que permitirá demostraciones más sencillas.
o Ser poco sensible a las fluctuaciones muestrales. Esta condición es imprescindible en la
Estadística Matemática y en la Teoría de Sondeos.

MEDIDAS DE CENTRALIZACIÓN: MEDIA, MEDIANA Y MODA


Media aritmética:

La media aritmética, promedio o simplemente media, que denotaremos por X , es el número


obtenido al dividir la suma de todos los valores de la variable y el número total de observaciones,
esto es, el promedio de la variable, y se define por la siguiente expresión:
En Estadística es normal representar una medida descriptiva de una población, o parámetro
poblacional, generalmente mediante letras griegas, en tanto que se utilizan letras romanas para las
medidas descriptivas de muestras, conocidas también como “Estadísticas Muestrales”.

La media aritmética, matemáticamente se expresa:

n donde:

 xi x  media aritmética.
x  i 1
Ʃxi = suma total de datos que componen la población o muestra.
n
n = número de datos de la población o tamaño de la muestra.
Para el caso que los datos estén agrupados por serie de frecuencias o por intervalos de clase,
matemáticamente la media aritmética se expresa:
donde:
n
x  media aritmética.
 xi . f i
fi = frecuencia
x  i 1

n xi = valor de la variable o marca de clase


Ʃxi . fi = suma del producto de datos poblacional o muestral.
n = número de datos de la población o tamaño de la muestra

Prof. Sergio R. STÜRTZ Página 13


Media aritmética ponderada:
La media aritmética ponderada a veces se asocia con los números x1, x2, x3,... xn ciertos factores
peso o “de peso” w1, w2, w3,... wn, dependientes de la relevancia asignada a cada número,
entonces:

 wi .xi
w 1 . x 1  w 2 . x 2  w 3 . x 3 ..... w n . x n
xp  i 1

n
w 1  w 2  w 3 ..... w n
 i 1
wi

Ejemplo 3. Si el examen final cuenta tres veces más que una evaluación parcial y un estudiante
tiene calificación de 85 en el examen final y, 70 y 90 en los dos parciales, la calificación media es:

1 .7 0  1 .9 0  3 .8 5
xp   83
11 3
Mediana (Me)
La mediana de un grupo, es el valor del dato que ocupa un lugar central cuando se los agrupa a
todos en ascendente o descendente. La mediana puede presentarse de dos formas:
a) Cuando el total de datos son un número impar. En este caso, la mediana será el dato que
queda exactamente en el centro, una vez ordenados los datos de menor a mayor.
Ejemplo 4: Hallar la mediana de: 6, 4, 8, 8, 3, 4, 8 ordenando se tiene: 3, 4, 4, 6, 8, 8, 8
Entonces se tiene Me = 6
b) Cuando el total de datos son un número par. Aquí debemos aplicar la siguiente fórmula:

x ( n / 2 )  x ( n / 2 1)
Me 
2

Ejemplo 5. Hallar la mediana del conjunto de números: 3, 6, 10, 11, 10, 12, 3, 13, 19, 11, 12, 8,
donde n = 12, luego se acomodan de forma que se encuentren ordenados de menor a
mayor 3, 3, 6, 8, 10, 10, 11, 11, 12, 12, 13, 19

Es decir es el promedio de los dos


x(6)  x(7 ) 10 11
Me = = = 10, 5 valores centrales
2 2

Moda:
La moda de un conjunto de números es el valor que tiene mayor frecuencia, es decir, el valor más
frecuente. La moda puede no existir, o incluso no ser única en caso de existir; si existe dos veces,
se llama bimodal.
En el caso de datos agrupados donde se haya construido una 1
curva de frecuencias para ajustar los datos, la moda será el valor
Mo = L1 + .i
o valores de “ x ” correspondiente al máximo o “máximos” de la 1   2
curva. La moda puede deducirse de una distribución de
frecuencias o de un histograma a partir de la fórmula:

Prof. Sergio R. STÜRTZ Página 14


donde:
L1 = Frontera inferior de la clase modal (clase que contiene la moda)
Δ1 = Exceso de frecuencia modal sobre la de la clase inferior inmediata
Δ2 = Exceso de la frecuencia modal sobre la clase superior inmediata
i = Ancho de intervalo de clase modal

RELACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Las diferencias entre los valores de la media, la mediana y la moda permiten saber la forma de la
curva de frecuencias en términos de asimetría.
a) Para una distribución unimodal simétrica, el valor de la media, la mediana y la moda es igual.
b) Para una distribución asimétrica positiva, la media es el mayor valor de los tres y la mediana es
mayor que la moda, pero menor que la media.
c) Para una distribución asimétrica negativa, la media es el menor valor de los tres y la mediana es
inferior a la moda, pero mayor que la media.
d) El coeficiente de asimetría de Pearson, es una medida conocida de asimetría que utiliza la
diferencia observada entre la media y la mediana de un grupo de valores.

Cuartiles, Deciles y Percentiles


La varianza y la desviación estándar son las medidas de dispersión más usadas. Sin embargo,
existen otros medios para describir la diseminación de un conjunto de datos. Un método es
determinar la ubicación de los valores que dividen a un conjunto de observaciones en partes
iguales. Para ello se pueden utilizar los cuartiles, deciles y percentiles, que se parecen mucho a la
media porque también subdividen una distribución de mediciones de acuerdo con la proporción de
frecuencias observadas. Mientras que la mediana divide a la distribución en dos mitades, los
cuartiles la dividen en cuatro cuartos, los deciles en diez décimos y los percentiles la dividen en
cien partes iguales.
Así por ejemplo, el primer cuartil (simbolizado con Q1) es el valor por debajo del cual se encuentra
el 25 % de las observaciones; el tercer cuartil (Q 3) es el valor por debajo del cual se encuentra el
75 % y desde luego, por encima del cual está el 25 % de los datos. El segundo cuartil coincide con
la mediana.
De modo similar se definen los deciles (D1, D2…) y los percentiles (P1, P2…).

Para calcularlo prácticamente se utiliza: Pk = (n+1) . P / 100

Donde: n = número de datos de la población o tamaño de la muestra y Pk el percentil deseado

Por ejemplo, si se tiene una muestra de 15 datos, el percentil 25 (o primer cuartil):


Q1 = (15+1) . 25/100 = 4 y el percentil 28 P28 = (15+1) . 28/100 = 4,48

Prof. Sergio R. STÜRTZ Página 15


11. MEDIDAS DE DISPERSIÓN

Generalmente las medidas de posición central, por sí solas, no proporcionan suficiente información
para dar una adecuada descripción de los datos. Quien base sus juicios sólo en la media, podría
compararse a una persona que teniendo su cabeza en una heladera y sus pies en el horno,
declarase: “en promedio, me siento muy bien”. Sin duda se requiere una medida que indique el
grado de variabilidad de los datos.
Consideremos las propiedades que debe tener una buena medida. Un buen índice de dispersión
debe ser independiente de la posición central de las observaciones, esto es, no depender de la
media. Esto implica que si se sumara (o restara) una constante a cada uno de los valores de un
conjunto de datos, tal transformación no debería influir en la dispersión. Además, para ser útil, una
medida de dispersión debe tomar en cuenta todas las observaciones, y no sólo algunos como el
mayor o el menor. Finalmente, una buena medida debería reflejar la dispersión típica de los datos
y ser convenientemente manejable matemáticamente.
La dispersión o variación de los datos intenta dar una idea de lo esparcido que se encuentra estos.
Hay varias medidas de tal dispersión, siendo las más comunes la desviación media, la
desviación típica o estándar y la varianza.

a) Rango (R)
El rango o recorrido de un conjunto de números es la diferencia entre el mayor y el menor de
todos ellos; es una medida de dispersión que no se utiliza mucho.
R=x max− x min

n
b) Desviación Media (Dm)
La desviación media o desviación promedio, de un conjunto de
 xi  x i
Dm  i 1
n números, x1, x2, x3...xn es abreviada por Dm y se define como: n

Donde: |xi − x | =valor absoluto de la desviación de xi respecto de x ;


n = número de datos de la población o tamaño de la muestra
Ejemplo 6. Hallar la desviación media del siguiente 2 + 3 + 6 + 8 + 11
conjunto de números: 2, 3, 6, 8, 11 x  6
5
2  6  3  6  6  6  8  6  11  6 430 2 4
Dm    2, 8
5 5

c) Varianza (σ2 o S 2)
La varianza es similar a la desviación media porque de basa en la diferencia entre cada uno de los
valores del conjunto de datos y la media del grupo. La diferencia consiste en que antes de
sumarlas, se eleva al cuadrado cada una de las diferencias. Matemáticamente se expresa:

   
n 2 n 2
xi  x xi  x
 2
 i 1
S 2
 i 1

n n 1

donde: σ2 = Varianza Poblacional S 2 = Varianza Muestral

x  media aritmética n = número de datos de la población o tamaño de la muestra

Prof. Sergio R. STÜRTZ Página 16


Ejemplo 7. En el mes de mayo, 8 vendedores x 2
de artículos electrónicos, vendieron los (x-x) (x-x)
siguientes números de aparatos: 8, 11, 5, 14, 8, 5 -5,50 30,25
11, 16, 11, en “Pepito Electrónica”. Encontrar la 8 -2,50 6,25
varianza. 8 -2,50 6,25
11 0,50 0,25
11 0,50 0,25
La media de las ventas es: 11 0,50 0,25
x  10,5 14 3,50 12,25
16 5,50 30,25

30 , 2 5  6 ,2 5  6 ,2 5  0 , 2 5  0 , 2 5  0 , 2 5  1 2 ,2 5  30 , 2 5
 2
  10, 75
8

d) Desviación estándar (σ o S)
En Estadística frecuentemente se aplica más la raíz cuadrada de la varianza a la cual se le llama
Desviación Estándar, representándose por σ para la población y S para una muestra. Las f órmulas
son:

   x 
n n 2
2
xi  x i  x
   2
 i 1
S  S2  i 1

n n 1

donde:
σ = Desviación Estándar Poblacional S = Desviación Estándar muestral

x  = media aritmética. n = número de datos de la población o tamaño de


la muestra
Los mismos parámetros para una distribución de frecuencias o intervalos son:

 
n 2
x 
n 2
 i  x . fi xi  x . fi
 2
 i1
S  2 i 1
n n 1

Para el ejemplo 7 con serie de frecuencias.

x f x.f (x-x).f (x-x)2. f


5 1 5 5,5 30,25
x = 10,5
8 2 16 2,5 12,50
Dm = 17,5 / 8 = 2,1875
11 3 33 0,5 0,75
14 1 14 3,5 12,25 σ2 = 86 / 8 = 10,75
16 1 16 5,5 30,25 σ = 3,279
Ʃ= 8 84 17,5 86,00

Así para el Ejemplo dado como 1: (Recordamos el enunciado)

Prof. Sergio R. STÜRTZ Página 17


Los siguientes datos representan el tiempo que tarda un autobús de la ruta 4 de la línea
“Transportes Modernos”. El tiempo se mide en minutos y en promedio se realiza 60 recorridos por
día. Elaborar una tabla de registro de datos, además, de construir el Histograma y polígonos de
frecuencias respectivos. El tiempo corresponde a un recorrido de dicha ruta.
75 74 62 67 64 71 68 66 65 79 80 77
73 74 78 82 71 71 72 67 82 80 70 67
72 78 81 74 70 76 75 64 66 74 69 68
64 65 75 78 70 77 63 69 75 64 70 66
67 76 71 73 71 69 62 77 72 69 65 68

La tabla de intervalos con los parámetros calculados es la siguiente:

Intervalos Marca Fr. clase Fr. Ac. Fr. Rel. Fr. Rel. Ac.
x . fa
de clase xm fa Fa fr Fr [ x - x ]. fa (x - x) 2.fa
62 – 65 63,5 10 10 0,167 0,167 635,00 79,333 629,378
66 – 69 67,5 14 24 0,233 0,400 945,00 55,067 371,307
70 – 73 71,5 14 38 0,233 0,633 1001,00 0,933 0,169
74 – 77 75,5 13 51 0,217 0,850 981,50 52,867 843,427
78 – 81 79,5 7 58 0,117 0,967 556,50 56,467 3774,124
82 - 85 83,5 2 60 0,033 1 167,00 24,133 8736,267
Ʃ= 4286,00 268,80 14354,67
n = 60 x = 4286 / 60 = 71,433

DM = 268,80 / 60 = 4,48 σ2 =14354,67 / 60 = 239,245 σ =15,468

Ejemplos Resueltos

Ejemplo 8. En el restaurante “Nueva Asia” se obtuvieron los siguientes pagos por el consumo de
15 personas de diversos platillos a la carta.

Sopa de pollo 25 Choap Suey de cerdo 52 Pollo asado con hongos 50


Especial de Cordero 29 Pollo asado 48 Sopa aleta de Tiburón 50
Calamar en su tinta 32 Pato asado 56 Arroz frito 44
Soplo de delfín 35 Codorniz 62 Milanesa de ballena 50
Tortuga a la tártara 40 Bocón al vapor 55 Chow main 66

Determine la media, mediana y moda, para el total de precios por cada uno de los platillos.

Rta/s: (a) La media aritmética es 46,27


(b) La mediana es 50
(c) La moda es 50

Ejemplo 9. De acuerdo a los datos del ejemplo anterior, hallar los valores de:

Prof. Sergio R. STÜRTZ Página 18


(a) El segundo cuartil. Rta/s: Q2 = 50
(b) El segundo decil. D2 = 33,5
(c) El punto percentil 40 P40 = 46

Ejemplo 10. Las calificaciones parciales del grupo 2° NAT en cuatro materias fueron 83, 88, 92 y
96. Si los respectivos créditos otorgados a estos cursos son 3, 6, 4, 2. Determinar una calificación
media apropiada.
Rta: Aplicando la media aritmética ponderada se tiene: 89,13.

Ejemplo 11. Los siguientes datos representan el número total de pasajeros que utiliza la ruta
Burzaco - Obelisco de la empresa “Date un Punch”. El total de recorridos en un día de servicio es
de 38 viajes.
52 23 29 32 54 50 48 40 34 32 23 39 33
36 28 22 26 27 35 38 40 46 44 22 24 27
50 43 36 30 26 23 25 28 24 31 22 29
Hallar:
(a) El viaje con mayor número de pasajeros
(b) El viaje con menor número de pasajeros
(c) Los 5 viajes con más pasajeros
(d) Los 5 viajes con menos pasajeros
(e) Construir una tabla de registro de datos
(f) Construir un histograma y un polígono de frecuencias
(g) Hallar la media, mediana, moda, varianza y desviación típica
Solución:
(a) 54 más alta (b) 22 más baja
(c) 54, 52, 50, 50, 48 (d) 22, 22, 22, 23, 23
(e) Primeramente, calcularemos el número de clases:

Primeramente se localizan los números mayor y menor.


Valor máximo=82 Valor mínimo=62
Calcula el número de intervalos: no = 1 + 3,32 log n n = número de datos
Sustituyendo: no = 1 + 3,32 log 60 = 6,9035
Vmax  Vmin 82  62
La amplitud de clase: A   2,9
n0 6,9035

Ejemplo 12. El “gigante” de las computadoras Hewlett Packard, dio a conocer el reporte de sus
ventas durante el periodo de 1992 a Abril de 1993. Las ventas están en dólares. Construir un
gráfico de torta con dicha información.

DESCRIPCIÓN DE ARTÍCULOS VENTAS (u$s) PORCENTAJE (%)

Prof. Sergio R. STÜRTZ Página 19


Computadora e Impresoras 7.401.000.000 76,30%
Equipos de Prueba 1.135.000.000 11,70%
Equipo Médico 553.000.000 5,70%
Instrumental Analítico 349.000.000 3,60%
Componentes Electrónicos 262.000.000 2,70%
9.700.000.000 100%

Cálculo de ángulos:
Computadoras -Impresoras: x = (76.3%)(360°) / 100% = 274.68 ≈ 275°
Equipos de Prueba: x = (11.7%)(360°) / 100% = 42.12 = 42°
Equipo Médico: x = (5.7%)(360°) / 100% = 20.52 ≈ 21°
Instrumental Analítico: x = (3.6%)(360°) / 100% = 12.96 ≈ 13°
Componentes Electrónicos: x = (2.7%)(360°) / 100% = 9.72 ≈ 10°

Prof. Sergio R. STÜRTZ Página 20


PRÁCTICA
Ejercicio 1:
Expresar si los enunciados siguientes representan datos discretos o continuos.
(a) Milímetros de lluvia en la ciudad de Monte Chico durante los meses del año de 2011.
(b) La velocidad de un automóvil en km/h.
(c) Número de billetes de $100.00 pesos en circulación en Argentina en cada momento.
(d) Volumen de acciones e indicadores diario en Mercado de Valores.
(e) El movimiento de la arena por la formación de olas en todos los mares y océanos del mundo.
(f) Los nacimientos en el estado de Baja Llavallol.
(g) El número de estudiantes matriculados en la UA (Universidad Autónoma) en varios años.
(h) Las filtraciones de agua por el canal “Todo Aguado” hacia el Valle Mojado, mientras no se
ejecute la obra de rehabilitación y cementado.
Ejercicio 2:
Los siguientes datos representan el número de clientes en el Restaurante “Silo Morfas” en los
dos primeros meses de 2013.
140 130 125 90 60 140 160 125 180 140
125 90 130 75 62 70 80 45 62 72
95 64 80 92 115 80 30 84 40 75
110 115 130 90 70 125 95 64 72 130
70 95 50 115 120 60 180 130 70 60
130 60 30 140 40 80 110 115 120 130
Encontrar:
(a) El valor máximo (b) El valor mínimo (c) El rango
(d) Los siete mayores (e) Los siete menores
(f) El treceavo en forma ascendente (de menor a mayor).
(g) Los días en que el número de clientes supera los tres dígitos.
(h) Los días en que el número de clientes solo llego a los dos dígitos.
(i) Construir una tabla de registros de datos (Distribución de Frecuencias).
(j) Construir un Histograma y el polígono de frecuencias.
(k) Construir un polígono de frecuencias acumuladas.
Ejercicio 3:
Los siguientes datos representan 105 muestras de concreto de la obra civil “El Caracol”. La
resistencia del concreto es de 250 kg/cm2 y la edad del ensayo es a 28 días. Las unidades de
medida en los datos son en kg/cm2 de resistencia a la comprensión del concreto.
253 274 249 204 265 309 260 236 211 273 225 318
270 249 248 274 260 287 226 249 227 233 291 311
238 276 246 240 356 224 236 211 226 280 300 207
260 275 250 260 219 238 219 238 211 301 244 214
250 227 260 211 252 210 203 301 304 234 236 232
252 255 205 248 215 240 290 260 217 294 232 270
260 252 189 302 301 234 240 294 256 326 250 237
204 264 265 287 271 297 276 245 241 261 208 259
284 244 239 337 249 261 226 245 196

Prof. Sergio R. STÜRTZ Página 21


(a) construir una tabla de registro de datos.
(b) construir un histograma y un polígono de frecuencia.
(c) Calcular la media. (d) Calcular la mediana. (e) Calcular la moda.
(f) Calcular la varianza poblacional y la desviación estándar.
Ejercicio 4:
En la tabla se muestran 30 resultados del examen para profesionistas extranjeros, los cuales
presentaron solicitud para ejercer en el la provincia de Monte Inmenso:
500 510 514 514 516 519 521 522 522 527
528 535 540 542 545 553 555 558 561 571
572 574 577 578 580 583 584 588 589 592

(a) Anotar las cinco calificaciones menores. (b) Anotar las cinco calificaciones mayores.
(c) Construir un histograma y polígono de frecuencia. (d) Calcular la media, mediana, y moda
(e) Calcular la varianza y la desviación estándar.
Ejercicio 5:
La siguiente tabla representa las temperaturas de 106 habitantes de “El Jodido”, llevadas a cabo
por una brigada de estudiantes de la ISFD. Las temperaturas Están medidas en grados Celsius.
35.8 36.3 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.1 37.3 36.0
36.3 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.1 37.3 36.1 36.3
36.4 36.7 36.7 36.9 36.9 37.0 37.0 37.1 37.4 36.1 36.3 36.5
36.7 36.7 36.9 36.9 37.0 37.0 37.1 37.4 36.1 36.3 36.6 36.7
36.7 36.9 36.9 37.0 37.0 37.1 37.5 36.2 36.4 36.6 36.7 36.8
36.9 36.9 37.0 37.0 37.1 37.5 36.2 36.4 36.6 36.7 36.8 36.9
36.9 37.0 37.0 37.2 36.2 36.4 36.6 36.7 36.8 36.9 36.9 37.0
37.0 37.2 36.2 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.0 37.2
36.3 36.4 36.6 36.7 36.8 36.9 37.0 37.0 37.1 37.2

(a) Anotar las siete temperaturas menores. (b) Anotar las siete temperaturas mayores.
(c) Construir una tabla de registro de datos. (d) Calcular la media, mediana, y moda.
(e) Construir un histograma y un polígono de frecuencia.
(f) Calcular la varianza y desviación estándar.

Ejercicio 6:
El servicio postal determinó que los pesos de una muestra de cartas procesadas en una oficina
postal, pesada hasta el gramo más próximo son: 21, 18, 30, 12, 14, 17, 18, 27, 31, y 35;
determinar:
(a) la media mediana y moda de los pesos de las cartas en gramos
(b) El tercer cuartil (c) El tercer decil (d) El punto porcentil 70

Prof. Sergio R. STÜRTZ Página 22

También podría gustarte