Está en la página 1de 16

Curso: Estadística Profesor: Diego Alejandro Chalarca R.

Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

CLASE N° 1.

INTRODUCCION A LA ESTADISTICA

La estadística, en general, es la ciencia que trata de la recopilación, organización


presentación, análisis e interpretación de datos numéricos con e
el fin de realizar una toma
de decisión más efectiva.

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa


concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al
análisis de estos datos unos significados precisos o unas previsiones para el futuro.

Los estudiantes confunden comúnmente los demás términos asociados con las
Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra tiene tres
significados: la palabra estadística, en primer término se usa para referirse a la inform
información
estadística; también se utiliza para referirse al conjunto de técnicas y métodos que se
utilizan para analizar la información estadística; y el término estadístico, en singular y en
masculino, se refiere a una medida derivada de una muestra.

Los métodos
odos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para
organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la
tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas
m
descriptivas.

Específicamente, la estadística trata de teoremas, herramientas, métodos y técnicas que se


pueden usar en:

a. Recolección, selección y clasificación de datos.


b. Interpretación y análisis de datos.
c. Deducción y evolución de conclusiones y de su confiabilidad, basada en datos
muéstrales.

Los métodos de la estadística fueron desarrollados para el análisis de datos muestreados,


así como para propósitos de inferencia sobre la población de la que se selecciono la
muestra.

La estadística como ciencia, cubre un extenso campo donde poder aplicarla. Se agrupa en
2 grandes áreas: estadística descriptiva y estadística inferencial, que desempeñan
funciones distintivas, pero complementarias en el análisis.

Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de


tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos y está
diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es,
sin intentar inferir nada que vaya más
m allá de los datos, como tales.
Obtención de conclusiones basados en los datos experimentales.

1
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de


una parte de un conjunto numeroso de elementos y esto implica que su análisis requiere de
generalizaciones que van más allá de los datos. Como consecuencia, la característica más
importante del reciente crecimiento de la estadística ha sido un cambio en el énfasis de los
métodos que describen a métodos que sirven para hacer generalizaciones. La Estadística
Inferencial investiga o analiza una población partiendo de una muestra tomada.

Conceptos fundamentales: población, muestra y variable.

Población. Es el conjunto de todos los elementos o datos que presentan una característica
común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se
puede estudiar las características
cas edad, peso, nacionalidad, sexo, etc.
Los elementos que integran una población pueden corresponder a personas, objetos o
grupos (por ejemplo, familias, fábricas, empresas, etc).
Una
na población en sentido estadístico no tiene porqué referirse a muchos iindividuos. Una
población estadística puede ser también el conjunto de calificaciones obtenidas por un
individuo a lo largo de sus estudios universitarios
universitarios.
Ejemplo:
• Notas de todos los alumnos en el primer parcial de tal mes y tal año. (varios
individuos)
• Notas
otas de un solo alumno en el primer parcial de las materias que cursa en ese
momento. (un solo individuo)
• Notas de un alumno a lo largo de los 6 años de carrera. (un solo individuo)
• Notas de todos los alumnos durante los 6 años de carrera. (varios individuos)
individu
Las características de la población se resumen en valores llamados parámetros.

Muestra. La mayoría de los estudios estadísticos, se realizan no sobre la población, sino


sobre un subconjunto o una parte de ella, llamado muestra, partiendo del supuesto de que
este subconjunto presenta el mismo comportamiento y características que la población. En
general el tamaño de la muestra es mucho menor al tamaño de la población.
Los valores o índices que se concluyen de una muestra se llaman estadígrafos y estos
mediante
ediante métodos inferenciales o probabilísticos, se aproximan a los parámetros
poblacionales.

Variable. Se llama variable a una característica que se observa en una población o


muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores
val
dependiendo de cada individuo.

Una variable se puede clasificar de la siguiente manera.

2
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

a) Variable cuantitativa: es aquella que toma valores numéricos. Dentro de ella, se


subdividen en:

Continua: Son
on valores reales. Pueden tomar cualquier valor
valor dentro de un intervalo.
Dados dos valores consecutivos, la variable puede adoptar muchos valores
intermedios. Ej.: Entre
ntre 1 y 2 metros, puede haber
haber muchas longitudes posibles, Peso,
estatura, sueldos.
Discreta: Toma
oma valores enteros. Es aquella en la cual, dados dos valores
consecutivos, no puede adoptar ningún valor intermedio Ej.: Entre
En 32 y 33 dientes,
no puede hablarse de 32.5 dientes,
dientes número de hijos de una familia, número de
alumnos de un curso.

Algunas veces una misma variable puede ser considerada como discreta o continua. Por
ejemplo, la variable peso es discreta si solamente interesan los pesos sin valores
intermedios (50 kg, 51 kg, etc), mientras que será continua si interesan también los valores
intermedios (50,3 kg, 50,35 kg, 50,357 kg, etc). Obviamente, al considerar una variable
como continua se obtendrá mayor precisión, es decir, mayor información.

b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se


subdividen en:

Nominal:: son cualidades sin orden. Ej. Estado civil, preferencia por una marca, sexo,
lugar de residencia,, Juan es ingeniero.
ingeniero

Ordinal: son cualidades que representan un orden y jerarquía.


jerarquía. Las variables pueden
ser ordenadas en series crecientes o decrecientes
decrecientes.. Ej. Nivel educacional,
educacio días de la
semana, calidad de la atención, nivel socioeconómico.

3
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

Obtención de los datos

Como se ha puesto de manifiesto, gran parte del trabajo de un estadístico profesional se


hace con muestras. Estas son necesarias porque las poblaciones son casi siempre
demasiado grandes para estudiarlas en su totalidad. Exigiría demasiado tiempo y dinero
estudiar la población entera, y tenemos que seleccionar una muestra de la misma, calcular
el estadístico de esa muestra y utilizarlo para estimar el parámetro correspondiente de la
población.

La obtención de la información se puede realizar por diversos medios.


Una forma es a través de una encuesta a un grupo de individuos, donde a cada uno se le
hacen las mismas preguntas. Otra forma es a través de experimentos donde la respuesta a
la variable es el resultado del experimento. Puede también recolectarse los
l datos en forma
directa, es decir, la información se extrae de alguna base de datos seleccionando una
muestra de ellos.
En cualquiera de estos casos contamos con una selección de información llamada muestra
y que se procede a analizar. Existen diferentes técnicas para realizar el muestreo y que
dependerá cada caso, cual usar. Algunas de ellas son:

Muestreo aleatorio simple: todos los elementos de la población tiene igual posibilidad de
ser escogido y se eligen al azar.
Muestreo sistemático: los elementos
elementos se seleccionan a un intervalo uniforme en una lista
ordenada. Una preocupación del muestreo sistemático es la existencia de factores cíclicos
en el listado que pudieran dar lugar a un error.
Muestreo estratificado: los elementos de la población son prime
primeramente
ramente clasificados en
grupos o estratos según una característica importante. Luego, de cada estrato se extrae
una muestra aleatoria simple.
Muestreo por conglomerado: los elementos de la población están subdivididos en grupos
y se extraen aleatoriamente algunos de estos grupos completos.

4
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

Ejercicios
.
1. De las siguientes afirmaciones ¿cuál se asemeja más a los conceptos: un parámetro, un
dato, una inferencia a partir de datos, un estadígrafo?

- Según estudios, se producen más accidentes en el centro de Medellín, a 35 km/h que a


65 km/h.

- En una muestra de 250 empleados, se obtuvo un sueldo promedio de $550.000

- La tasa de nacimiento en el país aumentó en 5% con relación al mes precedente.

- Las edades son 85, 36, 57, 24

- Se sabe que el 55% de las personas en Colombia son varones.

- Según datos de años anteriores se estima que la temperatura máxima de este año
aumentará en un 5%.

2. De los siguientes enunciados ¿cuál probablemente usa la estadística descriptiva y cuál,


la estadística inferencial?

- Un Ingeniero civil estudia la relación entre el tipo de pavimento en las carreteras y el


consumo de combustible del automóvil.

- Un ingeniero sanitario registra el crecimiento de la población sin agua potable en un área


determinada.

- Se desea establecer el promedio de bateo de un equipo determinado.

- Un profesor de estadística emplea diferentes métodos con cada uno de sus 2 cursos. Al
final del curso compara las calificaciones con el fin de establecer cual método es más
efectivo.

3. Clasificar
ar las siguientes variables en: continua, discreta, nominal, ordinal:

- n° de alumnos por carrera

- comuna en que viven los alumnos del curso de estadística

- color de ojos de un grupo de niños

- monto de pagos por concepto de matrícula en la universid


universidad

- clasificación de los pernos en un local según sus diámetros

5
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

- peso del contenido de un paquete de cereal

- monto de la venta de un artículo en pesos

- valor de venta de las acciones

- número de acciones vendidas

- nivel de atención en el banco

- nivel de educacional

- ARP a que pertenece un individuo

- edad

- clasificación de la edad en: niño, joven, adulto y adulto mayor

4. De cada una de las siguientes situaciones responda las preguntas que se plantean:

- Una empresa ambiental desea conocer


conocer la cantidad de personas que poseen automóvil y
qué cuentan con el servicio de combustible por gas. En un estudio de 13.000 personas con
automóviles, se encontró que el 45% de ellos usan gas como combustible.

- Según una encuesta realizada a 500 adult


adultos
os mayores de la comuna 8 de Medellín, reveló
que en promedio realizan 6 visitas anuales al consultorio. En vista de los resultados el
ministerio de salud deberá aumentar los recursos en un 10%.

a) ¿Cuál es la población?

b) ¿Cuál es la muestra?

c) Identifique
ifique el parámetro de interés

d) Identifique el estadígrafo y su valor

e) ¿Se conoce el valor del parámetro?

6
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

CLASE N° 2

ESTADISTICA DESCRIPTIVA

Dentro de la estadística descriptiva se incluyen medidas de posición como las medias


aritméticas, geométricas, armónicas, ponderada, la moda y la mediana, y medidas de
dispersión o variabilidad de la muestra como la varianza, la desviación típica y el coeficiente
coef
de variación.

El hecho de que sea una estadística simple y fácil de calcular no significa que no sea
importante. Es necesario, por lo general, calcular algunas de las medidas citadas
anteriormente para poder tener una idea preliminar de los datos antes de pasar a realizar
un tratamiento más complejo de los mismos. Por ejemplo, el tipo de distribución que tengan
los datos condicionará la clase de análisis estadístico que podremos utilizar. Algunos
tratamientos estadísticos que se utilizan mucho, como
como por ejemplo el análisis de varianza,
se basan en la comparación de la media y dispersión de los datos, ambos incluidos dentro
de la estadística descriptiva. Además, pueden ser unos indicadores muy útiles por sí solos
sin necesidad de tratamientos estadísticos
estadí más complejos.

El propósito fundamental de la estadística descriptiva es resumir y organizar una gran


cantidad de datos referentes a una muestra (lo más habitual) o a una población. Se supone
que los datos resumidos y organizados permiten describir adecuadamente la muestra o la
población a los efectos de conocerla y, eventualmente, utilizarlos en la estadística
inferencial para obtener conclusiones a partir de ellos.

Para resumir y organizar los datos se utilizan diferentes procedimientos, llamados técnicas
descriptivas:: la matriz de datos permite ordenarlos, las tablas de frecuencias (o tablas de
distribución de frecuencias) permiten agruparlos, los gráficos permiten visualizarlos, y las
medidas estadísticas y las medidas de asimetría y curtosis permiten pe resumirlos
reduciéndolos a un solo dato.

Secuencia para organizar y resumir datos individuales

La forma de ordenarlos y agruparlos los datos dependerá del tipo de variable considerada.
Por ejemplo, si son datos relativos a variables cualitativas (niveles
(niveles de medición nominal y
ordinal), no podremos utilizar tablas de frecuencias por intervalos.

7
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

Datos agrupados Datos agrupados


Datos ordenados
por frecuencia por Intervalos
Nivel nominal Matriz de datos Tabla de frecuencias
(Ejemplo: variable Sujeto x (religión) x (religión) f
religión) Juan Católica Católica 2
Pedro Católica Judía 1
María Judía Protestante 3
Antonio Protestante n=6
Luis Protestante
José Protestante f = frecuencia
n = tamaño de la
muestra

Nivel ordinal Matriz de datos Tabla de frecuencias


(Ejemplo: variable Sujeto x (clase x (clase social) f
clase social) social) Alta 1
Juan Alta Media 3
Pedro Media Baja 2
María Media n=6
Antonio Media
Luis Baja f = frecuencia
José Baja n = tamaño de la
muestra

Nivel cuantitativo Matriz de datos Tabla de frecuencias Tabla de frecuencias


(Ejemplo: variable Sujeto x (edad) x (edad) f por intervalos
edad) Juan 15 15 3 x (edad) f
Pedro 15 16 5 15-16
15 8
María 15 17 8 17-18
17 11
Antonio 16 18 3 19-20
19 3
Luis 16 19 2 n = 22
José 16 20 1 f = frecuencia
Ana 16 n = 22 n = tamaño de la
Gabriela 16 f = frecuencia muestra

8
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

Susana 17 n = tamaño de la
Martín 17 muestra
Sergio 17
Pablo 17
Daniel 17
Graciela 17
Daniela 17
Beatriz 17
Oscar 18
Felipe 18
Alberto 18
Mónica 19
Marta 19
Mariana 20

TABLAS DE FRECUENCIA.

Una tabla de frecuencia es la ordenación de la información obtenida de una muestra, en el


estudio de una sola variable.

Las tablas de frecuencias contienen tres elementos importantes: las frecuencias,


frecuencias el tamaño
de la muestra y los intervalos (en este último caso sólo para variables cuantitativas).

1) Frecuencia.
La frecuencia (f) se define como la cantidad de datos iguales o que se repiten. Por ejemplo:
la frecuencia 2 indica que el dato “católico” se repite dos veces, la frecuencia 3 que el dato
“clase media” se repite tres veces, y la frecuencia 8 que el dato “17 años” se repite ocho
veces.

1.1) Tipos de frecuencias

Frecuencia absoluta (f).- Es la cantidad de datos que se repiten. Por ejemplo, la


frecuencia 3 indica que hay tres personas de 15 años. La suma de todas las frecuencias
absolutas equivale al tamaño de la muestra.
Frecuencia porcentual (f%).-- Es el porcentaje de datos que se repiten. Por ejemplo, la
frecuencia porcentual 15% indica que el 15% de la muestra tiene la edad de 15 años. La
suma de todas las frecuencias porcentuales es 100%.
Frecuencia acumulada (F).- Es el resultado de haber sumado las frecuencias anteriores.
Por ejemplo, la frecuencia acumulada 10 resulta de sumar 7+3, e indica la cantidad de
veces que se repiten las edades 16 y 15. La última de todas las frecuencias acumuladas,
que en el ejemplo es 20, debe coincidir con el tamaño de la muestra.
Frecuencia acumulada porcentual (F%).- (F%). Es el porcentaje de las frecuencias
acumuladas.
Frecuencia relativa (fr).- A veces también llamada proporción, es el cociente entre la
frecuencia de un dato x y la frecuencia
frecuencia total o tamaño de la muestra. En la práctica, el
tamaño de la muestra se considera como 1, a diferencia del tamaño de la muestra en la
frecuencia porcentual, que se considera 100%.

9
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

Frecuencia relativa acumulada (Fr).-(Fr). Es el resultado de haber sumado las frecuencias


relativas anteriores. Por ejemplo: la frecuencia relativa 0.90 indica que en 0.90 casos sobre
1 las edades están comprendidas entre 15 y 17 años.
Frecuencias parciales y frecuencia total. total.- Tanto las frecuencias absolutas como las
porcentuales o las relativas pueden ser frecuencias parciales o una frecuencia total, siendo
ésta última la suma de todas frecuencias parciales

Tipos de frecuencias que pueden indicarse en una tabla de frecuencias


x (edad) f f% F F% fr Fr
15 3 15% 3 15% 0.15 0.15
16 7 35% 10 50% 0.35 0.50
17 8 40% 18 90% 0.40 0.90
18 2 10% 20 100% 0.10 1
n = 20 n = 100% n=1

2) Tamaño de la muestra.(n) (n)- Otro concepto importante es el tamaño de la muestra (n),


que designa la cantidad total de datos. Obviamente, la suma de todas las frecuencias f
debe dar como resultado el tamaño n de la muestra, por lo que el tamaño de la muestra
coincide con la frecuencia
a total.

3) Intervalos.- Un intervalo, también llamado intervalo de clase, es cada uno de los grupos
de valores ubicados en una fila en una tabla de frecuencias. Por ejemplo el intervalo 15-16
15
significa que en esa fila se están considerando las edades de 15 a 16 años. La frecuencia
frecuenc
correspondiente a un intervalo es igual a la suma de frecuencias de los valores en él
incluídos (2). Los intervalos presentan algunas características, que son las siguientes:

3.1) Tamaño del intervalo (a). También llamado amplitud o anchura del intervalo, es la
cantidad de valores de la variable que se consideran conjuntamente en ese intervalo. Por
ejemplo, el intervalo 15-16
16 años tiene una amplitud de 2, puesto que se consideran dos
valores: 15 y 16. En otro ejemplo, el intervalo 20-25
20 años tiene
e una amplitud de 6, puesto
que se consideran seis valores.

Téngase presente que:


a) Preferiblemente los intervalos deben tener un tamaño constante, de manera tal que no
se pueden considerar como intervalos 15-16
15 y 17-20,
20, porque tienen diferentes tamaños;
tamaños y
b) los intervalos han de ser mutuamente excluyentes, de manera tal que cuando se trata de
variables discretas, no pueden definirse los intervalos 15
15-16 y 16-17,
17, porque el valor 16
años está en ambos intervalos y no se podrá saber con seguridad en qué intervalo
i ubicar
dicho valor.

El problema se puede presentar con las variables continuas, donde, por definición, podría
aparecer algún valor intermedio entre dos intervalos. Por ejemplo, si se considera la
variable continua “ingresos mensuales” y se consid
consideran
eran en ella los intervalos 1000-2000
1000
dólares y 3000-4000
4000 dólares, puede ocurrir que un dato obtenido de la realidad sea 2500
dólares, con lo cual no podrá ser registrado en ningún intervalo. En tal caso se deberían

10
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

reorganizar los intervalos como 1000-2999


1000 dólares y 3000-4999
4999 dólares, con lo cual el
problema estaría resuelto.
Desde ya, puede ocurrir que aparezca un ingreso mensual de 2999,50 dólares, en cuyo
caso en principio deberían reorganizarse nuevamente los intervalos como 1000-2999,50
1000
dólares y 2999,51-4999
4999 dólares. La forma de reorganizar los intervalos dependerá entonces
del grado de precisión que pretenda el investigador o del grado de precisión del instrumento
de medición disponible.

3.2) Límites del intervalo.- Todo intervalo debe quedar definido


definido por dos límites: un límite
inferior y un límite superior. Estos límites, a su vez, pueden ser aparentes o reales

Límites aparentes Límites reales*


95-99 94.5-99.5
90-94 89.5-94.5
85-89 84.5-89.5
80-84 79.5-84.5
75-79 74.5-79.5
*Solo en el caso que la variable sea continúa.

3.3) Intervalos abiertos y cerrados


cerrados.- Idealmente, todos los intervalos deberían ser
cerrados, es decir, deberían estar especificados un límite superior y uno inferior de manera
definida. Sin embargo, en algunos casos se estab
establecen
lecen también intervalos abiertos, donde
uno de los límites queda sin definir.

Intervalos En el ejemplo, “18 o menos” y “29 o más” son intervalos abiertos.


18 o menos Obviamente, en este tipo de distribución los intervalos dejan de ser de
19-23 tamaño constante.
24-28
29 o más

3.4 Cantidad de intervalos.- La cantidad de intervalos es inversamente proporcional al


tamaño de los mismos: cuanto menor tamaño tienen los
los intervalos, más numerosos serán.

EJEMPLOS:

1. Variable discreta.

en una encuesta de presupuesto familiar, se ha obtenido la siguiente


información respecto al n° de hijos en 2 familias.
Variable x = n° de hijos
Los datos son los siguientes:

3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3
x1, x2 x21

11
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

Vemos que la variable x toma valores entre 0 y 4, es decir, existen en este grupo 5
categorías o clases.

Tabla 1.
Categorías Frec. Absoluta Frec. Absoluta Acum. Frec. Relativa Frec. Rel. Acum.
Xi fi Fi fr (hi) Fr (Hi)
0 f1 = 2 f1 = 2 f1 /n= 0.095 Fr1 = 0.095
1 f2 = 4 f1 + f 2 = 6 f2/n = 0.190 Fr1 + Fr2 =0.286
2 f3 = 7 f1 + f2 + f3 = 13 f3/n = 0.333 Fr1 + Fr2 + Fr3 =0.619
3 f4 = 6 f1 + f2 + f3 + f4 = 19 f4/n = 0.285 Fr1 + ….+ Fr4 =0.904
4 f5 = 2 f1 +………….+ f5 = 21 f5/n = 0,095 Fr1 +…… ….+ Fr5 =1.000
Total n = 21 1.000

Donde:
n = tamaño de la muestra
Xi = valor de la variable en el individuo i
fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i
Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i
fr (hi) = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene
dividiendo
endo la frecuencia de la clase por el tamaño de la muestra.
Fr (Hi) = frecuencia relativa acumulada. Porcentaje acumulado

1. Variable continúa.

Salarios semanales de 40 personas en miles de pesos.


90 62 102 85 92 106 110 95 105 112
108 86 110
10 68 118 99 98 74 91 80
80 100 79 93 93 104 77 106 98 73
95 85 91 83 67 119 108 115 74 88

Se busca el valor mínimo y el valor máximo Xmín = 62 Xmáx = 119

Rango: en todo conjunto de valores estadísticos hay valores extremos: el menor de todos y
el mayor de todos; la diferencia entre estos valores extremos se llama rango.
rango = xmáx − xmín
rango: 119 – 62 = 57.

Generalmente La cantidad de intervalos no de


debe
be ser menor de 5 ni mayor de 18. Por lo
general tiene el mismo ancho.

Una forma de calcular el número de intervalos para generar la tabla de frecuencias es


mediante la fórmula de Struges:
Struges
k = 1 + 3.322 log( n)

k = 1 + 3.322 x log (40) = 6.322 usamos k ≈ 6

12
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

rango
Se calcula la amplitud de cada intervalo c=
k
c = rango / k = 57 / 6 = 9.5 ≈ 10

Tabla 2.
Intervalos Marca de clase Frec. Absoluta Fi fr Fr
Yi-1 – Yi+1 Y1 fi
[60-70) 65 3 3 0.075 0.075
[70-80) 75 5 8 0.125 0.200
[80-90 ) 85 7 15 0.175 0.375
[ 90-100) 95 11 26 0.275 0.620
[ 100-110) 105 8 34 0.200 0.850
[ 110-120) 115 6 40 0.150 1.000
Total 40 1.000

Donde:
n = tamaño de la muestra
Xi = valor de la variable en el individuo i
fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i
Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i
fr (hi) = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene
dividiendo la frecuencia de la clase por el tamaño de la muestra.
Fr (Hi) = frecuencia relativa acumulada. Porcentaje acumulado
Yi = marca de clase (punto medio del intervalo xm):: su valor es igual a la mitad de la
suma de los limites inferior y superior del intervalo de clase. En todos los análisis
estadísticos su supone que el valor de la marca de una clase es el valor que
corresponde asignar a cada uno de los elementos ubicados en ese intervalo. Sirve
para calcular la media aritmética.
c = amplitud del intervalo:
valo: la diferencia en
entre los límites
mites reales de un intervalo.
Yi-1 = límite inferior del intervalo
Yi+1 = límite superior del intervalo

EJEMPLO

La fábrica de baldosas ”De las casas”, con el objeto de ofrecer una garantía de su producto,
desea hacer un estudio técnico de su producción, para lo cual extrae una muestra de 100
baldosas, cada una de las cuales se somete a una prueba de resistencia, destructiva cuyos
datos expresados en Kg/cm2, se relacionan a continuación:

13
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

2
Resistencia en Kg/cm .de 100 Baldosas de La Fabrica
“De Las Casas”
478 458 683 780 736 448 591 555
339 694 478 498 310 537 592 549
666 239 398 720 648 533 586 321
313 644 495 122 521 368 531 472
415 291 621 253 763 746 323 575
210 430 223 433 444 437 360 559
425 459 418 351 361 133 383 259
419 655 487 135 370 345 282 578
425 436 634 450 223 479 161 337
420 422 282 439 449 321 452 444
391 569 460 308 477 463 367 251
487 610 470 469 392 517 359 527
440 504 542 369

La clasificación en una distribución de frecuencias simple daría como resultante un


ordenamiento de por lo menos 80 items; la mayoría de ellos con frecuencia unitaria. Se
hace necesario el agrupamiento en intervalos o clases que haga más compacta, manejable
y presentable la información.

1. Determinar los datos de mayor y menor


meno valor Xmax, Xmin
xmáx = 780 xmín = 122

2. Calcular el rango o recorrido R= Xmax – Xmin

xmáx = 780

3. Determinar el número de intervalos (k) k = 1 + 3.322 x log (n) y la amplitud de clase


(A):

Debe tenerse presente que k es un número natural. Luego se busca la amplitud


A: A=R/k

4. Calcular el rango ampliado


ampliado: Ra=k x A

5. Establecer la diferencia:
a: a=Ra-R es decir la cantidad en que ha sido alterado el
recorrido, la cual no debe ser superior a la amplitud

14
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

6. Distribuir adecuadamente la cantidad “a” de la siguiente manera:


Al valor Xmin se le resta aproximadamente a/2 y la parte restante se le suma a
Xmax,, obteniendo el límite inferior del primer intervalo y el límite superior del último,
respectivamente.
X min − ≈ a / 2 = LIPI (Limite inferior del primer interva
intervalo)
X max + ≈ a / 2 = LSUI (Limite superior del último intervalo)
intervalo)

Distribución de Frecuencias por Intervalos


de la Resistencia de 100 Baldosas de la Fabrica “de las Casas”
Casas

Conclusiones:
0.14) de las baldosas tiene una resistencia entre 300 y 600 Kg/cm2.
El 72% (fra: 0.86-0.14)
El 86% de las baldosas resiste menos de 600 Kg/cm2.
Sólo Kg/cm2.
ólo el 5% resiste 700 o más Kg/c

Ejercicio:
3
Consumo de agua, en m de 184 familias
n un barrio residencial de una ciudad durante el mes de Abril:
Abril
4 8 8 13 15 20 10 19 9 18 17
16 16 29 17 23 3 17 25 10 18 29
6 23 11 23 10 21 21 6 22 18 13
23 12 23 17 22 18 27 27 17 13 13

15
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental

10 31 11 26 15 5 5 18 16 13 30
23 2 26 17 13 21 14 29 18 20 9
10 21 9 30 8 18 34 17 4 29 16
12 23 8 26 16 28 8 16 29 18 2
17 13 21 13 26 26 18 9 18 13 12
21 27 21 9 17 24 8 10 16 33 21
14 16 19 17 7 24 5 20 14 16 12
12 5 13 17 9 12 14 1 16 25 20
14 20 14 6 21 13 22 10 6 21 20
5 20 28 17 12 4 33 12 25 9 17
14 20 10 25 24 32 15 25 16 22 13
15 25 2 9 22 25 12 15 22 17 7
24 15 24 11 22 10 21 14

• Construir una distribución de frecuencias por intervalos.


• Asumiendo el número de intervalos m = 8
• Asumiendo el número de intervalos m = 9
• Comparar las dos distribuciones y las conclusiones que de ellas se deriven (resaltar
mínimo 4 conclusiones).

16

También podría gustarte