Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CLASE N° 1.
INTRODUCCION A LA ESTADISTICA
Los estudiantes confunden comúnmente los demás términos asociados con las
Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra tiene tres
significados: la palabra estadística, en primer término se usa para referirse a la inform
información
estadística; también se utiliza para referirse al conjunto de técnicas y métodos que se
utilizan para analizar la información estadística; y el término estadístico, en singular y en
masculino, se refiere a una medida derivada de una muestra.
Los métodos
odos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para
organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la
tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas
m
descriptivas.
La estadística como ciencia, cubre un extenso campo donde poder aplicarla. Se agrupa en
2 grandes áreas: estadística descriptiva y estadística inferencial, que desempeñan
funciones distintivas, pero complementarias en el análisis.
1
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
Población. Es el conjunto de todos los elementos o datos que presentan una característica
común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se
puede estudiar las características
cas edad, peso, nacionalidad, sexo, etc.
Los elementos que integran una población pueden corresponder a personas, objetos o
grupos (por ejemplo, familias, fábricas, empresas, etc).
Una
na población en sentido estadístico no tiene porqué referirse a muchos iindividuos. Una
población estadística puede ser también el conjunto de calificaciones obtenidas por un
individuo a lo largo de sus estudios universitarios
universitarios.
Ejemplo:
• Notas de todos los alumnos en el primer parcial de tal mes y tal año. (varios
individuos)
• Notas
otas de un solo alumno en el primer parcial de las materias que cursa en ese
momento. (un solo individuo)
• Notas de un alumno a lo largo de los 6 años de carrera. (un solo individuo)
• Notas de todos los alumnos durante los 6 años de carrera. (varios individuos)
individu
Las características de la población se resumen en valores llamados parámetros.
2
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
Continua: Son
on valores reales. Pueden tomar cualquier valor
valor dentro de un intervalo.
Dados dos valores consecutivos, la variable puede adoptar muchos valores
intermedios. Ej.: Entre
ntre 1 y 2 metros, puede haber
haber muchas longitudes posibles, Peso,
estatura, sueldos.
Discreta: Toma
oma valores enteros. Es aquella en la cual, dados dos valores
consecutivos, no puede adoptar ningún valor intermedio Ej.: Entre
En 32 y 33 dientes,
no puede hablarse de 32.5 dientes,
dientes número de hijos de una familia, número de
alumnos de un curso.
Algunas veces una misma variable puede ser considerada como discreta o continua. Por
ejemplo, la variable peso es discreta si solamente interesan los pesos sin valores
intermedios (50 kg, 51 kg, etc), mientras que será continua si interesan también los valores
intermedios (50,3 kg, 50,35 kg, 50,357 kg, etc). Obviamente, al considerar una variable
como continua se obtendrá mayor precisión, es decir, mayor información.
Nominal:: son cualidades sin orden. Ej. Estado civil, preferencia por una marca, sexo,
lugar de residencia,, Juan es ingeniero.
ingeniero
3
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
Muestreo aleatorio simple: todos los elementos de la población tiene igual posibilidad de
ser escogido y se eligen al azar.
Muestreo sistemático: los elementos
elementos se seleccionan a un intervalo uniforme en una lista
ordenada. Una preocupación del muestreo sistemático es la existencia de factores cíclicos
en el listado que pudieran dar lugar a un error.
Muestreo estratificado: los elementos de la población son prime
primeramente
ramente clasificados en
grupos o estratos según una característica importante. Luego, de cada estrato se extrae
una muestra aleatoria simple.
Muestreo por conglomerado: los elementos de la población están subdivididos en grupos
y se extraen aleatoriamente algunos de estos grupos completos.
4
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
Ejercicios
.
1. De las siguientes afirmaciones ¿cuál se asemeja más a los conceptos: un parámetro, un
dato, una inferencia a partir de datos, un estadígrafo?
- Según datos de años anteriores se estima que la temperatura máxima de este año
aumentará en un 5%.
- Un profesor de estadística emplea diferentes métodos con cada uno de sus 2 cursos. Al
final del curso compara las calificaciones con el fin de establecer cual método es más
efectivo.
3. Clasificar
ar las siguientes variables en: continua, discreta, nominal, ordinal:
5
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
- nivel de educacional
- edad
4. De cada una de las siguientes situaciones responda las preguntas que se plantean:
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) Identifique
ifique el parámetro de interés
6
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
CLASE N° 2
ESTADISTICA DESCRIPTIVA
El hecho de que sea una estadística simple y fácil de calcular no significa que no sea
importante. Es necesario, por lo general, calcular algunas de las medidas citadas
anteriormente para poder tener una idea preliminar de los datos antes de pasar a realizar
un tratamiento más complejo de los mismos. Por ejemplo, el tipo de distribución que tengan
los datos condicionará la clase de análisis estadístico que podremos utilizar. Algunos
tratamientos estadísticos que se utilizan mucho, como
como por ejemplo el análisis de varianza,
se basan en la comparación de la media y dispersión de los datos, ambos incluidos dentro
de la estadística descriptiva. Además, pueden ser unos indicadores muy útiles por sí solos
sin necesidad de tratamientos estadísticos
estadí más complejos.
Para resumir y organizar los datos se utilizan diferentes procedimientos, llamados técnicas
descriptivas:: la matriz de datos permite ordenarlos, las tablas de frecuencias (o tablas de
distribución de frecuencias) permiten agruparlos, los gráficos permiten visualizarlos, y las
medidas estadísticas y las medidas de asimetría y curtosis permiten pe resumirlos
reduciéndolos a un solo dato.
La forma de ordenarlos y agruparlos los datos dependerá del tipo de variable considerada.
Por ejemplo, si son datos relativos a variables cualitativas (niveles
(niveles de medición nominal y
ordinal), no podremos utilizar tablas de frecuencias por intervalos.
7
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
8
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
Susana 17 n = tamaño de la
Martín 17 muestra
Sergio 17
Pablo 17
Daniel 17
Graciela 17
Daniela 17
Beatriz 17
Oscar 18
Felipe 18
Alberto 18
Mónica 19
Marta 19
Mariana 20
TABLAS DE FRECUENCIA.
1) Frecuencia.
La frecuencia (f) se define como la cantidad de datos iguales o que se repiten. Por ejemplo:
la frecuencia 2 indica que el dato “católico” se repite dos veces, la frecuencia 3 que el dato
“clase media” se repite tres veces, y la frecuencia 8 que el dato “17 años” se repite ocho
veces.
9
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
3) Intervalos.- Un intervalo, también llamado intervalo de clase, es cada uno de los grupos
de valores ubicados en una fila en una tabla de frecuencias. Por ejemplo el intervalo 15-16
15
significa que en esa fila se están considerando las edades de 15 a 16 años. La frecuencia
frecuenc
correspondiente a un intervalo es igual a la suma de frecuencias de los valores en él
incluídos (2). Los intervalos presentan algunas características, que son las siguientes:
3.1) Tamaño del intervalo (a). También llamado amplitud o anchura del intervalo, es la
cantidad de valores de la variable que se consideran conjuntamente en ese intervalo. Por
ejemplo, el intervalo 15-16
16 años tiene una amplitud de 2, puesto que se consideran dos
valores: 15 y 16. En otro ejemplo, el intervalo 20-25
20 años tiene
e una amplitud de 6, puesto
que se consideran seis valores.
El problema se puede presentar con las variables continuas, donde, por definición, podría
aparecer algún valor intermedio entre dos intervalos. Por ejemplo, si se considera la
variable continua “ingresos mensuales” y se consid
consideran
eran en ella los intervalos 1000-2000
1000
dólares y 3000-4000
4000 dólares, puede ocurrir que un dato obtenido de la realidad sea 2500
dólares, con lo cual no podrá ser registrado en ningún intervalo. En tal caso se deberían
10
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
EJEMPLOS:
1. Variable discreta.
3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3
x1, x2 x21
11
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
Vemos que la variable x toma valores entre 0 y 4, es decir, existen en este grupo 5
categorías o clases.
Tabla 1.
Categorías Frec. Absoluta Frec. Absoluta Acum. Frec. Relativa Frec. Rel. Acum.
Xi fi Fi fr (hi) Fr (Hi)
0 f1 = 2 f1 = 2 f1 /n= 0.095 Fr1 = 0.095
1 f2 = 4 f1 + f 2 = 6 f2/n = 0.190 Fr1 + Fr2 =0.286
2 f3 = 7 f1 + f2 + f3 = 13 f3/n = 0.333 Fr1 + Fr2 + Fr3 =0.619
3 f4 = 6 f1 + f2 + f3 + f4 = 19 f4/n = 0.285 Fr1 + ….+ Fr4 =0.904
4 f5 = 2 f1 +………….+ f5 = 21 f5/n = 0,095 Fr1 +…… ….+ Fr5 =1.000
Total n = 21 1.000
Donde:
n = tamaño de la muestra
Xi = valor de la variable en el individuo i
fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i
Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i
fr (hi) = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene
dividiendo
endo la frecuencia de la clase por el tamaño de la muestra.
Fr (Hi) = frecuencia relativa acumulada. Porcentaje acumulado
1. Variable continúa.
Rango: en todo conjunto de valores estadísticos hay valores extremos: el menor de todos y
el mayor de todos; la diferencia entre estos valores extremos se llama rango.
rango = xmáx − xmín
rango: 119 – 62 = 57.
12
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
rango
Se calcula la amplitud de cada intervalo c=
k
c = rango / k = 57 / 6 = 9.5 ≈ 10
Tabla 2.
Intervalos Marca de clase Frec. Absoluta Fi fr Fr
Yi-1 – Yi+1 Y1 fi
[60-70) 65 3 3 0.075 0.075
[70-80) 75 5 8 0.125 0.200
[80-90 ) 85 7 15 0.175 0.375
[ 90-100) 95 11 26 0.275 0.620
[ 100-110) 105 8 34 0.200 0.850
[ 110-120) 115 6 40 0.150 1.000
Total 40 1.000
Donde:
n = tamaño de la muestra
Xi = valor de la variable en el individuo i
fi = frecuencia absoluta: nº de veces que se repite la variable en la categoría i
Fi = frecuencia absoluta acumulada. Indica el nº de individuos hasta la categoría i
fr (hi) = frecuencia relativa. Porcentaje de la categoría respecto del total, se obtiene
dividiendo la frecuencia de la clase por el tamaño de la muestra.
Fr (Hi) = frecuencia relativa acumulada. Porcentaje acumulado
Yi = marca de clase (punto medio del intervalo xm):: su valor es igual a la mitad de la
suma de los limites inferior y superior del intervalo de clase. En todos los análisis
estadísticos su supone que el valor de la marca de una clase es el valor que
corresponde asignar a cada uno de los elementos ubicados en ese intervalo. Sirve
para calcular la media aritmética.
c = amplitud del intervalo:
valo: la diferencia en
entre los límites
mites reales de un intervalo.
Yi-1 = límite inferior del intervalo
Yi+1 = límite superior del intervalo
EJEMPLO
La fábrica de baldosas ”De las casas”, con el objeto de ofrecer una garantía de su producto,
desea hacer un estudio técnico de su producción, para lo cual extrae una muestra de 100
baldosas, cada una de las cuales se somete a una prueba de resistencia, destructiva cuyos
datos expresados en Kg/cm2, se relacionan a continuación:
13
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
2
Resistencia en Kg/cm .de 100 Baldosas de La Fabrica
“De Las Casas”
478 458 683 780 736 448 591 555
339 694 478 498 310 537 592 549
666 239 398 720 648 533 586 321
313 644 495 122 521 368 531 472
415 291 621 253 763 746 323 575
210 430 223 433 444 437 360 559
425 459 418 351 361 133 383 259
419 655 487 135 370 345 282 578
425 436 634 450 223 479 161 337
420 422 282 439 449 321 452 444
391 569 460 308 477 463 367 251
487 610 470 469 392 517 359 527
440 504 542 369
xmáx = 780
5. Establecer la diferencia:
a: a=Ra-R es decir la cantidad en que ha sido alterado el
recorrido, la cual no debe ser superior a la amplitud
14
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
Conclusiones:
0.14) de las baldosas tiene una resistencia entre 300 y 600 Kg/cm2.
El 72% (fra: 0.86-0.14)
El 86% de las baldosas resiste menos de 600 Kg/cm2.
Sólo Kg/cm2.
ólo el 5% resiste 700 o más Kg/c
Ejercicio:
3
Consumo de agua, en m de 184 familias
n un barrio residencial de una ciudad durante el mes de Abril:
Abril
4 8 8 13 15 20 10 19 9 18 17
16 16 29 17 23 3 17 25 10 18 29
6 23 11 23 10 21 21 6 22 18 13
23 12 23 17 22 18 27 27 17 13 13
15
Curso: Estadística Profesor: Diego Alejandro Chalarca R.
Facultad de Ingeniería. Departamento de Ingeniería Sanitaria y Ambiental
10 31 11 26 15 5 5 18 16 13 30
23 2 26 17 13 21 14 29 18 20 9
10 21 9 30 8 18 34 17 4 29 16
12 23 8 26 16 28 8 16 29 18 2
17 13 21 13 26 26 18 9 18 13 12
21 27 21 9 17 24 8 10 16 33 21
14 16 19 17 7 24 5 20 14 16 12
12 5 13 17 9 12 14 1 16 25 20
14 20 14 6 21 13 22 10 6 21 20
5 20 28 17 12 4 33 12 25 9 17
14 20 10 25 24 32 15 25 16 22 13
15 25 2 9 22 25 12 15 22 17 7
24 15 24 11 22 10 21 14
16