Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 Estadistica PDF
1 Estadistica PDF
1 Estadistica PDF
Conceptos Estadísticos
Fundamentales
Estadística Aplicada
CONTENIDOS:
1
Estadística Aplicada
PLAN DE EVALUACION:
• Parcial 1: 25%
• Tarea previ a a parci al 2: 15%
• Parcial 2: 20%
• Trabajo de campo: 15%
• Asi stencia: 10%
Antecedentes
Para distinguir entre conocimiento e
información, podría decirse:
2
Antecedentes
En muchos casos es necesario trabajar con experiencias o
procesos que generan un número muy grande de datos o
resultados numéricos, es decir, espacios muestrales con un
número infinito o muy grande de elementos.
Antecedentes
Los orígenes de la estadística, aunque no se sabe con exactitud cuándo
se comenzó a utilizar, pueden estar ligados al antiguo Egipto como a los
censos chinos que se realizaron hace unos 4000 años,
aproximadamente.
3
Antecedentes
En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los
nacimient os y defunciones ocurridos en Londres; donde concluía acerca
de algunos factores relacionados con estos eventos. Esta obra es
considerada como el punto de partida de la e stadí stica moderna.
Conceptos Fundamentales
La estadística es la ciencia de la inducción lógica, ayuda a generar
conclusiones de carácter general a partir de un reducido número de
observaciones.
4
Conceptos Fundamentales
Por ejemplo:
• La estadística aporta herramientas que permiten utilizar una cantidad lim itada
o incompleta de información, para formular conclusiones acerca de causas y
efectos de algún fenómeno estudiado.
Estadística Descriptiva
Variables cualitativas
Variables Cuantitativas
5
Estadística Descriptiva
Variables cualitativas:
Relacionadas con características
no numéricas de un individuo
por ejemplo: atributos de una
persona, nacionalidad, color de
la piel, sexo, religión.
Estadística Descriptiva
6
Estadística Descriptiva
•Dicotóm icas
•Policotóm inas
Cualitativas
•Generales Por su
•Intermedias naturaleza
Cuantitativas
•Discretas
•Continuas
Por su nivel
de
Variables Con relación
abstracción
al fin de la
investigación
•Independientes
•Dependientes
•Intervinientes
Individuales •Extrañas
Por su
Colectivas am plitud •Ambientales
•Conexas
•Actuación y presencia del investigador
•Actuación de los sujetos investigados
Estadística Descriptiva
7
Estadística Descriptiva
Los datos pueden provenir de fuentes internas o externas.
• En una empresa las fuente s internas están conformados por
registros de ventas, producción, nómina, personal y los asientos
contables.
• Las fuente s externas están fuera de la organización que los usa, se
obtienen a través de publicaciones, pueden ser de dos tipos:
• Fuentes primarias, son datos publicados por quienes los
recolectaron y/o produjeron originariamente (censos de
población, estadísticas de ingresos, reportes anuales de
actividad industrial, etc.)
• Fuentes secundarias, como los diarios, revistas, libros y otros
medios de comunicación, que publican información elaborada
por las fuentes primarias.
Es preferible obtener la información de fuentes primarias, por las
imprecisiones que pueden enc ontrarse en dat os provenientes de
fuentes secundarias (errores de trascripción, datos incompletos,
ausencia de not as aclaratorias, etc.).
Estadística Descriptiva
8
Estadística Descriptiva
Generadores
Eléctricos Diesel
Muestra
Estadística Descriptiva
30 29
26
29 30 31
31
33 32
29 27 29 30
27 26 28 30
25 27
32
31
28 32
30 31
29 30 30
31 28
34
33 31
Población o Universo
9
Estadística Descriptiva
Cada dato numérico es un elemento de la población o
universo.
Una Muestra es un subconjunto pequeño de observaciones
extraídas de un universo o población.
Estadística Descriptiva
30 29
26
29 30 31
31
33 32 28
29 27 29 30
27 26 29
28 30 31
25 27
32 30
31 34
28 32
30 31
29 30 30
31 28
34 Muestra de
33 31
5 datos
Población o Universo
10
Estadística Descriptiva
Estadística Descriptiva
En una ciudad de 5.000 habitantes se
realiza un censo médico en el cual se mide
el peso, la altura y relevándose otros datos
de todos los habitantes de la ciudad.
11
Estadística Descriptiva
Por ejemplo,
• El conjunto de t odas las mediciones de altura (de los habitantesde la
ciudad) es un conjunto de datos y por lo tanto constituye un uni verso
o población de datos desde el punto de vista estadístico.
• Otro universo o población de dat os son los pesos medidos (de los
habitantes de la ciudad).
Estadística Descriptiva
El tratamiento estadístico considera dos categorías principales de datos:
• Variables y constantes.
• Las variables se denotan usualmente por medio de las últimas letras del alfabeto,
tales como x, y, o z.
• Dentro de esta categoría se incluyen también los estadísticos y los parámetros.
•Un estadístico es una característica medida u observada en una muestra y
usualmente se denota mediante una letra específic a.
• La media aritmética de una muestra se denota mediante Ẋ
• La característica o parámetro correspondiente a la población o universo al
cual pertenece la muestra seleccionada se denota mediante µ.
• Generalmente los estadísticos de una muestra se denotan mediante letras del
alfabeto latino, mientras los parámetros de la población correspondiente se
denotan mediante letras griegas Por ejemplo,
• El conjunto de todas las mediciones de altura (de los habitantes de la ciudad) es un
conjunto de datos y por lo tanto constituye un universo o población de datos desde el
punto de vista estadístico.
• Otro universo o población de datos son los pesos medidos (de los habitantes de la
ciudad).
• La población de habitantes, es decir, las personas que habitan la ciudad no son la
población (objeto de estudio) a la que se refiere desde el punto de vista estadístico.
12
Estadística Descriptiva
Con respecto a las constantes, existen dos tipos: Ordinarias
y “naturales”.
• Las constante s ordinarias se denotan mediante las primeras letras
minúsculas del alfabeto, es decir a, b, c, …
• También en este caso, es necesario distinguir entre constantes
basadas en la observación de una muestra y los parámetros de la
población correspondiente.
•Por ejemplo la siguiente relación entre dos variables X y Y
observada en una muestra:
• Y = a + bX.
•La ecuación correspondiente a la población o universo sería:
• Y = α + βX.
• En el ejemplo, a y b son estadísticos de la muestra mientras que α
y β son los parámetros de la respectiva población.
• Por constante s “naturales” se entienden los valores espec íficos
usados en las matemáticas, siendo el número irracional e =
2,71828..... y π = 3,14159... dos de las constantes naturales más
frecuent ement e utilizadas.
Estadística Descriptiva
Por ejemplo si una empresa se fabrica un lote muy grande, de 10
toneladas de un producto químico, y un técnico debe controlar la
calidad del mismo.
13
Estadística Descriptiva
Cuando el laborat orio efectúa algún ensayo en la muestra y obtiene
un resultado numérico, recién ahí se tiene un dato que puede ser
analizado desde el punto de vista estadístico.
Estadística Descriptiva
Si el técnico continuara sacando otras muestras del producto, hasta
agotar el lote y cada una es ens ayada en el laboratorio, el cual da los
resultados.
14
Estadística Descriptiva
Si se toman al azar 10 de esos resultados, se dice tener una
muestra de 10 elementos de ese universo o población.
Estadística Descriptiva
Del ejemplo anterior, si el técnico toma solamente 5 muestras
del lote original y las envía para analizar al laboratorio.
15
Estadística Descriptiva
Si se tiene una máquina que produce
piezas de plástico en serie y un
técnico toma 5 piezas sucesivas y les
mide la altura con un calibre.
Estadística Descriptiva
Debe considerarse lo siguiente:
Ese conjunto muy grande de res ultados num éricos que no existe, pero
que lo podría obtenerse en esas condiciones es el universo o
población del cual se extrae la muestra de 5 observaciones.
16
Estadística Descriptiva
En otro caso, el sindicato de la industria textil desea saber
cual es el sueldo promedio que gana un operario en esa
industria.
Estadística Descriptiva
Aunque el encuestador no disponga de esos datos, se sabe
que existen miles de trabajadores que ganan un salario
determinado y por lo tanto puede hablarse de un universo o
población cuyos elementos son los salarios de los
trabajadores de la industria textil en el país.
Entonces,
17
Estadística Descriptiva
El análisis estadístico de una población o universo de
datos tiene como objetivo final descubrir las características
y propiedades de aquello que generó los datos.
Estadística Descriptiva
Por ejemplo, se tiene una población de escolares
(Población física, población humana) y se les mide la altura.
El conjunto de datos de altura constituye una población o
universo estadístico.
El análisis de estos datos de altura (Universo estadístico)
sirve para caracterizar y estudiar a la población de
estudiantes (Que no es una Población estadística).
18
Estadística Descriptiva
Un instituto dedicado a estudios económicos ha realizado
una encuesta de ingresos en el país.
Estadística Descriptiva
Salarios (Bs.)
800
1250
950
2150
1780
1340
1500
2100
...
Población real
Población estadística
19
Estadística Descriptiva
Un ingeniero controla un proceso industrial, que genera a
diario muchos lotes de un producto (Población de lotes).
Estadística Descriptiva
Proceso
Muestra
Producto
Medición
Resultados
Numéricos
20
Estadística Descriptiva
A través de esos datos numéricos se puede evaluar el comportamiento
del proceso, que es lo que realmente le interesa.
Estadística Descriptiva
La población estadística representa una población física o
natural formada por elementos de la realidad, con respecto a
una característica o propiedad de esa población física.
21
Distribución de Frecuencias
Una Población o Universo de dat os es un conjunto muy grande de
números.
Distribución de Frecuencias
Gráficos Estadísticos
• La información contenida en las tablas de frecuencias resulta más
accesible y fácil de interpretar si se representan por medio de gráficos
estadísticos.
En él se asocia a cada v alor de la v ariable una Está f ormado por rectángulos, cuy as bases
barra, cuy a longitud es igual o proporcional a su corresponden con los interv alos de clase y sus
f recuencia. áreas son iguales o proporcionales a sus
f recuencias.
22
Distribución de Frecuencias
Gráficos Estadísticos
• Lainformación contenida en las tablas de frecuencias resulta más
accesible y fácil de interpretar si se representan por medio de gráficos
estadísticos.
Es una línea poligonal que une los vértices Es un gráf ico f ormado por un círculo
superiores de las barras de un diagr ama de div idido en sectores circulares cuy as
barras, o los puntos medios de las bases amplitudes son proporcionales a las
superiores de los rectángulos de un f recuencias de los datos
histograma. representados.
Distribución de Frecuencias
Gráficos Estadísticos
• Lainformación contenida en las tablas de frecuencias resulta más
accesible y fácil de interpretar si se representan por medio de gráficos
estadísticos.
Los pictogramas son gráf icos similares a En este tipo de gráf ico se representan los
los gráf icos de barras, pero empleando un v alores de los datos en dos ejes cartesianos
dibujo en una determinad a escala para ortogonales entre sí.
expresar la unidad de medida de los datos. Se pueden usar para representar: una serie o
Generalmente este dibujo debe cortarse más series
para representar los datos. Se usan para
lograr el interés masiv o del público.
23
Distribución de Frecuencias
Una forma sería escribir los números desde el menor hasta
el mayor y colocar encima de cada uno tantas cruces como
veces que figure repetido en la población:
Ordenando la Información
Al ordenar datos muy numerosos, es usual
agruparlos en clases o categorías.
Al determinar cuántos pertenecen a cada
clase, se tiene la fre cuencia.
Se Construye así una tabla de datos llamada
tabla de frecuencias.
Distribución de Frecuencias
Población o Universo
30 29
26
29 30 31
31
33 32
29 27 29
27 26 28 30 27 x
25
28 32 31 x x
28 32 x x x
30
29 30 31 x x x
31 30 x x x x x x
30 34
33 31 x x x x x x x x
x x x x x x x x x x
24 25 26 27 28 29 30 31 32 33 34 35
24
Distribución de Frecuencias
…o utilizar cuadrados en vez de cruces:
Población o Universo
30 29
26
29
31 30 31
33 32
29 27 29
27 26 28 30 27
32 25
28 31
28 30 32
31
29 31 30 30
30 34
33 31
24 25 26 27 28 29 30 31 32 33 34 35
Distribución de Frecuencias
24 25 26 27 28 29 30 31 32 33 34 35
25
Distribución de Frecuencias
El número de veces que aparece repetido cada dato es la
frecuencia de dicho valor.
Distribución de Frecuencias
Población o Universo
30 29 Promedio
26
29 30 31
31
33 32
29 27 29
27 26 28 30 27
25
28 32 31
28 30 32
29 30 31
31 30
30 34
33 31
24 25 26 27 28 29 30 31 32 33 34 35
26
Distribución de Frecuencias
También muestra cuales son los valores máximo y mínimo de la
población, es decir, el rango:
31 30
26 29
29
31 30 31
31 33 32
29 27 29
27 26 28 30 27
32 25
28 31
28 30 32
29 31 30 30
30 33 34
24 25 26 27 28 29 30 31 32 33 34 35
Rango
Recorrido o intervalo total
Distribución de Frecuencias
Otitis 13
Heridas 7
Fracturas 18
Vacunas 20
27
Distribución de Frecuencias
Tipos de frecuencias
1. Frecuencia o Frecuencia Absoluta: Es el número de veces que se
presenta un valor o categoría de una variable. Se repres enta por fi.
2. Frecuencia Relativa: La frecuencia relativa se puede expresar en
términos de porcentaje o de proporción y se representa por fr. (Es
la razón entre la frecuencia absoluta y el total de datos)
Categorías o Frecuencias
Recorrido de la variable Observadas
TOTAL n
Distribución de Frecuencias
• Frecuencia re lativa fr
28
Distribución de Frecuencias
2,8
3,2
3,9
4,2
5,0
5,6
6,0
Distribución de Frecuencias
29
Distribución de Frecuencias
Hasta el momento sólo se ha trabajado con una pequeña cantidad de
datos.
• ¿Cómo se procede si se tiene muchos datos?
Tabla de Distribución de Frecuencias agrupadas con
intervalos de clase o categorías
En ocasiones, conviene agrupar los datos en intervalos, esto ayuda a
realizar un mejor análisis.
Definiciones:
• Rango: Diferencia entre el máximo y el mínimo valor de una variable,
también denominado recorrido o intervalo total.
Distribución de Frecuencias
Una manera de caracterizar una población es construir una tabla distribución de
frecuencias o gráfico de frecuencias, siguiendo los siguientes pasos:
1. Se anota el valor máximo y el valor mínimo de la serie de datos que se está estudiando.
2. El número de clases o categorías se obtiene div idiendo la dif erencia del máximo y el mínimo
(rango o interv alo total) entre el tamaño del interv alo de clase (ic) deseado,
número de clases=Rango/ic
3. El tamaño del interv alo de clase (ic) debe ser tal que no hay a ni excesiv as clases ni muy pocas,
puede usarse la Regla de Sturge.
Rango
Tamaño de ic
1 3,322 log( N )
Valor Máximo
Tamaño del ic
30
Distribución de Frecuencias
4. También puede decidirse a priori en cuántas clases desean agruparse los datos,
entonces el tamaño del intervalo de clase es:
Distribución de Frecuencias
31
Distribución de Frecuencias
Estatura Mayor: 1,93 metros
Estatura Me nor: 1,66 metros
Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.
Se decide formar 6 clases o categorías – Cantidad de
intervalos
Para calcular el tamaño de inte rvalo se divide el Rango
27cm entre 6, obteniendo finalmente 4,5 ~ 5cm
Luego los intervalos de la tabla son:
Frecuencia
Intervalo Marca de Clase
Absoluta
1 ,65 – 1 ,69 n1
1 ,70 – 1 ,74 n2
1 ,75 – 1 ,79 n3
1 ,80 – 1 ,84 n4
1 ,85 – 1 ,89 n5
1 ,90 – 1 ,94 n6
Total N
Distribución de Frecuencias
1,66 1,66 1,67 1,67 1,67 1,7 1,71 1,72 1,72
1,69 1,72 1,73 1,73 1,74 1,75 1,75 1,75 1,76 Marca de
Intervalo Fi Fr
clase
1,72 1,73 1,74 1,75 1,75 1,75 1,76 1,77 1,78
1,65 1,69 1,67 6 0,075
1,74 1,75 1,76 1,76 1,77 1,77 1,77 1,79 1,79
1,70 1,74 1,72 12 0,150
1,76 1,77 1,77 1,77 1,79 1,79 1,8 1,8 1,81 1,75 1,79 1,77 30 0,375
1,76 1,77 1,78 1,79 1,8 1,81 1,82 1,82 1,83 1,80 1,84 1,82 22 0,275
1,85 1,89 1,87 8 0,100
1,77 1,79 1,8 1,83 1,83 1,83 1,83 1,84 1,84 1,90 1,94 1,92 2 0,025
1,81 1,83 1,83 1,84 1,84 1,84 1,85 1,86 1,92 80 1,000
35
Frecuencia Absoluta
30
25
20
15
10
5
0
1,65 – 1,69 1,70 – 1,74 1,75 – 1,79 1,80 – 1,84 1,85 – 1,89 1,90 – 1,94
Estatura (m)
32
Distribución de Frecuencias
Hi stograma de Frecuencias “Peso de varones adultos”:
Si se hace el área de cualquier rectángulo sobre el intervalo i-ésimo
igual a la frecuencia relativa fr = ni /N, el área total bajo el histograma
será igual a la unidad:
ni ni N
Area Total Ai 1
N N N
Gráfico de Distribución de Frecuencias
0,20
0,18
0,16
Frecuencia Relativa
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96
Pe so Kg.
Distribución de Frecuencias
El Histograma obtenido muestra la distribución de
frecuencias de la población, peso de varones adultos.
33
Distribución de Frecuencias
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96
Pe s o Kg.
Distribución de Frecuencias
Si se elige una persona del grupo y se le pesa, el resultado
es un dato que pertenece a la población de datos
representada en el gráfico.
34
Distribución de Frecuencias
Juan
En este caso, se dice que la
extracción es aleatoria.
Distribución de Frecuencias
Una extracción aleatoria es aquella en que cada miembro
de la población tiene la misma posibilidad de ser elegido.
Entonces:
35
Distribución de Frecuencias
No. Dato 1 Dato 2 Dato 3 Dato 4 Dato 5
1 10.7 10.7 10.7 10.7 10.9
Asignación 1: 2 10.8 10.9 10.8 10.9 10.7
Distribución de Frecuencias
Asignación 2:
• En su lugar de trabajo seleccionar una población física a estudiar.
• Describirla y delimitarla.
• Especificar la poblaciones estadísticas que serán objeto de estudio.
• De esta, seleccione las variables a caracterizar estadísticamente.
• Tipo de variable, valores que toma.
• Datos a rec oger para caracterizar la(s) variable(s) objeto de estudio
• Tipo de datos
• Procedencia de los datos.
• Reglas para su expresión.
• Formas de obtención y manejo.
• Parámetros y estadísticos de interés.
36
Medidas de Tendencia Central
Las medidas de tendencia central son:
• Promedio aritmético simple - Media
• Promedio geométrico simple
• Promedio armónico simple
• Mediana
• Modo
• Promedio aritmético en distribución de frecuencias
• Mediana en distribución de frecuencias
Medidas de posición
• Cuartiles
• Percentiles
La media, mediana y modo describen alrededor de cuáles
valores se agrupan los datos.
x1 x 2 x3 ..... x n x
i1
i
X
n n
Dados 3, 2, 3, 6, 4, 5
__ __ __
Calcular X , X g , X h , la mediana y el modo
37
Medidas de Tendencia Central
Promedio aritmético distribución de frecuencias
n
x
i 1
i fi
X n
f
i 1
i
70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 Li Ls xi fi
62 64 63 5
70 73 74 70 70 69 72 74 69 71 73 67
65 67 66 14
67 70 66 64 71 72 63 66 69 72 69 70
68 70 69 43
68 64 73 74 66 72 71 73 71 71 69 65
71 73 72 27
68 67 71 71 67 70 70 72 67 70 68 68
74 76 75 7
70 68 67 64 70 71 68 68 64 68 72 69
N = 96
70 72 76 70 69 71 70 72 69 69 70 75
__
63 * 5 66 * 14 69 * 43 72 * 27 75 * 7 6675
X 69 ,53
96 96
Medidas de posición
Cuartiles
• Son los valores de la distribución de frecuencias que la dividen en 4
partes iguales.
• Q1 es el primer cuartil:
•25% de las frecuencias se encuentran por debajo de él.
•75% de las frecuencias se encuentran por encima de él.
• Q2 es el segundo cuartil (mediana)
•50% de las frecuencias se encuentran por debajo de él.
•50% de las frecuencias se encuentran por encima de él.
• Q3 es el tercer cuartil:
•75% de las frecuencias se encuentran por debajo de él.
•25% de las frecuencias se encuentran por encima de él.
p. N
f a1
Q p Li 4 .ic donde p 1, 2 ó 3
fi
38
Medidas de Dispersión
Las medidas de dispersión son:
• Rango
• Desviación Media
• Varianza
• Desviación típica o estándar.
Estas medidas indican qué tan agrupados alrededor de un valor se
encuentran los datos.
Permiten medir la variabilidad de los datos obtenidos con respecto al
valor central representativo.
En qué medida se alejan los valores individuales del promedio
Medidas de Dispersión
Datos no agrupados o en series simples
Recorrido, intervalo total o rango:
• Valor mayor – Valor menor
La desviación media __
x i x
DM
N
Varianza __
2 ( xi x ) 2
S
N
39
Medidas de Dispersión
Datos agrupados en distribución de frecuencias
La desviación media __
x i x * fi
DM
N
Varianza __
( x i x )2 * f i
2
S
N
Medidas de Dispersión
Desviación típica en Distribución de Frecuencias
70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 __ 63 * 5 66 *14 69 * 43 72 * 27 75 * 7 6675
X 69,53
70 73 74 70 70 69 72 74 69 71 73 67 96 96
67 70 66 64 71 72 63 66 69 72 69 70
68 64 73 74 66 72 71 73 71 71 69 65
68 67 71 71 67 70 70 72 67 70 68 68
70 68 67 64 70 71 68 68 64 68 72 69
70 72 76 70 69 71 70 72 69 69 70 75
__
( x i x) 2 * f i 773,91
S 8,06 2,84
N 96
40
Medidas de Tendencia Central y Dispersión
70 66 72 68 70 68 69 68 70 71 75 76
70 69 73 66 70 70 71 65 66 71 69 71 __ 63 * 5 66 *14 69 * 43 72 * 27 75 * 7 6675
X 69,53
70 73 74 70 70 69 72 74 69 71 73 67 96 96
67 70 66 64 71 72 63 66 69 72 69 70
68 64 73 74 66 72 71 73 71 71 69 65
__
68 67 71 71 67 70 70 72 67 70 68 68
( x i x ) 2 * f i 773 ,91
70 68 67 64 70 71 68 68 64 68 72 69 S 8, 06 2,84
70 72 76 70 69 71 70 72 69 69 70 75 N 96
N 96
Min 63
Max 76
Rango 13
IC 1,63
Solución Excel
No. Clases 7,97
Ẋ 69,61
Md 70
Mo 70
S 2,71
41