Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MÓDULO I
TALLER DE ESTADÍSTICA
APLICADA A LA INVESTIGACIÓN
LOJA - ECUADOR
2010
2
1. INTRODUCCIÓN
2. OBJETIVOS
3. CONTENIDOS
1. PRINCIPIOS BÁSICOS
1.1. ESTADISTICA
1.2. OBJETO E IMPORTANCIA DE LA ESTADÍSTICA
1.3. PORQUE APRENDER ESTADISTICA
1.4. CLASIFICACIÓN DE LA ESTADÍSTICA
1.5. ESTADÍSTICA DESCRIPTIVA
a.) Características
b.) Variables Cardinales
c.) Variables Ordinales
d.) Estadísticos
e.) Estadísticas
f.) Parámetros
g.) Estimador
1.6. TRABAJO DEL ESTADÍSTICO. MODELO MATEMÁTICO.
1.7. POBLACIÓN
1.8. MUESTRA:
Diagramas de Barras
Diagrama de Barras Horizontales
Diagrama de Barras Compuestas
Diagrama de Porcentaje de Barras Compuestas
Diagrama de Puntos
Histograma
Polígono de Frecuencias
Diagrama de Frecuencia Acumulada
Gráfico Circular (pastel)
4. METODOLOGÍA
5. RECURSOS
Documento de apoyo
Tiza líquida
Calculadora
4
6. EVALUACION Y ACREDITACION
6.1. Evaluación
6.2. Acreditación
Asistencia y puntualidad 10
Desarrollo de las actividades extractase 10
Desarrollo de actividades en clase 10
Desarrollo de la Investigación 10
Pruebas 10
------
TOTAL 10
7. BIBLIOGRAFIA
UNIDAD I
1. PRINCIPIOS BÁSICOS
1.1. ESTADISTICA
Desde la más remota antigüedad los pueblos hicieron uso de una estadística
rudimentaria, pues en todos ellos se hicieron censos de población, de propiedades,
recopilación de datos para establecer la situación financiera del estado, inventarios de
bienes, controles de nacimientos, etc...
“De ahí el nombre de Estadística, que tiene la misma acepción que en el lenguaje
corriente, dado que estadística significa disciplina que estudia todo lo perteneciente al
Estado”
Únicamente a fines del siglo XVII se organiza la Estadística como una rama de la
matemática aplicada y alcanza su verdadero desarrollo en el Siglo XVIII, cuando se une
con el cálculo de probabilidad que le sirve de base y permite su aplicación en la mayoría
de estudios sean estos, demográficos, ciencias económicas, sociales, en biología,
astronomía, meteorología, psicología, comercio e industria, entre otros...
Estadística Descriptiva
De todo lo anterior, el trabajo del estadístico no se limita solo a poner en manos del
investigador estos instrumentos, sino que su participación es activa y directa en la
resolución de problemática experimental.
7
1.6. POBLACIÓN
De manera general se puede decir que una población es todo conjunto de elementos
que poseen características comunes observables.
Ejemplos:
En estos dos ejemplos los elementos que componen los conjuntos asociados a cada
una de las poblaciones pueden ser percibidos, observados, es decir que existen
concretamente, para poder ser analizados.
Ejemplos:
Puede apreciarse que en esta población, los conjuntos asociados a dicha población,
no tienen una existencia real, son producto de una suposición de trabajo que sido
elaborada, por tanto estas poblaciones solo existen en abstracto (supuesto):
Se supone que este conjunto exista y pueda conformar sendas poblaciones con
elementos que poseen características comunes, pero sería imposible contar
concretamente con cada uno de ellos.
1.7. MUESTRA:
8
Constituye cualquier subconjunto o parte de una población., de tal manera que se pueda
hacer inferencias con respecto a la población.
Se pudiera tomar una muestra de esta población, y a partir de ellas sacar la información
respecto a toda la población. Es aquí donde el trabajo estadístico juega un papel muy
importante.
Así se puede precisar que el objetivo fundamental del trabajo estadístico, es llegar a
conclusiones que tengan valor para la población, a través del estudio de una muestra
de dicha población.
Ejemplo:
9
1.8. VARIABLES
a.) Características
Reflexione.
¿Cree Ud. que esta muestra sea representativa de la población?, ¿Por qué?
¿Cómo sugeriría Ud. tomar la muestra?. Describa su reflexión.
Ejercicios.
1.- Considere la población formada por los alumnos del Módulo I del Área Educativa
de la UNL. Describa cómo tomar una muestra representativa de esta población.
10
UNIDAD II
2. ORGANIZACIÓN DE DATOS PARA QUE TRANSMITAN UN SIGNIFICADO
Método Analítico
Método Matemático
Como se ha visto todos los datos deben entrar en una escala de medición
generalmente por medio de fórmulas matemáticas, las mismas que pueden ser;
nominales (porcentajes, razones y proporciones), ordinales (mediana y moda), de
intervalo (media aritmética), de proporción (media geométrica), entre otras que a
lo largo del curso la iremos considerando.
Método Gráfico
Ejemplo:
Este arreglo nos permite visualizar fácilmente las características de los datos. Así
podemos observar que entre las especialidades del colegio, la que tiene mas
estudiantes en el 2008, fue la de Físico Matemático, y la que menos estudiantes
Administración.
2.3. Frecuencia
Ejemplos:
Calificaciones 20 19 18 16 14 13 12
Frecuencia 06 08 10 12 08 06 06
TOTAL 56
COLEGIOS FRECUENCIA
Vicente Anda Aguirre 780
Bernardo Valdivieso 580
Jaime Roldós 250
Benjamín Carrión 120
Manuel Enrique Rengel 300
La Inmaculada 240
Pío Jaramillo Alvarado 340
TOTAL 2610
EVALUACIÓN
Estimado estudiante dígnese contestar las siguientes preguntas; esto permitirá fortalecer
su comprensión en la terminología estadística
a = (XM – Xm) + 1
b.) Intervalo de Clase (i). A los números extremos y los incluidos en ellos
forman el intervalo de clase: 16-20 está formado por 16, 17, 18, 19, 20.
Los números extremos constituyen los límites de clase: en el intervalo 16-
20, significa que empieza en 16 y termina en 20. Aclaramos que estos
límites no son reales, ya que, el intervalo 16-20 varía desde 15,5 hasta
20,5 que son los límites verdaderos en su orden, al primero se llama límite
real inferior (Li) y al segundo límite real superior (Ls). A la diferencia de
los límites reales se denomina tamaño o ancho del intervalo, es decir:
i = Ls – Li
13
Li + Ls
Xm = ----------
2
16 + 20
Xm = ------------
2
Xm = 18
A
ni = ----- + 1
i
Ejercicio de Aplicación
16 17 18 15 15 12 12 19 14 13 19
14 17 13 09 14 11 06 09 14 13 11
09 12 05 05 12 04 09 14 14 07 13
10 17 14 09 13 15
AMPLITUD
Como:
A = (XM – Xm) + 1 (19 – 4) + 1 = 15
NÚMERO DE INTERVALOS
ni = a / i + 1 (15 / 3 ) + 1 = 5,0 + 1 = 6,0
14
Descendente = 69, 65, 62, 60, 58, 57, 55, 54, 52, 48
Ascendente = 48, 52, 54, 55, 57, 58, 60, 62, 65, 69
PROCESO
1. Se ordena la variable en forma ascendente (o descendente)
2. Se escribe en tablas los datos repetidos mediante rayas horizontales o
verticales.
3. Se suma el número de rayas, para formar la columna de las frecuencias.
16, 17, 18, 15, 15, 12, 12, 13, 14, 13, 19, 14, 17
13, 09, 14, 11, 10, 06, 09, 14, 13, 11, 09, 12, 05
05, 12, 04, 09, 14, 18, 07, 13, 10, 17, 14, 09, 13
PROCESO
Ejemplo.
49 50 50 66 57 44 45 49 50 51 57 66 37 41 45
36 65 55 50 50 45 47 43 37 65 52 55 61 39 40
45 45 50 51 56 49 46 45 40 38 61 56 51 49 45
45 46 49 51 55 60 45 37 40 46 42 36 79 60 49
52 49 47 41 41 34 36 40 41 48 79 51 50 55 67
Desarrollo
a = 46
ni = (a / i) + 1 ni = (46 / 5) +1 ni = 10,2 10
X f fa
75 – 79 01 75
70 – 74 00 74
65 – 69 05 74
60 – 64 04 69
55 – 59 08 65
50 – 54 15 57
45 – 49 22 42
40 – 44 11 20
35 – 39 08 9
30 – 34 01 1
TOTAL f = 75
Desarrollo:
1 = 01
(1+8) = 09
(9+11) = 20
(20+15) = 42
(35+22) = 57
(57+8) = 65
(65+4) = 69
(69+5) = 74
(74+0) = 74
(74+1) = 75
fr = f / N
Ejemplo:
Peso en Kg. f fr
48 08 0,067
53 23 0,192
58 48 0,400
63 34 0,283
68 05 0,042
73 02 0,017
TOTAL F= 120 1,000
Desarrollo:
P = (f *100) / N
Ejemplo:
48 08 06,67
53 23 19,17
58 48 40,00
63 34 28,33
68 05 04,17
73 02 01,67
TOTAL F= 120 100,00
Desarrollo:
P = (f * 100) / N
P = (8 * 100)/120 P = 6,67
P = (23 * 100)/120 P = 19,67
P = (48 * 100)/120 P = 40,00
...
...
...
P = (2 * 100)/120 P = 1,67
Pa = (fa * 100) / N
Ejemplo:
Peso en Kg. f fa Pa
48 08 08 06,67
53 23 31 25,83
58 48 79 65,83
63 34 113 94,17
68 05 118 98,33
73 02 120 100,00
TOTAL F=120
Desarrollo:
Pa = (fa * 100) / N
Pa = (8 * 100)/120 = 6,67
Pa = (31 * 100)/120 = 25,83
Pa = (79 * 100)/120 = 65,83
...
...
...
Pa = (120 * 100)/120 = 100
EVALUACIÓN
___________________________________________________
45 52 58 60 66 67 89 70 75 83
88 89 91 93 96 57 61 74 76 61
57 64 68 74 64 77 87 62 85 80
68 76 80 82 71 85 62 72 72 82
71 87 73 72 79 84 81 79 81 73
77 62 73 84 81 79 72 79 81 84
___________________________________________________
Calcular:
Marca de Clase
Numero de intervalo
Tabular los datos en forma ascendente
Encontrar la frecuencia de dichos datos
Realizar la tabulación mediante la serie estadística de intervalos, para lo cual se
propone el ancho de intervalo de 5.
La frecuencia acumulada
La frecuencia Relativa
El porcentaje de frecuencia
El porcentaje de frecuencia acumulada
21
UNIDAD III
3. GRÁFICAS DE LA DISTRIBUCIÓN DE FRECUENCIAS
DIAGRAMAS DE BARRAS
Se lo utiliza para representar datos de una variable continua y está constituido por
rectángulos o barras cuyas áreas son proporcionales a los datos de un fenómeno.
Para su construcción se debe tener en cuenta:
Ejemplo:
2610
1000
NUMERO ALUMNOS
780
800
580
600
400 300 340
250 240
200 120
1 2 3 4 5 6 7
0
COLEGIOS
Ejemplo:
Ejemplo:
9 3
5 8
3 6
6
10
6 7 1
5 5 4 2
3 2 1
20 19 18 17 16 15 14 13 12
24
Ejemplo:
p = f. * 100
N
p = 3. * 100
9
p = = 33.3 Paralelo A
p = 6. * 100
9
p = = 66.6 Paralelo B
TOTAL 43 43 86.0
DIAGRAMA DE PUNTOS
Ejemplo:
Con los datos del siguiente cuadro estadístico, los mismos que representan el
número de alumnos del Colegio "Pío Jaramillo Alvarado" en algunas especialidades.
TOTAL 450
140
136
120
100
90
80
62
60
42
40
20
1 2 3 4 5
ESPECIALIDADES
26
HISTOGRAMA
Clase f
(30 – 39) 01
(40 – 49) 04
(50 – 59) 09
(60 – 69) 05
(70 – 79) 27
(80 – 89) 32
(90 – 100) 07
TOTAL 85
30 40 50 60 70 80 90 100
Límites de clase (calificaciones)
POLÍGONO DE FRECUENCIAS
Un Polígono de Frecuencia, es una gráfica de líneas rectas que unen los puntos
obtenidos al colocar en el eje horizontal a los valores medios de clase y en el
vertical a las frecuencias relativas o absolutas. Debe hacerse notar que el
procedimiento equivale a unir los puntos medios de la cara superior de los
rectángulos de un histograma por medio de líneas rectas.
35
Frecuencias absolutas (estudiantes)
30
25
20
15
10
30 35 45 55 65 75 85 95 100
Valor medio de clase (calificaciones)
27
90
Frecuencias acumuladas
80
(absolutas)
70
60
50
40
30
20
10
0
30 40 50 60 70 80 90 100
COLEGIOS FRECUENCIA
Vicente Anda Aguirre 780
Bernardo Valdivieso 580
Jaime Roldos 250
Benjamín Carrión 120
Manuel Enrique Rengel 300
La Inmaculada 340
Pío Jaramillo Alvarado 240
TOTAL 2610
F * 360°
A° = ----------------------
N
780 * 360°
A° = ----------------------
2610
A° = 107,6 108
COLEGIOS FRECUENCIA(f) A° %
Vicente Anda Aguirre 780 108° 30.0
Bernardo Valdivieso 580 80° 22.0
Jaime Roldos 250 35° 09.6
Benjamín Carrión 120 16° 04.6
Manuel Enrique Rengel 300 41° 11.5
La Inmaculada 340 47° 13.0
Pío Jaramillo Alvarado 240 33° 09.2
7
6 9% 1
13% 30%
5
11%
4 2
5% 3
22%
10%
29
EVALUACIÓN
PRODUCTOS FRECUENCIA
(f)
Refrigeradoras 58
TV Color 25
Computadoras 12
Cocinas a Gas 30
Licuadoras 34
Equipos de Sonido 24
TOTAL 261
30
UNIDAD IV
4. MEDIDAS DE TENDENCIA CENTRAL.
Al igual que los promedios, las medidas de tendencia central nos indican el punto
medio o típico de datos que cabe esperar; también reciben el nombre de medidas
de localización. Las medidas de tendencia central que estudiaremos son tres:
Media aritmética, Mediana y Moda (o).
x
Ⴟ = ---------
N
X1 = 2, X2 = 12,
X3 = 9, X4 = 10,
X5 = 7 es:
x
Ⴟ = ---------
N
Ⴟ = Media Aritmética
x = Sumatoria de los valores de X
N = Número de casos
Ejemplo:
31
X = 15 12 14 17 18
15 + 12 + 14 + 17+ 18
Ⴟ = ------------------------------
5
76
Ⴟ = -------
5
Ⴟ = 15.2
xf
Ⴟ = ---------
N
Ⴟ = Media Aritmética
xf = Sumatoria del Producto de la variable por la frecuencia
N = Número de casos
X f
32
167 02
166 02
165 02
164 03
163 04
162 03
161 04
160 04
159 01
TOTAL 25
DESARROLLO:
1. Fx = F * x
fx = 2 * 167 =
fx = 2 * 166 =
fx = 2 * 165 =
fx = 3 * 164 =
Y así sucesivamente.
X f fx
167 02 334
166 02 332
165 02 330
164 03 492
163 04 652
162 03 486
161 04 644
160 04 640
159 01 159
TOTAL 25 4069
2. Aplicamos la fórmula:
xf
Ⴟ = ---------
N
4.069
Ⴟ = ---------
25
F * Xm
Ⴟ = -------------
N
Ⴟ = Media Aritmética
N = Número de casos
PROCEDIMIENTO:
EJEMPLO:
X f
65 – 61 04
60 – 56 07
55 – 51 16
50 – 46 27
45 – 41 41
40 – 36 67
35 – 31 99
30 – 26 191
25 – 21 83
TOTAL 535
34
X f Xm fXm
65 – 61 04 63 252
60 – 56 07 58 406
55 – 51 16 53 848
50 – 46 27 48 1.296
45 – 41 41 43 1.763
40 – 36 67 38 2.546
35 – 31 99 33 3.267
30 – 26 191 28 5.348
25 – 21 83 33 1.909
TOTAL 535 17.635
F*Xm
Ⴟ = -------------
N
17.635
Ⴟ = -------------
535
Ⴟ = 32,963 33 años
Como en este caso n = 5 (número n), hay un solo valor central que es 3.3, y éste
es el valor de la mediana. Es decir, Me = 3.3
Nótese que la mediana (3,3) es un valor más típico que la media aritmética (8).
35
Estaturas (cm): 162 158 170 151 163 168 167 153 152 173
Ordenando: 151 152 153 158 162 163 167 168 170 173
162 + 163
Me =
2
Me = 162,5
Peso (Kg): 63 52 78 49 71 62 68 48 56 67
Ordenando: 48 49 52 56 62 63 67 68 71 78
62 63
Me 62,5
2
NOTA: La mediana es un valor que divide a los datos en mitades. Una con todas
las observaciones mayores o iguales a la mediana y otra con aquéllas menores o
iguales a ella. Para conjuntos de datos asimétricos (histogramas con largas
colas), es mejor medida de tendencia central que la media.
[ (N/2) - fa.m]
Me = Li + * i
f
Donde:
Me = Mediana
36
Por ejemplo:
X f
65 – 61 04
60 – 56 07
55 – 51 16
50 – 46 27
45 – 41 41
40 – 36 67
35 – 31 99
30 – 26 191
25 – 21 83
TOTAL 535
DESARROLLO
X f fa
65 – 61 04 535
60 – 56 07 531
55 – 51 16 524
50 – 46 27 508
45 – 41 41 481
40 – 36 67 440
35 – 31 99 373
30 – 26 191 274
25 – 21 83 83
TOTAL 535
535
N= ---------
2
N= 267,5
25 + 26
Li = ----------
2
Li = 25,5
37
7. Aplicamos la fórmula:
[ (N/2) - Fa.m]
Me = Li + * i
F
267,5 - 83
Me = 25,5 + * 5 Me = 30,33
191
Otra medida de tendencia central que se usa, aunque con menor frecuencia que
las anteriores, es la Moda (Mo), cuyo nombre se explica perfectamente a partir de
la definición.
La Moda (Mo) de un conjunto de datos, es el valor (si existe) que ocurre con
mayor frecuencia. Si es un valor único decimos que la distribución de frecuencias
es unimodal. Si se tienen dos o más valores con la misma frecuencia máxima
decimos que la distribución es bimodal, trimodal, etc.
La moda es una medida de tendencia central que es poco usada por las
siguientes razones:
10 7 8 7 9 8 7 9
Peso (Kg): 63 52 78 49 71 62 68 48 56 67
Mo = No existe
Estatura (cm): 162 158 167 151 162 168 167 153 152 173
38
x = Me = Mo = 8.5
14 15 16 13 17 15 18 15
La Moda es: 15
Por los problemas que se mencionaron antes, la moda es una medida muy útil
cuando se consideran los datos individualmente. Sin embargo cuando se calculan
en una tabla de frecuencias, la moda adquiere mayor importancia, ya que es más
frecuente que sea un valor único. Para propósitos descriptivos es suficiente
reportar la clase modal, que es la clase cuya frecuencia absoluta es mayor. Si se
desea un valor único se toma el valor medio de la clase modal.
X f
20 02
19 01
18 02
17 04
16 08
15 13
14 03
13 01
12 01
35
d1
Mo = Li + * i
d1 + d2
De donde:
Mo = Moda
Li = Límite Real Inferior
d1 = Diferencia entre la frecuencia modal y la frecuencia
posterior
d2 = Diferencia entre la frecuencia modal y la frecuencia anterior
i = Intervalo
Para este ejemplo se considera el mismo de la edad de los profesores del Colegio
está dado en el presente cuadro estadístico:
X f
65 – 61 04
60 – 56 07
55 – 51 16
50 – 46 27
45 – 41 41
40 – 36 67
35 – 31 99
30 – 26 191
25 – 21 83
TOTAL 535
Calcular la Moda:
Li = 25,5
d1 = 191 - 83
40
d1 = 108
d2 = 191 - 99
d2 = 92
5. Aplicamos la fórmula:
d1
Mo = Li + * i
d1 + d2
108
Mo = 25,5 + * 5
108 + 92
Mo = 28.2 Respuesta.
EVALUACION