Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Araujo
Araujo
Básica y Media
OBJETIVOS: presentar una visión general de la Estadística y
sus aplicaciones, los procedimientos para recolección de datos,
su clasificación y organización, los requerimientos de una buena
investigación por muestreo y los errores que se pueden cometer
en una encuesta.
Mostrar cómo grandes conjuntos de datos numéricos pueden
organizarse y presentarse de manera eficaz, con el propósito de
favorecer el análisis y la interpretación de los datos, aspectos
claves del proceso de planificación y toma de decisiones.
Describir de manera conveniente las características de los datos
mediante tablas, diagramas y representaciones gráficas; es decir
presentar las técnicas básicas para realizar el análisis de los
datos.
Motivar a directivos y profesores de colegios para que la
estadística sea considerada importante en la formación y el
curriculum académico del estudiante, con la finalidad de que
forme parte de la cultura general en nuestro país.
1. INTRODUCCION
2
Sin embargo en muchas ocasiones no existe la información que
requerimos, y para obtenerla debemos diseñar un experimento,
o realizar un estudio basado en la observación del
comportamiento de interés, o hacer una investigación por medio
de una encuesta dirigida a una muestra de la población objeto
del estudio.
3
Para aclarar estos términos, en el siguiente tema, se introducen
algunas definiciones fundamentales.
2. DEFINICIONES BASICAS
3. TIPOS DE DATOS
4
Datos categóricos (variables cualitativas) y datos numéricos
(variables cuantitativas).
5
Variable discreta si los datos corresponden a respuestas
numéricas que provienen de un proceso de conteo.
6
determinar el diseño y el tamaño de la muestra con los
requerimientos más rigurosos.
7
El proceso de selección de una muestra aleatoria simple no
necesariamente es el mejor o el más económico de los métodos
de muestreo de probabilidad, pero proporciona la base a partir
de la cual han evolucionado los otros procedimientos.
8
representación en miniatura de la población, y por tanto se
espera obtener estimaciones razonables de sus características.
9
Numerados los elementos del marco de lista de la población, se
obtiene la muestra aleatoria seleccionando aquellos miembros
cuyos códigos concuerden con los dígitos extraídos de la urna.
10
deben examinar las respuestas buscando su integridad y posibles
errores para corregirlos.
11
Error de medición: que se refiere a inexactitudes en las
respuestas registradas.
Error de muestreo: que refleja la heterogeneidad, o las
diferencias de oportunidad, entre las muestras.
12
Ejemplo 1: los siguientes datos corresponden al número
(aproximado y en miles) de Unidades de Producción
Agropecuarias (UPAs) de cada provincia del país (resultados
del Censo Nacional Agropecuario CNA del año 2000)
Mo ZNA
Loja LoRiMana Sa Napo Orel Past Pich Sucu Tung ZaCh s
66 42 75 17 5 6 5 64 8 71 9 4
ZNA Mo
Prov Gala s Napo Past Orel Sucu ZaCh Carc Esme Sa ElOr
UPAs 1 4 5 5 6 8 9 13 16 17 22
Caña Imba Boli LoRi Pich Guay Loja Coto Tung Mana Chim Azua
32 34 39 42 64 65 66 68 71 75 82 99
13
Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba
UPAs 600 169 207 153 350 404 526 385 19 3309 344
Mo ZNA
Loja LoRiMana Sa Napo Orel Past Pich Sucu Tung ZaCh s
405 650 1186 115 79 86 62 2389 129 441 77 73
14
el rango o extensión (la diferencia entre el valor máximo y el
mínimo) es un medida de dispersión.
9. DIAGRAMAS Y GRÁFICOS
15
Representación de puntos del ejemplo 1
0 20 40 60 80 100
9 9
8 2
7 1/5
6 4/5/6/8
4 2
3 2/4/9
2 2
1 3/6/7
0 1/4/5/5/6/8/9
Ejercicio 5: Hacer al menos un diagrama (adicional) de tallo y
hojas con los datos del ejemplo 1, y dos diagramas con los
datos del ejercicio 1.
16
Gráfico de pastel: es una forma de resumir un conjunto de datos
categóricos. Es un círculo dividido en segmentos, donde el área
de cada uno de los segmentos es proporcional al número de
casos en la categoría correspondiente.
17
Población Nacional Por Categorías de Area
Rural Urbana
38.9%
Urbana Rural
61.1%
18
(g) Población (nacional masculina mayor a diez años) de
analfabetos por categorías quinquenales de edad
(respectivamente femenina)
19
N° 1337 1362 1341 1241 1169 947
habitantes
30 a 34 35 a 39 40 a 44 45 a 49 50 a 54 55 a 59 60 a 64
863 775 674 539 463 339 294
65 a 69 70 a 74 75 a 79 80 a 84 85 a 89 90 a 94 95 y más
244 195 143 97 63 39 32
Ejercicio
20 a 24 años8: realizar el gráfico de barras con los datos del
ejemplo 2.
10 a 14 años
0 a 4 años
Ejercicio 9:0 hacer
200 el gráfico
400 600de pastel,
800 y el 1200
1000 de barras,
1400 de
1600los
siguientes datos, que corresponden a la superficie (área)
N° habitantes
nacional según el uso del suelo (resultados del CNA 2000)
20
Se pueden representar datos numéricos si se elabora
previamente una tabla de frecuencias, en este caso el gráfico se
denomina histograma (los detalles de este procedimiento se
exponen en el siguiente tema).
CONDICION JURIDICA
Cate- Persona Soc.Hecho Soc. Institució Otras
sin n
goría Individua Contrato Legal Pública Condiciones
l Legal
UPAs 577 56 10 9 13
Sociedad de
Para crear la tabla de frecuencias con datos categóricos
Hecho se
8.4% 2.0%
cuenta el número de veces en la que aparece cada dato, es decir
se calcula el número de 4.8%elementos de cada una Sociedad
de las
1.4% Legal
categorías.
86.8%
1.5% Institución
Si los datos son numéricos se tiene que crear una partición
Pública del
intervalo que contiene a todos los valores, es decir dividirlo en
Otras
Condiciones
21
grupos de subintervalos, y se cuentan cuantos elementos están
en cada clase.
22
Para cada observación se determina a que clase pertenece para
calcular la frecuencia absoluta de cada clase.
4 5
5 3
0
De 1 a < 25.5 De 25.5 a <50 De 50 a <74.5 De 74.5 a 99
UPAs (en miles)
m = ( xi ) / n
23
Si los datos están dispuestos en una tabla de frecuencias
agrupados en clases (subintervalos) aquella que tiene la mayor
frecuencia se denominará clase modal y puede asumirse que, de
manera aproximada, la moda es su punto medio.
m = ( ni xi ) / n
Número de 0 1 2 3 4 5 6 7 8 9 10 y
hijos vivos mas
Número de 9 600 637 534 346 237 173 122 90 60 74
madres
24
Asumiendo que en la última categoría las 74 madres tienen en
promedio 11 hijos, se puede obtener que el valor aproximado de
la media es:
s = ( ( (xi - m)2/(n-1) )½
25
Cuando la distribución es normal (o parecida a ella) el intervalo
en mención: (m-3s;m+3s) contiene al menos el 99% de las
observaciones.
26
Ejercicio 11: Revisar los ejemplos del texto de Galindo
relacionados con las medidas de dispersión.
Q1-1,5RIQ Q1 Q2 Q3
Q3+1,5RIQ
Los datos que caen fuera de estas dos vallas (dadas por las dos
rectas trazadas) se consideran como valores atípicos.
27
Existen otras medidas de dispersión (poco usuales) como por
ejemplo:
28
Rural 2.392.39 2.332.86 4.725.253
1 2
Total 6.018.35 6.138.25 12.156.608
3 5
29
Rural 19,7% 19,2% 38.9%
Total 49,5% 50,5% 100,0%
30
una relación lineal entre dos variables: X=(x1,x2,...,xn) y
Y=(y1,y2,...,yn).
b1 = SCXY / SCXX ;
31
Dentro del análisis estadístico se debe determinar además si los
coeficientes son significativos, es decir si se acepta o rechaza la
hipótesis de nulidad de los parámetros correspondientes a bo y
b1.
32
Si el tamaño de la muestra está entre 10 y 13 el factor es
aproximadamente igual a 2,2 ; y está alrededor de 2,3 si n es
igual a 8 o 9 .
33
17. EL PROGRAMA CURRICULAR DE LA
ESTADISTICA EN LA EDUCACION BASICA Y MEDIA.
34
La propuesta es excelente, pero talvez es muy desagregada y
algo temprana; se podría empezar en sexto año de básica con
los temas sobre recolección de datos, diagramas de puntos y de
barras y medidas de tendencia central como la media, la
mediana y la moda; en el séptimo año básico se deberían
introducir otras representaciones como la de tallo y hojas y la
circular, o de pastel, y de paso recordar las de puntos y barras,
definir el rango y el rango intercuartil para la representación de
caja; y en los años: octavo, noveno y décimo seguir los
planteamientos de la Reforma Curricular.
35
económica, etc de su provincia o del país y compararla con la
de otros países del mundo. Es por esta razón que la Estadística
podría ser el medio para lograr otros conocimientos e incluso
para realizar ciertas investigaciones, basadas en encuestas por
muestreo aleatorio, en diversas disciplinas.
Bibliografía:
36