Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Técnicas de muestreos.
MUESTREO ALETORIO SIMPLE.
Todos los componentes de la población tienen exactamente las mismas
posibilidades de formar parte de la muestra y son elegidos al azar, mediante
sorteos o funciones RND informáticas.
Es el más utilizado en estadística, pero, en poblaciones muy numerosas, es el
menos fiable.
MUESTREO SISTEMÁTICO:
Este muestreo selecciona de forma aleatoria al primer individuo de la población
que hará parte del estudio y luego, define un intervalo para completar la muestra.
Muestreo no probabilístico.
MUESTREO DE BOLA DE NIEVE.
Esta técnica ayuda a los investigadores a encontrar muestras cuando son difíciles
de localizar. Es útil si el tamaño de la muestra es pequeño y no está disponible
fácilmente.
1 CUALITATIVA NOMINAL
VARIABLE
CUALITATIVA Aquellas variables que no
siguen ningún orden en
Son aquellas SE DIVIDEN EN específico.
características o LAS SIGUIENTES
cualidades que no 2 CUALITATIVA ORDINAL
pueden ser calculadas Aquellas que siguen un orden
con números, sino que o jerarquía, por ejemplo: Nivel
lo hacen con palabras. socioeconómico (Alto, medio,
bajo).
3 CUALITATIVA BINARIA
TIPOS DE En este caso, las variables
VARIABLES son solamente dos, por
ejemplo. Si o No. Hombre o
Mujer.
1 CUANTITATIVA DISCRESTA
VARIABLE
CUANTITATIVAS Aquellas variables que usa
valores enteros y no finitos.
Las variables Por ejemplo: La cantidad
cuantitativas son SE DIVIDEN EN
LAS SIGUIENTES de familiares que tiene una
aquellas características persona (2,3,4 o más).
o cualidades que si
pueden expresarse y 2 CUANTITATIVA CONTINUA
medirse a través de
números. Aquellas variables que
utiliza valores finitos y
objetivos. Suele
caracterizarse por utilizar
valores decimales. Por
ejemplo; (64.3 Kg, 72.3 Kg,
etc).
GRAFICAS ESTADISTICAS
GRAFICA CIRCULAR
También llamado gráfico de torta muestra la distribución de determinado total en
diferentes partes. Es una herramienta valiosa para las cosas en las que se conoce
el absoluto, y lo que interesa es conocer la forma en la que este se reparta en
varias partes.
Para realizar un gráfico de torta se debe dibujar un circular con un compás, dibujar
el radio del círculo y con un transportador calculas los siguientes datos. Colorear
cada porción de la tabla con un color.
GRAFICAS DE LINEA.
El diagrama o gráfico lineal se compone de una serie de puntos que al unirlos te
muestran una línea completa con los cambios de una variable a lo largo del
tiempo.
En este gráfico, los datos no se representan con barras o por trozos, si no con
puntos ubicados en el cruce de un eje x, que representa la variable del tiempo, y
un eje y, donde se ubica la variable continua que estás estudiando, como el
tamaño de una mascota, por ejemplo. Este tipo de diagramas son muy útiles
cuando cuentas con una variable cuantitativa y quieres ver su comportamiento en
el transcurso del tiempo.
Para realizar un gráfico lineal en papel se deben dibujar los dos ejes
nombrándolos con la variable que representan. Por ejemplo, x: cantidad de año; y:
cantidad de edificios. Luego se introduce el rango y escala de cada variable.
Marca cada dato con un punto y posteriormente unir los puntos con una línea.
HISTOGRAMA CON POLIGONO DE FRECUENCIA ACUMULADA
(OJIVAS)
Es un gráfico que muestra la frecuencia acumulada asociada a un conjunto de
datos, sirven para saber el número de datos que se encuentran debajo de un valor
determinado.
PARA REALIZARLO:
1. Calcular las frecuencias absolutas acumuladas del conjunto de datos.
2. Representar el eje horizontal y el eje vertical del gráfico. En general, eje
horizontal corresponde a los límites de los intervalos y el eje vertical a las
frecuencias acumuladas.
3. Representar las frecuencias absolutas acumuladas como puntos en la
gráfica.
4. Unir los puntos consecutivos del grafico mediante una línea para formar la
ojiva.
EJEMPLO:
DATOS NO AGRUPADOS
Los datos no agrupados son los datos sin procesar, y las estadísticas correctas
pueden ser determinadas. Los datos no agrupados son usualmente el punto de
inicio de los análisis.
Es el conjunto de datos obtenidos en la recopilación, una vez que se han
recopilado los datos, el siguiente paso consiste en organizarlos.
Cuando la muestra que se ha tomado de la población o proceso que se desea
analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos
datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que
se le llama tratamiento de datos no agrupados.
DATOS AGRUPADOS
Es aquella distribución en la que la disposición tabular de los datos estadísticos se
encuentra ordenados en clases y con la frecuencia de cada clase; es decir, los
datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase. Los datos agrupados significan que hay menos datos
con los cuales trabajar y mis estadísticas serán aproximadas. Los datos
agrupados se refieren al hecho de que estén ordenados, clasificados y contados
Distribución o tabla de frecuencias Para agrupar u organizar un conjunto de datos
se construye una tabla llamada tabla de frecuencias o distribución de frecuencias
simple.
MEDIDAS DE TENDENCIA (MEDIA, MEDIANA Y MODA)
MEDIA
Es la cantidad que se obtiene al sumar todos los datos de un conjunto de valores
para posteriormente dividir la cifra obtenida entre la cantidad de valores
analizados. El resultado se expresa en la misma unidad que los datos originales:
metros, litros, gramos, horas, etc.
MEDIANA
La mediana es el valor de la variable que ocupa la posición central, cuando los
datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones
tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o
superiores a la mediana.
MODA
La moda es la variable que más se repite en un conjunto de datos o muestra
poblacional. Una muestra puede presentar más de una moda. No hay una forma
específica para obtener esta información, solamente hay que verificar cuál es el
resultado que más se repite.
MEDIDAS DE DISPERSION COMO SON:
VARIANZA
La varianza es una medida de dispersión que representa la variabilidad de una
serie de datos respecto a su media. Formalmente se calcula como la suma de los
residuos al cuadrado divididos entre el total de observaciones.
DESVIACION ESTANDAR
Es otra medida que ofrece la dispersión respecto a la medida. Su cálculo es
exactamente el mismo que la varianza, pero realizando la raíz cuadrada de su
resultado.
COEFICIENTE DE VARIACION
Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de
la media del conjunto y por lo general se expresa en porcentaje para su mejor
comprensión.
RANGO
El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística.
ANALISIS DE CORRELCION Y REGRESION
Donde:
“x” es igual a la variable número uno, “y” pertenece a la variable número dos,
“zx” es la desviación estándar de la variable uno, “zy” es la desviación estándar
de la variable dos y “N” es número de datos.
Calificaciones en Estadistica de
alumnos de II semestre.
12
10
10
8
Frecuencia
6 7
4
4 4
2 3
2
0
5 6 7 8 9 10
Calificaciones
EJERCICIO 2
Realiza la tabla de distribución simple para datos no agrupados y realiza su grafica
de barras.
Supongamos que en el proyecto sembrando vida se necesita conocer las culturas
en cm de los árboles se toma una muestra de 20 árboles.
Muestra: 64,73,68,76,70,62,67,71,69,68,60,65, 68,66,68,67,71,66,72,68
1. El 25% cuantos arboles representa y que altura tiene
5 árboles que representan el 25% del total y tienen 68 cm.
3. El 70% del total cuantos arboles representa y entre que altura se encuentra.
14 árboles que representan el 70% del total, tienen entre 60 y 69 cm.
Variable Frecuencia f. relativa f. f. f. f.
(%) acumulada acumulada acumulad acumulada
(+) (+) % a (-) (-) %
60 1 5 1 5 20 100
62 1 5 2 10 19 95
64 1 5 3 15 18 90
65 1 5 4 20 17 85
66 2 10 6 30 16 80
67 2 10 8 40 14 70
68 5 25 13 65 12 60
69 1 5 14 70 7 35
70 1 5 15 75 6 30
71 2 10 17 85 5 25
72 1 5 18 90 3 15
73 1 5 19 95 2 10
76 1 5 20 100 1 5
TOTAL 20 100
3
2
1
0
60 62 64 65 66 67 68 69 70 71 72 73 76
Altura en cm. de arboles
EJERCICIO 3
Investigar un ejercicio de cualquier tema y desarrolla la tabla de distribución simple
para datos no agrupados y realizar su grafica de barra mínimo de 30 datos
Se realizó un examen de química a los alumnos del 3er grado de secundaria y sus
notas obtenidas fueron las siguientes.
Notas: 5,8,7,9,10,6,7,5,8,5,6,9,8,5,6,9,6,10,9,7,8,9,10,5,8,5,6,8,7,5
Calificaciones en Quimica de
3ro de secundaria.
8
7
6
5
Frecuencia
4
3
2
1
0
5 6 7 8 9 10
Calificaciones
ACTIVIDAD 2
Ejercicios de tabla de distribución para datos no agrupados.
5
4
VARIABLE
3 3 3 3
2 2 2 2 2 2
1 1 1 1 1 1 1
50 51 52 54 55 60 64 67 69 72 75 77 79 85 86 87 88 94 95
FRECUENCIA
Ejercicio 2. Ejercicio de datos agrupados
Los siguientes datos representan los precios de planchas eléctricas en 36 tiendas,
realizar tabla de distribución de frecuencias utilizando el conteo de paréntesis
cerrados según visto en la clase y realizar grafica histograma con polígonos de
frecuencia.
60,61,65,65,66,66,66,66,67,67,68,69,69,70,70,70,72,72,72,73,74,74,74,74,75,75,
75, 76,77,78,78,79,79,79,80,82
Tamaño de la muestra: n=36
Rango =xmax–xmin= 82-60=22
Nº de intervalo de la muestra (k)=1+3.322long (n)= 1+3.322(36) =6.17=6
Amplitud= A=R/K=22/6=3.6=4
Rango= 22
K= 6
Amplitud= 4
N° de Intervalo Marca de f. f. f. relativa f. relativa
clase Li Ls clase xi absoluta acumulada porcentual % acumulada
fi fa
1 (60-63) 61.5 2 2 5.5 5.5
2 (64- 67) 65.5 8 10 22.2 27.7
3 (68-71) 69.5 6 16 16.6 44.3
4 (72-75) 73.5 11 27 30.5 74.8
5 (76-79) 77.5 7 34 19.4 94.2
6 (80-83) 81.5 2 36 5.5 99.7
36 99.7
12 11
11
10
8
8 8 7
6 7
6 6
2 2 2
0
Marca de clase
Ejercicio 3
Con los siguientes datos que representan el tiempo dedicado al estudio fuera de
clases.
Realiza un conteo con paréntesis abierto.
1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,6,6,6,6,6,6,7,7,8,8,8,9,9,
10,10,10,10,11,11,11,11,12,12,12,12,13,13,14,15,15,16,16,17,17,18,18,20,21,22,
23
Rango= 22
Rango= 23-1= 22
K= 7
Intervalo K= 1+3.32long (70) = 7.12=7
A= 4
Amplitud= A=R/K= 22/7=3.14=4
Nº Clase Marca de f. f. f. f. relativa f. relativa f.
clases Li Ls clase xi absolut acumulada relativa porcentual acumulada porcentual
a fi fa fr fr% fra acumulada
fra%
Frecuencia absoluta
20
15
10
5
24 17 14 7 5 3
Ejercicio
0 4. Conteo con nuevo rango.
(1-5)con los
Realizar (5-9) (9-13) datos
siguientes (13-17) (17-21)
la siguiente (21-25) de distribución de frecuencia y
tabla
graficar. (Histograma conClasespolígono de frecuencia y dar la conclusión del ejercicio.)
Peso en kg de 30 personas:
50,50,52,53,55,56,56,56,56,57,58,58,58,58,59,60,61,61,63,63,63,63,64,64,64,64,
65,65,68,68
Rango= 68-50= 18 Rango= 18
10
Frecuencia absoluta
6
10
4
7
6
2 4
3
0
(49-53) (53-57) (57-61) (61-65) (65-69)
Intervalo de edades
ACTIVIDAD 3
Ejercicio 2
Una fábrica lanza al mercado un nuevo tipo de lampara incandescente. Para
determinar la vida útil promedio de esas lámparas, se escogieron al azar 120 y se
le sometió a una prueba de duración, obteniendo los datos siguientes.
Media: 7.03
Mediana: 7.0
Moda: 7.0
∑ Fx 843.6
x= =x =7.03
N 120
Media x=
∑ xf 614
=8.7
n 70
(n /2 fi−1∗ai)
Mediana= Me= Li +
fi
n
=70 ÷ 2=35
2
Li= 5 N=70 fi-1= 24 fi= 17 ai=4
N
fi−1
Me= 2
Li+ ∗ai
fi
Tiempo dedicado al estudio fuera
de clases
70 30
5+ −24
Frecuencia absoluta.
Me= 2 *4 25
17 20
11 15
Me= 5+ ∗4 24
17 10
17
14
Me= 5+2.58 5
7 5 3
0
Me= 7.58 24 17 14 7 5 3
fi−fi−1
Mo= Li+ ∗ai
( fi−fi−1 )+(fi−f +1)
24
1+ ∗4
( 24 ) + ( 24−17 )
24
1+¿ ∗4
31
Medidas de dispersión
Varianza poblacional
2
σ =¿ ¿
Coeficiente de variación.
σ 10.58
C.V= ∗100 %= ∗100 %=121.6 %
x 8.7
Rango.
32
66+ ∗2
42
66+1.52=67.52
M =67.52
MODA
fi−fi−1
Li+ ∗2
( fI−fI −1 )+ ( fi−f +1 )
42−18
66+ ∗2
( 42−18 ) + ( 42−27 )
24
66+ ∗2
24+ 15
24
66+ ∗2
39
66+ ( 0.61 )∗2
66+1.22 Mo=67.22
Medidas de dispersión.
Varianza poblacional.
2
σ =¿ ¿
Desviación estándar poblacional.
σ =√ ¿ ¿ ¿
Coeficiente de variación.
σ 2.91
C . v= ∗100 %= ∗100 %=0.0431∗100 %=4.31
x 67.45
Rango.
R=V . max−min=74−60=14
15
27
10 18
5 8
5
0
60-62 63-65 66-68 69-71 72-74
Ejercicio 5
A completar la siguiente tabla de distribución para datos no agrupados.
En un centro de estudios los profesores imparten clases, ellos necesitan saber
cuál es el promedio de las horas trabajadas en un mes así también la desviación
típica hay con respecto a la media. Tomar los siguientes datos como si fuera
una población.
Variable horas de clases.
Intervalo Marca de frecuencia f. Producto
de clase clase (x) (f) acumulada xf ( x−x )2 ( x−x )2 * f
(horas) (fa)
55-60 57.5 5 5 287.5 213.45 1067.25
60-65 62.5 18 13 1125 92.35 1662.3
65-70 67.5 20 43 1350 21.25 425
70-75 72.5 50 93 3625 0.15 7.5
75-80 77.5 17 110 1317.5 29.05 493.85
80-85 82.5 16 126 1320 107.95 1727.2
85-90 87.5 4 130 350 236.85 947.4
130 6330.5
n 130
= =65 Li= 70 N= 130 fi-1= 20 fi= 50 ai= 5
2 2
130
−20
2 45
70+ ∗5=70+ ∗5=70+ 0.9∗5=70+ 4.5=74.5
50 50
MODA
fi−fi−1
Li+ ∗5
( fi−fi−1 )+ ( fi−f +1 )
50−20
70+ ∗5
( 50−20 )+ ( 50−17 )
30
70+ ∗5
30+33
30
70+ ∗5
63
70+0.47∗5
70+2.3
Mo=72.3
Medida de dispersión.
Varianza poblacional
2
σ ¿¿¿
σ =√ ¿ ¿ ¿
Coeficiente de variación.
σ 6.97
C . v= ∗100 %= ∗100 %=9.66
x 72.11
Rango.