Documentos de Académico
Documentos de Profesional
Documentos de Cultura
08 Estadistica
08 Estadistica
Unidad de análisis:
Es el objeto del cual se desea obtener información. Muchas veces nos
referimos a las unidades de análisis con el nombre de elementos.
Es un subconjunto de unidades de
análisis de una población dada,
destinado a suministrar información
sobre la población.
La muestra debe ser representativa, en
el sentido de que las conclusiones
obtenidas deben servir para el total de
la población.
VARIABLE
Es la cualidad o cantidad medible que se estudia de las unidades de análisis y
que varían de una unidad a otra. Por ejemplo: edad, ingreso de un individuo,
sexo, cantidad de lluvia caída, etc.
VARIABLES CUANTITATIVAS:
VARIABLES
Las variables cuantitativas según el tipo de valores CUALITATIVAS
que pueda tomar pueden ser discretas o continuas.
La característica que
VARIABLE CONTINUA VARIABLE DISCRETA miden de la unidad de
Surgen por procesos de Surgen por procesos de análisis es una cualidad.
medición. conteo. como categorías o
atributos.
• Se refiere a la recolección, presentación, descripción, análisis e
interpretación de una colección de datos. Esencialmente
consiste en resumir éstos mediante medidas descriptivas que
caracterizan la totalidad de los mismos.
Los datos para que sean útiles se deben organizar de manera que
faciliten su análisis, se puedan seleccionar tendencias, describir relaciones,
determinar causas y efectos y permitan llegar a conclusiones lógicas y
tomar decisiones bien fundamentadas; por esa razón es necesario
conocer los métodos de Organización y Representación, la finalidad de
éstos métodos es permitir ver rápidamente todas las características
posibles de los datos que se han recolectado.
Una forma de presentar ordenadamente un grupo de observaciones,
es a través de tablas de distribución de frecuencias. La estructura de
estas tablas depende de la cantidad y tipo de variables que se están
analizando, siendo las más simples las que se refieren a una variable.
Categorías o
Frecuencias
Recorrido de la
Observadas
variable
TOTAL n
k
Frecuencia Absoluta : Es la cantidad de veces que se
n fi repite un valor particular de la variable. La suma de las
i 1 frecuencias absolutas simples debe ser igual a la cantidad de
valores observados.
fi
ri Frecuencia Relativa: Es el cociente entre la
n frecuencia absoluta y el total de observaciones.
Frecuencia
Frecuencia Frecuencia Frecuencia Relativa
Nota Absoluta
Absoluta Relativa Acumulada
Acumulada
1 1 1 1/25 1/25
2 4 5 4/25 5/25
3 3 8 3/25 8/25
4 5 13 5/25 13/25
5 6 19 6/25 19/25
6 2 21 2/25 21/25
25
De esta tabla se pueden sacar conclusiones como:
Número de clases
Se puede obtener uniendo cada punto medio (marca de clase) de los rectángulos
del histograma con líneas rectas, teniendo cuidado de agregar al inicio y al final
marcas de clase adicionales, con el objeto de asegurar la igualdad del áreas.
Tomemos por ejemplo la siguiente distribución por intervalos de clase
correspondiente al volumen de ingresos (en millones de pesos) de 50
empresas constructoras en agosto del año 2017.
Intervalos de clase fi
45-55 6
55-65 10
65-75 19
75-85 11
85-95 4
n 50
Medidas de Posición
Medidas de Dispersión
Medidas de Forma
Media Aritmética
Mediana
Modo
Para datos agrupados por tablas de frecuencias, la fórmula correspondiente es:
x ni i (Datos muestrales)
x f
xi f i
x n (Datos muestrales)
Aclaración:
x es el punto medio de cada intervalo marca de clase
i
f es la frecuencia de cada intervalo
i
x
x
i fi
1 1 2 4 3 3 4 5 5 6 6 2 7 4 108
4,32
n 25 25
Intervalos de
x i xi f i
El volumen de ingreso promedio
fi
clase
𝒏+𝟏
Es el valor que ocupa la posición en la serie ordenada de
𝟐
datos.
3 3 8
Entonces (Me)°=26/2= 13 por lo
4 5 13
tanto el valor de la mediana
5 6 19
coincide con la observación 12.
6 2 21
𝑴𝒆 = 𝟒 𝒑𝒖𝒏𝒕𝒐𝒔
7 4 25
25
Para datos agrupados con intervalos de clase
65-75 19 35
75-85 11 46 n 50
2 Fant 2 16
85-95 4 50 Me Li a 65 10 69, 74
f 19
n 50
Es el valor de la variable que más veces se repite, es decir, aquella
cuya frecuencia absoluta es mayor. Puede haber más de una moda
en una distribución.
Para datos agrupados por tablas de frecuencias
Frecuencia
Nota
Absoluta El modo corresponde al valor de variable de
1 1 mayor frecuencia.
2 4
Mo = 5 puntos
3 3
4 5
5 6 Por lo tanto la nota que se da con mayor
frecuencia es 5 puntos.
6 2
7 4
25
Para datos agrupados con intervalos de clase
Intervalos de fi
clase d1 9
M o Li a . 6 5 10 . 70, 29
d1 d 2 9 8
45-55 6
55-65 10
65-75 19
El volumen de ingreso en pesos durante el
75-85 11
85-95 4 mes de agosto del 2017 de mayor frecuencia
n 50 fue $70,29.
Percentiles
Son valores que dividen a la distribución en 100 partes iguales
55-65 10 16
30% de 50 50 . 0, 30 15
65-75 19 35
k .n 30.50
75-85 11 46
100 Fant 100 6
85-95 4 50 P30 D3 Li a 55 10 64
f 10
n 50
El ingreso por venta del 30% de la empresas que menos ingreso tienen es
de $64.
Rango
Varianza
Desvío Entandar
Coeficiente de Variación
Es la diferencia entre el mayor y el menor valor de la variable.
1 n 2
s
x x .f
2
n 1 i 1 i i
Para datos agrupados por tablas de frecuencias
n 2
( x i x ) . fi
s i 1
2
n1
n
( x x ) . f
2
s 2 i 1
i i
n1
Es la raíz cuadrada de la varianza. Es una medida de dispersión
absoluta. Cuanto mayor es su valor, mayores son las diferencias
de las observaciones con respecto a la media.
s s2
Una desviación estándar
grande indica que los
puntos están lejos de la
media.
:
Si el coeficiente de variación es menor o igual al 20% se considera que
la distribución de los datos es homogénea, y que la media es
representativa del conjunto de datos. Si es mayor al 20%, los datos serán
heterogéneos.
R Vmáx Vmín 95 45 50
Intervalos de
clase fi x i xi x 2 f i
x x fi
2
6082
45-55 6 50 2258,16 s
2
124,12
55-65 10 60 883,6
n1 49
65-75 19 70 6,84
75-85 11 80 1235,96
85-95 4 90 1697,44
s s 2 124,12 11,141
n 50 6082
s 11,141
CV 100 100 0,16 100 16%
x 69,4
El rango de variación en los ingresos es de $50.
La dispersión respecto del promedio es de $11,141.
La media es representativa del conjunto de datos ya que el
CV es menor al 20% , por lo tanto los datos son homogéneos.
Asimetría
Si x Me La distribución es simétrica