Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La Estadistica Descriptiva
La Estadistica Descriptiva
ESTADISTICA
DESCRIPTIVA
FACILITADOR: INTEGRANTES:
SECCION “B”
SAN FERNANDO- ESTADO APURE
INDICE:
DESCRIPCION: PAGINA
INTRODUCCION ………………………………………… N° 01
SECCION “B”
SAN FERNANDO- ESTADO APURE
INTRODUCCION:
Actualmente los datos suelen ser analizados con ordenador, por lo que deben
ser almacenados en archivos informáticos. Las bases de datos contienen datos
provenientes de un número de observaciones más o menos grande respecto de un
conjunto de variables que puede llegar a ser bastante grande. La generación de una
base de datos supone la codificación previa de las observaciones, la introducción
(grabación) de los datos en archivos informáticos, la depuración de los datos ya
grabados (detección y tratamiento de los errores de grabación y valores faltantes), y
eventualmente la realización de transformaciones y tratamiento de ficheros que
faciliten su posterior tratamiento estadístico.
SECCION “B”
SAN FERNANDO- ESTADO APURE
CONTENIDO
LA ESTADÍSTICA DESCRIPTIVA
SECCION “B”
SAN FERNANDO- ESTADO APURE
SECCION “B”
SAN FERNANDO- ESTADO APURE
Generalmente las tablas incluyen varías columnas con las frecuencias relativas
(son el número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o
"pi"), frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de
SECCION “B”
SAN FERNANDO- ESTADO APURE
SECCION “B”
SAN FERNANDO- ESTADO APURE
hora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar
inmediatamente que el intervalo con mayor número de datos es el 34-39, o que el
75% de los datos tiene valor inferior a 46.
Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en
una distribución de frecuencias
SECCION “B”
SAN FERNANDO- ESTADO APURE
Límites aparentes: Valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los
límites aparentes del intervalo con mayor número de frecuencias son 34 y 39.
Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites
son 33.5 y 39.5
Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por
dos. Mc del intervalo del ejemplo= 36.5
Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
inferior. En el ejemplo es igual a 6.
Es aquella distribución que indica las frecuencias con que aparecen los datos
estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que haya
hecho modificación al tamaño de las unidades originales.
Este tipo de distribución de frecuencia nos permite ver directamente con qué
frecuencia ocurrieron valores diferentes en nuestro conjunto de datos. Por ejemplo:
Y así.
SECCION “B”
SAN FERNANDO- ESTADO APURE
Por ejemplo, en los datos de nuestra encuesta de antes solo había 8 valores
únicos, por lo que tenía sentido crear una distribución de frecuencia no agrupada.
SECCION “B”
SAN FERNANDO- ESTADO APURE
SECCION “B”
SAN FERNANDO- ESTADO APURE
Son medidas estadísticas que se usan para describir cómo se puede resumir la
localización de los datos. Ubican e identifican el punto alrededor del cual se centran
los datos. Las más utilizadas son: la media, la mediana y la moda.
MEDIA
SECCION “B”
SAN FERNANDO- ESTADO APURE
MEDIANA
1. Calcular el valor
donde:
SECCION “B”
SAN FERNANDO- ESTADO APURE
= Total de frecuencias
MODA
Si todos los intervalos tienen la misma amplitud, la moda se calcula por medio
de:
SECCION “B”
SAN FERNANDO- ESTADO APURE
Obedeciendo a este concepto, se afirma que hay tres medidas que son comunes
para poder identificar el centro de los conjuntos de datos, que vienen a ser la media,
mediana y moda. cada una de ellas son ubicadas alrededor del punto donde los
datos se aglomeran.
Una desviación estándar baja indica que la mayor parte de los datos de una
muestra tienden a estar agrupados cerca de su media (también denominada el valor
esperado), mientras que una desviación estándar alta indica que los datos se
extienden sobre un rango de valores más amplio.
Rango intercuartílico:
SECCION “B”
SAN FERNANDO- ESTADO APURE
Se usa para construir los diagramas de caja y bigote (box plots) que sirven para
visualizar la variabilidad de una variable y comparar distribuciones de la misma
variable; además de ubicar valores extremos.
menor.
SECCION “B”
SAN FERNANDO- ESTADO APURE
DESVIACION ESTANDAR:
Ejemplo:
SECCION “B”
SAN FERNANDO- ESTADO APURE
VARIANZA:
Se refieren a la media aritmética de los cuadrados de las desviaciones de cada valor
respecto de la media aritmética de los datos, por lo que a veces también se
denomina desviación cuadrática media.
Se utilizan cualquiera de las fórmulas para obtener un resultado, va dependiendo si
se calcula toda una población o solo una muestra de esa población.
SECCION “B”
SAN FERNANDO- ESTADO APURE
SECCION “B”
SAN FERNANDO- ESTADO APURE
SECCION “B”
SAN FERNANDO- ESTADO APURE
CONCLUCION:
SECCION “B”