La Estadistica Descriptiva

SAN FERNANDO- ESTADO APURE
ESTADISTICA
DESCRIPTIVA
FACILITADOR: INTEGRANTES:
SECCION “B”
INDICE:
DESCRIPCION: PAGINA
INTRODUCCION ………………………………………… N° 01
LA ESTADISTICA DESCRIPTIVA ………………………………………… N° 02

DISTRIBUCCION DE FRECUENCIAS
………………………………………… N° 03
AGRUPADAS
DISTRIBUCCION DE FRECIENCIAS NO
………………………………………… N° 07
AGRUPADAS
MEDIDAS DE TENDENCIA CENTRAL PARA
………………………………………… N° 10
DATOS AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL PARA
………………………………………… N° 12
DATOS NO AGRUPADOS
MEDIDAS DE DISPERSIÓN DE DATOS
………………………………………… N° 13
AGRUPADOS
MEDIDAS DE DISPERSIÓN DE DATOS NO
………………………………………… N° 14
AGRUPADOS
CONCLUCION ………………………………………… N° 19
SECCION “B”
INTRODUCCION:
Actualmente los datos suelen ser analizados con ordenador, por lo que deben
ser almacenados en archivos informáticos. Las bases de datos contienen datos
provenientes de un número de observaciones más o menos grande respecto de un
conjunto de variables que puede llegar a ser bastante grande. La generación de una
base de datos supone la codificación previa de las observaciones, la introducción
(grabación) de los datos en archivos informáticos, la depuración de los datos ya
grabados (detección y tratamiento de los errores de grabación y valores faltantes), y
eventualmente la realización de transformaciones y tratamiento de ficheros que
faciliten su posterior tratamiento estadístico.
SECCION “B”
CONTENIDO
LA ESTADÍSTICA DESCRIPTIVA
es la técnica matemática que obtiene, organiza, presenta y describe un

conjunto de datos con el propósito de facilitar el uso, generalmente con el apoyo de
tablas, medidas numéricas o gráficas. Estas técnicas son utilizadas en el proceso de
investigación, en la etapa donde el investigador necesita procesar y analizar los
datos recolectados en dicho estudio.
El término estadística descriptiva (en el sentido de contar sustantivos contables)

es una técnica matemática que describe o resume cuantitativamente las
características de una colección de información, mientras que también puede
emplearse el mismo término (en el sentido de contabilizar sustantivos no
numerables) para el proceso de usar y analizar esas técnicas y resultados.
La estadística descriptiva se distingue de la estadística inferencial (o estadística

inductiva) por su objetivo de resumir una muestra, en lugar de utilizar los datos para
aprender sobre la población que se cree que representa la muestra de datos. Esto
generalmente significa que las estadísticas descriptivas, a diferencia de las
estadísticas inferenciales, no se desarrollan sobre la base de la teoría de la
probabilidad y, con frecuencia, son estadísticas no paramétricas. Incluso cuando un
análisis de datos extrae sus principales conclusiones utilizando estadísticas
inferenciales, generalmente también se presentan estadísticas descriptivas. Por
SECCION “B”
ejemplo, en los artículos que informan sobre sujetos humanos, normalmente se

incluye una tabla con el tamaño de la muestra general, los tamaños de la muestra
en subgrupos importantes (por ejemplo, para cada tratamiento o grupo de
exposición) y características demográficas o clínicas, como la edad promedio, la
proporción de sujetos de cada sexo, la proporción de sujetos con comorbilidades
relacionadas, etc.
Algunas medidas que se emplean comúnmente para describir un conjunto de

datos son las medidas de tendencia central y las medidas de variabilidad o
dispersión. Las medidas de tendencia central incluyen la media, la mediana y la
moda, mientras que las medidas de variabilidad incluyen la desviación estándar (o
varianza), los valores mínimo y máximo de las variables, la curtosis y la asimetría.
Distribución de frecuencias agrupadas
Las distribuciones de frecuencias son tablas en que se dispone las modalidades

de la variable por filas. En las columnas se dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que contienen los datos.
Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de

la exhibición de imágenes violentas por televisión, para lo cual han recogido los
siguientes datos:
SECCION “B”
La inspección de los datos originales no permite responder fácilmente a

cuestiones como cuál es la actitud mayoritaria del grupo, y resulta bastante más
difícil determinar la magnitud de la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la

variable acompañados del número de veces (la frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).
La distribución de frecuencias de los datos del ejemplo muestra que la actitud

mayoritaria de los individuos del grupo estudiado es indiferente. La interpretación de
los datos ha sido facilitada porque se ha reducido el número de números a examinar
(en vez de los 20 datos originales, la tabla contiene 5 valores de la variable y 5
frecuencias).
Generalmente las tablas incluyen varías columnas con las frecuencias relativas
(son el número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o
"pi"), frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de
SECCION “B”
los valores iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No

obstante, la frecuencia acumulada también es definida incluyendo al valor de
referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es el
total de frecuencias relativas de los valores iguales o inferiores al de referencia, y se
simbolizan "fr" o "pa")
Consideremos el siguiente grupo de datos:
La distribución de frecuencias es:
SECCION “B”
La reducción de datos mediante el agrupamiento en frecuencias no facilita su

interpretación: La tabla es demasiado grande. Para reducir el tamaño de la tabla
agrupamos los valores en intervalos, y las frecuencias son las de los conjuntos de
valores incluidos en los intervalos:
hora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar
inmediatamente que el intervalo con mayor número de datos es el 34-39, o que el
75% de los datos tiene valor inferior a 46.
Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".
Elementos básicos de las tablas de intervalos:
Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en
una distribución de frecuencias
SECCION “B”
Límites aparentes: Valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los
límites aparentes del intervalo con mayor número de frecuencias son 34 y 39.
Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites
son 33.5 y 39.5
Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por
dos. Mc del intervalo del ejemplo= 36.5
Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
inferior. En el ejemplo es igual a 6.
LA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS
Es aquella distribución que indica las frecuencias con que aparecen los datos
estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que haya
hecho modificación al tamaño de las unidades originales.
Este tipo de distribución de frecuencia nos permite ver directamente con qué
frecuencia ocurrieron valores diferentes en nuestro conjunto de datos. Por ejemplo:
4 familias tenían 1 mascota
3 familias tenían 2 mascotas
2 familias tenían 3 mascotas
1 familia tenía 4 mascotas
Y así.
Cuándo utilizar distribuciones de frecuencia no agrupadas
SECCION “B”
Las distribuciones de frecuencia desagrupadas pueden ser útiles cuando desea

ver la frecuencia con la que ocurre cada valor individual en un conjunto de datos.
Tenga en cuenta que las distribuciones de frecuencia no agrupadas funcionan

mejor con conjuntos de datos pequeños en los que solo hay unos pocos valores
únicos.
Por ejemplo, en los datos de nuestra encuesta de antes solo había 8 valores
únicos, por lo que tenía sentido crear una distribución de frecuencia no agrupada.
Sin embargo, si tuviéramos un conjunto de datos con cientos o miles de valores

únicos, una distribución de frecuencia no agrupada sería increíblemente larga y
difícil de recopilar información.
Para conjuntos de datos más grandes, tiene sentido construir distribuciones de

frecuencia agrupadas.
¿Cómo visualizar distribuciones de frecuencia no agrupadas?
La forma más sencilla de visualizar los valores en una distribución de frecuencia

no agrupada es crear un polígono de frecuencia, que muestra las frecuencias de
cada valor individual en un gráfico simple.
Así es como se vería un polígono de frecuencia para nuestros datos de muestra
SECCION “B”
Esto nos ayuda a comprender rápidamente la frecuencia con la que se produce

cada valor en el conjunto de datos.
Alternativamente, podríamos crear un gráfico de barras para mostrar exactamente

los mismos datos usando barras en lugar de una sola línea:
SECCION “B”
Ambos gráficos nos permiten comprender rápidamente la distribución de valores

en nuestro conjunto de datos.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
Son medidas estadísticas que se usan para describir cómo se puede resumir la
localización de los datos. Ubican e identifican el punto alrededor del cual se centran
los datos. Las más utilizadas son: la media, la mediana y la moda.
MEDIA
Si en una tabla de distribución de frecuencia, con clases, los puntos medios

son: y las respectivas frecuencias son , la media aritmética
se calcula de la siguiente manera:
SECCION “B”
Donde el número total de observaciones es
MEDIANA
Cuando los datos se encuentran agrupados en una distribución de frecuencia no se

conocen los datos originales, por lo tanto, es necesario estimar la mediana
mediante los siguientes pasos:
1. Calcular el valor
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo

mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia
acumulada es igual o mayor que
3. Aplicando la siguiente fórmula con los valores del intervalo mediano:
donde:
SECCION “B”
= Límite inferior de la clase de donde se encuentra la mediana
= Total de frecuencias
= Frecuencia acumulada anterior a la clase mediana
= Frecuencia del intervalo mediano
= amplitud del intervalo de clase
MODA
Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias

con datos agrupados, se habla de intervalo modal.
Si todos los intervalos tienen la misma amplitud, la moda se calcula por medio
de:
Medidas de tendencia central para datos no agrupados
Las medidas de tendencia central para datos no agrupados son un conjunto de

indicadores estadísticos que van a mostrar hacia qué valores se agrupan los datos
numéricos, es decir, son medidas estadísticas que buscan resumir en un solo valor
un conjunto de valores.
SECCION “B”
Obedeciendo a este concepto, se afirma que hay tres medidas que son comunes
para poder identificar el centro de los conjuntos de datos, que vienen a ser la media,
mediana y moda. cada una de ellas son ubicadas alrededor del punto donde los
datos se aglomeran.
MEDIDAS DE DISPERSIÓN DE DATOS AGRUPADOS
En estadística, las medidas de dispersión (también llamadas variabilidad,

dispersión o propagación) es el grado en que una distribución se estira o se
comprime. Ejemplos comunes de medidas de dispersión estadística son la
varianza, la desviación estándar y el rango intercuartil.
Las medidas de dispersión se contrastan con la ubicación o la tendencia central,

y juntas son las propiedades más utilizadas de las distribuciones.
En estadística, la desviación típica (también conocida como desviación

estándar y desvío típico y representada de manera abreviada por la letra griega
minúscula sigma σ o la letra latina s, así como por las siglas SD (de standard
deviation, en algunos textos traducidos del inglés) es una medida que se utiliza para
cuantificar la variación o la dispersión de un conjunto de datos numéricos.
Una desviación estándar baja indica que la mayor parte de los datos de una
muestra tienden a estar agrupados cerca de su media (también denominada el valor
esperado), mientras que una desviación estándar alta indica que los datos se
extienden sobre un rango de valores más amplio.
Rango intercuartílico:
El rango intercuartílico es una medida de variabilidad adecuada cuando la

medida de posición central empleada ha sido la mediana. Se define como la
diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3 - Q1.
A la mitad del rango intercuartil se le conoce como desviación cuartil (DQ), es
afectada muy poco por cuentas extremas. Esto lo hace una buena medida de
dispersión para distribuciones sesgadas: DQ = RQ/2= (Q3 - Q1)/2.
SECCION “B”
Se usa para construir los diagramas de caja y bigote (box plots) que sirven para
visualizar la variabilidad de una variable y comparar distribuciones de la misma
variable; además de ubicar valores extremos.
MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS.
Los datos no agrupados son el conjunto de datos que no se ha clasificado y se

es presentada en su forma de aparición en una tabla de datos donde cada valor se
representa de forma individual. Por lo general este conjunto comprende una
cantidad de elementos menor a 30 (n<30) con poca o nula repetición
RANGO: El rango de un conjunto de números es la diferencia entre el mayor y el

menor de todos ellos. Hay 2 maneras de expresar ésta medida:
La diferencia entre los valores mayores y
menor.
SECCION “B”
 Los valores mayor y menor del grupo.
DESVIACION ESTANDAR:
Denota con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos,

es una medida de dispersión para variables de razón (variables cuantitativas o
cantidades racionales) y de intervalo.
Se define como la raíz cuadrada de la varianza de la variable.
Para un mejor entendimiento, se muestran las formulas con las que se llega al
resultado y claro ejemplo para obtener la desviación estándar.
Ejemplo:
SECCION “B”
VARIANZA:
Se refieren a la media aritmética de los cuadrados de las desviaciones de cada valor
respecto de la media aritmética de los datos, por lo que a veces también se
denomina desviación cuadrática media.
Se utilizan cualquiera de las fórmulas para obtener un resultado, va dependiendo si
se calcula toda una población o solo una muestra de esa población.
SECCION “B”
GRÁFICA DE FRECUENCIA ACUMULADA
La distribución de frecuencias, en general, se representa mediante diagramas de

columnas, diagramas de barras o, en caso de que los datos estadísticos se
encuentren agrupados en intervalos, histogramas. Utilizar estos tipos de gráficos
estadísticos puede resultar útil al momento de realizar posteriores análisis y
observaciones.
A continuación, veremos un ejemplo de diagrama de barras combinado que

representa la frecuencia acumulada de un grupo de datos:
SECCION “B”
Como se puede observar, las frecuencias aumentan de manera progresiva y

proporcional, pues los resultados anteriores se acumulan, sumándose,
recursivamente, con los demás hasta alcanzar el total. Esta progresión también se
puede representar mediante únicamente un gráfico de líneas.
SECCION “B”
CONCLUCION:
La estadística descriptiva tiene como objetivo resumir la evidencia encontrada en

una investigación de manera sencilla y clara para su interpretación. Consta de
tablas o cuadros, figuras o gráficas e imágenes o fotografías. Los cuadros se utilizan
para resumir datos y mostrar cifras puntuales. Las figuras o gráficas tienen la
finalidad de señalar tendencias y comparaciones. Las imágenes o fotografías
permiten mostrar fenómenos difícilmente explicables en el texto. Se recomienda no
usar más siete de estas herramientas en una publicación.
SECCION “B”

La Estadistica Descriptiva

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Estadistica Descriptiva

Cargado por

Copyright:

Formatos disponibles

SAN FERNANDO- ESTADO APURE

LA ESTADISTICA DESCRIPTIVA ………………………………………… N° 02

es la técnica matemática que obtiene, organiza, presenta y describe un

El término estadística descriptiva (en el sentido de contar sustantivos contables)

La estadística descriptiva se distingue de la estadística inferencial (o estadística

ejemplo, en los artículos que informan sobre sujetos humanos, normalmente se

Algunas medidas que se emplean comúnmente para describir un conjunto de

Distribución de frecuencias agrupadas

Las distribuciones de frecuencias son tablas en que se dispone las modalidades

Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de

La inspección de los datos originales no permite responder fácilmente a

Podemos hacernos mejor idea si disponemos en una tabla los valores de la

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).

La distribución de frecuencias de los datos del ejemplo muestra que la actitud

los valores iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No

Consideremos el siguiente grupo de datos:

La distribución de frecuencias es:

La reducción de datos mediante el agrupamiento en frecuencias no facilita su

Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".

Elementos básicos de las tablas de intervalos:

LA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS

4 familias tenían 1 mascota

3 familias tenían 2 mascotas

2 familias tenían 3 mascotas

1 familia tenía 4 mascotas

Cuándo utilizar distribuciones de frecuencia no agrupadas

Las distribuciones de frecuencia desagrupadas pueden ser útiles cuando desea

Tenga en cuenta que las distribuciones de frecuencia no agrupadas funcionan

Sin embargo, si tuviéramos un conjunto de datos con cientos o miles de valores

Para conjuntos de datos más grandes, tiene sentido construir distribuciones de

¿Cómo visualizar distribuciones de frecuencia no agrupadas?

La forma más sencilla de visualizar los valores en una distribución de frecuencia

Así es como se vería un polígono de frecuencia para nuestros datos de muestra

Esto nos ayuda a comprender rápidamente la frecuencia con la que se produce

Alternativamente, podríamos crear un gráfico de barras para mostrar exactamente

Ambos gráficos nos permiten comprender rápidamente la distribución de valores

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Si en una tabla de distribución de frecuencia, con clases, los puntos medios

Donde el número total de observaciones es

Cuando los datos se encuentran agrupados en una distribución de frecuencia no se

2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo

acumulada es igual o mayor que

3. Aplicando la siguiente fórmula con los valores del intervalo mediano:

= Límite inferior de la clase de donde se encuentra la mediana

= Frecuencia acumulada anterior a la clase mediana

= Frecuencia del intervalo mediano

= amplitud del intervalo de clase

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias

Medidas de tendencia central para datos no agrupados

Las medidas de tendencia central para datos no agrupados son un conjunto de

MEDIDAS DE DISPERSIÓN DE DATOS AGRUPADOS

En estadística, las medidas de dispersión (también llamadas variabilidad,

Las medidas de dispersión se contrastan con la ubicación o la tendencia central,

En estadística, la desviación típica (también conocida como desviación

El rango intercuartílico es una medida de variabilidad adecuada cuando la

MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS.

Los datos no agrupados son el conjunto de datos que no se ha clasificado y se

RANGO: El rango de un conjunto de números es la diferencia entre el mayor y el

La diferencia entre los valores mayores y

 Los valores mayor y menor del grupo.

Denota con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos,

GRÁFICA DE FRECUENCIA ACUMULADA

La distribución de frecuencias, en general, se representa mediante diagramas de