Está en la página 1de 21

SAN FERNANDO- ESTADO APURE

ESTADISTICA
DESCRIPTIVA

FACILITADOR: INTEGRANTES:

SECCION “B”
SAN FERNANDO- ESTADO APURE

INDICE:

DESCRIPCION: PAGINA

INTRODUCCION ………………………………………… N° 01

LA ESTADISTICA DESCRIPTIVA ………………………………………… N° 02


DISTRIBUCCION DE FRECUENCIAS
………………………………………… N° 03
AGRUPADAS
DISTRIBUCCION DE FRECIENCIAS NO
………………………………………… N° 07
AGRUPADAS
MEDIDAS DE TENDENCIA CENTRAL PARA
………………………………………… N° 10
DATOS AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL PARA
………………………………………… N° 12
DATOS NO AGRUPADOS
MEDIDAS DE DISPERSIÓN DE DATOS
………………………………………… N° 13
AGRUPADOS
MEDIDAS DE DISPERSIÓN DE DATOS NO
………………………………………… N° 14
AGRUPADOS
CONCLUCION ………………………………………… N° 19

SECCION “B”
SAN FERNANDO- ESTADO APURE

INTRODUCCION:
Actualmente los datos suelen ser analizados con ordenador, por lo que deben
ser almacenados en archivos informáticos. Las bases de datos contienen datos
provenientes de un número de observaciones más o menos grande respecto de un
conjunto de variables que puede llegar a ser bastante grande. La generación de una
base de datos supone la codificación previa de las observaciones, la introducción
(grabación) de los datos en archivos informáticos, la depuración de los datos ya
grabados (detección y tratamiento de los errores de grabación y valores faltantes), y
eventualmente la realización de transformaciones y tratamiento de ficheros que
faciliten su posterior tratamiento estadístico.

SECCION “B”
SAN FERNANDO- ESTADO APURE

CONTENIDO

LA ESTADÍSTICA DESCRIPTIVA

es la técnica matemática que obtiene, organiza, presenta y describe un


conjunto de datos con el propósito de facilitar el uso, generalmente con el apoyo de
tablas, medidas numéricas o gráficas. Estas técnicas son utilizadas en el proceso de
investigación, en la etapa donde el investigador necesita procesar y analizar los
datos recolectados en dicho estudio.

El término estadística descriptiva (en el sentido de contar sustantivos contables)


es una técnica matemática que describe o resume cuantitativamente las
características de una colección de información, mientras que también puede
emplearse el mismo término (en el sentido de contabilizar sustantivos no
numerables) para el proceso de usar y analizar esas técnicas y resultados.

La estadística descriptiva se distingue de la estadística inferencial (o estadística


inductiva) por su objetivo de resumir una muestra, en lugar de utilizar los datos para
aprender sobre la población que se cree que representa la muestra de datos. Esto
generalmente significa que las estadísticas descriptivas, a diferencia de las
estadísticas inferenciales, no se desarrollan sobre la base de la teoría de la
probabilidad y, con frecuencia, son estadísticas no paramétricas. Incluso cuando un
análisis de datos extrae sus principales conclusiones utilizando estadísticas
inferenciales, generalmente también se presentan estadísticas descriptivas. Por

SECCION “B”
SAN FERNANDO- ESTADO APURE

ejemplo, en los artículos que informan sobre sujetos humanos, normalmente se


incluye una tabla con el tamaño de la muestra general, los tamaños de la muestra
en subgrupos importantes (por ejemplo, para cada tratamiento o grupo de
exposición) y características demográficas o clínicas, como la edad promedio, la
proporción de sujetos de cada sexo, la proporción de sujetos con comorbilidades
relacionadas, etc.

Algunas medidas que se emplean comúnmente para describir un conjunto de


datos son las medidas de tendencia central y las medidas de variabilidad o
dispersión. Las medidas de tendencia central incluyen la media, la mediana y la
moda, mientras que las medidas de variabilidad incluyen la desviación estándar (o
varianza), los valores mínimo y máximo de las variables, la curtosis y la asimetría.

Distribución de frecuencias agrupadas

Las distribuciones de frecuencias son tablas en que se dispone las modalidades


de la variable por filas. En las columnas se dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que contienen los datos.

Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de


la exhibición de imágenes violentas por televisión, para lo cual han recogido los
siguientes datos:

SECCION “B”
SAN FERNANDO- ESTADO APURE

La inspección de los datos originales no permite responder fácilmente a


cuestiones como cuál es la actitud mayoritaria del grupo, y resulta bastante más
difícil determinar la magnitud de la diferencia de actitud entre hombres y mujeres.

Podemos hacernos mejor idea si disponemos en una tabla los valores de la


variable acompañados del número de veces (la frecuencia) que aparece cada valor:

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).

La distribución de frecuencias de los datos del ejemplo muestra que la actitud


mayoritaria de los individuos del grupo estudiado es indiferente. La interpretación de
los datos ha sido facilitada porque se ha reducido el número de números a examinar
(en vez de los 20 datos originales, la tabla contiene 5 valores de la variable y 5
frecuencias).

Generalmente las tablas incluyen varías columnas con las frecuencias relativas
(son el número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o
"pi"), frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de

SECCION “B”
SAN FERNANDO- ESTADO APURE

los valores iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No


obstante, la frecuencia acumulada también es definida incluyendo al valor de
referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es el
total de frecuencias relativas de los valores iguales o inferiores al de referencia, y se
simbolizan "fr" o "pa")

Consideremos el siguiente grupo de datos:

La distribución de frecuencias es:

SECCION “B”
SAN FERNANDO- ESTADO APURE

La reducción de datos mediante el agrupamiento en frecuencias no facilita su


interpretación: La tabla es demasiado grande. Para reducir el tamaño de la tabla
agrupamos los valores en intervalos, y las frecuencias son las de los conjuntos de
valores incluidos en los intervalos:

hora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar
inmediatamente que el intervalo con mayor número de datos es el 34-39, o que el
75% de los datos tiene valor inferior a 46.

Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".

Elementos básicos de las tablas de intervalos:

Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en
una distribución de frecuencias

SECCION “B”
SAN FERNANDO- ESTADO APURE

Límites aparentes: Valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los
límites aparentes del intervalo con mayor número de frecuencias son 34 y 39.

Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites
son 33.5 y 39.5

Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por
dos. Mc del intervalo del ejemplo= 36.5

Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
inferior. En el ejemplo es igual a 6.

LA DISTRIBUCIÓN DE FRECUENCIA PARA DATOS NO AGRUPADOS

Es aquella distribución que indica las frecuencias con que aparecen los datos
estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que haya
hecho modificación al tamaño de las unidades originales.

Este tipo de distribución de frecuencia nos permite ver directamente con qué
frecuencia ocurrieron valores diferentes en nuestro conjunto de datos. Por ejemplo:

4 familias tenían 1 mascota

3 familias tenían 2 mascotas

2 familias tenían 3 mascotas

1 familia tenía 4 mascotas

Y así.

Cuándo utilizar distribuciones de frecuencia no agrupadas

SECCION “B”
SAN FERNANDO- ESTADO APURE

Las distribuciones de frecuencia desagrupadas pueden ser útiles cuando desea


ver la frecuencia con la que ocurre cada valor individual en un conjunto de datos.

Tenga en cuenta que las distribuciones de frecuencia no agrupadas funcionan


mejor con conjuntos de datos pequeños en los que solo hay unos pocos valores
únicos.

Por ejemplo, en los datos de nuestra encuesta de antes solo había 8 valores
únicos, por lo que tenía sentido crear una distribución de frecuencia no agrupada.

Sin embargo, si tuviéramos un conjunto de datos con cientos o miles de valores


únicos, una distribución de frecuencia no agrupada sería increíblemente larga y
difícil de recopilar información.

Para conjuntos de datos más grandes, tiene sentido construir distribuciones de


frecuencia agrupadas.

¿Cómo visualizar distribuciones de frecuencia no agrupadas?

La forma más sencilla de visualizar los valores en una distribución de frecuencia


no agrupada es crear un polígono de frecuencia, que muestra las frecuencias de
cada valor individual en un gráfico simple.

Así es como se vería un polígono de frecuencia para nuestros datos de muestra

SECCION “B”
SAN FERNANDO- ESTADO APURE

Esto nos ayuda a comprender rápidamente la frecuencia con la que se produce


cada valor en el conjunto de datos.

Alternativamente, podríamos crear un gráfico de barras para mostrar exactamente


los mismos datos usando barras en lugar de una sola línea:

SECCION “B”
SAN FERNANDO- ESTADO APURE

Ambos gráficos nos permiten comprender rápidamente la distribución de valores


en nuestro conjunto de datos.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Son medidas estadísticas que se usan para describir cómo se puede resumir la
localización de los datos. Ubican e identifican el punto alrededor del cual se centran
los datos. Las más utilizadas son: la media, la mediana y la moda.

MEDIA 

Si en una tabla de distribución de frecuencia, con   clases, los puntos medios


son:   y las respectivas frecuencias son  , la media aritmética
se calcula de la siguiente manera:

SECCION “B”
SAN FERNANDO- ESTADO APURE

Donde el número total de observaciones es   

MEDIANA

Cuando los datos se encuentran agrupados en una distribución de frecuencia no se


conocen los datos originales, por lo tanto, es necesario estimar la mediana   
mediante los siguientes pasos:

1. Calcular el valor   

2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo


mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia

acumulada es igual o mayor que 

3. Aplicando la siguiente fórmula con los valores del intervalo mediano:

donde:

SECCION “B”
SAN FERNANDO- ESTADO APURE

= Límite inferior de la clase de donde se encuentra la mediana

= Total de frecuencias

= Frecuencia acumulada anterior a la clase mediana

= Frecuencia del intervalo mediano

= amplitud del intervalo de clase

MODA

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias


con datos agrupados, se habla de intervalo modal.

Si todos los intervalos tienen la misma amplitud, la moda   se calcula por medio
de:

Medidas de tendencia central para datos no agrupados

Las medidas de tendencia central para datos no agrupados son un conjunto de


indicadores estadísticos que van a mostrar hacia qué valores se agrupan los datos
numéricos, es decir, son medidas estadísticas que buscan resumir en un solo valor
un conjunto de valores.

SECCION “B”
SAN FERNANDO- ESTADO APURE

Obedeciendo a este concepto, se afirma que hay tres medidas que son comunes
para poder identificar el centro de los conjuntos de datos, que vienen a ser la media,
mediana y moda. cada una de ellas son ubicadas alrededor del punto donde los
datos se aglomeran.

MEDIDAS DE DISPERSIÓN DE DATOS AGRUPADOS

En estadística, las medidas de dispersión (también llamadas variabilidad,


dispersión o propagación) es el grado en que una distribución se estira o se
comprime. Ejemplos comunes de medidas de dispersión estadística son la
varianza, la desviación estándar y el rango intercuartil.

Las medidas de dispersión se contrastan con la ubicación o la tendencia central,


y juntas son las propiedades más utilizadas de las distribuciones.

En estadística, la desviación típica (también conocida como desviación


estándar y desvío típico y representada de manera abreviada por la letra griega
minúscula sigma σ o la letra latina s, así como por las siglas SD (de standard
deviation, en algunos textos traducidos del inglés) es una medida que se utiliza para
cuantificar la variación o la dispersión de un conjunto de datos numéricos.

Una desviación estándar baja indica que la mayor parte de los datos de una
muestra tienden a estar agrupados cerca de su media (también denominada el valor
esperado), mientras que una desviación estándar alta indica que los datos se
extienden sobre un rango de valores más amplio.

Rango intercuartílico:

El rango intercuartílico es una medida de variabilidad adecuada cuando la


medida de posición central empleada ha sido la mediana. Se define como la
diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3 - Q1.
A la mitad del rango intercuartil se le conoce como desviación cuartil (DQ), es
afectada muy poco por cuentas extremas. Esto lo hace una buena medida de
dispersión para distribuciones sesgadas: DQ = RQ/2= (Q3 - Q1)/2.

SECCION “B”
SAN FERNANDO- ESTADO APURE

Se usa para construir los diagramas de caja y bigote (box plots) que sirven para
visualizar la variabilidad de una variable y comparar distribuciones de la misma
variable; además de ubicar valores extremos.

MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS.

 Los datos no agrupados son el conjunto de datos que no se ha clasificado y se


es presentada en su forma de aparición en una tabla de datos donde cada valor se
representa de forma individual. Por lo general este conjunto comprende una
cantidad de elementos menor a 30 (n<30) con poca o nula repetición

RANGO: El rango de un conjunto de números es la diferencia entre el mayor y el


menor de todos ellos. Hay 2 maneras de expresar ésta medida:

  La diferencia entre los valores mayores y

menor.   

SECCION “B”
SAN FERNANDO- ESTADO APURE

  Los valores mayor y menor del grupo. 

DESVIACION ESTANDAR:

Denota con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos,


es una medida de dispersión para variables de razón (variables cuantitativas o
cantidades racionales) y de intervalo.
Se define como la raíz cuadrada de la varianza de la variable. 
Para un mejor entendimiento, se muestran las formulas con las que se llega al
resultado y claro ejemplo para obtener la desviación estándar.

Ejemplo:

SECCION “B”
SAN FERNANDO- ESTADO APURE

VARIANZA:
Se refieren a la media aritmética de los cuadrados de las desviaciones de cada valor
respecto de la media aritmética de los datos, por lo que a veces también se
denomina desviación cuadrática media. 
Se utilizan cualquiera de las fórmulas para obtener un resultado, va dependiendo si
se calcula toda una población o solo una muestra de esa población.

SECCION “B”
SAN FERNANDO- ESTADO APURE

GRÁFICA DE FRECUENCIA ACUMULADA

La distribución de frecuencias, en general, se representa mediante diagramas de


columnas, diagramas de barras o, en caso de que los datos estadísticos se
encuentren agrupados en intervalos, histogramas. Utilizar estos tipos de gráficos
estadísticos puede resultar útil al momento de realizar posteriores análisis y
observaciones.

A continuación, veremos un ejemplo de diagrama de barras combinado que


representa la frecuencia acumulada de un grupo de datos:

SECCION “B”
SAN FERNANDO- ESTADO APURE

Como se puede observar, las frecuencias aumentan de manera progresiva y


proporcional, pues los resultados anteriores se acumulan, sumándose,
recursivamente, con los demás hasta alcanzar el total. Esta progresión también se
puede representar mediante únicamente un gráfico de líneas.

SECCION “B”
SAN FERNANDO- ESTADO APURE

CONCLUCION:

La estadística descriptiva tiene como objetivo resumir la evidencia encontrada en


una investigación de manera sencilla y clara para su interpretación. Consta de
tablas o cuadros, figuras o gráficas e imágenes o fotografías. Los cuadros se utilizan
para resumir datos y mostrar cifras puntuales. Las figuras o gráficas tienen la
finalidad de señalar tendencias y comparaciones. Las imágenes o fotografías
permiten mostrar fenómenos difícilmente explicables en el texto. Se recomienda no
usar más siete de estas herramientas en una publicación.

SECCION “B”

También podría gustarte