Está en la página 1de 21

Contenido

INTRODUCCION .................................................................................................................... 1
LA ESTADISTICA DESCRIPTIVA ......................................................................................... 2
1. DEFINICIÓN .................................................................................................................. 2
2. TÉRMINOS ESTADÍSTICOS....................................................................................... 2
2.1. POBLACIÓN ............................................................................................................ 2
2.2. MUESTRA ................................................................................................................ 2
3. VARIABLES ESTADISTICAS ..................................................................................... 3
3.1. CUALITATIVA ........................................................................................................ 3
3.2. CUANTITATIVA ..................................................................................................... 3
4. ORGANIZACIÓN DE DATOS ..................................................................................... 5
4.1. FRECUENCIA .......................................................................................................... 5
4.2. DISTRIBUCION DE FRECUENCIAS POR INTERVALOS ................................. 6
4.3. MARCA DE CLASE ................................................................................................ 6
5. MEDIDAS DE RESUMEN ............................................................................................ 7
5.1. MEDIDAS DE TENDENCIA CENTRAL ............................................................... 7
5.2. MEDIDA DE DISPERSIÓN..................................................................................... 8
6. MEDIDAS DE FORMA ............................................................................................... 10
6.1. COEFICIENTE DE ASMETRÍA DE PEARSON .................................................. 10
6.2. ASIMETRÍA Y CURTOSIS DE FISHER .............................................................. 11
7. MEDIDA DE POSICIÓN O CUANTILAS ................................................................ 12
7.1. DECILES ................................................................................................................ 12
7.2. PERCENTILES ....................................................................................................... 12
7.3. CUARTILES ........................................................................................................... 13
8. GRÁFICOS DE LA DISTRIBUCIÓN POR INTERVALOS ................................... 14
8.1. HISTOGRAMA ...................................................................................................... 14
8.2. BOX PLOT ............................................................................................................. 15
8.3. DIAGRAMA CIRCULAR ...................................................................................... 15
8.4. POLIGONO DE FRECUENCIA ............................................................................ 16
8.5. OJIVA MAYOR ..................................................................................................... 17
8.6. OJIVA MENOR ...................................................................................................... 18
8.7 ASIMETRIA DE PEARSON .................................................................................. 17
8.8 CURTOSIS DE FISHER ........................................................................................ 18

0
INTRODUCCION

La estadística es una de las herramientas más ampliamente utilizadas en la investigación

científica. Su aplicación en instituciones gubernamentales y educativas, en los negocios

y en la industria, en la banca y en otros quehaceres diarios, hacen de la estadística una

herramienta indispensable.

Sin embargo el término “Estadística” tiene varios significados para diferentes personas;

para la gente común y corriente la estadística solamente significa números, para otras

personas es un método para obtener, presentar y escribir grandes cantidades de datos, y

para otras es un método para tomar decisiones en situaciones difíciles.

El objetivo básico de este fascículo es aclarar los significados de Estadística, definir sus

conceptos básicos utilizados con frecuencia y analizar los usos y abusos de los métodos

estadísticos. Aunque los significados sean diferentes, todos ellos forman parte del

concepto total de “Estadística”. La palabra tiene su sentido más amplio para aquellas

personas cuyo trabajo requiere un conocimiento de los aspectos más técnicos de la

estadística. Para estas personas, la palabra tiene relación con aquellos conceptos y

técnicas que se utilizan en la recopilación, organización, resumen, análisis, interpretación

y comunicación de información numérica. Estos conceptos y técnicas juegan un papel

importante en las actividades que realizan los profesionales de todas las ciencias.

1
LA ESTADISTICA DESCRIPTIVA

1. DEFINICIÓN

La estadística descriptiva es la rama de la estadística que recolecta, analiza y caracteriza

un conjunto de datos (peso de la población, beneficios diarios de una empresa,

temperatura mensual, etc.) con el objetivo de describir las características y

comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.

2. TÉRMINOS ESTADÍSTICOS

2.1. POBLACIÓN: Conjunto de elementos que contienen una o más características

de naturaleza cualitativa o cuantitativa.

2.2. MUESTRA: Se refiere a una parte de la población seleccionada de acuerdo con

un plan o regla, con el fin de obtener información acerca de la población de la

cual proviene.

3. Escalas de medición

Las Escalas de medición o Niveles son las formas de clasificar los datos, pueden ser:

3.1. ESCALA NOMINAL: Se caracteriza por datos que consisten exclusivamente en

nombres, rótulos o categorías. Los datos no pueden acomodarse según esquema

de ordenamiento (digamos de bajo alto). El término nominal puede asociarse con

“sólo nombres”.

Se ha de tener presente que los números asignados a cada categoría sirven

única y exclusivamente para identificar la categoría y no poseen propiedades

cuantitativas.

2
3.2. ESCALA ORDINAL: Implica datos que pueden acomodarse en algún orden,

pero no es posible determinar diferencias entre los valores de los datos, o tales

diferencias carecen de significado.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho

mismo de poder ordenar todas sus categorías, el cálculo de las medidas

estadísticas de posición, como por ejemplo la mediana.

3.3. ESCALAS POR INTERVALOS: es como el nivel ordinal, con la propiedad

adicional que podemos determinar magnitudes de diferencias entre los datos que

tienen algún significado. Sin embargo, no hay un punto de partida o cero

inherente (natural) en el que la cantidad esté totalmente ausente.

3.4. ESCALA DE RAZÓN: Es el nivel de medida más elevado y se diferencia de las

escalas de intervalos únicamente por poseer un punto cero propio como origen;

es decir que el valor cero de esta escala significa ausencia de la magnitud que

estamos midiendo.

4. VARIABLES ESTADISTICAS

Característica definida en la población. Puede tomar dos o más variables.

4.1. CUALITATIVA: Expresan una cualidad, o atributo, sus datos se expresan

mediante una palabra.

4.1.1. VARIABLE CUALITATIVA NOMINAL: Permiten percibir diferencias

o semejanzas de las unidades estadísticas que se midan.

4.1.2. VARIABLE CUALITATIVA ORDINAL: Los valores se pueden ordenar

de manera ascendente (o descendente) para establecer relaciones

comparativas.

4.2. CUANTITATIVA: variables que toman valores numéricas.

3
4.2.1. VARIABLE CUANTITATIVA DISCRETA: Es aquella variable que

puede tomar solo ciertos valores en un intervalo fijado y no admite ningún

valor entre dos valores consecutivos fijos.

4.2.2. VARIABLE CUANTITATIVA CONTINUA: Variable que puede tomar

cualquier valor en el intervalo considerado.

5. RECOPILACIÓN DE DATOS

5.1. FUENTES PARA OBTENER DATOS

Los datos pueden obtenerse de dos tipos de fuentes:

5.1.1. FUENTES INTERNAS: cuando los datos son parte de la propia actividad

del ente que los recopila, se dice que el dato es interno y la fuente es interna.

5.1.2. FUENTES EXTERNAS: cuando se tiene que otras empresas,

instituciones, poblaciones, etc., fuera del ente recopilador.

5.2. TÉCNICAS PARA RECOPILAR DATOS

Para obtener la información existen varias técnicas, entre estas: encuesta, entrevista,

cuestionario y observación.

5.2.1. ENCUESTA: Conjunto de preguntas tipificadas dirigidas a una muestra

representativa, para averiguar estados de opinión o diversas cuestiones de

hecho.

5.2.2. ENTREVISTA: Las entrevistas se utilizan para recabar información en

forma verbal, a través de preguntas que propone el analista. Es un canal de

comunicación entre el analista y la organización; sirve para obtener

información acerca de las necesidades y la manera de satisfacerlas, así como

concejo y comprensión por parte del usuario para toda idea o método nuevos.

4
5.2.3. CUESTIONARIO: Se entiende por cuestionario a la lista de preguntas que

se proponen por cualquier fin, el cuestionario proporcionan una alternativa

muy útil para la entrevista.

5.2.4. OBSERVACIÓN: Consiste en observar a las personas cuando efectúan su

trabajo. Como técnica de investigación, la observación tiene amplia

aceptación científica.

6. ORGANIZACIÓN DE DATOS

6.1. FRECUENCIA: Es una medida que sirve para comparar la aparición de un

elemento Xi en un conjunto de elementos (X1, X2,…, XN). Mediante tablas de

distribuciones de frecuencia se puede presentar organizadamente el recuento de

datos.

Todo cuadro de distribución de frecuencia debe tener:

 Título.

 Fuente.

 Unidades.

6.1.1. FRECUENCIA ABSOLUTA: Es el número de veces que se repite un

determinado valor de la variable; en el caso de intervalos es el número de

observaciones comprendidas en dicho intervalo. Asimismo, la suma de las

frecuencias absolutas simples es igual al número total de observaciones y se

expresa del siguiente modo:

∑ 𝑛𝑖 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑁
𝑖=1

5
6.1.2. FRECUENCIA RELATIVA: Es el cociente de la frecuencia absoluta de

cada clase entre el número total de observaciones. La suma de frecuencias

relativas es igual a uno.

𝑛𝑖
𝑓𝑖 =
𝑁

Dónde:

 𝑛𝑖 : Frecuencia absoluta de cada clase.

 𝑁 : Número total de observaciones.

6.1.3. FRECUENCIA ABSOLUTA ACUMULADA: Es la suma sucesiva de las

frecuencias absolutas y se representa por: Fi

6.1.4. FRECUENCIA PORCENTAJE: Es el resultado de multiplicar la

frecuencia absoluta por 100.

6.2. DISTRIBUCION DE FRECUENCIAS POR INTERVALOS

1- Determinar el rango de variación de datos: R= Xmax - Xmin.

2- Determinar el número de intervalos K: K= 1+ 3.322log(n)

3- Determinar la amplitud del intervalo. C= R/K

6.3. MARCA DE CLASE: Representa a todos los datos contenidos en el intervalo.

mI=(Li+Ls)/2

6
7. MEDIDAS DE RESUMEN

7.1. MEDIDAS DE TENDENCIA CENTRAL: Son indicadores usados para señalar

que porcentaje de datos dentro de una distribución de frecuencias superan estas

expresiones, cuyo valor representa el valor del dato que se encuentra en el centro

de la distribución de frecuencia.

7.1.1. MEDIA ARIMETICA: Es una medida matemática, un número individual

que representa razonablemente el comportamiento de todos los datos.

 DATOS NO AGRUPADOS

∑𝑁
𝑖=1 𝑋𝑖
𝑀𝑒𝑑𝑖𝑎(𝑥) = 𝑋̅ =
𝑁

 DATOS AGRUPADOS

∑𝑘𝑖=1 𝑓𝑖 × 𝑚𝑖
𝑋̅ =
𝑛

7.1.2. LA MEDIANA: Es el valor de la observación que ocupa la posición central

de un conjunto de datos ordenados según su magnitud. Es el valor medio o

la media aritmética de los valores medios.

 DATOS NO AGRUPADOS: Si n es impar, la mediana es el dato ordenado

del centro. Pero si n es par, la mediana es la semisuma de los dos valores

ordenados centrales.

 DATOS AGRUPADOS:

𝑛
− 𝐹𝑎−1
𝑀𝑒 = 𝐿𝑖 + [2 ]∗𝐶
𝑓𝑎

7
Dónde:

Li: Límite inferior del intervalo.

n: número total.

Fa-1: Frecuencia absoluta acumulada anterior.

fa: Frecuencia absoluta del intervalo.

C: amplitud

7.1.3. MODA: Es el valor de un conjunto de datos que ocurre más

frecuentemente, se considera como el valor más típico de una serie de datos.

 DATOS NO AGRUPADOS: Es el valor más frecuente.

 DATOS AGRUPADOS:

∆1
𝑀𝑜 = 𝐿𝑖 + [ ]∗𝑐
∆1 + ∆2

7.2. MEDIDA DE DISPERSIÓN: Estudia la distribución de los valores de la serie,

analizando si estos se encuentran más o menos concentrados, o más o menos

dispersos.

7.2.1. VARIANZA: Medida del cuadrado de la distancia promedio entre la media

y cada observación de la población.

 DATOS NO AGRUPADOS

∑𝑛𝑖=1( 𝑋𝑖 − 𝑋̅)2
𝑆2 =
𝑛−1

8
 DATOS AGRUPADOS

2
∑𝑛𝑖=1( 𝑚 − 𝑋̅ )2 ∗ 𝑓𝑎
𝑆 =
𝑛−1

Donde:

m: Marca de clase.

X: Media.

fa: Frecuencia absoluta.

n: Tamaño de muestra.

7.2.2. DESVIACIÓN ESTÁNDAR: Se calcula obteniendo la raíz cuadrada

positiva de la varianza. Esta medida de dispersión tiene las mismas unidades

que los datos originales, a diferencia de la varianza en la que las unidades

están expresadas por los cuadrados de las unidades.

 DATOS NO AGRUPADOS

𝑆 = √𝑆 2

 DATOS AGRUPADOS

𝑆 = √𝑆 2

7.2.3. COEFICIENTE DE VARIACIÓN DE PEARSON: Es una medida relativa

de dispersión que relaciona la desviación estándar y la media, expresando la

9
desviación estándar como porcentaje de la media, la unidad de media es

entonces “porcentaje”, en lugar de las unidades de los datos originales.

𝑆
𝐶𝑉 = ∗ 100
𝑋̅

8. MEDIDAS DE FORMA

8.1. COEFICIENTE DE ASMETRÍA DE PEARSON: Mide si la curva de la gráfica

que representa a los datos es simétrica respecto al eje vertical, si lo es se dice que

la hay simetría y si no lo es se dice que es Asimétrica

𝑥̅ − 𝑀𝑜
𝐶𝐴𝑝 =
𝑆

Donde:

X: media.

Mo(x): Moda.

s: Desviación estándar.

CAp<0 CAp=0 CAp>0

10
8.2. ASIMETRÍA Y CURTOSIS DE FISHER: Mide la altura o grado de

apuntamiento de la gráfica que representa a los datos (eje horizontal).

 DATOS NO AGRUPADOS

∑(𝑋 − 𝑋̅)3
𝐶𝐶𝐹 =
𝑛 ∗ 𝑆3

 DATOS AGRUPADOS

∑(𝑋 − 𝑋̅)3 ∗ 𝑚
𝐶𝐶𝐹 =
𝑛 ∗ 𝑆3

CCF>0 CCF=0 CCF<0

11
9. MEDIDA DE POSICIÓN O CUANTILAS

9.1. DECILES: Son 9 valores que distribuyen la serie de datos, ordenada de forma

creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos

concentra el 10% de los resultados.

 DATOS NO AGRUPADOS

𝑛∗𝑘
𝐷𝐾 =
10

 DATOS AGRUPADOS

𝑛×𝑘
− 𝐹𝑎−1
𝐷𝑘 = 𝐿𝑖 + [ 10 ]∗𝑐
𝑓𝑎

9.2. PERCENTILES: Son 99 valores que distribuyen la serie de datos, ordenada de

forma creciente o decreciente, en cien tramos iguales, en los que cada uno de

ellos concentra el 1% de los resultados.

 DATOS NO AGRUPADOS

𝑛∗𝑘
𝑃𝐾 =
100

 DATOS AGRUPADOS

𝑛×𝑘
− 𝐹𝑎−1
𝑃𝑘 = 𝐿𝑖 + [ 100 ]∗𝑐
𝑓𝑎

12
9.3. CUARTILES: Son 3 valores que distribuyen la serie de datos, ordenada de forma

creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos

concentra el 25% de los resultados.

 DATOS NO AGRUPADOS

𝑛∗𝑘
𝑄𝐾 =
4

 DATOS AGRUPADOS

𝑛×𝑘
− 𝐹𝑎−1
𝑄𝑘 = 𝐿𝑖 + [ 4 ]∗𝑐
𝑓𝑎

13
10. GRÁFICOS DE LA DISTRIBUCIÓN POR INTERVALOS

10.1. HISTOGRAMA: Es una gráfica que se construye a partir de la tabla

estadística, consiste en rectángulos verticales unidos entre sí, en donde sus lados

son los límites reales inferior y superior de clase y cuya altura es igual a la

frecuencia de clase. El criterio para calcular la altura de cada rectángulo es el de

mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada

intervalo y el área de los mismos.

Histograma de Sacos de Cemento


25

20

15

10

0
300-500 500-700 700-900 900-1100 1100-1300 1300-1500

Fuente: FIC-UNP

14
10.2. BOX PLOT: Es una herramienta que permite visualizar, a través de

los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos,

la posición de la mediana, etc.

BOX PLOT DE LA CANTIDAD DE SACOS DE CEMENTOS

300 1500

Q1: 510 Q2:727.3 Q3: 841

Fuente: FIC-UNP

10.3. DIAGRAMA CIRCULAR: Sirve para representar variables cualitativas o

discretas. Se utiliza para representar la proporción de elementos de cada uno de

los valores de la variable.

Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa.

Entiéndase como porción la parte del círculo que representa a cada valor que toma

la variable.

SECTOR CIRCULAR DE LA CANTIDAD DE SACOS DE CEMENTO


12 𝑋1
=360° X1 = 86.4°
50
10 𝑋2
= X2=72°
50 360°
22 𝑋3
= X3=158.4°
50 360°
3 𝑋4
= X4=21.6°
50 360°
2 𝑋5
= X5=14.4°
50 360°
1 𝑋6
= X6=7.2°
50 360°

Fuente: FIC-UNP

15
10.4. POLIGONO DE FRECUENCIA: Consiste en una serie de segmentos que

unen los puntos cuyas abscisas son las marcas de cada clase y cuyas ordenadas

son proporcionales a sus frecuencias respectivas.

El polígono de frecuencias se construye fácilmente si tenemos representado

previamente el histograma, ya que consiste en unir mediante líneas rectas los

puntos del histograma que corresponden a las marcas de clase.

Poligono de Frecuencia de Sacos de


Cemento
25

20

15

10

0
300-500 500-700 700-900 900-1100 1100-1300 1300-1500

Fuente: FIC-UNP

16
10.5. OJIVA MAYOR: A cada límite inferior le corresponde la frecuencia

acumulada de cada clase culminando con el límite superior del ultimo intervalo

asignándole F=0.

Se calcula a partir de la posición de la última frecuencia acumulada del último

intervalo y se acumula hacia arriba hasta el primer intervalo.

OJIVA MAYOR DE SACOS DE CEMENTO

Grafico 01
1.2

1
1

0.8
0.8

0.6
0.425
0.4

0.175
0.2

0
0 20 40 60

Serie 1

Fuente: FIC-UNP

17
10.6. OJIVA MENOR: Menor que La base representa los intervalos de clase y

las alturas las frecuencias absolutas acumuladas menor que ( Fi )

A cada límite superior le corresponde la frecuencia acumulada de cada clase

iniciando con el límite inferior del primer intervalo asignándole F = 0

OJIVA MENOR DE SACOS DE CEMENTO

Grafico 01
1.2
1
1
0.825
0.8

0.6
0.4
0.4

0.2

0
0 20 40 60

Serie 1

Fuente: FIC-UNP

18
10.7. ASIMETRÍA DE PEARSON:

Asimetría de Pearson de Sacos de


Cemento
25

20

15

10

0
300-500 500-700 700-900 900-1100 1100-1300 1300-1500

10.8. CURTOSIS DE FISHER

Kurtosis de Fisher de Sacos de Cemento


25

20

15

10

0
300-500 500-700 700-900 900-1100 1100-1300 1300-1500
19
20

También podría gustarte