Está en la página 1de 76

ESTADÍSTICA

DESCRIPTIVA
PARTE I
Introducción
Ing. Marcelo Bastidas Jiménez
INTRODUCCION
• El término estadística no es nuevo.

•La Estadística debió comenzar como una aritmética estatal


para asistir al gobernante que deseaba conocer la riqueza y el
número de sus súbditos con el objeto de recaudar impuestos o
presupuestar la guerra.

•Es de presumir que todas las culturas que intencionalmente


registraron su historia, también registraron sus estadísticas.

•Este concepto de estadística no ha variado con el tiempo, tan


solo ha evolucionado y con el se han implementado una serie de 3
herramientas aplicables en distintos ámbitos
Ing. Marcelo Bastidas Jiménez
DEFINICION

Estadística es la ciencia
que trata de la
recopilación, organización,
presentación, análisis e
interpretación de datos
numéricos con el fin de
realizar una toma de
decisiones más efectiva.
4
CONCEPTOS IMPORTANTES
Divisiones de la Estadística

a) Estadística Descriptiva: Procedimientos estadísticos que


sirven para organizar y resumir conjuntos de datos numéricos.

b) Estadística Inferencial: Procedimientos estadísticos que


sirven para deducir o inferir algo acerca de un conjunto de datos
numéricos (población), seleccionando un grupo menor de ellos
(muestra).

Ing. Marcelo Bastidas Jiménez


ANALISIS ESTADISTICO

6
CONCEPTOS IMPORTANTES

Población: Conjunto de todos los posibles individuos,


personas, objetos o mediciones de interés estadístico. Al
tamaño de la población se lo denota con N.

Muestra: Una porción o parte de una población de


interés. Al tamaño de una muestra se lo denota con n.
El tamaño de la muestra no es determinante pero si es
importante. El factor más importante de la muestra en la
forma de seleccionarlo aleatoriamente. Una muestra es
representativa de acuerdo a la manera en la que se 7
selecciona.
Muestreo: Buenos y malos

La muestra debe ser


Ejemplo de un pésimo muestreo
representativa del conjunto

8
CONCEPTOS IMPORTANTES
Parámetros: Se refieren a las características medibles de una
población.

Estadístico: Se refieren a las característica medibles de una


muestra.
Puedo tener en los dos casos promedio,variabilidad o
proporción.

Censo: Esta técnica consiste en la obtención de datos procedentes de todos


los elementos de la población u objeto de estudio, en un tiempo determinado
y siguiendo un instrumento de recolección determinado.

Muestreo: Se diferencia del censo en que el estudio se aplica solo sobre una
muestra de la población.
Error estadístico es la diferencia entre una estimación y una realidad.
Ejemplo edad estimada de una persona 50 y real 42 . 9
Error no estadístico induce un error con criterios de medición no estadistico.
CONCEPTOS IMPORTANTES
Variable: Característica de una población que se está
analizando en un estudio estadístico.

Tipos de Variables

a) Variable cualitativa: Cuando la característica o variable en


estudio es no numérica; se les denomina también variables de
atributo.

b) Variable cuantitativa: Cuando la variable estudiada es


expresable numéricamente. Las variables cuantitativas pueden
ser discretas o continuas. 10
CONCEPTOS IMPORTANTES
Tipos de Variables
b) Variable cuantitativa….
Variables discretas: Pueden asumir solo ciertos valores y existen
usualmente “brechas” entre ellos. Normalmente las variables
discretas resultan de un conteo. Cuando adopta solo números enteros

Variables continuas: Pueden asumir cualquier valor dentro de un


intervalo específico. Cuando puedo asumir ciertos valores de un intervalo
cual quiera que sea.

0 1 2 3 ... 0 1/16 1/4 1/2 1


Por lo tanto, el número de Por lo tanto, el número de
valores es contable valores es incontable 11
CONCEPTOS IMPORTANTES

Escalas

Generación de un continuo en el que se colocan los objetos


medidos (variables); es un forma de clasificar las variables, según
lo cual se pueden realizar cálculos para resumir y presentar la
información.

• Nominal

• Ordinal

• De Intervalo; y
12

• De Razón
Ing. Marcelo Bastidas Jiménez
CONCEPTOS IMPORTANTES
Para variable Cualitativa
Escala Nominal: Observaciones solo pueden clasificarse o contarse, no existe un orden
específico. Ej. SEXO: Masculino y femenino.; ESTADO CIVIL: Soltero, casado ; viudo; divorciado; unión libre.
Escala Ordinal: Se generan categorías que se clasifican u ordenan de acuerdo con las
características particulares que poseen.
Muy bueno, bueno, regular, malo, muy malo; Gusto por las estadísticas: Muchos pocos y nada.

Para variable Cuantitativa


Escala de Intervalo: Contiene las características de la escala anterior, y además la
diferencia entre los valores representa un tamaño constante, el cero es un punto mas de la
escala. Ejm Escala de grados celsius, o centigrado, criterios de gustos 1,2,3,4,5.

Escala de Razón: Mismas característica de la escala de intervalo. Además, el punto 0


representa ausencia de valor y la razón entre dos valores es importante.
La escala de razón es netamente númerica, Ejm registre cuanto gana, cual es su edad,

13

Ing. Marcelo Bastidas Jiménez


IDENTIFIQUE LA ESCALA
 Edad (en años cumplidos):__cuantitativa- Discreta- Escala razón
 Sexo: (M) (F):______cualitativa-discreto y nominal
 Estatura (cm):_______ V cuantitativa, V continua, Escala de Razón.
 Estado civil S___ C___ D____ U___ V___ V cualitativa, V discreta, escala Nominal.

 Número de hermanos:____ V cuantitativa, V discreta, escala de razón

 Lugar de nacimiento ciudad): _____ V cualitativa, Escala de Nomianl

 La asignatura Cálculo I es:


muy fácil___ fácil___ difícil___ muy difícil___
 V cualitativa, Escala Ordinaria

 Asignatura que más te agradó en el semestre anterior:_______


 V Cualitativa, Escala nominal

 ¿Trabajas? SI:____ NO:___ V Cualitativa,, escala nominal.

 En inglés, te consideras ?
Principiante__ intermedio__ avanzado__ V. Cualitativa, V. Discreta, Escala Ordinaria

14
PARTE II
RECOLECCION
DE DATOS
Ing. Marcelo Bastidas Jiménez
INTRODUCCION

Esta parte es muy importante en la Estadística y dependerá


principalmente del uso que se le pretende dar a los datos
levantados o recolectados:

- Generación de indicadores
- Presentación de información
- Base para sistemas de información
- Proyecciones o análisis de tendencias
- Inferencia estadística
- Tratamiento para posteriores estudios.
16

Ing. Marcelo Bastidas Jiménez


FUENTES DE DATOS
Datos primarios: Datos que origina el investigador para
aplicación específica.
Datos secundarios: Datos ya publicados que han sido
recolectados para propósitos diferentes a las necesidades específicas
de la investigación en desarrollo.

Fuentes secundarias de información


- Bases de datos computacionales (internet).
- Fuentes gubernamentales (censos, estudios): INEC, CORPEI,
BCE.
- Fuentes de empresas o Instituciones: MARKOV, MARKET.
17
- Revistas o periódicos: América Economía, Latin Trade,
Industrias.
DATOS PRIMARIOS
Formas de generación
- Censos.
- Estudios de observación.
- Experimentación.
- Manejo de información histórica
- Investigación cuantitativa
- Investigación Cualitativa.

-Clientes fantasmas evaluando la calidad del servicio que se brinde.

18

Ing. Marcelo Bastidas Jiménez


REGLAS PARA CUESTIONARIOS
1. Las preguntas han de ser pocas (no más de 30).
2. Las preguntas preferentemente cerradas y numéricas.
3. Redactar las preguntas con lenguaje sencillo.
4. Formular las preguntas de forma concreta y precisa.
5. Evitar usar palabras abstractas y ambiguas.
6. Preguntas cortas.
7. Las preguntas formularlas de manera neutral.
8. En las preguntas abiertas no dar ninguna opción alternativa.
9. No hacer preguntas que obliguen a hacer esfuerzos de memoria.
10. No hacer preguntas que obliguen a consultar archivos.
19
11. No hacer preguntas que obliguen a hacer cálculos numéricos complicados.
12. No hacer preguntas indiscretas.
Ing. Marcelo Bastidas Jiménez
REGLAS PARA CUESTIONARIOS
13. Redactar las preguntas de forma personal y directa.

14. Redactar las preguntas para que se contesten de forma directa e inequívoca.

15. Que no levanten prejuicios en los encuestados.

16. Redactar las preguntas limitadas a una sola idea o referencia.

17. Evitar preguntas condicionantes con palabras que conlleven una carga
emocional grande.

18. Evitar estimular una respuesta condicionada. Es el caso se preguntas que


presentan varias respuestas alternativas y una de ellas va unida a un objetivo Tan
altruista que difícilmente puede uno negarse. 20

Ing. Marcelo Bastidas Jiménez


PARTE III
PRESENTACION Y
ORGANIZACIÓN DE
LOS DATOS
INTRODUCCION

Si los datos no se organizan de una manera


conveniente, finalmente el trabajo de recolección
es vano, ya que no se podrán hacer estudios
sobre ellos que aporten a una toma de decisiones
más efectiva.

Si la información no se presenta de manera


conveniente, no se podrán sacar conclusiones
favorables de los estudios realizados.
22
HERRAMIENTA
Distribuciones de Frecuencia
Representación ordenada de los datos brutos,
en clases o intervalos excluyentes y exhaustivos.

Nota:
Cuando se realizan distribuciones de frecuencias de
variables cualitativas, se debe referir a las clases
como categorías

Excluyente: Si un valor esta en una clase/categoría


no puede estar en otra a la vez
Exhaustivo: No podemos olvidar ningún posible
valor de la variable 23

Ing. Marcelo Bastidas Jiménez


Ejemplo: Hudson Auto Reparación

El Gerente de Hudson Auto Reparación quisiera tener una


mejor comprensión del costo de las refacciones utilizadas
al hacer una afinación de motor en sus taller de servicio.
Examina 50 facturas de clientes de afinación de motor. Los
costos de las refacciones de cada afinación, redondeados
al dólar más cercano, se enumeran abajo.

91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
24
DISTRIBUCION DE FRECUENCIA
Ejemplo: Hudson Auto Reparación
 Datos distribuidos en clases o intervalos
 Resumen (Frecuencias y Porcentaje de Frecuencias)

Costo Frecuencia Frecuencia


partes ($) Absoluta Relativa
50-59 2 4%
60-69 13 26 %
70-79 16 32 %
80-89 7 14 %
90-99 7 14 %
100-109 5 10 %

Total 50 100 %
 (Confirmar con investigación)
 Mutuamente excluyente.- Una observación no puede pertenecer a más de una
clase (Confirmar con investigación)
 Exhaustivo.- No habrán datos que se queden fuera.
25
Ejemplo: Hudson Auto Reparación
 Resumen gráfico (Histograma)

18
16
Frecuencia Absoluta

14
12
10
8
6
4
2
Costo de
50-59 60-69 70-79 80-89 90-99 100-109 partes ($) 26
PASOS PARA DISTRIBUCIONES DE
FRECUENCIA
1. Recolección de los datos (Datos sin procesar) – n representa el
número de datos

2. Ordenamiento de los datos (Datos ordenados)


a) Se puede apreciar el máximo y mínimo
b) Se puede ver la frecuencia de aparición de ciertos datos

3. Elección del número de intervalos o clases (k siempre es entero)

k = 1 + 3.32 * Log (n) (fórmula de Sturges)

4. Cálculo de la Amplitud de Clase: distancia entre dos límites


consecutivos (siempre se redondea al entero siguiente)

A = (Máximo – Mínimo)/k 27
Si la variable es discreta entonces A se redondea al entero siguiente
Si la variable es continua entonces A mantiene decimales
PASOS PARA DISTRIBUCIONES DE
FRECUENCIA
5. Generación de la tabla de frecuencias

• Intervalos o clases (Límite inferior y superior)

• Marca de clase: (punto medio de la clase)


MC = (Li + Ls) / 2

• Frecuencia absoluta: Conteo de observaciones que hay


en cada clase

• Frecuencia relativa: Proporción o porcentaje de


observaciones en cada clase
FR = (FA / n) x 100% 28

Ing. Marcelo Bastidas Jiménez Ing. Marcelo Bastidas Jiménez


PASOS PARA DISTRIBUCIONES DE
FRECUENCIA
6. Gráficas

• Histograma de frecuencias (absoluto y relativo) – para


variables cuantitativas
• Gráfica de sectores (pie) o de barras – para variables
cualitativas

29

Ing. Marcelo Bastidas Jiménez


Tablas de Contingencia
(tabulación cruzada)
La tabla de contingencia permite comparar o examinar dos variables
simultáneamente. ( Tablas de contingencias o tabulación cruzada PUEDO
COMPARAR Y ANALIZAR DOS VARIABLES A LA VEZ. La
frecuencia relativa solo permite analiza una variable.
Variable A
E1 E2 E3

F1 P(E1 y F1) P(E2 y F1) P(E3 y F1)


Totales
F2 P(E1 y F2) P(E2 y F2) P(E3 y F2) De las

P(E1 y F3) P(E2 y F3) P(E3 y F3) filas


F3

Totales de las columnas

30

Ing. Marcelo Bastidas Jiménez


Tablas de Contingencia
(tabulación cruzada)
 Las tabulaciones cruzadas pueden ser usadas cuando:
 Una variable es cualitativa y la otra es cuantitativa
 Ambas variables son cuantitativas
 Ambas variables son cualitativas

31

Ing. Marcelo Bastidas Jiménez


OTRAS REPRESENTACIONES
GRAFICAS

- Gráficos de líneas.
- Gráficos de barras: verticales y horizontales.
- Gráficos combinados de barras y líneas.
- Gráficos de barras seccionadas.
- Gráficos de sectores (pie).

32

Ing. Marcelo Bastidas Jiménez Ing. Marcelo Bastidas Jiménez


33

Ing. Marcelo Bastidas Jiménez


PARTE IV
SUMARIZACION
Ing. Marcelo Bastidas Jiménez
DE LOS DATOS
Ing. Marcelo Bastidas Jiménez
ESTADISTICA SUMARIA

Medidas de Tendencia Central: Son aquellas que hacen referencia al


punto medio de una distribución de datos.

Medidas de dispersión y variabilidad: Son aquellas que hacen referencia a la


manera de cómo se distribuyen los datos alrededor de la tendencia central.

Medidas de posición no central: Son aquellas que permiten conocer otras


características del conjunto de datos, normalmente son valores que dividen a la
muestra en partes iguales.

Medidas de forma: Son aquellas que permiten conocer datos sobre la forma de
la distribución 35
SUMARIZACION
DE LOS DATOS

MEDIDAS DE
TENDENCIA CENTRAL
LA MEDIA

Media muestral Media poblacional

_
x
 x
  x
n N
•Excel = promedio /AVERAGE
•Conocida como media aritmética o promedio
• Es la medida de tendencia central más utilizada.
• Es sensible a datos extremos. (La media es sensible a datos atípicos
•Del conjunto de datos.
37
• Se puede aplicar a datos de niveles de intervalo y de razón
Ing. Marcelo Bastidas Jiménez
LA MEDIANA ~x
La mediana no es sensible a valores atípico. ES IMPOTANTE ORDENAR LOS
DATOS. En excel la función mediana ordena los datos automáticamente.
La mediana describe exactamente la posición central en un conjunto ordenado de
datos; Antes y después de la mediana se encuentra un 50% de las observaciones.

- Cuando n es impar: la mediana es exactamente el valor de la mitad.


- Cuando n es par: la mediana es el promedio de los dos valores intermedios.

-Formula excel: MEDIANA / MEDIAN

• La ventaja que tiene la mediana sobre la media es que no es sensible a


valores extremos como lo es la media.

• Se la puede utilizar para datos de niveles ordinal, de intervalo y de


razón. 38

Ing. Marcelo Bastidas Jiménez


LA MODA x̂
La moda representa a la observación que se repite con mayor frecuencia.

Formulas: = moda () / mode ( )

• Puede haber conjuntos de observaciones que no tengan una moda (no se asume
como 0).

• Podemos encontrar conjuntos de observaciones que tengan más de una moda


(distribuciones multimodales)

• Se la puede utilizar para datos de niveles nominal, ordinal, de intervalo y de razón; se


la prefiere utilizar con los dos primeros.
•LA FRECUENCIA ESTA MEDIDA POR LA ALTURA NO POR LO
ANCHO DE LA BANDA
39
LA MEDIA GEOMETRICA

MG  n x1 * x2 * .... * xn Otra medida de tendencia central


La formula si la encuentro en excel

Medida de crecimiento
Valor al final del período
MG  n 1 porcentual promedio en series de
Valoral inicio del período
ventas o económicas..
n representa el # de períodos
entre las mediciones La información no la encuentro
en excel 40

Ing. Marcelo Bastidas Jiménez


LA MEDIA PONDERADA

w   XW i i

W i

Esta medida toma en cuenta


la importancia relativa de las
observaciones

41
42
SUMARIZACION
DE LOS DATOS

MEDIDAS DE
DISPERSION
EL RANGO

Rango  máximo  mínimo  X max  X min

• Conocido como alcance o amplitud


• Es un indicador de la extensión del conjunto de datos, sin
proporcionar más información al respecto; es calculado con la
diferencia entre el máximo y el mínimo.
•Los rangos pueden tener datos atípicos
44

Ing. Marcelo Bastidas Jiménez Ing. Marcelo Bastidas Jiménez


45
LA VARIANZA Y LA
DESVIACION ESTANDAR

2 
 (x  ) 2

Varianza poblacional
N

s2   ( x  x ) 2
Varianza muestral
n 1

La desviación estándar se obtiene sacando la raíz cuadrada de


la varianza, así mismo se tiene desviación estándar tanto
muestral como poblacional.
46
LA VARIANZA Y LA
DESVIACION ESTANDAR

La desviación estándar se entiende como un promedio


de las desviaciones entre las diferentes observaciones y la
media

47

Ing. Marcelo Bastidas Jiménez


48
49
50
51
52
53
COEFICIENTE DE VARIACION

s
CV  (100%)
x
• PARA BUSCAR UNA VARIACION ENTRE DOS CONJUNTO DE DATOS

• Mide la desviación típica en forma de “qué tamaño tiene con


respecto a la media”
• También se la denomina variabilidad relativa.
• Es frecuente mostrarla en porcentajes
• Es una cantidad adimensional. Interesante para comparar la
variabilidad de diferentes variables.
54
SUMARIZACION
DE LOS DATOS

MEDIDAS DE
POSICION NO CENTRAL

Ing. Marcelo Bastidas Jiménez


Medidas de Posición no Central
Son aquellas que permiten conocer otros puntos
característicos de la distribución que no son los
valores centrales que suelen usar indicadores que
dividen el conjunto de datos en tramos iguales.
Se las conoce también como cuantiles o fractiles.
No es tramos de longitud, sino tramos de igual
contenido.

• Cuartiles
• Quintiles
• Deciles 56

• Centiles
Ing. Marcelo Bastidas Jiménez
Medidas de Posición no Central
Cuartiles: (Q), 3 valores que distribuyen la serie ordenada en 4
tramos, cada uno de los cuales contiene aproximadamente un 25%
de los resultados.

Deciles: (D), 9 valores que distribuyen la serie ordenada en 10


tramos, cada uno de los cuales contiene aproximadamente un 10%
de los resultados.

Centiles: (C), 99 valores que distribuyen la serie ordenada, en 100,


cada uno de los cuales contiene aproximadamente un 1% de los
resultados.

Quintiles: 4 valores que distribuyen la serie ordenada en 5 tramos,


cada uno de los cuales contiene aproximadamente un 20% de los
57
resultados.

Ing. Marcelo Bastidas Jiménez


Medidas de Posición no Central

a(n  1)
Localizaci ón del cuantil 
b
Cabe anotar que la fórmula nos da la ubicación del cuantil buscado,
finalmente en el arreglo original se busca dicha posición y el valor
encontrado en la misma, corresponde al cuantil deseado.

a: cuantil buscado

b: # de tramos en el que se divide el conjunto de datos


58
n: # de observaciones
Ing. Marcelo Bastidas Jiménez
Medidas de Posición no Central
(El diagrama de cajas)
Xmin Xmax

Q1 Q2 Q3

59

Ing. Marcelo Bastidas Jiménez


SUMARIZACION
DE LOS DATOS

LOCALIZACION RELATIVA Y
DETECCION DE VALORES ATIPICOS

Ing. Marcelo Bastidas Jiménez


Regla Empírica

Podemos medir aún con más precisión el porcentaje de observaciones


que caen dentro de un alcance especifico de curvas simétricas con
forma de campana, en estos casos podemos decir:

• Aproximadamente 68% de los valores de la población cae dentro de


 1 desviación estándar a partir de la media.
• Aproximadamente 95% de los valores estará dentro de  2
desviación estándar a partir de la media
• Aproximadamente 99% de los valores estará en el intervalo que va
desde 3 desviaciones estándar por debajo de la media hasta tres
desviaciones estándar por arriba de la media.

61
VALORES Z xi  x
zi 
s
 El valor z es frecuentemente llamado el valor
estandarizado

 Denota el numero de desviaciones estándar que el


valor de un dato xi está de la media.
 Un dato con valor menor que la media de la muestra tendrá un
valor de z menor que cero.

 Un dato con valor mayor que el promedio de la muestra tendrá


un valor de z mayor que cero
62
 Un dato con valor igual que el promedio de la muestra tendrá un
valor de z igual a cero
DETECCIÓN DE VALORES ATÍPICOS

 Un valor atípico es un valor inusualmente muy


pequeño o muy grande para el conjunto de datos.

 Un dato con valor de z menor que -3 o mas grande


que +3 puede ser considerado como un valor atípico.

 Puede ser un valor de dato registrado Incorrectamente.


 Puede ser un dato
 Puede ser un valor de dato que fue incorrectamente
incluido en el conjunto de datos.
 Puede ser un valor de dato correctamente registrado y
que pertenece al conjunto de datos!!! 63
DETECCIÓN DE VALORES ATÍPICOS

Dispersión de la
Rango Intercuartílico = Q3 – Q1
mayoría de los datos

Xmin Xmax

Q1 Q2 Q3

> Q3 + 1,5 (Q3 – Q1 ) = LS


Datos
atípicos
< Q1 - 1,5 (Q3 – Q1 ) = LI

64
SUMARIZACION
DE LOS DATOS

MEDIDAS DE
FORMA

Ing. Marcelo Bastidas Jiménez


ASIMETRÍA O SESGO
 Una distribución es simétrica si la
mitad izquierda de su distribución es la
imagen especular de su mitad
derecha.

 En las distribuciones simétricas media


y mediana coinciden. Si sólo hay una
moda también coincide.

 La asimetría es positiva o negativa en


función de a qué lado se encuentra la
cola de la distribución.

 La media tiende a desplazarse hacia las


valores extremos (colas).

 Las discrepancias entre las medidas de


centralización son indicación de
asimetría.
66
ASIMETRÍA O SESGO
 El coeficiente de asimetría puede variar desde -3 hasta 3.
 Un valor cero indica una distribución simétrica.

3(media  mediana)
de Pearson CA 
s
n
(1 / n)( ( xi  x )3
De Fisher
g1  i 1
s3 67
APUNTAMIENTO O CURTOSIS
 analiza el grado de concentración que presentan los valores
alrededor de la zona central de la distribución. La comparación
siempre es respecto de una distribución normal o gaussiana. Es
adimensional.

 Se definen 3 tipos de distribuciones según su grado de


curtosis:

 Platicúrtica: curtosis < 0


 Mesocúrtica: curtosis = 0
 Leptocúrtica: curtosis > 0

n
(1 / n)( ( xi  x ) 4
g2  i 1
4
3 68
s
APUNTAMIENTO O CURTOSIS
 Distribución mesocúrtica: presenta un grado de concentración
medio alrededor de los valores centrales de la variable (el mismo que
presenta una distribución normal).

 Distribución leptocúrtica: presenta un elevado grado de


concentración alrededor de los valores centrales de la variable.

 Distribución platicúrtica: presenta un reducido grado de


concentración alrededor de los valores centrales de la variable.
160
300 400

140

300

120 200

100 200

100
80
100
Frecuencia

Frecuencia

60

0 0
40 27 37 45 53 61 69 77 85 93 3 27 37 47 57 67 77 87 97 108
45 48 51 54 57 60 63 66 69 72 75 78 81 84 32 41 49 57 65 73 81 89 99 16 32 42 52 62 72 82 92 102 138
69
Platicúrtica Mesocúrtica Leptocúrtica 69
SUMARIZACION
DE LOS DATOS

MEDIDAS PARA
DATOS AGRUPADOS

Ing. Marcelo Bastidas Jiménez Ing. Marcelo Bastidas Jiménez


LA MEDIA

  f .MC 
media 
n
Donde:
f : Frecuencia absoluta en cada clase
MC : Punto medio de la clase (marca de clase)
n : # de observaciones

71

Ing. Marcelo Bastidas Jiménez


LA MEDIANA
En primer lugar se halla la “clase mediana”, que es aquella clase
donde se agrupa por lo menos un 50% de los datos, luego se aplica la
siguiente fórmula:

 I  n 
mediana  Li     FA 
Donde:  f  2 
Li : Límite inferior de la “clase mediana”
f : Frecuencia absoluta en la “clase mediana”
n : # de observaciones
FA : Frecuencia acumulada anterior a la “clase mediana”
72
I : Intervalo
Ing. Marcelo Bastidas Jiménez Ing. Marcelo Bastidas Jiménez
LA MODA
En primer lugar se halla la “clase modal”, que es aquella clase que
tiene la mayor frecuencia absoluta.

 d1 
moda  Li  I *  
 d1  d 2 
Donde:
Li : Límite inferior de la “clase modal”
I : Intervalo
d1 : Frecuencia de la “clase modal” – frecuencia anterior
d2 : Frecuencia de la “clase modal” – frecuencia posterior
73

Ing. Marcelo Bastidas Jiménez Ing. Marcelo Bastidas Jiménez


LA VARIANZA Y LA
DESVIACION ESTANDAR
Varianza poblacional Varianza muestral
 ( MC   ) 2
*f   _

2 
N
 

( MC  x ) 2
* f 

s 
2

n 1
Donde:
f : Frecuencia absoluta en cada clase
MC : Punto medio de la clase (marca de clase)
n ó N : # de observaciones
media : Se utiliza la media de datos agrupados

La desviación estándar se obtiene sacando la raíz cuadrada de


74
la varianza, así mismo se tiene desviación estándar tanto
muestral como poblacional.
Ing. Marcelo Bastidas Jiménez
Porcentaje de Variación
Se utiliza para calcular el porcentaje en que un dato varía con
el tiempo o para calcular simplemente la desviación entre un
dato calculado y el dato real.

 real  estimado 
variación    *100%
 estimado 

Para el cálculo de una tasa de crecimiento simplemente se toma el


dato de un período como el real y el dato de un período anterior
como el estimado.
75
Tasa de Crecimiento

 actual  anterior 
variación    *100%
 anterior 

76

Ing. Marcelo Bastidas Jiménez

También podría gustarte