Está en la página 1de 52

ESTADSTICA

DESCRIPTIVA
PLUTARCO MARTNEZ BUSTOS

Calendario acadmico
2015 2
Primer seguimiento: del 7 al 11 de
septiembre
Segundo seguimiento: del 13 al 16 de
octubre
Tercer seguimiento: del 16 de al 20 de
noviembre

Contenido
Unidad I: Conocimientos Bsicos y Generales
Sobre Estadstica Descriptiva
Qu es Estadstica?
Que es investigacin estadstica
Conceptos
Bsicos:
Estadstica
descriptiva,
estadstica inferencial, poblacin, Muestra, variable,
variables cuantitativas y cualitativas
Elaboracin de una tabla de frecuencias.
Anlisis e interpretacin de tablas de frecuencias.
Variables cuantitativas discretas y continuas y
variables cualitativas
Representaciones grficas

Contenido
Unidad II. Medidas de Tendencia Central, de
Dispersin y de Forma
Medidas de Tendencia Central: Media, mediana,
moda, cuartiles, deciles y percentiles.
Medidas de dispersin: Varianza, desviacin
tpica, coeficiente de variacin.
Medidas de Forma: Asimetra y curtosis
Unidad III. Relacin Entre Variables
Covarianza
Coeficiente de correlacin
Relacin entre variables

Contenido
Unidad IV. Herramienta de Office Excel
Aplicacin de todo lo visto utilizando la
herramienta de Excel

Estadstica
Es la ciencia que se ocupa de 1) La recoleccin,
organizacin, resumen y anlisis de los datos y 2) la
obtencin de inferencias a partir de un volumen de
datos cuando se examina solo una parte de estos.
Las personas que realizan esta actividad estadstica
deben estar preparadas para interpretar y comunicar
los resultados a los dems, tal como lo demande la
situacin. En trminos sencillos, se puede decir que
los datos son nmeros, que los nmeros contienen
informacin y que el propsito de la estadstica es
investigar y evaluar la naturaleza y el significado de
esa informacin.

Qu es Investigacin Estadstica?

Es la metodologa orientada a la recopilacin de


informacin sobre una poblacin.
Es la que permite identificar, determinar y seleccionar
todos los elementos necesarios (variables, poblacin,
datos, mtodos) para medir la investigacin.
El conocimiento de la estadstica interviene en todas
las fases del trabajo de investigacin, desde la
decisin sobre las variables que se investigan y la
planificacin de la forma que se ha de recoger los
datos, hasta la interpretacin de los resultados
obtenidos en el anlisis del mismo.

Qu es Investigacin Estadstica?

Los aspectos bsicos en el planteamiento


de una investigacin estadstica son:
1.
2.
3.
4.
5.

Objeto de la investigacin
Unidad de investigacin
Recoleccin de la informacin
Procesamiento de la informacin
Publicacin

Conceptos Bsicos en
Estadstica

Estadstica

Descriptiva

Procedimientos empleados para organizar y resumir


conjuntos de observaciones en forma cuantitativa, puede
hacerse mediante tablas y grficos, estos permiten
simplificar la complejidad de los datos que intervienen en
la distribucin. As mismo se calculan parmetros
estadsticos que caracterizan la distribucin. No se hace
uso del clculo de probabilidades y nicamente se limita a
realizar deducciones directamente a partir de los datos y
parmetros obtenidos.
Con este mtodo, se obtienen conclusiones sobre el
conjunto de datos sin que sobrepasen el conjunto de
conocimientos que proporcionan.

Estadstica Inferencial
Plantea y resuelve el problema de establecer previsiones y
conclusiones generales sobre una poblacin a partir de la informacin
contenida en una muestra. Los modelos estadsticos actan de
puente entre lo observado (muestra) y lo desconocido (poblacin). Su
conclusin y estudio estn basado en el clculo de las probabilidades.
Mtodo y conjunto de tcnicas utilizadas para obtener un conjunto de
datos, conclusiones que sobrepasan los lmites de los conocimientos
aportados por el conjunto de datos.
Generalmente este proceso se determina mediante el estudio
de muestras.

Conceptos Bsicos

Poblacin: Es el conjunto de todos los elementos que


cumplen ciertas propiedades y entre los cuales se desea
estudiar un determinado fenmeno.
Muestra: Es el subconjunto de la poblacin que es estudiado
y a partir de la cual se sacan conclusiones sobre las
caractersticas de la poblacin. La muestra debe ser
representativa, en el sentido de que las conclusiones
obtenidas deben servir para el total de la poblacin.
Variable: Cada uno de los rasgos o caracterstica de los
elementos de una poblacin y que varan de un individuo a
otro (salario, color de ojos, sexo, nmero de hijos, etc.)

Conceptos Bsicos
Tipos de Variables
Variables cualitativas (o categricas): Aquellas que no
aparecen en forma numrica, sino como categoras o
atributos (sexo, estado civil, color de ojos, etc.)
Estas pueden agruparse en variables nominales u ordinales.
Variable nominal: Cuando los datos correspondan a una
variable cualitativa que se agrupa sin ninguna jerarqua entre
s, como por ejemplo: nombres de personas, de
establecimientos, raza, grupos sanguneos, estado civil. Estas
variables no tienen ningn orden inherente a ellas ni un
orden de jerarqua.
Variable ordinal: Cuando las categoras o valores que
adopte una variable cualitativa poseen un orden, secuencia o
progresin natural esperable, por ejemplo: grados de
desnutricin,
respuesta
a
un
tratamiento,
nivel
socioeconmico, intensidad de consumo de alcohol, das de
la semana, meses del ao, etc.

Conceptos Bsicos
Variables cuantitativas: Las que pueden expresarse
numricamente (temperatura, produccin, edad, etc.)
Las Variables cuantitativas se clasifican en
variables
discretas y variables continuas
Si entre dos valores determinados existen infinitas
posibilidades de valores, hablaremos de una variable de
tipo continuo. Ejemplos de este tipo de variables son: el
peso, la talla, la presin arterial o el nivel de colesterol, etc.
Si la variable a medir slo puede adoptar un slo valor
numrico, entero, con valores intermedios que carecen de
sentido, hablaremos de variable cuantitativa de tipo
discreto. Son ejemplos de ellas: el nmero de hijos, de
unidades vecinales del sector, nmero de exmenes de
laboratorio o de pacientes atendidos.

Elaboracin de una Tabla de


Frecuencias Datos no
Agrupados

Para
una tabla de frecuencias se procede de la
siguiente
elaborar
manera:
Marca de clase (): Son las observaciones
Frecuencia absoluta (): Es el nmero de veces que se
repite cada observacin
Frecuencia absoluta acumulada (): Es la suma sucesiva de
la frecuencia absoluta
Frecuencia relativa (): Es la relacin entre la frecuencia
absoluta y el total de observaciones multiplicado por cien.
Esto es:
Frecuencia relativa acumulada (): Es la suma sucesiva de
la frecuencia relativa

Ejemplo
Los siguientes datos representan los
ingresos anuales de 30 familias
expresados en millones de pesos
20

20

22

19

18

20

18

19

21

20

20

20

21

22

20

21

19

20

21

20

22

21

21

19

22

21

20

22

22

21

Representacin Grfica
Para dar una informacin general de los
datos, se usan las representaciones grficas.
Las grficas sirven visualizar mejor la
informacin, pero nunca sustituyen al
cuadro, tan solo se les debe considerar
como complemento.
Grfico de frecuencias (Grfico de
barra): En el eje horizontal se colocan los
distintos valores de la variable Xi y en el eje
vertical van los valores de las frecuencias
absolutas o relativas.

Representacin Grfica
Grfico
circular: Es el rea del circulo

dividido en sectores o porciones de rea
correspondiente a la frecuencia relativa,
cada sector circular se encuentra por la
expresin.
donde es la frecuencia relativa.

Ejemplo
Los
siguientes
datos
representan
los
tiempos
(redondeados a minutos) que demoran en ser atendidos
40 clientes de un banco
13
10
10
13

10
11
10
12

11
9
9
9

9
10
9
9

11
9
13
12

11
15
11
12

10
10
10
11

15
15
12
12

13
13
10
15

11
12
10
11

Elabore la tabla de frecuencias


Realice un grfico de barras para la frecuencia relativa
Realice un grfico circular
Que porcentaje de personas demoran en ser mas
atendidos

Ejemplo
Los siguientes datos representan el nivel de estudio de 50 trabajadores
Hallar: Tabla de frecuencias
Que porcentaje de personas son profesionales
Realice un grafico de barras para fr y uno circular

Bachille Maestr Bachille Maestr Profesio Bachille Profesio Maestr Profesio Profesio
r
a
r
a
nal
r
nal
a
nal
nal
Profesio Bachille Profesio Profesio Maestr Bachille Profesio Maestr Maestr Bachille
nal
r
nal
nal
a
r
nal
a
a
r
Maestr Profesio Profesio Profesio Profesio Doctora Profesio Profesio Profesio Maestr
a
nal
nal
nal
nal
do
nal
nal
nal
a
Doctora Bachille Doctora Bachille Bachille Bachille Profesio Maestr Bachille Maestr
do
r
do
r
r
r
nal
a
r
a
Profesio Bachille Maestr Profesio Doctora Profesio Bachille Profesio Maestr Bachille
nal
r
a
nal
do
nal
r
nal
a
r

Elaboracin de una Tabla de


Frecuencias Datos Agrupados
Los siguientes datos representan las
estaturas de una muestra de 50
estudiantes
del
programa
de
contadura
163 144 190 158 138 180 164 193 195 159
178
147
194
196

196
174
199
178

189
190
136
154

152
165
169
180

174
134
169
153

168
175
151
174

170
168
198
170

167
172
184
166

146
165
202
183

198
180
176
152

Representacin Grfica
Histograma: Son diagramas de frecuencias
unidimensionales en los cuales en un plano
cartesiano se levantan rectngulos de rea
proporcionales a las frecuencias sobre los intervalos
del eje horizontal. en ellos se representan las
frecuencias absolutas y relativa.
Ojiva: La representacin grfica para las frecuencias
absolutas y relativas acumuladas en una variable se
hace a travs de una ojiva ascendente. Para ello se
determinan los puntos de intercepcin entre cada
valor de la variable y su respectiva frecuencia, luego
se une con trazos rectilneos

Ejemplo 2
La compaa High Performance Bicycle Products de Chapel
Hill, Carolina del Norte, hizo un muestreo de sus registros
de embarque (Tiempo entre la relacin de una orden y su
entrega) para ciertos das con los siguientes resultados :

1
1 1
1 1 1
4
8
6 7
2
4 1
3 3 1
1 2
1 1 1 2
2
Elabore una tabla5de frecuencias7
6
1 0
9 0 5 4
9
Si la compaa desea asegurar que la

a.
b.
mitad de sus
entregas se hagan en 9 das o menos, puede determinar,
a partir de la distribucin de frecuencias, si han logrado
esta meta?
c. Elabore un histograma para la frecuencia relativa y una
ojiva para la frecuencia relativa acumulada

Ejemplo 3
Los resultados siguientes representan las calificaciones
del examen final de un curso de estadstica elemental.
23

60

79

32

57

74

52

70

82

36

80

77

81

95

41

65

92

85

55

76

52

10

64

75

78

25

80

98

81

67

41

71

83

54

64

72

88

62

74

43

60

78

89

76

84

48

84

90

15

79

34

67

17

82

69

74

63

80

85

61

Construya una tabla de frecuencias


Realice un histograma para fa y una ojiva para FR

Medidas de Tendencia Central

Las
medidas de tendencia central nos permiten
determinar la posicin de un valor respecto a
un conjunto de datos, el cual consideramos
como representativo para el total de las
observaciones.
Dentro de las medidas de tendencia central
tenemos: Media Aritmtica, mediana, moda.
Media Aritmtica : Es la mas conocida y
sencilla de calcular, de gran estabilidad en el
muestreo y sus formulas admiten tratamientos
algebraicos. Su principal desventaja es el de ser
muy sensibles a los cambios que se le haga en
algunos de sus valores, o cuando los valores
extremos son demasiado grandes o pequeos.

Medidas de tendencia
Central

Mediana (Me):Se dene como el valor central en la


distribucin de los datos. De la mediana se
puede decir que es nica, es simple y los valores
extremos no tienen efectos importantes sobre la
mediana, lo que si ocurre con la media.
a. Nmero impar de observaciones: Si tomamos
los datos originales para calcular la mediana, lo
primero que debemos hacer es ordenar los datos
de menor a mayor o de mayor a menor y luego
tomamos el valor central.

Medidas de tendencia
Central
b. Nmero par de observaciones:
Cuando el nmero de observaciones es
par, la mediana es igual al promedio
aritmtico de los dos trminos
centrales, es decir, el valor resultante
de la suma de las dos observaciones
centrales dividida por dos.

Medidas de tendencia
Central
Moda (Mo): Es el valor de la variable que
presenta mayor frecuencia. La moda se puede
hallar en variables cuantitativas y cualitativas.
Si en un grupo hay dos o varias puntuaciones
con la misma frecuencia y esa frecuencia es
la mxima, la distribucin es bimodal o
multimodal, es decir, tiene varias modas
Cuando todas las puntuaciones de un grupo
tienen la misma frecuencia, no hay moda

Medidas de Posicin

Cuando la distribucin contiene un


nmero alto de intervalos o de marca
de clases y se requiere obtener un
promedio de una parte de ella, se
puede dividir la distribucin en cuatro,
diez o cien partes. En el primer caso se
habla de cuartiles, en el segundo se
denomina deciles y en el ltimo
centiles o percentiles.

Medidas de Posicin

Cuartiles: son los tres valores que dividen al


conjunto de datos ordenados en cuatro partes
iguales.
El primer cuartil Q1 se dene como aquel valor
de la variable que supera el 25% de la
observaciones y es superado por el 75% de las
observaciones
El segundo cuartil Q2 (la mediana), es aquel
valor de la variable que supera al 50% y es
superado por el 50%
El tercer cuartil Q3 es aquel valor de la
variable que supera al 75% y es superado por
el 25% de las observaciones

Medidas de
Posicin

Deciles: son los nueve valores que


dividen al conjunto de datos ordenados
en diez partes iguales.
Percentiles: Son 99 valores que
dividen en cien partes iguales el
conjunto de datos ordenados en cien
partes iguales.

Ejemplos
1. Para el siguiente conjunto de datos
1 1 1
1 1 1 1
6 8
9
4 7 0
5 9 1 3

Hallar:
a. D3, D6 y D9
b. P8; P35; P60

Ejemplos
2. Los siguientes datos representan los
ingresos mensuales de 15 persona.
650 670 700 750 800
750 800 850 900 900
650 670 650 670 800
Hallar:
a. Ingreso medio
b. Ingreso central
c. Ingreso que mas se repite
d. Q1, D4; P80

Medidas de dispersin
Son aquella que nos determinan como
se agrupan o se dispersan los datos
alrededor de un promedio (o media).
Entre las mas importantes tenemos:
Varianza,
desviacin
tpica
o
desviacin estndar y coeficiente de
variacin.

Medidas de dispersin
Varianza:

De todas las medidas de


dispersin es la mas importante, mas
conocida y usada. Se le define como la
media aritmtica de los cuadrados de
las desviaciones respecto a su media.
Esta dada por:

Medidas de dispersin
Desviacin
tpica o desviacin estndar: Es

la raz cuadrada de la varianza, y est dada por:
Coeficiente de variacin: En ocasiones nos
interesa comparar la variabilidad de dos series
de datos. Generalmente podemos encontrar que
ambas series estn expresadas en diferentes
unidades. Puede darse el caso en que estn
expresadas en la misma unidad, pero nos
interesa determinar la variacin respecto a una
base. Para resolver el anterior problema se usa

Medidas de Distribucin
Las medidas de distribucin nos permiten
identificar la forma en que se separan o aglomeran
los valores de acuerdo a su representacin grfica.
Estas medidas describen la manera como los datos
tienden a reunirse de acuerdo con la frecuencia
con que se hallen dentro de la informacin. Su
utilidad radica en la posibilidad de identificar las
caractersticas de la distribucin sin necesidad de
generar el grfico. Sus principales medidas son la
Asimetra y la Curtosis.

Asimetra

Esta
medida nos permite identificar si
los datos se distribuyen de forma
uniforme alrededor de la Media
aritmtica. La asimetra presenta tres
estados diferentes, los cuales son:
1. Asimetra positiva cuando
2. Simtrica cuando
3. Asimetra negativa cuando

Asimetra

Coeficiente de Asimetra de Fisher

El Coeficiente de asimetra, se calcula


mediante la siguiente frmula:
Si As = 0 la distribucin es simtrica.
Si As > 0 La distribucin es
asimtricamente positiva.
Si As < 0 La distribucin es
asimtricamente negativa

Curtosis
Esta medida determina el grado de
concentracin que presentan los valores en la
regin central de la distribucin
TIPOS DE CURTOSIS
As puede ser:
Leptocrtica.-Existe una gran concentracin.
Mesocrtica.-Existe
una
concentracin
normal.
Platicrtica.-Existe una baja concentracin.

TIPOS DE CURTOSIS

Coeficiente de Curtosis

Para
calcular el coeficiente de Curtosis
se utiliza la ecuacin

Si a < 3 la distribucin es platicrtica


Si a = 3 la distribucin es normal o
mesocrtica
Si a > 3 la distribucin es leptocrtica

Ejemplos
Determinar qu tipo de asimetra y
curtosis tienen las siguientes
distribuciones
a) 8, 14, 16, 13, 16
b) 6, 9, 9, 12, 12, 12, 15 y 17

Medidas de las relaciones entre variables

En el anlisis de los procesos empresariales y


econmicos se utilizan a menudo las relaciones entre
variables. La covarianza y la correlacin permiten
describir numricamente una relacin lineal.
Covarianza (Cov): Es una medida de la relacin
lineal entre dos variables. Un valor positivo indica
una relacin lineal directa o creciente y un valor
negativo una relacin lineal decreciente. La Cov est
dada por

Coeficiente
de correlacin: Nos da una medida

de la relacin lineal entre dos variables, nos indica el
sentido como el grado de relacin. La covarianza y
el coeficiente de correlacin tienen el mismo signo
(ambos positivos o ambos negativos). Esta dado por:
El coeficiente de correlacin va de -1 a +1. Cuanto
ms cerca se encuentra r de +1, mas cerca se
encuentran los datos de puntos de una lnea recta
ascendente que indican una relacin lineal positiva.
Cuanto ms se encuentra r de -1, mas cerca se
encuentran los datos de puntos de una lnea recta
descendente que indican una relacin lineal
negativa. Cuando r=0, no existe relacin entre x e y.

Ejemplo
A continuacin se presenta una muestra del
precio de la lamina de triple x, y la cantidad
vendida, y (en miles)
Precio por
Lamina (x)

Laminas
Vendidas (y)

80

60

70

40

10

20

Calcule la covarianza y el coeficiente de


correlacin

Relaciones Lineales

En el anlisis de los procesos empresariales y econmicos se


utiliza a menudo las relaciones entre variables. Estas relaciones
se expresan en trminos matemticos de la forma siguiente:
Donde f(x) es una funcin que puede adoptar muchas formas
lineales y no lineales.
En el modelo de regresin lineal simple hay dos variables una
independiente(x) y una dependiente (y) , el cual esta dado por:
Con como la ordenada en el origen y la pendiente de la recta. Es
decir la variacin que experimenta por cada variacin unitaria de

Regresin

por mnimos cuadrados


La recta de regresin
Donde
Y

Ejemplo
Una empresa fija un precio distinto
sistema de DVD en ocho regiones del
siguientes datos muestran los precios
nmero de unidades vendidas (y) (en
dlares)
Preci
o

5.5

6.0

6.5

6.0

5.0

6.5

4.5

para un
pas. Los
(x) y el
miles de
5.0

Vent 420 380 350 400 440 380 450 420


as
Encuentre
los valores de a y b para la recta

a.
de
regresin
b. Estime la venta para un precio de 7.0
c. Represente los datos en un grafico de dispersin

Ejemplo
Un profesor intenta mostrar a sus estudiantes la importancia de
los exmenes cortos, aun cuando el 90% de la calificacin final
est determinada por los exmenes parciales. l cree que
cuanta ms alta son las calificaciones de los exmenes cortos,
ms alta ser la calificacin final. Seleccion una muestra
aleatoria de 15 estudiantes de su clase con los siguientes datos:
Promedio
exmenes cortos
Promedio Final

de 5
9
6
5

9
2
8
4

7
2
7
7

9
0
8
0

9
5
7
7

8
7
8
1

8
9
8
0

7
7
8
4

7
6
8
0

6
5
6
9

9
7
8
3

4
2
4
0

9
4
7
8

6
2
6
5

9
1
9
0

1. Establezca la variable dependiente (Y) y la variable


independiente (X). Utilizando el mtodo de mnimos cuadrados
estime los parmetros del modelo de regresin
2. Estime la nota promedio final para una nota promedio de
exmenes cortos de 80
3. Dibuje un diagrama de dispersin para estos datos y trace
la recta de regresin

Bibliografa
Lind D, Marchal W. y Wathen S. Estadstica
aplicada a los negocios y la economa.
Mcgraw Hill 2005.
Levin R. Rubin D. Estadstica para
administracon y economa. Pearson. 2004
Martin F. Introduccin a la estadstica
econmica y empresarial. Ac editorial 2004
Walpole y Myers. Probabilidad y Estadstica.
Pearson ediciones. Sexta edicin