Está en la página 1de 27

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

ESTADSTICA APLICADA

Estadstica: Ciencia que trata de la recopilacin, organizacin presentacin, anlisis


e interpretacin de datos numricos (estadsticas), con el fin de realizar una toma de
decisiones ms efectiva.
Estadstica
descriptiva

Probabilidad

Estadstica
Inferencial

Procedimientos estadsticos que sirven para organizar y resumir


conjuntos de datos numricos.
Mide la incertidumbre, deduce las leyes que rigen a los
fenmenos que se investigan.
Implica realizar inferencias acerca de la de la poblacin a partir
de datos muestrales y requiere clculo de probabilidades.

Poblacin Conjunto de todos los posibles individuos, personas, objetos o mediciones


de inters estadstico sobre el que estamos interesados en obtener conclusiones (hacer
inferencia). Normalmente es demasiado grande para poder abarcarlo (Tamao
poblacin: N)
A las medidas de resmenes poblacionales como la media poblacional , desviacin
estndar , se les denominan parmetros.
Parmetro: Caracterstica numrica de la poblacin. Un parmetro es un valor que
describe a toda una poblacin.
Ejemplo: La edad "promedio" () de los estudiantes de tercer ao de Ingeniera
en Obras Civiles.

Civil

Muestra: es un subconjunto de la poblacin al que tenemos acceso y sobre el que


realmente hacemos las observaciones (mediciones)
Debe ser representativa se denota Tamao de la muestra: n
Esta formado por miembros seleccionados de la poblacin (individuos, unidades
experimentales).
A las medidas de resmenes muestrales como la media de la muestra x , desviacin
estndar de la muestra s, , se les denomina estadsticos.

Estadstico: Caracterstica numrica de una muestra. Una estadstica es un valor


que describe a una muestra. x , desviacin estndar de la muestra s, , se les
denomina estadsticos.
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Ejemplo: El tiempo "promedio" ( x ) calculada a partir de un conjunto de 80 tiempos


mximos (minutos) de barras planas de un tipo de acero que soportan antes de
fragmentarse, cuando son sometidas a tensin. (n=80)

Unidad de observacin: Cada uno de los elementos que componen la poblacin en


estudio
Variable:Es una caracterstica, atributo o propiedad que puede variar ( tomar
diversos valores ) de una unidad de observacin a otra y cuya variacin es
susceptible de medirse
Notacin:- En vez de escribir la variable en cada oportunidad, se emplean smbolos,
letras maysculas ltimas del abecedario
Ejemplo: Variable peso = X y xi la observacin i-sima; cuando se tiene que reemplazar
por una observacin especfica, se cambia el subndice i por un nmero. Si en una familia
cinco nios pesan 20, 18, 13, 40 y 52 kilos: x1 =20; x2=18;x3=13;x4=40 y x5=52

Qu significara Xi-1 si i = 3?

X2 = 18

Datos: Conjunto de valores de la variable, medidos a partir de cada uno de los


elementos de una poblacin o muestra.
Observacin estadstica: Conjunto de datos correspondientes a varias variables
identificadas y pertenecientes a un mismo individuo o elemento.
Variable: es una caracterstica observable que vara entre los diferentes individuos
de una poblacin. La informacin que disponemos de cada individuo es resumida en
variables.
Dato: Valor de la variable asociado a un elemento de la poblacin o muestra.
Ejemplo1:-Los siguientes valores expresan el nmero de veces que 22 consumidores
compraron una determinada marca de un producto en los dos ltimos meses:

0, 2, 5, 0, 3, 1, 8, 0, 3, 1, 1, 9 4, 0 2, 2, 9 , 3, 0, 1, 9, 8
Construya la tabla que muestre estos datos en forma ordenada

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Valores

RESPUESTA
EJEMPLO 1

0
1
2
3
4
5
8
9
Total

N
veces
5
4
3
3
1
1
2
3
22

Observe que la tabla tiene dos


columnas (valores y n de
veces que se compr
determinada marca de un
producto) y 11 filas, sumando
el total 22 marcas

Ejemplo de tabla de frecuencias con variable


cualitativa
En una gran empresa Constructora se registra el tipo
de procedimiento que realizan los trabajadores en
el mes se clasifican en procedimiento :insuficiente
(DI) y suficiente (DS) de acuerdo a las labores
efectuadas.
DS

DS

DS

DS

DS

DS

DS

DS

DS

DS

DI

DS

DS

DS

DI

DS

DS

DI

DI

DI

DI

DI

DI

DS

Cmo se construira una tabla de frecuencias


PROF.:FLOR SOLIS F.
con esta informacin?

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Respuesta
Tipo de
procedimento
(X)

ni

fi

Ni

Fi

DS
DI
Total

16
8
24

66,7
33,3
100

16
24

66,7
100

PROF.:FLOR SOLIS F.

Ejemplo 2:- En la universidad Z, se desea cuantificar el gasto semestral de la


educacin de los alumnos de primer ao. Uno de los gastos que hace un estudiante
es la compra de sus libros de estudio, insumos del computador, fotocopias. Para este
efecto, se realiza una encuesta a los alumnos de las carreras de Contador Auditor,
Medicina, Ingeniera Comercial ,Ingeniera Civil en Obras Civiles, se les pregunta
sobre el gasto realizado en la compra de estos tems durante el semestre.
La poblacin en estudio es.
La muestra est constituida por
La variable en estudio es..
La unidad de observacin es.
Un ejemplo de dato es..
Un ejemplo de observacin estadstica es

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

RESPUESTA
EJEMPLO 2

La poblacin en estudio es:


Todos los estudiantes de la universidad Z
La muestra esta constituida por los estudiantes de las
carreras de primer ao Contador Auditor , Medicina,
Ingeniera Comercial e Ingeniera Civil en Obras Civiles
La variable en estudio es: el gasto en $ de la compra de
libros, insumos computacionales, fotocopias.
La unidad de observacin es cada alumno de la universidad
Dato: el precio de un libro, el precio de un CD.
Observacin estadstica: Para el alumno Y, el gasto por
comprar un libro de Fsica, Matemtica, Estadstica , 50 CD, 300
fotocopias etc

Ejemplo 3:- Continuando con el mismo ejemplo, el Departamento de Finanzas desea


evaluar el gasto promedio en libros de todos los alumnos de la universidad;
identific a 50 estudiantes y les solicit que tomaran nota de sus gastos en libros y
que informaran cuanto gastaron en promedio.

El parmetro es..
La estadstica es

El parmetro es el gasto promedio en libros de todos


los alumnos de la universidad
La estadstica es el gasto en libros de los 50
estudiantes

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

II.- CLASIFICACIN DE VARIABLES


Segn su naturaleza, las variables se clasifican en:
Variables cualitativas o categricas, son aquellas que slo pueden clasificarse pero
no medirse.
Variables cuantitativas, son aquellas cuyos valores se pueden expresar en
cantidades numricas.
Segn el recorrido, las variables se clasifican en:
Variables dicotmicas: slo toma dos valores
Variables discretas, solo pueden tomar determinados valores, en general, nmeros
enteros adems el cero.
Variables continuas, son aquellas que pueden tomar cualquier valor dentro de un
intervalo dado.
Ejemplo 4:- Identifique en cada caso si la variable de inters es cualitativa o
cuantitativa.
Una empresa automotriz realiza un estudio de mercado para saber cual es la
aceptacin que ha tenido un modelo especfico de sus automviles. Para ello se
encuest a 20 personas que haban adquirido el vehculo , obtenindose la
siguiente informacin:
Aceptacin del vehculo (1 = excelente, 2 = bueno, 3 = regular y 4 = malo)
Ingreso mensual en miles de pesos.
Edad de las personas.
Sexo de las personas (1 = masculino; 2 = femenino)
N de meses que posee el vehculo.
Kilmetros recorridos.
Color del vehculo.
De acuerdo con su naturaleza, a las variables se les puede asignar una escala de
medicin, es decir, son las clases, categoras o intervalos que se le puede asignar
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Para las variables categricas, las escalas son: nominal u ordinal


Para las variables cuantitativas, las escalas son: de intervalo y de razn
Escala nominal: Cuando se utiliza nombres para establecer categoras en las cuales
se clasifican exclusivamente los valores de las variables. Estas categoras no tienen
orden lgico ni una relacin jerarqua.
Categoras mutuamente excluyentes, son aquellas en que una persona, objeto o
medicin se incluye solamente en una categora.
Escala ordinal: Se compone de distintas categoras en las que hay implcito un
orden en virtud de un determinado criterio.
Escala Intervalar: Al igual que los dos tipos de escalas anteriores, esta escala
permite establecer relaciones de igualdad /desigualdad y de orden entre los objetos
que se miden. Establece la distancia entre una medida y otra. Este tipo de escala
carece de un cero absoluto.
Ejemplo: Temperatura. Los intervalos de la escala son iguales, se puede afirmar
que la diferencia de temperatura que existe entre 25 y 28 grados es la misma que
existe entre 30 y 33 grados. Sin embargo, dado que el punto 0 de la escala es
arbitrario -no existe ausencia de temperatura- no se puede afirmar, por ejemplo,
que 20 grados es exactamente la mitad de 40 grados.
Escala de Razn: Es la escala que permite el nivel ms alto de medicin. Adems
de las operaciones que permiten las escalas anteriores, en una escala de razn existe
el cero (0) emprico, por lo cual se puede efectuar cualquier operacin aritmtica
con los nmeros de la escala. El tiempo de reaccin, por ejemplo es una variable
medida en escala de razn. No slo se puede afirmar que la diferencia entre 3 y 6
segundos es la misma que entre 6 y 9 segundos (afirmacin vlida tambin en la
escala de intervalos), sino, adems, que 6 seg. es el doble de 3 seg. Afirmacin que
es posible establecer gracias a que en la escala de tiempo de reaccin existe el cero
absoluto: cero seg. Significa ausencia de tiempo de reaccin.
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

En el esquema siguiente, se resume la clasificacin de las variables

ORGANIZACIN Y REPRESENTACIN DE LOS DATOS.


Una vez que se dispone de los datos para cada individuo, la pregunta que
surge es como presentarlos de manera resumida?, es decir cmo describir la
informacin disponible de una manera clara y concisa?
Una forma de describir los datos es mostrar la frecuencia con que se
presentan o se repite cada uno de los valores, los que se agrupan en intervalos (en el
caso de datos cuantitativos) o categoras (para datos cualitativos) de la o las
variables consideradas.
Frecuencia absoluta: el nmero de individuos que pertenecen a cada categora o el
nmero de veces que un mismo valor se presenta en el conjunto de datos. Se
designa por n i
Frecuencia relativa: proporcin de individuos que poseen la cualidad o que
pertenecen a dicha categora. Se denota fi, y representa la posicin relativa que
ocupa cada categora en el total (n). fi = (ni / n)*100
Frecuencia absoluta acumulada Ni: es la suma de las frecuencias absolutas.
Frecuencia relativa acumulada Fi: es la suma de las frecuencias relativas.
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Distribucin de frecuencias de variables cuantitativas de nivel de medicin de


razn o de recorrido continuo
Modelo general de una tabla de distribucin de frecuencias
Nombre de la
variable (X)

Frecuencia
Absoluta
ni

Frecuencia
Relativa fi

n1
n2
.
.
.
nk
n

f1
f2
.
.
.
fk
1

k clases o
categoras, o el
recorrido de la
variable en
intervalos
Total

ni = nmero de observaciones en la clase i ;

Frecuencia
Absoluta
Acumulada Ni
N1
N2
.
.
.
Nk = n

ni = n

Frecuencia
Relativa
Acumulada
Fi
F1
F2
.
.
.
Fk = 1

i=1,2,3,.........k

n = tamao de la muestra
fi = ni/n proporcin de datos en la clase i ;

fi = n

i = 1,2,3,.........k

Ni = ni ;

Fi = fi

i = 1,2,3,.........k

i = 1,2,3,.........k

Al construir tablas de frecuencias con intervalos es necesario tener presente:

Nmero de clases o intervalos

Una regla que puede ayudar a decidir el nmero de clases es la frmula de Sturges:
Nmero de clases = [1 + 3,3 log n] (donde n = tamao de la muestra)

Amplitud de intervalo
Amplitud de intervalo
Valor mximo Valor mnimo
Nmero de clases

Marca de clase: Es el punto medio de un intervalo. Se designa por x'i

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

MEDIDAS DE RESUMEN

- de Tendencia central o de posicin


- de Dispersin
- de Forma

I MEDIDAS DE TENDENCIA CENTRAL O DE POSICIN


Una de las caractersticas ms sobresaliente de la distribucin de datos es
su tendencia a acumularse hacia el centro de la misma. Esta caracterstica se
denomina tendencia central.
Las medidas de tendencia central mas usuales son:
Media Aritmtica o Promedio Aritmtico
1.- Es una medida totalmente numrica o sea slo puede calcularse en datos de
caractersticas cuantitativas.
2.- En su clculo se toman en cuenta todos los valores de la variable.
3.- Es lgica desde el punto de vista algebraico.
4.- La media aritmtica es altamente afectada por valores extremos.
5.- No puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
6.- El promedio de una variable X se denota X
La media es una medida apropiada de tendencia central para muchos
conjuntos de datos. La media de las observaciones X1, X2 , X3,...X n es el promedio
aritmtico de estas y se denota:
x =

xi/n

(para datos sin tabular)

xini/n

(para datos tabulados, con k = n de intervalos)

i =1

x =

i =1

A veces se asocia a los nmeros


W1, W2, ....Wn

X1 , X2, X3 , .... X

ciertos factores o pesos

que dependen de la significacin o importancia de cada uno de los

nmeros, a esto se le llama media aritmtica ponderada y se calcula:

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

10

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

X =

i=1

wx /

i = 1

Mediana (med(x):
Es aquel valor que divide a la muestra en dos partes iguales
dejando bajo y sobre ella el 50% de las observaciones.
Si el nmero de observaciones es impar, la mediana es el
valor central del conjunto ordenado. Si el nmero de datos es par se considera la
mediana como el promedio aritmtico de los valores

centrales del conjunto

ordenado. Alternativamente la mediana puede determinarse a partir de la


distribucin acumulativa, es decir, la mediana es el percentil 50.
1.- En su clculo no se incluyen todos los valores de la variable.
2.- La Mediana no es afectada por valores extremos.
3.- Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4.- La variable de una variable X se denota: med(x)
La mediana se calcula de la siguiente forma:

Para un nmero impar de datos:

Para un nmero par de datos:


Xn + Xn

Med (n impar de datos)=X n+1

Med ( n par de datos) =

+1

indica la posicin del valor


Para datos tabulados:

med ( x )

N J 1

= Li + Ci 2
nJ

Li: lmite inferior del intervalo mediano


Ci: amplitud del intervalo
n/2: mitad de la muestra
Nj-1: frecuencia absoluta acumulada anterior a Nj
nj : frecuencia absoluta en la posicin J; J > n/2

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

11

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

1.- Hallar la mediana en la siguiente distribucin de frecuencias


Espesores en pulgadas

ni

Ni

0.306 - 0.310

0.310 - 0.314

0.314 - 0.318

13 Nj-1

0.318 - 0.322

22

35 Nj

0.322 - 0.326

14

49

(X)

n = 49
Solucin:
El intervalo 0.318 0.322 contiene la clase mediana.

49

13

= 0.32
med ( x) = 0.318 + 0.004 * 2
22

Moda

1.- En su clculo no se incluyen todos los valores de la variable.


2.- El valor de la moda puede ser afectado grandemente por el mtodo de
designacin de los intervalos de clases.
La moda es el valor ms frecuente de la variable . Para el caso de datos
tabulados, la moda es la marca de clases del intervalo de mayor frecuencia.
Hallar la moda en los siguientes datos
16, 18, 15, 20, 16

Solucin:

moda = 16

CUARTILES, DECILES Y PERCENTILES


Percentiles: son los valores que dividen a los datos en cien partes iguales, es un

porcentaje y se define como:


____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

12

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Pp = x

'
j1

np100 N j1

+ c j

nj

Los Percentiles Pp son los valores que dividen un conjunto de datos


ordenados de menor a mayor en 100 partes con igual (aproximadamente) nmero
de datos.
p%
|
x(1)
Mn.

Cuartil:

(100 - p)%
|
Pp

|
x(n)
Mx.

es un valor que divide a los datos en cuatro partes iguales, y estn

representados por Q1, Q2, Q3

se llaman primer, segundo y tercer cuartil

respectivamente; el valor de Q2 es igual a la mediana.


Decil: valores que dividen a los datos en diez partes iguales, y se representan por:
D1, D2, ......D9.

II MEDIDAS DE DISPERSIN
Rango
El rango de un conjunto de nmeros es la diferencia entre el mayor y el
menor de todos ellos. Por ejemplo: el rango de los nmeros 2,3,3,4,4,4,5,10,12 es
12-2=10

R(x)= Xmax - Xmin

Rango intercuartlico
Se calcula este rango, cuando la distribucin posee intervalos abiertos, no
tienen lmite superior o bien no tienen lmite inferior.
Q = Q3 Q1
Rango semi-intercuartlico o desviacin cuartilca
Se define por:

Q= (Q3 Q1)/2

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

13

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Varianza
La varianza de un conjunto de datos se define como el cuadrado de la
desviacin tpica o estndar, mide la dispersin que existe de los datos con respecto
a su promedio, el resultado de la varianza es en unidades cuadrticas, por lo tanto
para linealizar un conjunto al medir su dispersin, le extraemos raz cuadrada
llamada desviacin estndar, luego, para calcular la varianza tenemos.
Para datos sin tabular:

2(x) =

(xi )2/N

i =1

Para datos tabulados:

2(x) =

(xi )2ni /N

i =1

Desviacin estndar
Es la raz cuadrada de la varianza dada por:

Es decir, dado un conjunto de datos x1, x2, ...., xn de una variable X con
nivel de medicin en escala de intervalos o de razn, se define la desviacin
estndar o desviacin tpica: como el promedio de las desviaciones de los puntos xi
respecto a su promedio aritmtico.
La desviacin estndar toma valores no negativos y mide la dispersin:
a mayor desviacin estndar mayor dispersin.
El cuadrado de la desviacin estndar se denomina varianza S2
Observacin: S2 se llama varianza corregida, dividida por n 1 se utiliza en inferencia
estadstica como la estimacin de la varianza poblacional (
2)
Coeficiente de variacin
El coeficiente de variacin es una medida que nos permite comparar dos o ms
distribuciones con distintas unidades de medida. Diremos que mientras menor sea el
coeficiente de variacin la distribucin es ms homognea, es decir, los datos estn menos
dispersos con respecto al promedio: C.V( X ) =

X
X

*100

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

14

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Ejemplo 5.- En un centro de computacin, el nmero de veces que el computador se


detiene, por error de mquina, diariamente, fue recolectado por un perodo de 70
das. Los datos obtenidos fueron los siguientes.
1
1
0
2
0

0
7
3
2
1

2
5
1
0
6

( X ) N de detenciones del computador por da.


0
0
0
3
3
0
0
1
0
0
4
3
0
6
2
0
1
0
1
0
1
7
0
2
4
0
1
2
1
2
0
0
4
3
3
1
2
4
0
2

0
2
2
5
1

0
3
1
2
0

0
0
0
1
4

5.1.- Tabule y grafique los datos adecuadamente.


5.2.- Cul es la proporcin de das en que ocurre por lo menos 2 detenciones
5.3.- Calcule una medida de tendencia central apropiada. (Justifique su respuesta).
Ejemplo 6.- Con el propsito de estudiar si hay discriminacin en el sueldo de los
profesionales hombres y mujeres en el rea de la administracin que entran a
trabajar por primera vez, se tom una muestra en una gran empresa y se les consult
sobre sus sueldos. La informacin obtenida se presenta en la siguiente tabla:
400 - 500

500 - 600

600 - 700

700 - 800

800 - 900

Hombres

20

30

40

20

15

10

Mujeres

20

28

33

25

18

Sueldos M$

900 - 1000 1000 - 1200

6.1.- Construya un grfico que le permita comparar el sueldo de los profesionales,


hombres y mujeres. Qu puede concluir de l?
6.2.- Qu porcentaje de los hombres tienen sueldo superior a $760.000?
6.3.- Se est estudiando dos alternativas para el prximo reajuste de sueldos a
profesionales mujeres.
i)
ii)

5% de reajuste ,ms un bono mensual de $10.000


10% de reajuste

Con cul de estas dos alternativas la distribucin de sueldos reajustados resulta


ser ms homognea que la original? Responda aplicando solo propiedades.

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

15

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Tablas de contingencia o de asociacin


Muestran la asociacin entre dos o ms variables; se recomienda que sean a lo ms
tres, para facilitar la lectura de la tabla. Como hay ms de un criterio de
clasificacin, se preferir colocar aquel con mayor nmero de categoras en la
columna. Cuando el nmero de intervalos o categoras es el mismo, se colocar el
antecedente en la columna y el consecuente en la fila.
Ejemplo 7:- Se estudia el consumo diario (Y) en kwh de 180 consumidores de
energa elctrica. Los consumidores se clasifican segn tipo en tres grandes grupos:
consumidores habitacionales, industriales y empresas comerciales. La informacin
obtenida se muestra en la siguiente tabla:
Tabla : Consumo diario de energa elctrica (kwh) segn tipo de consumidor
Consumo
Tipo de consumidor
diario (kwh)

< 20
20-50
50 y +
Total

Habitacional

Industriales

20
10
5
35

57,1
28,6
14,3
100,0

5
40
60
105

4,8
38,0
57,2
100,0

Empresas
comerciales
N
%

Total

5
20
15
40

30
70
80
180

12,5
50,0
37,5
100,0

Determine la medida de posicin ms adecuada. Interprete sus resultados.


REPRESENTACIN GRFICA

Grficos: La presentacin grfica puede revelar de un vistazo las principales


caractersticas de un conjunto de datos.
Los grfico de barras y el de torta (o sectorial) son lo ms en datos cualitativos.
Si la informacin se encuentra en una tabla de frecuencias con intervalos de clase,
las representaciones adecuadas son el histograma o el polgono de frecuencias,
Diagrama de caja, Tallo y hojas se utilizan en datos de variables cuantitativas
contnuas.

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

16

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Uso de celulares segn m arca

% de uso de celulares segn marca


27

Sony

Samsung

10

10

Nokia

Samsung

38

15

Sagem

15

Sin
celular

40
30
20
10
0
Nokia

38

Sony
Sin celular
27

Sagem

Marca de celular

Histograma

Polgono de frecuencias

60,00%

40

55,00%
50,00%

Porcentaje

n de personas

45,00%

30

20

40,00%

38,1%

35,00%

32,1%

30,00%
25,00%
20,00%

17,9%

15,00%

10

10,00%
4,8%

5,00%
1,2%

0
0

ndice de temor

Este grfico consiste en una serie de


barras adyacentes cuyas superficies
son proporcionales a la frecuencia del
intervalo sobre el cual se levantan.

4,8%

1,2%

0,00%
12-19

19 - 26 26 - 33 33 - 40 40 - 47 47 - 54 54 - 61

indice de temor

Este grfico consiste en una lnea poligonal


que resulta de unir los puntos medios o
marcas de clases de la parte superior de los
rectngulos del histograma

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

17

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

edad

n de
personas

25
20
15
10
5
0
0

Media =44,21
Desviacin tpica =16,1
N =84

8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84 88 92

edad

DIAGRAMA DE PARETO

Sirve para mostrar actividades o categoras acumuladas; se usan con frecuencia en


control de calidad. Es un grfico de barras simples ordenadas segn frecuencias de
mayor a menor, al cual se le adiciona la frecuencia acumulada, como una manera de
saber donde se concentra el 50% de las actividades.

100

N DE PERSONAS

50

Porcentaje

60

40

30
50
20
17

15

10

12
7

0
excelente

bueno

regular

malo

aceptacion del vehculo

Diagrama de tallo y hojas (steam and leaf plot). Tukey 1977


Es un procedimiento semi-grfico para variables cuantitativas continuas que
permite obtener simultneamente una distribucin de frecuencias de la variable y
su representacin grfica. Para construirlo basta separar en cada dato el ltimo

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

18

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Tiempo en minutos
Frecuencia

tallo &

2,00
0
5,00
1
5,00
1
4,00
2
1,00
2
2,00
3
1,00 Extremes

.
.
.
.
.
.

hoja
78
02444
56899
0122
5
01
(>=41)

DIAGRAMA DE CAJA: La grfica describe la distribucin de un conjunto de datos


en referencia a los valores de los cuartiles como medidas de tendencia central y al
valor del rango intercuartlico como medida de variabilidad. Constituye un medio
ideal para la observacin del grado de simetra de la distribucin, es una de las
principales tcnicas del anlisis exploratorio de datos.
17
40

30

20

10

tiempo (minutos)

Medidas de resumen: Descripcin numrica de una variable


Medidas de posicin o Tendencia Central:
Media aritmtica, Mediana y Moda
Percentiles
Medidas de Dispersin: Varianza, Desviacin Tpica
Medidas de Forma (distribucin): Asimetra, Curtosis

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

19

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Descripcin Estadstica de una variable nominal


Tabla de frecuencias
Nombre de la
Var.
.
.
.

Grficos (ms utilizados)

Nmero
de
unidades
.
.
.

100

Total

.
.
.

Medidas de resumen

Barras separadas
Sectorial
Diagrama
de
Pareto

Moda

Descripcin Estadstica de una variable ordinal


Tabla de frecuencias
Nombre
Var.
.
.
.
Total

Nm. de
unidades
.
.
.
n

Frec.
Acum.
.
.
n
-

Grficos (ms utilizados)


-

%
.
.
.
100

Medidas de resumen

Barras separadas
- Moda
Sectorial
Diagrama
de - Mediana
Pareto
- Percentiles

cuando
tenga
sentido

Descripcin Estadstica de una variable cuantitativa discreta


Tabla de frecuencias

Grficos (ms

Medidas de resumen

utilizados)

Nombre
Var.
.
.
.
Total

Nm. de
unidades
.
.
.
n

Frec.
Acum.
.
.
n
-

%
.
.
.
100

Barras
separadas

- Moda
Tendencia
- Mediana
central
- Promedio
- Percentiles

Posicin

- Rango
- Rango Intercuartlico
- Desv. estndar
dispersin

- Coef. de variacin

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

20

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Descripcin Estadstica de una variable cuantitativa contnua


Tabla de frecuencias
Grficos (ms
Medidas de resumen
utilizados)

Nombre
Var.
[,)
.

Nm. de
unidades
.
.
.
n

Total

Frec.
Acum.
.
.
n
-

%
.
.
.
100

- Moda
Tendencia
- Mediana
central
- Promedio
- Percentiles

Histograma
Polgono de
frec.
Tallo - hojas
Diagrama de
caja
Otros

Posicin

- Rango
- Rango Intercuartlico
- Desv. estndar
dispersin

- Coef. de variacin

X Mediana asimetra, lo que sugiere heterogeneidad en los datos.

La Mediana es la medida de tendencia central adecuada para resumir los datos.


Simtrica

Asimetra positiva

Asimetra Negativa
10

10

10

Simtrica
8

2.5

7.5

12.5

17.5

22.5

27.5

32.5

0
2.5

7.5

12.5

17.5

22.5

X = Me = Mo

27.5

32.5

2. 5

7.5

12. 5

17.5

22.5

27.5

Mo < Me < X

32.5

X < Me < Mo

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

21

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Estadsticos de dispersin o variabilidad

Observaciones

La variable X debe ser por lo


menos de intervalos.
- Defectos. No permite hacer una
interpretacin precisa de un
valor mximo valor mnimo
valor dentro de una distribucin.
- No interviene en relaciones
matemticas importantes en la
inferencia estadstica.
- La variable X debe ser por lo
menos de intervalos.
- RI se usa con mayor frecuencia
acompaando a la mediana
RI = Q3 Q1
cuando la presencia de valores
= P75 P25
extremos
hace
poco
Longitud del 50% central de la
recomendable el uso del
distribucin de datos
promedio.
- No interviene en relaciones
matemticas importantes en la
inferencia estadstica.
-

Rango

Rango
intercuartlico

Varianza

Desviacin
estndar o
desviacin
tpica

s2 =

(x x)
i =1

s2 =

i =1

n -1

Varianza corregida (se utiliza cuando


la muestra del estudio es aleatoria
simple)

n
n

(x
s=

(x x)

(x

- x)

i =1

s=

- x)2

i =1

n-1

Anlisis de datos con dos variables


(descripcin conjunta con dos variables)

Caso 1: Variable de inters (dependiente) cuantitativa, variable independiente


cualitativa Objetivo: comparar dos grupos
Caso 2: Dos variables cualitativas Objetivo: comparar grupos, analizar asociacin
Caso 3: Dos variables cuantitativas Objetivo: medir asociacin (correlacin)
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

22

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Ejemplo 6: Analizar si existe relacin lineal entre peso y estatura


Grfico adecuado: Diagrama de dispersin
Medida de resumen: Correlacin lineal. Pearson - Spearman
Correlaciones
Peso

Estatura

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

Peso
1
250
,821**
,000
250

Estatura
,821**
,000
250
1
250

**. La correlacin es significativa al nivel 0,01 (bilateral).

DIAGRAMA DE DISPERSIN.

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

23

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

FORMULAS DE INTERS

x=

xi
i =1

s 2x =

x=

x n
i

i =1

(x
i =1

s 2x =

x)2
=

n-1

(x
i =1

xi
n
x i2 i =1

n
i =1
n-1

x) 2 ni

n-1

x i ni
k

x i2 ni i =1

n
i =1
n-1

Cov(x,y) = s xy =

(x
i =1

- x)(y i - y)

n -1

r=
Pp = x

'
j1

Sx =

S 2x

CV x =

sx
x

n n
x i y i
n
x i y i i =1 i =1

n
i =1
n -1

s xy
sxs y

np100 N j1

+ c j

nj

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

24

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Cuadro resumen. Medidas de Posicin.


Medidas de Posicin
Medidas de Tendencia Central
Medidas de Dispersin

X Desviacin Estndar o tpica.

Media Aritmtica o Promedio Aritmtico


Moda

Mo Varianza Poblacional

Med Coeficiente de Variacin


ni Rango Intercuartlico
PX
Q
D

Mediana
Frecuencia
Percentiles
Cuartiles
Deciles

Q=Q3 Q1

Cuadro Resumen. Grficos.

Clasificacin de las variables


Tamao del recorrido
Discretas

Escala de Medicin

Distribucin de
Frecuencias

Asociacin entre
variables (dos o
ms)

(una variable)
Barras Simples
Circular o de torta

Barras
Subdivididas
Barras agrupadas

Histograma simple

Lineal

Histograma ajustado

Correlacin

Nominal u ordinal
Continuas

Intervalos o Razn

Polgono de
Frecuencias

Resumen de algunas frmulas.


Ley de Sturges (determinar n de Intervalos)

[1+3.3 Log n]

Correccin de la Amplitud

nc =

Rango Intercuartlico

k * ni
ci

RI = Q3 Q1
2 = (x - )2 ni

Varianza

N
Desviacin Estndar

X = X2

Me

med ( x )

n
N j 1
= lim.inf . + ci ( 2
)
nj

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

25

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Coeficiente de Correlacin:
5.- Para determinada tarea en una fbrica, donde se necesita mucha destreza, se
quiere investigar si la productividad en el trabajo debe ser mayor al aumentar los
aos de experiencia. Se seleccionaron al azar diez empleados de entre lo que
tienen ese trabajo. Los datos de aos de experiencia y medicin de productividad
son los siguientes:

5.1 Realice el diagrama de dispersin y calcular el coeficiente r de Pearson.


Interprete los resultados.
El coeficiente de correlacin nos permite analizar si existe una relacin lineal
entre dos variables X e Y.

r(x,y) = Cov(x,y)
Sx * Sy
Y es a travs del diagrama de dispersin, donde es ms fcil apreciar, que tan
homogneos son los datos.

A
A
A

90,0

1productividad = 77,36 + 1,10 * aos


R-cuadrado = 0,85A

productividad

productividad

90,0

87,5
A
A

85,0

Regresin lineal
A

87,5
A
A

85,0

82,5

A
A

82,5

80,0

2,5

5,0

7,5

10,0

12,5

aos

A
A

80,0
2,5

5,0

7,5

10,0

12,5

aos

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

26

ESCUELA DE CONTADORES AUDITORES DE SANTIAGO

Instituto Profesional

Correlaciones
aos
aos
productividad

Correlacin de Pearson
n
Correlacin de Pearson

1
10
,920**

productividad
,920**
10
1

**. La correlacin es significativa al nivel 0,01 (bilateral).

r = 0.9197  91.97%

Entre las variables existe una correlacin positiva fuerte, es decir si


aumenta una variable, la otra tambin aumentar, lo que se puede
observar en el diagrama de dispersin.
La grfica siguiente resume la fuerza y la relacin del coeficiente
de correlacin.
Correlacin
Negativa
Perfecta

Correlacin
Negativa
Fuerte

-1

Correlacin
Positiva
Perfecta

No hay
Correlacin

Correlacin
Negativa
Moderada

Correlacin
Negativa
Dbil

-0.5

Correlacin
positiva
Dbil

Correlacin
Positiva
Moderada

0.5

Correlacin
Positiva
Fuerte

Correlacin Negativa
Correlacin Positiva

____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores

27

También podría gustarte