Está en la página 1de 44

Guillermo Paucar C.

23/06/2020 Guillermo Paucar C. 1


UNIDAD II
ORGANIZACIÓN DE
DATOS. TABLAS DE
FRECUENCIAS Y
GRÁFICAS
UNIDIMENSIONALES

23/06/2020 Guillermo Paucar C. 2


2.1.- ORGANIZACIÓN DE DATOS A TRAVES DE TABLAS
DE FRECUENCIAS Y REPRESENTACIONES GRAFICAS

DISTRIBUCIÓN DE FRECUENCIAS.- Lista valores de datos, ya


sea de manera individual o por grupos de intervalos, junto son sus
frecuencias o conteos correspondientes

2.1.1.- DISTRIBUCIÓN DE FRECUENCIAS PARA


VARIABLES CUALITATIVAS

A1) TABLAS DE FRECUENCIAS


Supongamos que para una variable o característica cualitativa X, se
tiene una muestra con n unidades estadísticas en la que se observan
k características o modalidades

23/06/2020 Guillermo Paucar C. 3


TITULO

Frecuencias Frecuencias
Categorías de la Absolutas Absolutas relativas Frecuencias Absolutas
variable Porcentuales
X fi hi pi %

C1 f1 h1 p1

C2 f2 h2 p2

C3 f3 h3 p3
. . . .

. . . .

. . . .

Ck fk hk pk
TOTAL N 1.00 100.00

FUENTE:

23/06/2020 Guillermo Paucar C. 4


Donde:

fk :
Es el número de datos observados, en cada categoría o modalidad, la suma de todas estas
modalidades o categorías deben sumar igual a n; es decir:
n

i =1
fi = n

hk : Es la frecuencia relativa, esta definida por:


fi
hk =
n
La suma de todas las frecuencias relativas es igual a la unidad; es decir:
n

h i =1
i =1

pk : Es la frecuencia porcentual, definido por:

pk = 100  hi %
La suma de todas las frecuencias porcentuales, es igual a 100%; es decir:
n

p
i =1
i = 100%

23/06/2020 Guillermo Paucar C. 5


A2) REPRESENTACIONES GRÁFICAS

Ahora existen poderosos programas de computación que son bastante


efectivos para generar graficas impresionantes, en la presente
asignatura se hará referencia frecuentemente al SPSS y MNITAB. Para
variables o características cualitativas, la representaciones gráficas
pueden utilizarse para representar datos de manera llamativa y efectiva
para revelar la distribución de datos presentados en las tablas de
frecuencias; para ello podemos mencionar las siguientes
representaciones graficas utilizados con mucha frecuencia.

•GRÁFICA DE BARRAS SIMPLES.- Las graficas de barras se utilizan


para representar cada una de las modalidades C a través de barras
rectangulares verticales, cuya altura es proporcional a su
frecuencia.

23/06/2020 Guillermo Paucar C. 6


TITULO
TITULO
FRECUENCIA
FRECUENCIA
400
400
350
350
300
300
250
250 LEYENDA
LEYENDA
200
200
AA BB
150
150
100
100 CC DD
50
50
00
AA B
B C
C D
D
FUENTE:
FUENTE:

•DIAGRAMA CIRCULAR.- Las graficas circulares se utilizan para visualizar datos


cualitativos. Para elaborar se debe obtener el ángulo de cada región o sector
circular el cual debe asociarse a cada respuesta

TITULO

LEYENDA

A B

C D
FUENTE:

23/06/2020 Guillermo Paucar C. 7


•DIGRAMA DE PARETO.- La grafica de PARETO es una grafica de barras para datos
cualitativos, donde las barras se ordenan en forma creciente o decreciente de acuerdo
con las frecuencias.

TITULO
TITULO
FRECUENCIA
FRECUENCIA
600
600

500
500

400
400
LEYENDA
LEYENDA
300
300 AA BB
200
200

100
100 CC DD

00
AA B
B C
C D
D
FUENTE:
FUENTE:

•PICTOGRAMAS.- los pictogramas son graficas donde los datos son representados por
imágenes de objetos, como soldados, tanques, aviones, monedas, etc.

TITULO
FRECUENCIA

600

500

400 LEYENDA

300

200 A B C D
100

0
A B C D
FUENTE:

23/06/2020 Guillermo Paucar C. 8


2.1.2. DISTRIBUCION DE FRECUENCIAS PARA
VARIABLES CUANTITATIVAS
B1) TABLAS DE FRECUENCIAS
•VARIABLE CUANTITATIVA DISCRETA
Dada un conjunto de datos numéricos de tipo discreto, para organizar esta
información, se utiliza una tabla de frecuencias con las propiedades mencionadas:
TITULO
Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias
Absolutas Absolutas Porcentuales Acumuladas Acumuladas Acumuladas
Valores de
la variable fi relativas
hi pi Fi Relativas
Hi
Porcentuales

X
Pi %
x1 f1 h1 p1 F1 H1 P1

x2 f2 h2 p2 F2 H2 P2
x3 f3 h3 p3 F3 H3 P3

. . . . . . .

. . . . . . .
xk fk hk pk
n 1 100%
TOTAL n 1.00 100.00
FUENTE:
23/06/2020 Guillermo Paucar C. 9
Donde:
: Es el número de datos numéricos observados, la suma de todas estas n

frecuencias deben sumar igual a n; es decir: f


i =1
i =n
fk
: Es la frecuencia relativa, esta definida por: fi
hk hk =
n
n
La suma de todas las frecuencias relativas es igual a la unidad; es decir:
h
i =1
i =1

pk : Es la frecuencia porcentual, definido por: pk = 100  hi %


n
La suma de todas las frecuencias porcentuales, es igual a 100%; es decir: p
i =1
i = 100%

Fi : Es la frecuencia acumulada, definido por: K


Fi =  f j
j i

H i : Es la frecuencia acumulada relativa, definido por: K


Hi =  hj
j i

23/06/2020 Guillermo Paucar C. 10


B2) TABLAS DE FRECUENCIAS
•VARIABLE CUANTITATIVA CONTINUA
Dada un conjunto de datos numéricos de tipo continuo, para organizar esta información, se
utiliza una tabla de frecuencias con las propiedades mencionadas:
TITULO

FUENTE:

11
Guillermo Paucar C. 23/06/2020
Donde:
mi : Es la marca de clase, se define como el punto medio de cada intervalo o clase.
Ii : Es el intervalo o clase, de amplitud constante.

f k : Es el número de datos numéricos observados, la suma de todas estas n

frecuencias deben sumar igual a n; es decir: f


i =1
i =n

fi
hk : Es la frecuencia relativa, esta definida por: hk =
n
n

La suma de todas las frecuencias relativas es igual a la unidad; es decir: hi =1


i =1

pk : Es la frecuencia porcentual, definido por: pk = 100  hi %


n
La suma de todas las frecuencias porcentuales, es igual a 100%; es decir:
p
i =1
i = 100%
K
Fi : Es la frecuencia acumulada, definido por:
Fi =  f J
j i
H i : Es la frecuencia acumulada relativa, definido por: K
H i =  hJ
23/06/2020 Guillermo Paucar C. j i 12
PROCEDIMIENTO PARA DETERMINAR LOS INTERVALOS

23/06/2020 Guillermo Paucar C. 13


C1) REPRESENTACIONES GRÁFICAS

1. GRÁFICA DE BARRAS.- Es una gráfica de barras en donde la escala


horizontal representa los valores de los datos y la escala vertical representa
frecuencias. Las alturas de las barras corresponden a los valores de
frecuencia, las barras se dibujan de manera separada.

23/06/2020 Guillermo Paucar C. 14


2. HISTOGRAMA.- Es una gráfica de barras en donde la escala horizontal
representa clases o intervalos de valores de datos y la escala vertical
representa frecuencias. Las alturas de las barras corresponden a los valores
de frecuencia, las barras se dibujan de manera adyacente (sin espacios entre
ellas).

23/06/2020 Guillermo Paucar C. 15


3. POLIGONO DE FRECUENCIAS.- Utiliza segmentos lineales conectados a
puntos que se localizan directamente por encima de los valores de las
marcas de clase. Las alturas de los puntos corresponden a las frecuencias
de clase.

23/06/2020 Guillermo Paucar C. 16


4. OJIVA.- Una ojiva es una grafica lineal que presenta frecuencias
acumulativas, de la misma forma que la distribución de frecuencias
acumulativas

FRECUENCIA
OJIVA (para datos
ACUMULADA continuos
70

60

50

40

30

20

10

0
1 3 5 7 9 11 13 15
CARACTERISTICA
FUENTE:

23/06/2020 Guillermo Paucar C. 17


5. GRAFICA DE TALLOS Y HOJAS.- Una gráfica de tallo y hojas representa
datos que se separan cada valor en dos partes: tallo el dígito ubicado en el
extremo izquierdo) y la hoja (el dígito del extremo derecho).

PROCEDIMIENTO PARA GRAFICAR TALLOS Y HOJAS


•Se selecciona uno o más dígitos directores para los valores del tallo.
Los dígitos finales se convierten en las hojas.
•Liste los posibles valores del tallo en una columna vertical.
•Registre la hoja por cada observación junto al valor correspondiente
del tallo.
•Indique las unidades para tallos y hojas en algún lugar del diagrama.

INFORMACION QUE TRANSMITE TALLOS Y HOJAS


•Identificación de un valor característico o representativo.
•Grado de dispersión respecto al valor característico.
•Presencia de algún hueco en los datos.
•Grado de simetría en la distribución de los valores.
•Cantidad y ubicación de picos.
•Presencia de cualquier valor atípico.

23/06/2020 Guillermo Paucar C. 18


6. GRAFICA DE CAJAS Y BIGOTES.- Una grafica de cajas y bigotes se utiliza
para describir varias características de un conjunto de datos. Entre estas
características están:
•Centro,
•Dispersión,
•Naturaleza y magnitud de cualquier desviación respecto a la simetría,
•Identificación de “valores atípicos”(valores bastante alejados del grueso de datos).

23/06/2020 Guillermo Paucar C. 19


El diagrama de cajas se puede utilizar también para
indicar de manera explicita la presencia de valores
atípicos.

23/06/2020 Guillermo Paucar C. 20


23/06/2020 Guillermo Paucar C. 21
USO DEL SPSS17 Y
MINITAB14
EJERCICIO 1
EMPLEOS. Se realizan un estudio para determinar la
manera en que las personas obtienen empleo. La tabla
incluye datos de 400 sujetos que se seleccionaron
aleatoriamente. Los datos se basan en resultados del
National Center for Carrer Strategies. Construya el gráfico
de pareto. Si alguien deseara obtener un empleo, ¿Cuál
parece ser el método mas efectivo?

Fuente de empleo de sujetos que se encuestaron Frecuencia


Anuncios clasificados 56
Empresas que buscan ejecutivos 44
Contactos interpersonales 280
Envios por correo 20
23/06/2020 Guillermo Paucar C. 22
23/06/2020 Guillermo Paucar C. 23
23/06/2020 Guillermo Paucar C. 24
PROBLEMA 5. (TIEMPO DE VIDA DE UN TALADRO) En el articulo STUDY
ON THE LIFE distribución of Microdrills (J. of. Engr. Manufacture, 2002) aparecen las
observaciones siguientes, listadas en la tabla, el tiempo de vida del taladro (número de
agujeros que maquina un taladro antes de romperse) cuando se hacen agujeros en una
cierta aleación de latón.

•Construya una distribución de frecuencias y un histograma.


•¿Qué proporción de las observaciones de tiempo de vida en esta muestra son
menores que 100? ¿Qué proporción de las observaciones son por lo menos 200?

11 14 20 23 31
93 96 99 101 104
81 84 85 89 91
71 74 76 78 79
59 61 65 67 68
36 39 44 47 50
263 289 322 388 513
161 168 184 206 248
136 139 141 148 158
105 105 112 118 123
23/06/2020 Guillermo Paucar C. 25
23/06/2020 Guillermo Paucar C. 26
ORGANIZACIÓN DE
DATOS. TABLAS DE
FRECUENCIAS Y
GRÁFICAS
BIDIMENSIONALES

Guillermo Paucar C. 27
TABLAS BIDIMENSIONALES
ORGANIZACIÓN DE DATOS A TRAVES DE
TABLAS DE FRECUENCIAS BIDIMENSIONALES

• Frecuentemente se analiza más de un carácter de los


individuos de la población.
• Es posible el análisis estadístico descriptivo de cada uno de
estos caracteres por separado y conjuntamente.
• A la consideración conjunta de dos variables X e Y o dos
atributos A y B se les denomina variable bidimensional
(X,Y)con valores ( xi , yoi )atributo bidimensional (A,B) con
valores (,xrespectivamente.
i , yi )
Junto con sus frecuencias
absolutas constituyen una distribución bidimensional.

Guillermo Paucar C. 28
TABLAS BIDIMENSIONALES
INDEPENDENCIA Y RELACIÓN FUNCIONAL DE
DOS VARIABLES CUANTITATIVAS Y
CUALITATIVAS

DEPENDENCIA
ESTADÍSTICA

DEPENDENCIA
FUNCIONAL INDEPENDENCIA
Y = f (X ) NO EXISTE RELACIÓN ENTRE
XeY

Guillermo Paucar C. 29
TABLAS BIDIMENSIONALES
TÍPOS DE
CARACTERÍSTIC
AS
(o variables)

VARIABLES VARIABLES
CUALITATIVAS CUANTITATIVAS
(o atributos)

TABLAS DE TABLAS DE
CONTINGENCIA CORRELACIÓN
Guillermo Paucar C. 30
TABLAS BIDIMENSIONALES
DISTRIBUCIÓN BIDIMENSIONAL DE
FRECUENCIAS.
Variables bidimensionales asociadas a la descripción de los
datos provenientes de la observación simultánea de dos
características (unidimensionales) sobre individuos de una
muestra extraída de la población.
INTERÉS DE LA OBSERVACIÓN SIMULTÁNEA:
Posibilidad de analizar relaciones de dependencia entre las
dos características.
VARIABLE ESTADÍSTICA BIDIMENCIONAL:
Magnitud cuyos valores son todos pares ( xi , yi ) en los que
xi = valor de una variable unidimensional X en algún
individuo de la población e yi = valor de la variable
unidimensional Y en ese individuo. Denotado por (X; Y).
Guillermo Paucar C. 31
TABLAS BIDIMENSIONALES
DATO BIDIMENSIONAL: Par asociado a un
individuo de la muestra.

1. RECOPILACIÓN DE DATOS: Pares de datos, o


datos agrupados (en clases o intervalos)
separadamente para cada variable unidimensional.

2. ORGANIZACIÓN DE DATOS: Valores distintos


de (X,Y) en la muestra:

( xi , yi ), i = 1,2,..., k ; j = 1,2,..., l

Guillermo Paucar C. 32
TABLAS BIDIMENSIONALES
FRECUENCIA ABSOLUTA: Del valor ( xi , yi ) :
n( xi , yi ) = ni j = n : individuos de la muestra
para los que X = xi e Y = yi .
k l
ni j  N , 0  ni j  n,  n
i =1 j =1
i j =n

FRECUENCIA RELATIVA: Del valor ( xi , yi ) :


f ( xi , yi ) = f i j = proporción individuos de la muestra
para los que X = xi e Y = yj
Guillermo Paucar C. 33
TABLAS BIDIMENSIONALES
k l
f i j  Q, 0  f i j  1,  f
i =1 j =1
i j =1

ni j
fi j = , ni j = n  f i j
n

DISTRIBUCIÓN DE FRECUENCIAS CONJUNTA: De


X e Y:

(( x , y ), n
i j i j ), i = 1,2,..., k ; j = 1,2,..., l

Guillermo Paucar C. 34
TABLAS BIDIMENSIONALES

TABLA PARA LA VARIABLE BIDIMENSIONAL


(X, Y)
X/Y y1 y2 ..... yl-1 yl

x1 n1,1 n1,2 … n1,l-1 n1,l


x2 n2,1 n2,2 … n2,l-1 n2,l
..... … … … … …
xk-1 nk-1,1 nk-1,2 … nk-1,l-1 nk-1,l

xk nk,1 nk,2 … nk-1,l-1 nk,l

Guillermo Paucar C. 35
TABLAS BIDIMENSIONALES
TABLA PARA LA VARIABLE
BIDIMENSIONAL (X, Y)
X/Y y1 y2 ..... yl-1 yl ni.
x1 n1,1 n1,2 … n1,l-1 n1,l n1.
x2 n2,1 n2,2 … n2,l-1 n2,l n2.
..... … … … … … …
xk-1 nk-1,1 nk-1,2 … nk-1,l-1 nk-1,l nk-1.

xk nk,1 nk,2 … nk-1,l-1 nk,l nk.


n.j n.1 n.2 ….. n.l-1 n.l n
Guillermo Paucar C. 36
DISTRIBUCIONES MARGINALES
Distribución Y y1 y2 ... yj ... yl
marginal de Y
n.j n.1 n.2 … n.j … n.l n

X ni. Distribución
x1 n1. marginal de X l
x2 n2. k n. j =  ni j
... . ni . =  ni j j =1
i =1
xi ni.
... .
xK nk. k l k l
n =  ni . =  n. j =  ni j
n i =1 j =1 i =1 j =1
Guillermo Paucar C. 37
DISTRIBUCIONES CONDICIONALES
Distribución de Y Y/xi y1 y2 ... yj ... yk
condicionada a X=xi
nj/i ni1 ni2 … nij … nik ni .
X/yj ni/j.
x1 n1j Distribución de X
condicionada a Y=yj
x2 n2j l
ni . =  ni j
... . i =1
xi nij
... .
xK nkj k
n. j =  ni j
j =1
n. j
Guillermo Paucar C. 38
DIAGRAMA DE DISPERSIÓN
REPRESENTACIONES GRÁFICAS DE LA
DISTRIBUCIÓN DE FRECUENCIAS CONJUNTA
DIAGRAMA DE DISPERSIÓN O
GRAFICA DE BARRAS
NUBE DE PUNTOS

Guillermo Paucar C. 39
GRÁFICO DE BARRAS

Guillermo Paucar C. 40
INDEPENDENCIA ESTADÍSTICA
INDEPENDENCIA ESTADÍSTICA: Dos variables X e Y son
independientes estadísticamente si verifican
ni j ni . n. j
=  i, j
n n n
COVARIANZA: Es una medida de asociación lineal entre
dos variables, que resume la información existente en un
gráfico de dispersión.
k l k l

  ( x − x )( y
i =1 j =1
i j − y )ni j   ( x y )n
i =1 j =1
i j i j

S XY = COV ( X , Y ) = = −x y
n n

Guillermo Paucar C. 41
COVARIANZA

INTERPRETACIÓN DE LA
COVARIANZA
Interpretación del signo de la covarianza:

• Sxy > 0, indica asociación positiva (ambas variables


varían en el mismo sentido).

• Sxy < 0, indica asociación negativa (ambas variables


varían en el sentido inverso).

• Sxy = 0 , en caso de independencia estadística de dos


variables, la covarianza toma el valor cero.
Guillermo Paucar C. 42
COVARIANZA
PROPIEDADES DE LA COVARIANZA

Guillermo Paucar C. 43
COVARIANZA
PROPIEDADES DE LA SUMA DE DOS VARIABLES
ESTADÍSTICAS

Guillermo Paucar C. 44

También podría gustarte