Está en la página 1de 19

Eadica Descriptiva 1

.
.
Eadica Descriptiva
Usos, procedimiento, anlisis y representacin grca del
agrupamiento de datos
Prof. Hans Sigri
UAC-SF
http://hsigrist.github.io/blog/docencia/estadistica_enf
Eadica Descriptiva Agrupamiento de datos z
Temario
...
1
Agrupamiento de datos
...
z
Procedimiento
Eadica Descriptiva Agrupamiento de datos z
Ejemplo
Algunos inveigadores han propueo que el consumo de
vitamina A previene el cancer. Para probar ea teora, un
cueionario diettico podra ser utilizado para recoger datos sobre el
consumo de vitamina A entre los ioo pacientes hoqitalizados con
cancer (casos/experimental) y ioo controles. Los controles se pueden
combinar con reqeco a la edad y el sexo con los casos de cancer y
earan en el hoqital al mismo tiempo para una enfermedad no
relacionada. Qu debe hacerse con eos datos dequs de que se
recogen:
Eadica Descriptiva Agrupamiento de datos
6 C H A P T E P 2

Descriptive Statistics
methods of inferential statistics, might be worthwhile. Descriptive statistics are also
crucially important in conveying the nal results of studies in written publications.
Unless it is one of their primary interests, most readers will not have time to criti-
cally evaluate the work of others but will be inuenced mainly by the descriptive
statistics presented.
What makes a good graphic or numeric display? The main guideline is that the
material should be as self-contained as possible and should be understandable with-
out reading the text. These attributes require clear labeling. The captions, units, and
axes on graphs should be clearly labeled, and the statistical terms used in tables and
gures should be well dened. The quantity of material presented is equally impor-
tant. If bar graphs are constructed, then care must be taken to display neither too
many nor too few groups. The same is true of tabular material.
Many methods are available for summarizing data in both numeric and graphic
form. In this chapter these methods are summarized and their strengths and weak-
nesses noted.
2.2 Measures of Locatlon
The basic problem of statistics can be stated as follows: Consider a sample of data
x
1
, . . . , x
n
, where x
1
corresponds to the rst sample point and x
n
corresponds to the
Figure 2.1 Dal|y vltamln-A consumptlon among cancer cases and contro|s
! RDA
*
! RDA
*
> , ! 1
> , ! 1
> 1, ! 2 > 2, ! 5
> 1, !2
Consumption of Vitamin A.
> 2, !5
10
20
30
40
50
P
e
r
c
e
n
t
a
g
e

o
f

c
a
s
e
s
10
20
30
40
50
P
e
r
c
e
n
t
a
g
e

o
f

c
o
n
t
r
o
l
s
*
RDA = Recommended Daily Allowance.
CHE-ROSNER-10-0205-002.indd 6 7/16/10 11:06:37 AM
Copyright 2010 Cengage Learning, Inc. All Rights Reserved. May not be copied, scanned, or duplicated, in whole or in part.
Figura : Consumo diario de vitamina A en casos con cancer y control.
Eadica Descriptiva Agrupamiento de datos {
Ejemplo
Los inveigadores mdicos han soqechado que los
fumadores pasivos , personas que no siendo fumadoras viven o
trabajan en un entorno en el que otras personas fumen, podran
generar un deterioro de la funcion pulmonar como resultado. En 18o
un grupo de inveigacion en San Diego publico resultados que
indican que los fumadores pasivos tienen efecivamente la funcion
pulmonar signicativamente mas baja que los no fumadores
comparables que no trabajaban en ambientes con humo. Como
evidencia de apoyo, los autores midieron las concentraciones de (CO)
monoxido de carbono en los entornos de trabajo de los fumadores
pasivos y de los no fumadores cuyas empresas no permitan fumar en
el lugar de trabajo para ver si la concentracion de CO en relacion,
cambio en el transcurso del da.
Eadica Descriptiva Agrupamiento de datos
2.2

Measures ol Location 7
nth sample point. Presuming that the sample is drawn from some population P,
what inferences or conclusions can be made about P from the sample?
Before this question can be answered, the data must be summarized as succinctly
as possible; this is because the number of sample points is often large, and it is easy
to lose track of the overall picture when looking at individual sample points. One
type of measure useful for summarizing data denes the center, or middle, of the
sample. This type of measure is a measure of location.
The Arithmetic Mean
How to dene the middle of a sample may seem obvious, but the more you think
about it, the less obvious it becomes. Suppose the sample consists of the birth-
weights of all live-born infants born at a private hospital in San Diego, California,
during a 1-week period. This sample is shown in Table 2.1.
One measure of location for this sample is the arithmetic mean (colloqui-
ally called the average). The arithmetic mean (or mean or sample mean) is usually
denoted by x.
Figure 2.2 Mean carbon-monoxlde concentratlon ( standard error) by tlme of day as measured
ln the worklng envlronment of passlve smokers and ln nonsmokers who work ln a
nonsmoklng envlronment
Soutce. Peproduced with permission ol The New Fnglond Joutnol oI Medicine, 302, ?20-?23, 1980.
7 8 9 10 11 12
C
O

c
o
n
c
e
n
t
r
a
t
i
o
n
(
p
a
r
t
s

p
e
r

m
i
l
l
i
o
n
,

m
e
a
n


s
t
a
n
d
a
r
d

e
r
r
o
r
)
1 2 3 4 5 6 7
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
11.0
12.0
13.0
A.M. Noon P.M.
Passive smokers
Nonsmokers who work
in nonsmoking environment
CHE-ROSNER-10-0205-002.indd 7 7/16/10 11:06:38 AM
Copyright 2010 Cengage Learning, Inc. All Rights Reserved. May not be copied, scanned, or duplicated, in whole or in part.
Figura : La concentracion de monoxido de carbono media ( error
eandar) por hora del da, medida en el entorno de trabajo de los fumadores
pasivos y en los no fumadores que trabajan en un ambiente de no fumadores.
Eadica Descriptiva Agrupamiento de datos o
Ejemplo
,8 118 i 1o8 1i i 1o 18 o 1o1
1io 8o 11, 118 , 8 11i 1i8 1i, 1i
1i 1 o, 1i 1,, 1o, 1oo 11i 11
1o 1i 8 1o 1i 8, 11o 11
1i1 o8 1o, 1ii 1io 88 8 1o8 11, 8,
111 1i1 1i 1o 1i, 1oi 1ii 1, 11o 1o1
1 1ii 18 11, 1o 8 8 11 1o
1o 11, 18 1o, 1 8, 88 1o 1o8 1o
1i8 1oo 1i, 1o8 8 1 1o 1ii 1i 11o
1 11, 1i, 1, 8 1i1 11i 1, 11, o
Cuadro : Muera de pesos de 1oo recin nacidos Boon Hoqital
Eadica Descriptiva Agrupamiento de datos ;
Ejemplo
La Cuadro 1, representa los pesos ( [oz] ) al nacer de 1oo partos
consecutivos en un hoqital de Boon. Supongamos que queremos
morar eos datos para nes de publicacion. Como podemos hacer
eo: La forma mas sencilla de morar los datos es generar una
diribucin de frecuencias usando algn lenguaje.
Eadica Descriptiva Procedimiento 8
Temario
...
1
Agrupamiento de datos
...
z
Procedimiento
Eadica Descriptiva Procedimiento 8
R rango
Calcular la diferencia entre el dato mayor y el dato menor en el
conjunto de datos (e.g., Cuadro 1). El rango se identica con la
diancia entre dos puntos extremos en una diribucion. Note que al
calcular el rango, se habla de un nmero, no del rango de valores:
comprendido entre i-1o1.
nmero de posibles resultados = (puntaje mayor puntaje menor),
nmero de posibles resultados = (1o1i) =1i
Eadica Descriptiva Procedimiento p
c nmero de clases
Calcular el nmero ptimo de clases, que viene dado por el calculo de
la expresion: log

(n), redondeado a la parte entera mayor donde n


correqonde al tamao de la muera.
log

(1oo) = o.o8,o18,,,i,
,
Eadica Descriptiva Procedimiento 1o
A amplitud
La amplitud de cada clase o intervalo viene dada por el cociente entre
el rango R y el nmero de clases c, es decir, A=
R
/
c
. Luego
A=
1i
/
,
=18.
Eadica Descriptiva Procedimiento 11
clases: lmites
El valor mnimo de la tabla es el lmite inferior de los valores (el peso
mnimo, i). El lmite superior de cada clase viene dado por la formula:
lmite superior = lmite inferior +A,
lmite superior = i+18 =,o
Sin embargo, para que los lmites sean reales, la primera clase la
consideramos desde el i inclusive, y la ampliamos haa el ,1
exclusivo y en la siguiente clase, hacemos inclusivo el ,1 y as
sucesivamente.
Eadica Descriptiva Procedimiento 1z
X
i
: marca de clase
clases X
i
[i, ,1[
Cuadro : Marcas de clase para pesos Cuadro 1
Note, que la primera clase contiene al menor regiro (peso i) y que
la ltima clase (sptima) debe contener a la observacion con mayor
regiro (peso 1o1).
Eadica Descriptiva Procedimiento 1
Stem & leaf, frecuencias
tallo hoja
i (1)
, 8 (1)
o ,8 ()
8 ,,o,88 (1o)
1i,o888 (11)
1o o1i,,o,8888 (1)
11 oo1iii,,,,,,o88 (1,)
1i o111iiii,,o,,88 (io)
1 iii,,,888 (1i)
1 o1o ()
1, , (1)
1o 1 (1)
Cuadro : Tallo|hoja pesos, |i
signica i
clases X
i
f
i
[i, ,1[
[,1, ,o[
[,o, 8[
[8, 1o8[
[1o8, 1i,[
[1i,, 1o[
[1o, 1o[
Cuadro : TDF frecuencias
Eadica Descriptiva Procedimiento 1{
TDF
clases X
i
f
i
F
i
h
i
=p p% H
i
[i, ,1[
[,1, ,o[
[,o, 8[
[8, 1o8[
[1o8, 1i,[
[1i,, 1o[
[1o, 1o[
Cuadro : TDF pesos
Eadica Descriptiva Procedimiento 1
TDF
clases X
i
f
i
F
i
h
i
=p p% H
i
[i, ,1[ 1., 1 1 .o1oo 1 1
[,1, ,o[ oo., , .ooo ,
[,o, 8[ ,., , 1i .o,oo , 1i
[8, 1o8[ 8., i, .i,oo i,
[1o8, 1i,[ 11,., ,8 .oo ,8
[1i,, 1o[ 1o., 1 , .1oo 1 ,
[1o, 1o[ 1,,., 1oo .ooo 1oo
1oo

h
i
=1

p%=1oo
Cuadro : TDF pesos
Eadica Descriptiva Procedimiento 1o
Hiograma de frecuencias
Figura : Hiograma datos Tabla 1
Eadica Descriptiva Procedimiento 1;
Apndice

Una copia del presente trabajo, se encuentra en el enlace
1eadiica_descriptiva_talk.pdf .
Todo el trabajo aqu expueo, ea reservado bajo una
Licencia GNU .

También podría gustarte