Está en la página 1de 18

6

, i

LItSlern

',/2
:rb/x

t''mqli,n
It

l6d
l-l-t

EL ANLISIS DE LOS DATOS


-

'.i
l4hdeum
o A {"hr^t ,,M'
'---i
e. tP^elki,{. , &rd,xY*: &rhrafs.
r

.t

rl

6.1. LA ORGANIZACIN DE LOS DA:I'OS

AI referirncls a los criterios para la constitucitilt cii'


un corpus (3.2) utilizamos ia noci<in c1c variable, cjcliiri
da siguiendo a Hatch y Farhady (1982,12) conro un att'ibuto de una persona o de un objeto que varit cle pct'stlna a persona o cle objeto a objeto. Vimc-s qLlc en e I ciisco de un corpus pueden considerarse un gran nLlllret'o
de variables, que siempre estarn en hrncin de lzt hi;i.'tesis inicill. Tambin al hacer referencia a los inf ot'

mantes (4.2) mencionamos algunas cle las variatblcs quc


los caracterizan. Existen adems vrriables reiacionaclas
ejemplo, en esturdios compzLretnclo
con el entorno
-pol"
la inteligibilidad del habla enmascarada con distintr-rs tipos de ruido similar al que puede encontrarse en los sistemas reales de telecomunicacin- o motivadas pr:r lat
propia tcnica de anlisis, si se comparan diversos mtodos de estudio de un mismo parmetro fontict.
Sin embargo, es importante, en algunos casos, llet'rr
a cabo lo que Brown (1988, 8) denomina una delinicitin
operativa de las variables, es decir, hacer erplcilos los
t

-])

ti,
$,

clitcl-i()s cn los c.luc nrJS brsrrnos para ,zrsignarles lrn dclel'ltlintclo valclti; csto succclt' cn el caso cle arlgunas vzrl'ilrbl.'- Ll ur'\'ir Itcl)rr,s lt'llei,)l)rclcl \ qLte scgttit-cmos utilizancl< cn los cicrrrplos clt este .upitlto, .-" el gr-aclo
cie bilrngtiisrl,. No p.cle'ros asignzrr arbitrarirrnenle ur-r
cieter-r-lrinrclo glardo clc bilingirismo a un informante, sino
(lLlc rlt:cesitrnros habeI rcalizrdo anterior-mente algrn

tipo

clc evaluacit-r clc'

sr-r

conocin-iiento cle las do-s Ieneuas

cic sr-r Lrso en ciertas sitr-rtciones; slo especifican<1o


nucstrrs crilelit_rs nos rsegrlrlremos de que el mismo expelimento pr-reda scr llevado a cabo por otro investigzrclor utilizanclo lis r-l-tisntas var-iables.
['[enos sealado ya varias veces que la decisin sobre ias varirblcs clc un experirnento se toma dur-ante la
frisc cle ciisct-r del ntisn-lo, pelo la nocin dc vrriable es
trnrbin csencial a la hclrr clc or.ganizar los datos obtenick-ls clc' ctra l sll prcscntacjn o a un tratrmiento estaclstico. EnlpezeLntos, por cste rnotivo, describie'ndo los
princip:rles tipos cle vrriable que suelen encontl.arse en
urn r-rzrbajo en cl intbito de la fontica.
.

.1. Tipos de variables

Los mannrles ,.le estrclstica distinguen diversas cla_


scs cler vri'iables, I)ct-o nos ccntraremos aqu en ias que
son slrsceptibles cle aparrcccr err nuestro campo. Una prin-le t':l sc'paracicin clc:be l'eilizrr:;e entr-e las variabl es itzdeterttl ientes v las r/ercttdien/es. Clonsideremos Lln estudio
sobrc- la cflrracitirt loclicr en lrrncin del acc-nto; el in\/estil-ac{ot' ltabr ciinstr-uiclo Lur corpus en el c1ue. se encLlentl'crr slrit:rs rccntuiclrs v no rcentuadrs, v hrr
nrecliciot'rc's s<bre ia cllrrrcilt rle la vocal en estrs slaLrzr.s, que seri ciistint.a cn cadr caso. La variable inderetrdiente es pLles la pt-e'sc.neia o ausencia de acento en
la slrba
dc:cir:, li variable que manipula el investi_
gaclor--, -es
inicntr rs cuc ler dependiente es la durrcin de
lr vocil, r,ariable en lzr clue sc- nlide el efecto del cainbio
de las olras varirblcs. Sj rcle-ils del acento introdr-rjra-

l3t'

I
i.
,

ft

E"

I
N,r

i
l

lll
nos ctmbic-ls ctltrtroltdos t'rt cl trlttltt'l-'."1t'tlllLh;'t tl'
(ltle
il
slll(lC
lalubra.r,,cn lr sOnrr'idacl cic lr.:r.rtls()lltlltC
ia u,r.al, strs scran ()trls taI)tiIS r'triitblcs ittc{ellctrci it'ti
tr'.1"
teS que inciclir'an cn lr cllttrcitin clc lir voeltl. Plttlie
('sr:
s(r
e rl
lltrtl
pl
prtcclcll
cle eit, c[istincin, ]<ls rcsr-tlttd's
r;.rri;,'
trna tablr c llr clrtc sc,,ltsr'trctr l<,s tltlltlli,rs .tt llr
( {)rl\ii.:('
ble depenclientc cn f lrcin dc Irs cr-r.^ l't\;rrt)()\
rado indepenclic'n tes.
Entrinckr Vt er) las dilc|entcs cllrses clc vltt ialrlt's r tr,'
poclemos enCOntrar er-l Lln tr-1bai() crpe titnct-tttl, clrlrt't'it't
tror L,.ru prime|a separacirn enU-c lis Ilal-l-lrclts vlrt ialll''s
r';-ts
cotttintLcLi y las discotttinuns. Mict-ltlats qltt llts ltiltrt
n'riL'r'l
la
clLtrrcititr
p-dii tc'ner cuzrlquie r- vrlor
-c()nt()
iir"g.,r-rd,_r, cle *n enr-rncircl,r t.l lt ['r-ccrrctcit clt hcl t:i,s ti.'
s'ilti
,_,, io"ro'.te-, las va'iablcs clisc.lrtinltrs ' cliscl'ctt:
t, tl.'
DUeClen tcil-ntr ciertos vriOr-cs (p<lI cit'rn1ll()' cl itttlt't
rtttr
iic
tcctltttit:ititt
cler
ia,au, cle uni palabr:i o el grzrd,
slzrba).

Suele clislingr-rirse trrn bin e n ll'c Vat'irblcs t t tt t t t i t t,t l,''


y orrlinales. Las variables nominrlt's st.,n cr-ralililti\';t\; s..
vulor no acepta grados -el scro, llt lcnguil rnlte lllt o ci
curso ai que pcrtenece un estrrcl iuttc,-, ltlie lttl:.ts ttlt lrts
grdinaleS sOr-r aqr-rellas CLIVOS ya[9t-cs I)tlt'tlt'll ()l Fltlliz;tlst
escala dc nlhs r ntL'fr()s (lor t'it'rt,1i,,,,.1
en grados
"r,,rru
gruo de bilingtiismo clt: un hnbiuttc o l0s t'r.'slrltiitiii:; tl'.'
r.rn test).
FinalmentC, n()S refcri rClll()s t ir rlilt't't:lltil '-rlritt i:'''
variables de intervcLh,' y las vrt'iallles tlt' re lttt it)tt fuX it'llir r-rs
qLlC en laS prir-ncrIs n() hrv r,tn cel'. tlls.lltt' t'l.s iitit'ts(.
valOS entrC lOs puntcls cle lt csctlal pttcClCn collsi.i('iltJ
i.i\
' .r
r:quivalente s -*cs e I crsO clc ltL tt-.rnlrl ittttt-it r'tr
() libs.llt[(), l)t'-ii,'lrrl'
, iable, Cle l^clacirir-t sc clt ttll ce l
los iltie t't'ltlt't t'titti ltis
l-lIL's
tambin considcrase ecltivale
pllntos cle la escalr; un ejcmplo clc cslts ltill-ras st'r'iri i;i
iuracin de un cnu'ciad' cnantiIictcltt crl t'iliscrttIltl,s
Tal como veremos mrs aclelrntc, t'stts clistitrt i()ll(':i,
clue ahora pueclen pareccr sinrplcs t-clitl;rt'nicrri()\ ri ''l
a6r, rgar impOrterntes a la hr,'t'l clc sclc'Cci,lltl ir):i lt'i;r r'il
los que se btsa el tralamientr t'sltcls;t.ic'r'

W.,

ffi

6.L2. Tablas de"datos


ffi!

En el momentp de llevar a cabo el anlisis del corpus


si lo somelemos a un tratamiento instmmentai
-tanto
como si evaluamos auditivamente la presencia o ausen_
cia de una determinada variable fontica- es til cons_
truir tablas en las que se puedan ir anotando los valores
encontrados para,cada variable. Por lo tanto, su organizacin depender del nrnero y de las caracterstic de
ias variables que intervengan en nuestro experimento.
Empezaremos por un caso simple, tomado de un es_
tudio sobre el graclo de velarizacin de la consonante lateral |] cuando hablantes que conocen el cataln
-lengua que posee una [l] velarizada- y el castellano aprenden francs (Llisferri y Martnez Daudn, 1990). para
r"ealizar este tr:abajo se midi la frecuencia del sesundo
formante (F2) de Ia lateral, considerado un buenl*oonente del grado de velarizacin; esto se realiz en las
prodr-rcciones de cliversos informantes, siernpre en el
contexto consonarlte literal seguida de la vocal [e], leyendo un texto en irancs. La presentacin de los da_
tos en estc'ci:;c ::; ilLiv sinrple, al corno se reileja en la

tal'rlr

ffi

ritposible manera de organizar los clalos cxtridos dci


()n.\(
/ i 1/1( '
iisis acstico de la duracin cle l V0'l (i'utt,'
c()tlsoutLra
de
explosln
la
tiemPo que transcurre entre
sivocil
lt
de
nant ociusiva Y ei inicio de la sonoriclrd
c(.t't
corltacto
cn
guiente) de las tres ociusivas del catalirrl
s<.'bl tr
iodas las vc-rcales tnicrs de esta lcngua, rcaiizlLclo
cinco informantes (Llisterri, I 987):

ffi
,,ffi,
&ii I

'LqeL 2. Valores en miliseguttdos clel VO'I' de Lus tre\


consonalltes cclusivas scr!aS tlel catalan er1 cot1(L(l()

,,$,;

cott
ff''

$i

lil [e]

tPl

{
f

rrl

1:

Inf
Inl
Inf
Inf
lnf

lnf

s90 s08 J ss9


i610 1539 1396
1

1498 1549
1590 r549

570
1549
1641 1549
1600 1651
1

1539 1478 1529 1600 1407


1417 1600 1672 1763 1580
1692 1631 i4B 100 1580
1570 i570 I 580

Cada una de las cifras representa pues el valor de la


variable e.studiada en cada uno de los 34 casos analizados para uno de los informantes.
La siguiente tabli presenta, a modo de eje.:rplo, una

IJ

fKl

5,5
3,6
I 0,7
l 8,8
i7,8

8,4
6,1
9,8

[r;]
6,e
1?-,l

13,3

8,2
12,2
8,3

Inf I

17,3 12,8

9,s

Int

23

Inf
Inf

Inl

Tlel.n 1. Valores en hrcios ,lel segundo fonnante


de la corLso,ut.te latercLl Il] en el contexto Ilel en un hablant.
bilingtie catalan,,.-ctstellano leyendo un texto en francs

t,ccaLes tniccts en civtt:t inIrtrtrtcLt Lte's

Inf
Inf
Inf
Inf
Inf

4
5

13,

,4
13,5 i6,1
,3

11

-q

44,5 23,9
10,7 22

28,7

z
3

4
5

15 ,2
1 0,7
25,1
) 8,2

l,l

l,rl ir-,1 i_l


13,6 9,9 l
5,
63
9,1
9,E I l)
I

13, 13,
9,1 10,8
lt
9,6
10,9
24,5
20,6

l9.b

".1,3

l:1.(

4)I 15

i,1 ll,7
ll,8 14,6
10,2 ll'7
26,5 30,7
16,1 1c1,3

26,2 21,1 13,6 it) q


29 24,2 30,9 t6,2
16, i
.8,6
18,7 23,4 30
26,7
3,5
3
8,
34,6
32
39,8
,8
27 ,6
4)6 20,6 21,4 32
1

11,9

q)

t)

t3..1
i7 i

l.l.

ll,rr
(t,i

1l,l
18,:-.

2a,1
.l

9,9

l?,2

i7

3L)

1l

i2
30

,:)

,l

3:r ,tl

l5 l

En este caso, el valor clel VOT conslilu-r''c llt vrtr itlrlc


\( rl IlL:
dependiente, Irrientras que las indc'p''rrdictltt't
el lugar de articulacin de ia consonzrnte tlch'Lsivr' t'l
contJxto voclico y el informante' Corresponde' rc[crtrs'
Ltretli'
al modelo de tabl que se elabor; para anotar las
qrtc
Pueslo
ciones en el momento cie realizar el anirlisis'
dt' tlL
en el estuclio original cada in{'ormante proclurjo trls
\t

caso de cada consonante en cada contexto voclico, caen la tabla 3- que re-(c> de
presente cada uno de los casos
combinacin . ,rro
oclusiva con una vocal que aparecen en el corpus:

'I.nra

4, Frecuencia de aparicin de manifestaciones lonticas


de la intenupcin del discurso en utt conferenciante
y en dos intrpretes

bra aadir otra colurnna

TasL,{

3.

Va.lores en milisegundos del VOT d.e la c:onscnante

oclusiva sorda Ip] del cataln en contacto con vocales tnicas


en ctco informanies, presentando lo.s valores de tres casos
ael corpus
t

tpl

Inf
Inf
Inf
Inf
Inf

2
3

il

c] c2
15'5 17,2
3,6 6,7
ro,7 11,3

18.8

17 ,6

t7

16,5

,8

tel
c3
16,3
10,1

16,9
16,9

cl

c2

8,4 10,2
6,1, 8,2
9,8 10,2

13,6 14,6
13,3 13,9

c3

q?
77,1

Intrprete

Conferenciante
(efD

JI

vocal larga
total

ueh>

(mm)

Intryrete

23
0

12

vocal larga

J/

29

49

total

46

)/.

En el momento de presentar los resultados rJe pruebas de percepcin suelen utilizarse las llamadas matrices
de confusiones. Yeamos como ejemplo parte de los resuitados de una prueba de identificacin de vocales sintetizadas (Llisterri, 1984) en la tabla 5:

10

Tara 5. Matriz de confusiones (en porcentaies) resubado


de un test de oerceocin de vocale.s sintetizadas

La tabla 4 ofrece en cambio un ejemplo de organiza_


cin de variables discretas; en estos casos, suele rcoserse Ia frecuencia de uparicin de cada uno de los fenLe_
nos estudiados. se trata aqu de presentar los resultados
obtenidos al contai' el nmero de fenmenos fonticos
relacionados con ir intermpcin del flujo del discurso
por vacilaciones en un conferenciante ingls y en dos de
sus intrpretes al espaol; se refleja aqu el nmero to_
tal de veces que aparecen elementos como oero (en ingls)
o ueho y (mm> (en r;spaol), adems del alargamiento vo_
clico ante pausa al final de una palabra o frase. Estos
elementos se tomaron como indicadores de la estructuracin y fluidez del discurso en un estudio realizado por
Llisterri y Poch (1990).
Mediante la tabia 4 podemos comparar la diferencia
en la frecuencia de aparicin de intermpciones del tipo
descrito en el conferenciante y en los intrpretes, al
tiempo que es posilrle contrastar las estrategias utiliza_
das por cada intrprete en los momentos de vacilacin.
140

tjl

[e]

jl 60,6 34
[e] l,s e2,4
t

te

4,s

[a]

tal

1,5
1

trl
tol

tul 0,75 o,7 5

tel

tl
Lol

4,5 0,7s
3,7 0,75
93,9 0,7 5
0,7 5 84,8

[]

-'l I
Lc

tol

tul
0,75

o,75

94,6

2,2

7,5

))

3,7

0,7s

94,6

))

q)4

0,75

5?
97,7

En el eje vertical de esta tabla se colocan las vocales


sintetizadas que los sujetos del test deban identificar, y en
el eje horizontal sus respuestas, presentadas aqu en porcentajes; 60,6a/o en la interseccin entre las dos vocales [i]
nos indica que tal vocal fue identificada correctamente un
60,60/o de las veces que apareci en el test, mientras que e[
r41

por ciento que se encuentra en la interseccin


entre
:Xrr".
y LeJ rndrca en qu proporcin la primera
se confundi
con la segunda. nn t"gu.i. po.."rjes hubiera
sido no_
sible utilizar tambin-el nmer"
";
;;;;;;
"U."i"to
niendo la precaucin de indicar cuntos
sujetos participa_
ron_en el test y cuntas veces escucharon
cada estmulo.
Vemos que, rriediante la confeccin de estas
.investigador
tuU., .l
puede ya hacerse una primera idea de
las ten_
dencias de sus resultados. Al mismo tiempo,
la tabulacin
de_ los datos consfituye el primer paso
para su presenta_
cin grfica y pai^a el tratamient estadstico p"r,".ioi
LrJ

1350 1450 1550 1650 1705


Ftcuna

4. Histograma

segundo formante de

6.2. LA PRESEN?'ACIN DE

LOS DATOS

Las tablas que acabamos de ver constituyen


una bue_
na marera de pre-sen,tar los datos, pero imaginemos
que
a la tabla 3 aadii'amos los ."*liudo. .";"-.p";ai.r,..
a las tres consonantes y a las siete vocales pru
to, .irr_
co informantes; seda muy diffcil obtener una
visin glo_
bal de las tendencias que se desprenden de fu,
ciones. Por tal motivo es til a tenudo r"p."s.ntar
"U..ir"_
de
forma grfica los r.esultados obtenidos; para
.rt".,
diversas tcnicas, que exponemos en este apartado.
"l
Una de las ms utilizadas es el histog**",i
,._
presentacin en la que en el eje horizontl
se sitan lo.
valores hallados para una detrminaa. uu.iubi"-r-il.1
eje vertical el nmero de casos encontrados par
.ada
valor, es decir, sufrecuencia d.e aparicin. Ef frirt"g.um,
permite obtener una primera impresin visual
soire la
distribucin de los daios.
!" 11 figura 4 ofrecemos el histograma que corres_
ponde a los datos de la tabla 1, presentando
distribu_
cin de los valores del segundo fbrmante de *;;;1"_
[l]
formante bilingrie leyendo un texto .., fru.r.Zr,
.".oiJ"_
mos que puesto que el contexto y el informante son
siernpre los mismos, la nica variaLle
.l .rulo. ; E.

",

142

Hz

de la distribucin de los valores del

tll

en el contexto

[]el

en un informante

El eje horizontal recoge Ios valores encontrados para


en intervalos de 50 lHz-, y en el
la variatle
-agrupados
vertical se muestra el nmero de casos en que aparece
cada intervalo de valores. Puede observarse as cules
son los valores que aparecen con ms frecuencia, obteniendo de este modo una primera indicacin sobre Ia
distribucin de los datos.
Presentamos a continuacin un histograma de caractesticas similares, que visualiza los datos de la tabla 4,
relativos a la frecuencia de aparicin de fenmenos relacionados con la intermpcin del discurso en mornentos
de vacilacin en un conferenciante y en dos intrpretes:

20
10

"er"

conf

alug

conf

"eh"

intl

"eh"

int2

"mm"

intl "mm' int2

alarg

intl

lrg inl2

Histograma de la frecuencia de aparicin


de fenmenos relacionados con la interrupcin del discurso
en un conferenciante y en dos intrpretes

Flcuu 5.

t43

. Fn el eje horieontal se encuentran las variables estu_


diadas
de vocales, simborizada como
,,alargo,-prolongacin
nero (en ingls) y neho, <mm) (en espaol)_,
tanto relativas al conferenciante (nconfo)'.o.rro , f".'i"_
trpretes (<intl" e ,,int2r); el eje vertical muestra eln_

mero de veces que aparece cad una de ellas, p";;l;


do evaluar visualmente tanto las diferen.i"i -."t."-.r
conferenciante y ios intrpretes como entre los dos
in_
trpretes.
Esta misma infor-rnacin podra representarse
rotan_
do la posicin de los ejes, y tendramos entonces lo que
a veces se denomiJra un diagrama de barras, tal
como'se
muestra en ia fisura :

alatg int2
alarg intl
"mm" int2
"mm" intl
"eh" int2
"eh" intl
alarg conf

"er" conf

010203040
- Frcuna 6. Diagre_ma de barras mostrando el nmero
de fenmenos relacionados con ra intenupcitt der
discurso
en un conferenciante y en dos intrpretes
La informacin es, en este caso, equivalente a la
terior. Sin embargo, en el momento d preparar rrr. an."_
presentacin grfica de los datos debe ienrse
en .r".r_
ta especialmente laicraridad. si intentamos representar
mediante un histograma ros datos de la tabra i."l.,i;;,
al valor del vor de las tres ocrusivas sordas del
cataln
en contacto con las vocales tnicas realizadas por
cinco
informantes obtendremos er resultado de la fd; t. ^t44

filtiltil{il[i]telleltelfelieltEllEltEltEltEltaltaltaltaltajt0ltojl0l[0]lol{olLollollol[o]fullullullullul

Frcun 7. Histograma de los valores del VOT dn [p], tLl y |kl


del cataln seguidas de vocal tnica en cinco informantes

En el eje horizontal aparecen cinco repeticiones de


cada vocal (tEl y [O] simbolizan [e] y [r] respectivamente), ya que cada una ha sido realizada por un informante distinto; las barras verticales corresponden a las
tres consonantes [p], [] y Ik] por este orden; en cambio,
en el eje vertical no encontramos aqu el nmero de casos para cada variabl,e, tal como suceda en las figuras
anteriores, sino que se ha representado el valor en rnilisegundos de la variable dependiente, es decir, del VOT.
Observando la figura 7 se hace relativamente difcil realizar una evaluacin visual de los resultados.
Por ello, en muchos casos deberemos recurrir a presentar valores medios, tal como se ha hecho en la figura 8: para cada vocal se representa el valor de la media
de las realizaciones de los cinco informantes, con lo que
perdemos informacin sobre el comportamiento de cada
locutor, pero ganamos en claridad a la hora de plasmar
las tendencias generales de los resultados.
Esta misma informacin puede aparecer en un diagrama de barras, tal como se muestra en la figura 9.
En este caso, en el eje horizontal se encuentra la escala en milisegundos; la longitud total de la bar-ra es Ia
suma de todos los valores encontrados para el VOT de
las tres consonantes en contacto con una determinada
145

vocal

ste es i:n dato que no aporta nada a una des_


-y fontica--,
cripcin
y las zonas sombreadas corresponden a la duracin del VOT en cada oclusiva; este tipo de

grfico permite observar claramente la relacin entie las


tres consonantes, mostrando en qu proporcin el valor
de e-sta variable es mayor o menor segn el lugar de ar_
ticulacin.

Otra posibilidad viene dada por los llamados polgonos de frecuencia. Los valores de las variables se representan mediante puntos en lugar de hacerlo mediante
barras como en los histogramas, aunque siguiendo el
mismo principio: la altura del punto en el eje vertical indica o bien la frecuencia de aparicin o bien el valor de
una determinada variable, situada en el eje horizontal'
Pueden compararse distribuciones de datos juntando dos
o ms polgonos en la misma grh'ca, tal como se ha hecho en la figura 10, en la que se presentan de nuevo los
valores medios del VOT de las tres oclusivas sordas del
cataln en funcin de la vocal que les sigue:

til [e] tl [a] tol [o] Iul

VoT [tl

Frcunl 8. Valores medios del VOT d" tpl, tLl y


en eontacto con vocal tnica

tkl

vor

[p]

d.el cataln

til [e] iEl [a] tol [o] lul


Iu]

Ftcuru 10. Poligono de frecuencias con los valores medios


del VOT d" [p], [L] y [<] del cataln en contacto

lol

con vocal tnica

tol
lal
IE]
Ie]

til
0

Frcun

20

40

9. Valores medios

60

80

del VOT d" [pJ, tL] y

en cantacto con vocal tnica

l4

tkl

del cataln

En el eje vertical encontramos la duracin en milisegundos del VOT, y en el horizontal el contexto voclico
en el que se ha realizado cada consonante. La ventaja de
esta figura reside en que permite observar de forma independiente el comportamiento de las tres consonantes
de una manera q.uiz ms clara que el histograma, aunque en realidad no aporta ninguna informacin que no
conociramos de las grficas anteriores.
Este tipo de diagramas es tarnbin una buena altert47

nativa para representar los resultados de experimentos


relacionados con la percepcin.
En la figura 1l se recogen los resultados de un test
de identificacin de slabas sintetizadas cuya consonante inicial era [pl o [Ll (Llisterri, l9B7); se piesentaron l
siabas sintetizadas del tipo [p] + vocal y 16 con la estmctura [t] + vocal, y se pidi a un grupo de 35 personas que identificaran la consonante inicial.
El eje horizontl muestra cada uno de los estmulos
(slabas con [p] y slabas con [l]) y en el eje verrical se
encuentra el nmel-o de casos en que cada estmulo fue
identificado como una slaba con la consonante inicial
lpl o [t]:

conjunto de vocales del cataln, a partir de datos extrados de Llisterri (1987). En el eje horizontal encontramos
la frecuencia en hercios del primer formante (Fl) y en el
vertical la del segundo (F2); cada punto representa una
vocal producida por un informante, de modo que los
seis puntos que pueden contarse para cada vocal corresponden a las realizaciones de la misma vocal en el
mismo contexto de seis informantes diferentes:

t++

fi!

2000

++olq
!d,
o

40

----+-

1000

^^

^r
u0

trl
0f
2D0

o -

"o3

a
".

600

?00

Frcun 12' Campo d",!::t:nT:":;2x* de una muestra

pppppppppppppppp r r r r r r r r r r r ft r t

-Gr-

tpl

Flcun, 11. Polgono cle frecuencias ind.icand.o la id.entificacin


de la consonante inicial (tpl o [L]) en s{labas sintetizadas

Una cuarta posibilidad viene dada por los campos de


dispersin o scatters. [istos se obtienen situando io. .rrr,lores de dos variables en un eje de coordenadas, de manera que pueda observarse tanto la dispersin de los datos como la relacin entre las variables.
La figura 12 rnuestra el campo de dispersin de un

t48

La representacin de los campos de dispersin de los


sistemas voclicos es una de las utilizaciones nls f-t'ecuentes de loslsZii'i'is',.n fontica, pei'o hay que sealar
que pueden tdib.'in tilizarse en cualquier caso en el
que se desee mostrar cmo se distribuyen ios valores de
dos variables. En el prximo apartado nos referiremos
tambin al papel de este tipo de diagramas para visuallzar la existencia de una correlacin entre dos variables.
Finalmente, cabe referirse a Ios diagramas de porciones, en los que los valores de las variables se reparten sobre una superficie circular. Las figuras 13 y 14 representan la informacin contenida en la tabla 4 y en las figuras 5 y mediante dos diagramas de este tipo.
Cada una de las porciones representa una de las variables tomadas en consideracin, y la parte que ocllpa en
119

el crculo es proporcional al nmero de veces que apa_


rece; puede tambin incluirse, como se ha hechoaqu, el
clculo del porcentaje que representa respecto del total.
As, mediante la figura 13 sabemos que del total de va_
cilaciones en el discurso del intrprete, un 0 a/o corresponde a prolongaciones de vocales, un 10 Zo a elementos
como <mm> y un 8 ot,b a <ehr.
4,7

0%

Hay que advertir que la terminolo ga uttlizada en ia


d.rro-i.tucin de los grficos puede. variar ligeramente
en cada autor y en cada programa de tratamlento estadstico. Brown (1988, 65) denomina histograma a una
representacin en la que las frecuencias de aparicin
se representan mediante puntos,'diagrama de barras
cuando stas se representan mediante barras, y polgono de frecuencia al resultado de unir mediante una lnea los extremos superiores de las barras' Woods' Fletcher y Hughes (1986, 17) se refieren a los histogramas
.rr.to loJ valores de la variable que aparece en el eje
horizontal se agmpan en intervalos, utilizando la denominacin de diagrama de barras cuando esto no sucede.

FlcuRa 13. Dia,,rama de porciones de Ia aparicin


de los elementas relacionados con internLpciones
del discurso en el intrprete 1

Acabaremos sealando que corresponde al investigador seleccionar el tipo de presentacin grfica que se
que
adecua mejor a sus resultados, y que en la revisin
posibiliacabamos e hacer no hemos agotado todas las
dades de presentacin visual. Por ello, un programa -de
es una de las
;;fi."t flexible y relativamente completo
erramientas imprescindibles en la realizacin de un
trabajo de fontica experimental'

6.3. EL TRATAMIENTO ESTADISTICO

44,23%

55,l7%

Intrprete

I
I

"eh"
alargamiento

Flcune 14. Diagrama de porciones de la aparicin


de elementos relacionados con la intem,Lpcin
del discurso en el intrprete 2
150

Si en el apartado anterior hemos presentado algunos


procedimientos que permiten una- aproximacin visual
'al
anlisis de los datr, .o-".ponde ahora discutir brevemente las posibilidades de tratamiento numrico de
nuestros ."r.rltudot. Es del todo irnposible presentar
aqu de manera completa las herramientas estadsticas
qu. prr"d.n utilizars" .tt ,,.tu investigacin en fontica;
po. no en el captulo de lecturas remitimos a una serie
. *unrr.les deicados al tratamiento de datos lingsticos, y nos limitaremos a esbozar una rpida panormica e algunas de las posibilidades que nos ofrece la
151

estadstica para la interpretacin de ios resultados de un


experimento.
centraremos nuestra exposicin en tres mbitos: la
descripcin de los datos en lo que se refiere a las tendencias generales y a su variabilidad o dispersin, las
herramientas relacionadas con el falseamiento de rrrptesis nula y la correlacin entre las variables.

6.3.1. La descripcin estadstica de los datos

0 1 23

En el momento de realizar una descripcin estadstica de los datos, hay dos factores que entran en consi_
deracin: las llamadas
"medidas de Lu t"rrd".r.ia central>
y los que podemos denominar
..indicadores de la dis_
persin". Ambos parten del concepto de distribucin
norynal, que ejemplificaremos a continuacin.
.3.1.1. La distribu.cin normal
Imaginemos ql-te en una clase de 3 estudiantes, las
rlotas de un examelr. son las que se recogen en la tabia 6:
:.

Tabla 6. Notas de 36 estudiantes en Ltn examen


correspondientes a una distribucin norynal
Estudiante n."
Nota
Estudiante n.o
Nota
Estudiante n."
Nota
Estudiante n.o
Nota

0
10
8
19
'7

28
6

23456789
10 1199222
u12131415161718
88333377
20 21 22 23 24 25 26
74444466
29 30 31 32 33 34 35
66555s55

27
36

El histograma correspondiente a la distribucin de


notas en esta clase es el siguiente:
152

4 5 67

8 910

FIcuna 15. Histograma de la distribucin de notas


en un grupo de 36 estudiantes representando
una distribucin normal

Si uniramo, rn.Oru.rte una lnea curva los extremos


de cada una de las barras, obtendramos lo que se conoce como campana de Gauss, o curva de la distribucin normal, caracterizada por su forma simtrica respecto del punto ms alto. El examen de las notas de la
tabla nos indica las caractersticas de este tipo de distribucin: slo un estudiante ha obtenido un 0 y slc-r
uno ha obtenido un 10, dos tienen 1 y dos 9, tres han obtenido un 2 y tres un 7, y as sucesivamente.
En los datos reales, nunca nos encontrarnos con
por
una distribucin perfectamente normal
-comprese,
ejemplo, este histograma con el de la figura 4- y por ello
hemos recurrido aqu a un ejemplo antificial; en general,
cuantos ms valores recojamos, ms se acerca su distri"
bucin a la curva de una distribucin normal. Habitualmente, cuando el nmero de casos es igual o mayor que
30, la distribucin de una muestra de casos *-elegidos al
aza, y no construidos ad-hoc como en el ejemplo precedente- se acerca suficientemente a la normal.
Esta cifra es importante a la hora de considerar el nmero de muestras de cada caso que necesitamos para
construir un cofpus; en una situacin ideal, tendramos
30 muestras de cada caso estudiado --por ejemplo, en el
caso del VOT, 30 casos de [p] seguida de [i], 30 de [p:l ser53

guida de [e] y as sucesivamente, si el entorno voclico

constituye una variable del estudio; si, en cambio, decidi_


mos tratar nicamehte la variable nruga. de articulacinr,
3O..casos d" [p], 30,de tll y 30 de
t[] sern ,"n.i..r,.r.
Mrlroy (7987,135) cita a propsito de este tema las con_
clusiones de Guy (l!80): .o.,
-".ro, de l0 .u.o, p*u .rr.
determinada variabie encontraremos
seguramente que
sta-se comporta al zar; con 10 casos tenemos
eI90ok de
posibilidades de acercarnos a una distribuci.,
.roa,
mientras que con 35 llegaremos casi con toda seguridad
a una distribucin ndrmal, a condicin de que
a..fr"e, ,ro
deseemos formar grltpos ms pequeos en el interior
de
esta variable. Cuando se- desea xaminar el comporta_
_
miento conjunto de rns
de una variable upli"anJo IJ."icas como las que se clescriben en el apartabo
.3.4 es ne_
cesario disponer de un nmero ms elevado d. .u.sos.
Es importante conocer la normalidad de
,bucin
""u-i.,.i
de datos, pues muchas pruebas
,"
basan en el principio de que las aplicamor;;;;l;;",
"n "rtui.,il
de valores.que se acercan estas ndiciones.

6.3.1.2. Its medidas de la tendencia central

lfemos observado en e_l histograma anterior que la


nota ms frecuente entre los alumnos del grupo ircinco, siguiendo, por. orden descendente, n cuatro",y
un seis. Las calificaciones parecen pues agmparse alre_
dedor de estas puntuaciorr.r, qr. constituyei el centro
visual de la distribucin. Existen diversas medidas
numricas, que nos indican de forma cuantitativa lo que

hasta ahora slo hemos observado cualitativamente. '


La mediana es el v;rlor de una distribucin pu.r.l qrr.
podemos encontrar el mismo nmero de casos cor
rn ir.lor ms alto que con irn valor ms bajo; por lo tanto, es
el valor que se encuentra en el centro-de ia distribucin.
Puede verse fcilmente que el valor de la mediana
., t;"
el grupo de notas que estamos analizano; po. .U":
.
esta nota quedan 15 casos, y por encima otios
15.
r54

utiliza tambin la moda, entendida como el valor


con la frecuencia de aparicin ms alta en una distribucin; en nuesto caso, tambin es 5, puesto que es la nota
obtenida por seis alumnos, mientras que el resto,de noSe

tas corresponden a grupos ms pequeos de estudiantes'


No obstante, el valor ms empleado para indicar la
tendencia central de un conjunto de datos es la media,
que se calcula como la suma de los vaiores de todos los
dividida por el nmero de casos' La nota media de
"uro,
nuestro grupo es un cinco (la suma de todas las notas es
180 y ltly lO alumnos), y podemos observar que en el
caso de una distribucin perfectamente normal coincicie
con la mediana y Ia moda, cosa que no suceder en las
distribuciones de datos reales con las que trabajarernos
en fontica. Por ejemplo, en la distrihucin de valores
del segundo formante de [l] de la tabla 1, la mediana
tiene tin valor de 1.570 Hz, mientras que la media es de
1.565,4 Hz, situndose la moda entre los 1'550 -v los
1.00 Hz.
La media se considera una buena rnedida de la tendencia central en la distribucin de los resultados, puesto
que tiene en cuenta todos los casos, al contrario de la meii.nu y la moda. Su principal iimitacin es que tambin
tiene n cunta los valores extremos de la distribucin,
aunque esto puede obviarse considerando un nmero elevado de casos. En conjuntos de datos'no muy grandes,
este es un factor que debe tomarse en consideracin'
Las cifras siguientes nos ofrecen un ejemplo de las limitaciones de la media como nico parmetro para caracterizar una distribucin:
Conjunto de datos

(a):

Conjunto de datos

(b):

Conjunto de datos

(c):

Conjunio de datos

(d):

1,2, 3, 4, 5,6,7, 8, 9, 10'


Media = 5,5
5, 5, 5, 5, 5, 6, 6,6, 6' 6'
4sdi = 5,5
l, l,1,1, 1, trO, 10, 10, 10, 10'
Media = 5,5
3,3,3,8, 8, B, 6,5,6,5'
Media = 5,5

i5s

No hace falta examinar los histogramas, para darse


guent-a de que una. rnisma media puede
a
distribuciones de valores muy distintas, y"oo.rporrder
po. .ilo es necesario tener ciertas precauciones a la hora de interpre_
tar sus resultados, que pasan por considerar algunoi de
los indjcadores de la dispersin a los que se hce refe_

rencia en el prxirno apartado.


',

6.3.1.3. Indicadores de la distribucin de los datos


El anlisis de la variabilidad de los valores de un con_

junto de datos puede iniciarse considerando los varores


mdximos
ms
y mnimos
ms baio_
-valor de alto-valor
como indicativos
la dispersin. La
diferencia
".rt..
ellos constituye el rango. No obstante, estos dos indica-

dores se ven afectados tambin por la presencia de valores atpicos en el grupo. Si observams los valores de
la tabla 2, veremos que el VOT de [k] presenta un valor
mnimo de 12,5 ns y un mximo de 59,5 ms, con un
rango de variacin de 47,3 ms; en cambio, tanto la media (29,3 ms) como la mediana (29 ms) tienden a coincidir, demostrando que se trata de una distribucin que
se aproxima a la normal, exceptuando los valores extremos que aparecen a la derecha de la fieura 16:

Debido a estas limitaciones el indicador de la dispersin ms utilizado en estadstica es la desviacin tpica.


para hallarla, se calcula en primer lugar Ia diferencia de
cada valor con respecto a la media; algunas diferencias
sern positivas mientras que otras sern negativas; a fin
de eliminar la diferencia de signos se elevan los valores
al cuadrado y se suman para encontrar la suma de los
cuadrados; dividiendo por el nmero de casos menos uno
es una precaucin que se toma cuando la mues-sta
tra es pequea- y realizando la raz cuadrada obtenemos la dsviacin tpica. A grandes rasgos, sta puede
considerarse una especie de promedio de las desviaciones de todos los valores respecto de la media'
Hemos explicado el procedimiento empieado -para
calcular la desviacin tpica para poner de manifiesto
que es un ndice que tiene en cuenta la.variacin de cada
J.ro ."rp.cto dela media. Para la inlerpretaci. de la
desviacin tpica hay que considerar que cuanto m.s
lu ditp.rsin respecto de la media
elevada ..u, -uyo,
"i
de cada uno de los valores, mientras que cuanto ms baja'
ms agrupados se encuentran los valores alrededor de la
media o punto central de la distribucin. volviendo a ios
datos t"i - @ que anteriormente hemos presentado, la
desviacin tfpica de cada grupo es la siguiente:
Conjunto
Conjunto
ConJunto
Conjunto

ms

Frcun 76. Histograma de los valores en ms det VOT de


. del cataln
15

[k]

de
de
de
de

datos
datos
datos
datos

(a)
(b)
(c)
(d)

Desviacin tpica = 3
Desviacin tpica = 0,5
Desviacin tpica = 4,7
Desviacin tpca = 2,1

Se cumple pues que, cuanto mayor es la dispersion


de los datos, mayor ser la desviacin tpica'
Hay que tener tambin en cuenta que el valor ?b:oluto de la desviacin tpica depende de los valores de los
datos. As, mientrut qtt la desviacin tpica en el caso de
los valores del VOT de tkl de la tabia 2 es de 10,2, la del
segundo formante de tl] en ia tabla I se eleva a77,3, debio a la diferencia en los valores absolutos de los datos.
Al examinar una distribucin, suele hacerse referen157

cia tambin a la .simetra respecto del centro


en estadstica corno sesgo- y a su agrupacin-conocida
alrededor
del valor central *-o curtosis-. Estos o. i.rdi.udores pueden cuantificars numricamente, aunque son aprecia_
bles observando los histogramas. una distribucin puede tener sus valores centrados hacia la izquierda (srgo
positivo) o hacia,la derecha (sesgo negativo); en el pri_
mer caso, la media suele ser ms baja que la mediana, y
la mediana ms baia que la moda, mieniras que en el segundo sucede lo contrario. Una curtosis alta iignifica, en

carnbio, que los valores se agn-lpan de forma"m,.ry p.o_


nunciada alrededor de la media, mientras que .r.r .r.tosis baja indica: que se reparten, tendieno hacia un
histograma que dara una lnea casi plana si uniramos
los extremos de las barras.

6.3.2. Los test estadsticos

Al plantear crno se formulan las hiptesis hicimos


referencia a los conceptos de hiptesis nula e hiptesis
alternativa (2.4.2), v rnencion.-or que en un experimen_
to intentamos siempre falsar la hiptesis nula, simboligomo Ho. Vamos a volver ,br. el problema del
-z-a_da
VOT de las oclusiias para ejemplificar crno podemos
proceder en este caso.
E,s un hecho bin establecido en fontica que el VOT
(recordemos que se define como el intervalJ temporal
entre_ la explosin cle la consonante y el inicio de ,onoridad en la vocal) distingue el lugai de articulacin de
las oclusivas: [p] tiene un VOT de una duracin mayor
que [t] y ste a su vez es ms elevado que el de
tkl (iis_
ker y Abramson 1964, 1973). E' la tubru z p."i..rtiu.mos mediciones dei vor de las tres ociusivai sordas del
cataln, y se trata cie ver ahora cmo podemos plantear,
desde un punto de sta estadstico, lai difere.r.i., entre
estas consonantes, limitndonos, para mayor simplici
dad, a trarar de distinguir entre ipl V ttl.
La hiptesis nu.ia, en este .uro, ,. formulara del
r58

el VOT de [p'i
modo siguiente: no hay diferencias entre
valores qup hemos relaciov^. ft! si fuera i"t', los
iuo .tt cada una de las consonantes perteneceralt'.en
Nuestro objetivo
realidad, a un nico conjunto de datos'
utilizando
es demostrar la f^lttd^ de esta afirmacin'
los vaque
demostrar
,ra, pro."aimiento que nos.permita
a dos conjunlores hallados en ei anlisii corresponden
tos de datos distintos'
conocidcr
Para elio utilizaremos un test estadstico
de
como t-test de Student' Este test compatq l?.*'tdias
que
probabilidad de
;;;^;*p;, d" duto' v nos da unaque
estn extradas de
pertenezcan al mismo gtt'po o de
las medias de durail;;;;;; ait"r.,'I"'' o*p^t'ndo
este test' obtene.i?"-"ivoT de [P] y de [ mediante
quiere decir. que tc;;; ;;. significaci cle 0' Io que
pro;;;"; d 0"% cle posibilidades de que las medias
vengan dei mismo grupo'
gmpos los daEn cambio, i,'tt-"tt-os dividir en dos
que en
-"1 gf"P"
tos relativos a la oclusiva [p1, de modo
bilabiales
oclusivas
las
a
tengamos to, .ot'"'fondlttti"t
vocalcs
las
con
que han sido pronunciadas en contacto
con
[a]' L:l'
contacto
[i], tel y tel y "" "oo-f"t d9 lpl ennos proporcionan unr
t-test
ioi v iul Los resultados del
indica.que' cr)n
significacin estadstica de 0,561, lo que
de
posibilidacies
e
i;il;;;;tli;;J;;;t";emos er 56o/o
gntmismo
medias corTespondan en realidad al

qL f"t

po de datos.

Ia hiptesis nula hemo's partido pues de


en las mediciones
f" i"" . que los lo'"' obtenidos
conjunto de datos' y hemos' aplicaf"*..r"...t ul -i.r,,o
nos ha dadr:r un
do un test que, co*pututdo las medias'
de que esto suceda' Este grado de
;;J; " proUubilid;d
estadstica
orobabilidad se relaciona on Ia signi[icacin forma de-

"" ;;;l;isar

"ffiJ;;;i

it", q"t suele presentarse en

cimal y se convierte en un porcentaje multiplicndola


probabiliad de obtener un deterr'i;;;1b Ctu.,doiu
conludo ,"rrrltado si loi datos pertenecicran al mismo
--es
nula
j""r. es alta, no podemos iaisar ia hiptesis
conjuntos de vadecir, tenemos inicio, de que los dos
159

lores corresponden en reaiidad a un mismo gmpo como


en el caso de la separacin que hemos realizrdo en los
valores del vor 4" tpl- y se habla entonces de diferencias no significativas entre los dos grupos. por el conrrario, cuando ms baja sea esta probabilidad ms seguros

podemos estar de'quLe estamos {rente a clos grupos

d"e da_

tos distintos, corno en el caso de los valorei et vor ae


tpl V [t]. Una expiicacin ms detallada d"
p-."ro
"rt".ro.ir, d"
aqu hemos simplificado excluyendo la
-que
valo- crtico- puede verse en Brown (19gg, l|g_122).
El nivel de significacin es la probabiridad mnima a
partir de la cual podemos considerar que la hiptesis
nula queda falsada, es decir, qu tanto por ciento de po_
sibilidades considt'ramos el minimo para pensar que nos
hallamos frente a dos gmpos diferentes de datos. En ci.ncias humanas suele fijarse el nivel de significacin en
0,05 (5 ok); es decir, cuando la probabilidd de que los
dos grupos de valores compa..dos pertenezcan a una
misma clase es igual o menor al 5o/o puede pensarse ya
que pertenecen a dos clases distintas. En eite caso se

puede aceptar que ias diferencias entre los dos gmpos no


son debidas al azar y considerarlas significati"vas. si la
probabilidad es del 1 % (0,01) se habla de diferencias
muy significativas. -No obstante, la existencia de diferencias significativas entre grupos de datos no constituye
una explicacin d" qn fenmeno fontico; el resultado del
test estadstico es la herramienta que nos permite falsar
la hiptesis nula en la que basamos un experimento, pero
no nos indica el morivo de las diferencias entre los dtos.
Este mismo razonamiento podra aplicarse al estu_
dio sobre la velarizacin de la lteral en hablantes bilinges que hemos presentado anteriormente. El problema
es el siguiente: tanto el castellano como el frncs son
lenguas que presenian una consonante latral alveolar,
mientras que el cataln se caracteriza por una []] velarizada; desde el punto de sta acstico, esto se manifiesta e-r diferencias en,la frecuencia del segundo formante
(Delattre, 1951). Se trata de averiguu. si.rrundo un ha_
tlante bilinge cataln-castellano aprende frurruer, pro_
r0

duce una consonante lateral alveolar o bien utiliza la variante velarizada propia del cataln.
Para ello debemos obtener tres conjuntos de datos
para cada uno de nuestros informantes; los valores del
F2 de [l] cuando hablan cataln, cuando hablan castellaltimos se presentan
no y cuando hablan francs
-estos
para un informante en la tabla 1-. Si pensamos que plrede haber una fuerte interferencia del cataln en el h'ancs, plantearemos la hiptesis nula en los trminos siguientes: no hay diferencias entre los valores de F2 de lll
en las realizaciones catalanas y en las realizaciones francesas de los infbrmantes. Un test adecuado nos permitir establecer el grado de significacin de las diferencias,
y decidir si podemos o no falsar la hiptesis nula. Un grado de significacin por encima de 0,05 nos indicar que
hay rns de un 5o/o de posibilidades de que los valores de
F2 encontrados para ambas lenguas pertenezcan ai mismo conjunto de datos, con lo que no podremos falsar la
hiptesis nula y tendremos indicios suficientes para penr.i q,t., al hablar trancs, nuestros locutores esln utilizandc la variante velartzada propia del cataln.
Los ejemplos que hemos utilizado hasta ahora se refieren a la comparacin entre dos conjuntos de datos
VOT d" [p] y [U o los vaiores de F2 de []l en fian-el
cs y en cataln- y en estos casos pr,rede utilizarse el
t-test de Student al que hemos hecho referencia. Sin e mbargo, puede ser que necesitemos comparar ios datos de
ejemplo los valores de VOT de
ms de un grupo
los valores del F2 de [l] en cataln,
las tres oclusivas o-por
castellano y francs-i para ello debemos recurrir a otra
tcnica, conocida como anlisis de varianza.
A grandes rasgos, se trata de determinar si la variabilidad de los datos entre los diferentes grupos es mayor
que la variabilidad en el interior de cada grupo, ccn objeto de falsar la hiptesis nula si esto sucede; volviendo a nuestro ejemplo, las diferencias que se encuentran
comparando las mediciones del VOT d* ipl, tll V Ik] deben ser mayores que las que hallamos comparando entre s todas las las mediciones realizadas para lp l, para

16i

[L] o para [k]. En este caso se aplicara la prueba deno_


minada one way analysis of uariance o one way ANOVA.
En casos ms complejos se utiliza un anlisis factorial
de varianza, encarninado a mostrar dnde se encuentran

las diferencias significativas entre distintos grupos

Lehiste, 1970). Los siguientes datos, tmados de Llisterri (1984), corresponden a valores medios para el calalan
de una informante femenina:

de

datos relacionados unos con otros.


Todo lo dicho,hasta ahora muestra la amplia gama
de procedimientos estadsticos para comparar divrsas
variables, pero no..constituye ni mucho menos una pre_
sentacin exhaustjva; por este motivo remitimos al lec_
tor a los trabajos sobre tratamiento estadstico de datos
lingsticos citados en el apartado dedicado a las lecturas. Hay que sealar que la seleccin del test ms ade_
cuado para falsar la hiptesis nula depende de varios
factores, entre los que se cuenta el tipo de variable
-h.y
test adecuados pa'a 'ariables de intervalo y de relacin
y otros mejor adaptados a las variables nominales y ordinales-, el nmero de casos, la diferencia de tamao
entre los gmpos que se comparan y la normalidad de la
distribucin. Por ello, antes de utilizar un determinado
tipo de test, es preciso asegurarse de cules son los re_
quisitos que nuestros datos deben cumplir.

Tanu 7. Valores medios en hercios del f'undamental


y del primer formante de las vocrtles tnicas del cataln
p(f,ra una inforunante femerina
tal

Io]

trl

tuj

208

191

591

204
516

208
429

212

525

Vocal

trl

lvt

fpl

Ie]

Fo

200

204

F1

331

325

Representando estos datos en un ,campo de disPersin obtenemos el siguiente grfico:

Etee
.40:ll.l

.3.3. La correlacin entre las variables


Queda por examinar un tipo especial de relacin que
puede darse entre dos variables, conocido como
cin. Dos variables ije encuentran en correlacin "ooilo_
cuando
aumentan o dism
grado de

co?itrlffiiffi*S visuiiza en un campo de dispersin o


scatter, observando,la colocacin respecto a los dos eies
de los puntos que representan a los valores.
Ilustraremos este concepto con otra nocin bien conocida en fontica: 'la relacin entre la frecuencia fun_
damental intrnseca de una vocal
decir, la frecuencia
-es en el momento
de vibracin de las'cuerdas vocales
cie
pronrrnciarla, simbolizada como Fn- y la frecuencia del
primer formante de la misnra (Lehiste y peterson . 196l:
162

190

210

220

FlcuRa 17, Conelacin entre la frecuencict fundamental


y la frecuencia del primer fonnante en una muestrct
de vocales tnicas del cataldn realizadas por una
informante femenina

lil, lel y [e ]
(en
el eje hoal aumentar Ia frecuencia del fundamental
rizontal) aumenta tambin la del primer formante (en el
eje vertical), mientras que en las posteriores Ia], [cl, [:l y
[u] al incrementarse la frecuencia del fundamental trecreSe observa que para las vocales anteriores

13

ce la del primer forrnante. En el primer.caso se trata de


u.tta correlacin positiva
valores altos de una variable
-ade la otracorresponden valores altos
y en el segundo de
.rna correlacin negativa, en la que los valores d una va_
riable aumentan mientras que los de la otra disminuyen.
Esta interreiacin entre variables puede tambin cuan_
tificarse mediante el llamado coeficiente de correlacin,
una cifra cuyos valores oscilan entre + 1 y - 1, de modo
que obtenemos uri valor de + 1 en las correlaciones per_
fectamente positivas, un valor de 0 cuando no existe iringuna correlacin, J/ Lln valor de - I cuando sta es totalmente negativa. El valor del coeficiente de correlacin
en las vocales anteriores de la tabla 6 es de 1, mientras
que el de las posteriores es de - 1. Adems, los test de
correlacin permiren tambin obtener un grado de significacin, con el que se puede conocer la-probabilidad
de encontrarnos un determinado valor en el coeficiente de
correlacin si las 'dos variables fueran independientes.
En los casos anterires, el nivel de significacin es 0, indicando.que no tendramos ninguna probabilidad de encontrar un valor de I si las dos variables estudiadas fue_
ran independientes. Como se ve, se trata tambin aqu
de aplicar los crjrelios para falsar Ia hjptesis nula.
Sin embargo, antes de ter-rninar este apartado es preciso sealar que el coeficiente de correlacin indica iim_
plemente la existencia de una relacin matemtica entre
dos variables y que, por lo tanto, no puede interpretarse
directamente como'una relacin de causa a efecto. El tratamiento estadsticcl rt,oS cotfirma simplemente que cuando un valor aumenth tambin aumenta el otro ( viceversa), y que esto sucede de forma sistemtica; las explicaciones cleben buscar.se en el marco de la fontica,
rn.
etapa posterior de interpretacin de los resultados."n
I

6.3.4. Otros tipos de anlisis


El anlisis de ias correlaciones es til cuando en nuestro estuciio intervie:ren slo dos variables; sin embargo.
164

en muchos casos esto no ser as. Por ejemplo, partiendo de los datos de la tabla 2 podra interesarnos esttldiar
la relacin entre las tres variables que all se presentan:
lugar de articulacin de la consonante, vocal adyacente
e informante. Habitualmente encontramos una combinacin de variables dependientes e independientes, y
queremos estudiar su interaccin. Se habla entonces de
nlisis multivariante, y para llevarlo a cabo existen diversas tcnicas como la regresin mltiple, el anlisis
discriminante y el anlisis factorial.
La regresin mltiple permite evaluar la influencia simultnea de varias variables independientes sobre una
variable dependiente, superando las limitaciones de la
correlacin, que slo es til para examinar simultneamente dos variables. Complicando ligeramente el disero
del experimento sobre la velarizacin de la consonante
Iateraf en los bilinges cataln-castellano que aprenden
francs, podramos introducir dos tipos de corpus: un corpus ledo y un corpus que consistiera en una convel'sacon un hablante francs nativ<-r; si adeLin
"tpotttnea
ms clasificamos a nuestros informantes segn su grado
de bilingismo, obtendrenros dos variables independientipo de corpus y el grado de bilingismo-, que
tes
-el
influirn conjuntamente sobre la variable.dependiente
velari za;in de la consonante lateral. ste es un t-la
pico diseo experimental al que podramos aplicar un
anlisis basado en la regresin mltiple.
Etl anlisis discriminante se utlliza, en cambio, cuando en la variable dependiente tenemos ms de una categora y queremos averiguar cmo se relaciona esta divisin con nuestras variables independientes' Sabentrs,
por ejemplo, que en la identificacin del lugar de articuiacin de una oclusiva influye el VOT, tal como se deduce de los datos examinados hasta aqu, pero tambin
se ha mostrado que son importantes las caractersticas
de la explosin y de la transicin desde la consonante a
la vocal que la sigue. Podramos preparar un experimento en el que, mediante la sntesis, creramos ar1ifi"
cialmente una serie de slabas en las que variaran los va1s

lores de estos tres pat"metr<ts --que serian las variables


inclepenchentes-; los participantes en el estudi."r deberarr
decidir para cada slaba si la identifican como una de las
dos categoras [p] o [t]. Un anlisis discriminante de los
resultados de la identificacin en relacin cori las variaciones introducidas en la slaba sintetizada mostrara la
importancia de las diversas combinaciones posibles de
variaciones en el VOT, la explosin o la transicin en la
clasificacin perceptiva de una oclusiva como labial o
como dental.
F,\ anlisis factorial constituye una herramienta para
obtener informacin sobre las caractersticas subyacentes a un coniunto de datos, cuando ste es rnuy grande
y no es factible analizarlo con las tcnicas que hemos
visto hasta ahora. Todas las variables se consideran independientes, y s(:) busca, con este tipo de anlisis, qu
conexiones se est4blecen entre ellas, de modo que puedan
identificarse un c\erto nmero de factores que las relacionen. En fonti;a se ha aplicado a menudo este tipo
de anlisis para ':xplicar las confusiones entre consonantes encontrad:rs en pmebas de discriminacin de slabas. Tambin a estos mismos datos se ha aplicado una
tcnica conocida como escalado multidimensional, orientada hacia una represe ntacin grhca de las diferencias
enlre los distintos elementos basada en un clculo de la
disimilaridad que puede establecerse entre ellos'
fil anli,sis en componentes principales ayrrda tambicn a distinguir tcndencias v agrupaciones en los resultaclos reduciendo el nmero de dimensiones que el investigador examina e indicando en qu medida cada una
de ellas contribuye a la variabilidad del grupo de datos;
esta tcnica se ha aplicado a estudios de sociolingstica (Milroy, 1987, 140-141) y de enseanza de lenguas
(Woods, Fletcher y Hughes, 1986, 273'290).
Acabaremos el captulo mencionando la existencia
en el mercado y en los laboratorios de un gran nmero de
programas de tratamiento estadstico, con los que puede llevarse a cabc, un anlisis de los datos obtenidos en
tunr investigacin, Sin embargo, antes de utilizaruna de-

terminada tcnica es esenciai conoc,lr, como hemos


di_
qu tipo. de variables y de distriUrr.io.r", p.r._
a
V1,
:ho
de aplicarse y cules son los conce]tos que ,rrbyuce.,
a
los clculos realizados. corresponde, tamtin al investigador seleccionar los programas mis adecuados
a sus
necesidades y al tipo de tratamiento que realiza
de forma habitual' As como los instrurnerrts de un laboratorio son elementos auxiliares para la investigacin a tra_
vs de los cuales obtenemos los datos que eseamos,
la
estadstica nos proporciona una he,ra'mi."tu
[.r. .ro,
en la interpretacin de los resultador, p.riliti..,iy"gi
do falsar nuestras hiptesis sobre las relacior., qrr"-r"
establecen entre los datos obtenidos. Sin embu.fo,
.rn
buen tratamiento estadstico es solamente el primei paso
para la interpretacin de los resultldos de
mento, y no un fin en s mismo.
"., .*i".i
Recordemos, para acabar, un fragmento de Claude
Bernard citado por Mart (r9g0, 150I ..to r"uli.
l.r
gnero ha sido imaginado por un fisiOlogo q".
t uUi".r_
do tomado la orina de un urinario d,:, la -estaciOn
de un
ferrocarril, por donde pasaban gentes de todas las na_
ciones, crey poder dar as el anilisis de la
_.iu
europea!r. Tras esta historia, huelga todoorinu
comentario
sobre la necesidad de comprender
papel de la estads_
"i
tica en la investigacin experimental.

LECTURAS

El captulo 9 de **Seliger y Shohamy (19g9) presenta

di_

versos procedimientos para el tratamiento ,:stadstico


de datos
cuantitativos y cualitativos, siguiendo un e.nfoque
_ry
pu.".i_
do al que hemos dado al tem en este libro, y en
l ."-Uuru.,

algunas de las descripciones

**Brown (1988) constir-uye de tcnicas de, an"lisi, ",iiiruJ^.


una excerente iritroduc.io^" L
lizacin de la estadstica en- la investigacin sobre
",r
segundas
lenguas al igual que *"Ha1ch y Farhay (i[.g2),
y en"ambos
pueden encontrarse ejemplos directament"i
upti.ut.,

"i';

166

t67

Do de

la fontica. **Butler (1985) y **Woods, Fletcher

ill,ghes (1986) presentan las nociones estadsticas ms releuuni". para los esturtios lingsticos, el primero a un nivel ms
bsico que el segundo; ambos libros no se limitan a los problemas de la adquisicin de segundas lenguas, sino que examinan casos ms generales; Woods, Fletcher y Hughes, por
ejemplo, basan muchas de sus explicaciones en un anlisis de
ullo.-.t del VOT y mencionan tambin experimentos sobre
confi-rsiones de consonantes, utilizando adems ejernplos relacionados con la adquisicin de la primera lengua y la patologa del lenguaje. Anshen (1978) se centra en los conceptos
stadsticos necesarios para el anlisis de variables sociolingsticas siguiendo planteamientos labovianos. Milroy (1987)
edica su captulo al anlisis de las variables fonolgicas en
sociolingstica, presentando algunos de los problemas propios del tratamiento estadstico.

LA PRESENTACIN DE LOS RESULTADOS

Hasta este punto hemos seguido paso a paso las etapas propias de los estudios experinrentales tal como se
esquematizaban en la figura 3 dei segundo captulo. Se
han tratado los problemas relacionaCos con la delimitacin del campo de trabajo y la formulacin dei las hiptesis, las diversas tcnicas para constituir un co.pus y
seleccionar a los informantes, las precauciones a la hora
de realizar las grabaciones y algunos mtodos para la
presentacin y el tratamiento de los datos cuantitativos.
Acabamos el captulo anterior insistiendo en la necesidad de diferenciar la estadstica de la interpretacin de
los datos, y una vez hnalizada esta ltima etapa nos encontramos ya en condiciones de trasladar al papel el resultado de nuestro trabajo.
La forma final depender, natural.mente, del destinatario. Un artculo para una revista especializada no tiene las mismas caractersticas que un trabajo de investigacin realizado en el marco de unltercer ciclo universitario o que una tesis doctoral; una exposicin oral en
un congreso o en un seminario ser necesariamente diferente de una presentacin escrita. Sin embargo, existen una serie de puntos en comn en la presentacin de
1B

t69