Está en la página 1de 76
Estadistica aplicada a las Ciencias Sociales 1.6 Problemas resueltos 1, A partir de los siguientes titulos de posibles estudios, indi- ca la poblacién que deberia considerarse y qué variables se podrian estudiar, identificando de qué tipo son: acteristicas generales de los alumnos matriculados 1a Universidad de Alicante b) Resultados de Generales de 2011. a) Poblacién: Todos los alumnos de la Universidad de Alican- te. Variables: como es un estudio general y no se especiti mis, podrfamos incluir bles personales, de de: ci6n fisica 0 académica: Altura: cuantitativa continua, Peso: cuantitativa continua, Color de ojos: cualitativa nominal. Lugar de nacimiento: cualitativa nominal. Nota de las pruebas de acceso: cuantitativa continua, Etc. b) Poblacién: Todos los espajioles con derecho a voto. Variable: Partido votado, cualitativa nominal. 2. ando las posibles cate- a) Intenci6n de voto para Ia alealdia de la ciudad de Ali- cante en los préximos comicios electorale b) Salario de los trabajadores de la Universidad de Alican- te. ©) Gravedad de los accidentes lab empr ocurridos en una Escaneado con CamScanner Meng a) Variable cualitativa nominal, cada partido politico ht tg categoria. b) Variable cuantitativa continua. ©) Variable cualitativa ordinal, ve podria clasificar cada dente como leve, grave, muy grave, ete. Escaneado con CamScanner Estadlistica aplicada a las Ciencias Sociales 29 1.7 Problemas propuestos 1, A partir de los siguientes titulos de posibles estudios, indica la én que deberia considerarse y qué variables se podrian , identificando de qué tipo son: a) Encuesta sobre el gasto en educacién de los hogares a nivel nacional. b) Resultados de las Pruebas de Acceso a la Universidad en la convocatoria de junio de 2014 en la Comunidad Valencia- na. c) Estudio de los accidentes laborales en una empresa en un perfodo determinado. 2. Clasifica las siguientes variables indicando las posibles catego- rias en aquellas variables que sean cualitativas: a) Gasto de las familias alicantinas en la campaiia navidefia de 2013. b) Tipo de delitos denunciados en una comisaria. c) Nivel de estudios de los asistentes a un concierto de jazz. 4d) Compaiifa de telefonfa mévil con la que se tiene contrato. e) Modo de acceso a la Universidad de los alumnos de primer curso de Criminologfa en la Universidad de Alicante. Escaneado con CamScanner M.D. Molina, J. Mule 30 OM ey 1.8 Cuestionario de autoevaluacién El conjunto de todos los elementos sobre los realizar un estudio estadistico se denomina: Me se Prete, a) Muestra. b) Poblacién. ¢) Subpoblacién. nv Cada una de las propiedades que poseen los elementos de im poblacién y que son objeto de estudio se lama: a) Pardmetro. b) Estadistico. c) Variable. » La rama de la Estadistica que se encarga de generalizar los re sultados de la muestra a la poblacién se denomina: a) Inferencia estadistica. b) Estadfstica descriptiva. c) Econometrfa. a . La variable “Nivel de agresividad” (Nada agresivo, Poco agresi- vo, Muy agresivo, Totalmente agresivo) es una variable: a) Cuantitativa discreta. b) Cualitativa ordinal, ¢) Cualitativa nominal, wn + Para estudiar el gasto en combustible de los taxistas espaiioles se seleccionan 100 taxistas y se controla su gasto. Entonces: 8) Esos 100 taxistas son Ia poblacidn objeto de estudio. ) La poblacion de este estudio son las gasolineras espafol®s: ©) Los 100 taxistas son una muestra de la poblacién y el £88! en combustible es la variable de la poblacisn a analizat: Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales u 6. Un individuo 0 unidad estadistics a) Siempre es una persona b) Es un elemento de la poblacién. c) Puede ser cualitativo o cuanti ivo. 7. La variable “Valor en bolsa de una accién” (medida en euros) es a) Cuantitativa continua. b) Cualitativa continua, c) Cuantitativa discreta. 8. Un estadistico: a) Es un valor numérico calculado a partir de todos los indi- viduos de la poblacién. b) Es una expresién matematica. c) Es un valor numérico calculado a partir de los datos de una muestra. 9. El andlisis de los datos: a) Se realiza después de la interpretacién del modelo. b) Incluye la validacién del modelo a estudiar. c) Requiere de la ordenacién de los datos en cualquier caso. 10. La variable “Numero de delitos al afio” es una variable: a) Cualitativa ordinal. b) Cuantitativa discreta. c) Cuantitativa continua. Escaneado con CamScanner Tabulacion y representacién de datos Tal y como hemos descrito en el capftulo anterior en la descripcién de las etapas de un estudio estadistico, tras plantear el problema y pla- nificar el trabajo de campo, llega el momento de recopilar los datos y analizarlos. Una vez recogidos y depurados los datos, tarea que como se ha sefialado no se contempla en este manual, y con el fin de enten- der mejor la informacién que nos pueden aportar, nos veremos en la necesidad de organizarlos y resumirlos. El objetivo fundamental de este capitulo es organizar y ordenar los datos previamente recogidos para obtener una mejor comprensién de ellos, asi como hacer uso de gréficos para presentar la informacién obtenida de forma resumida, clara e intuitiva. 2.1 Variables cualitativas as o cualitativas son aque- ible de me- mo pode- roporcio- Recordemos que las variables categéric: i" llas que representan una caracteristica cualitativa no susceptit dida, con un mimero fijo de clases 0 categorias. Veamos CO! Mos organizar y representar graficamente Jos datos que nos p! nan este tipo de variables. Escaneado con CamScanner M.D. Molina, J. Mulero, MS. Ny 4 ey 21.1 Tabla de frecuencia abla de distribucién de frecuencias, o simplemengs ; es una tabla que recoge, ordena y clasifica Ia int ably b a proporciona. Consideremos una poblacién g Moe “iy descrita segtin un cardcter 0 variable X Cualitatiyg stad La ti frecuencias, que la muest nindividuos, ” : categorfas son X1, X25--» X;. Para cada una de las categorfas, defi” a @ Frecuencia absoluta de la categoria X;: Niimero de obser nes que presenta dicha categoria. La denotaremos Por f, i Bi Frecuencia relativa de Ja categoria Xj: Tanto por uno dg aby yaciones que pertenecen a la categoria. La denotaremos a y se calcula como el cociente entre su frecuencia absolut yg muimero total de observaciones, es decir, fi x Sri Porcentaje de la categoria X;: Tanto por ciento de observacions que pertenecen a la categoria. Lo denotaremos por pj y se calcula como Pi = 100 fri %. La tabla de frecuencias para una variable cualitativa con k categ rfas se construird de la siguiente manera: en la primera columna ap recerdn cada una de las categorfas de la variable X. En las sucesivs columnas, iremos recogiendo los valores de las magnitudes que acaba: mos de definir. La tiltima fila representa la suma de los datos deca columna. Con todo ello, la tabla quedara: X | fil fil pi X [A | fa] pi fi Fi Pi el fi | fx | ve n | 1 [100 #, Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales 35 Ci ____ Construye la tabla de frecuencias para la variable SEXO del Ejemplo 1.1. La tabla de frecuencias sera: x Gi\_fi|_ pi HOMBRE | 13 [0.65 | 65% MUJER | 7 | 0.35 | 35% 20| 1 100% zay—_H+___, Construye la tabla de frecuencias para la variable CALIFI- CACION del Ejemplo 1.1. La tabla de frecuencias sera: x fi|_fri Pi SUSPENSO. S| 0.25 | 25% APROBADO. 10 | 0.5 | 50% NOTABLE 3 [O15 | 15% SOBRESALIENTE | 2 | 0.1 [ 10% 20[ 1 | 100% =—$—_—_ Hemos encuestado a 19 miembros de una poblacién obtenien- do en sus respuestas 4 personas solteros, 5 casados, 7 viudos y 3 divorciados. Construye su tabla de frecuencias. \ sali oc Alicea daaianene ees eee eee) Escaneado con CamScanner M.D. Molina, J. Mulero, M. J. M.S. Nueda y 4 Pa 2 eu Ejemplo 2.3 (Connie je cualitativa “Estado civil” - La tabla te Consideremos la variabl frecuencias sera: xX Sri Di Solteros 4/19 = 0.2105 | 21.05% Casados 3/19 = 0.2632 | 26.32% Viudos 7/19 = 0.3684 | 36.84% Divorciados 3/19 = 0.1579 | 15.79% 1 100% 2.1.2 Representaciones grAficas Tras resumir y organizar la informacién que nos proporciona la muestra en una tabla, es conveniente realizar alguna representaciéa gréfica que nos permita hacernos una idea del comportamiento de nues- tra variable a simple vista. Actualmente, son muchos los programas informaticos que nos posibilitan la realizacién de gréficos muy elabo- rados. Sin embargo, todos ellos estén basados fundamentalmente ¢ dos tipos de graficos: el diagrama de barras y el diagrama de sectores. H Diagrama de barras Representamos unos ejes cartesianos situando las categories variable en el eje horizontal y las frecuencias en el eje vertical Pat cada una de las categorfas, dibujamos una barra hasta st fre correspondiente. En el eje vertical, podemos situar la frecuencia ® Tuta, la frecuencia relativa o el Porcentaje. Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales 37 Contruye el diagrama de barras para los datos del Ejemplo 2.3. El diagrama de barr in | | H Diagrama de sectores Se trata de dividir los 360° de un cfrculo entre las diferentes cate- gorfas de la variable representada. A cada categoria le asociamos un sector circular con un mimero de grados proporcional a su frecuencia relativa. El ntimero de grados, «;, para cada categoria X; se calcula del siguiente modo: @; = 360 x fri. eee Construye el diagrama de sectores para la variable del Ejem- plo 2.3. Escaneado con CamScanner M.D. Molina, J. Mulero, 1 Primero calculamos el mimero de grados que le cory, Sond ta cada categoria: rlteros. = 360 x 0.2105 ~ 76°, Qeasaios = 360 x 0.2632 ~ 95°, yiudos = 360 x 0.3684 ~ 133”, Wfivorciados 360 x 0.1579 ~ 57°. El grifico de sectores sera: RE ti ELS 2.2, Variables cuantitativas discretas Recorder ; sos / ' creta son es Que los valores que toma una variable cuantitative ds a valores aislados que se pueden cuantificar 0 medi. A ong s cémo podemos organizar y representar et jae los datos s qui i que nos proporcionan este tipo de variables. Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales 39 2.2.1 Tabla de frecuencias Consideremos una poblacién o muestra de n individuos, descrita segtin un cardcter o variable X cuantitativa discreta, cuyas modalida- des son X1, Xo,..., X, ordenadas de menor a mayor. Para cada una de esas modalidades introducimos, igual que en el caso cualitativo, las siguientes magnitudes: | Frecuencia absoluta de la modalidad X;: nimero de observa- ciones que presenta dicha modalidad, La denotaremos por fi- @ Frecuencia relativa de la modalidad Xj: tanto por uno de obser- vaciones que pertenecen a la modalidad. La denotaremos por fyi y se calcula como el cociente entre su frecuencia absoluta y el numero total de observaciones, es decir, fi fi=e. n © Porcentaje de la modalidad Xj: tanto por ciento de observacio- nes que pertenecen a la modalidad. Lo denotaremos por pi y se calcula como i= 100 x fri %. La existencia de un orden entre las modalidades nos permite intro- ducir tres magnitudes adicionales que, en el caso cualitativo, en prin- cipio, no tienen sentido: By Frecuencia absoluta acumulada de la modalidad Xj: nimero de observaciones de la poblacién o muestra cuya modalidad es menor o igual que Xj. La denotaremos por F; y se calcula como Rafithtetfi l Frecuencia relativa acumulada de la modalidad Xj: tanto por uno de observaciones de la poblaci6n o muestra cuya modalidad es menor o igual que Xj. La denotaremos por Fri y se calcula como F; Fiafat fate thin a Escaneado con CamScanner M.D. Molina, J. Mulero, Md. Nueda y 4, “ Seu lado de la modalidad X;: tanto POF cientg ntaje acum! fm Porcentaj es 0 menores que Xi. Lo denotaremos a 10 observaciones igual Py se calcula por p= pit pat-- + Pi = 100 x Fri %, La notacién para las magnitudes acumuladas es la misma ero con las letras maytisculas. — ; Por tanto, la tabla de distribucién de frecuencias tendré en Sener] la forma: X | fi | fil pi Fi Fri B X [filial a | FA Fa Pi Xlhlflmi| Fa Py Xf | fal Pe | n} 1 | 100 DOT OPA Construye la tabla de frecuencias para la variable CONVO- CATORIA del Ejemplo 1.1, La tabla de frecuencias sera: X\ fil fi | pi 0.45 | 45% 0.25 | 25% 10% 15% 3% Escaneado con CamScanner Extadistica aplicada a lax Ch Se ha preguntado a 12 familias el nimero de hijos, obteniendo Jos siguientes datos: 1, 3,2, 3, 2,3, 4, 4, 2,3, 3,4, Construye la tabla de frecuencias. ;Qué porcentaje de fami- lias numerosas hay? LC 1 25% | 4 | 0.3333 | 33.33% (41.67% | 9 | 0.75 | 15% 25! 12] 1 | 100% 100% L_ El porcentaje de familias numerosas serdn las familias con tres y con cuatro hijos. Para calcularlo, se sumaran los porcentajes de las familias que tiene 1 6 2 hijos: 41.67% + 25% = 66.67%. Otro modo de calcularlo es como cl complementario de las fa- milias con dos o menos de dos hijos, es decir, la diferencia entre €1 100% y el 33.33% que es el porcentaje de familias con dos 0 menos hijos: 100% — 33.33 % = 66.67 %. 2.2.2 Representaciones graficas Las representaciones serdn las mismas que para las cualitativas, es decir, el diagrama de barras y el diagrama d caso podemos lores; aunque en este fiadir una més: el diagrama de barras acumulado. Escaneado con CamScanner M.D. Moline, J. Mulero. Md. Neda yg A Pag ‘a Construye el grafico de sectores, cl diagrama de barra ‘ons! diagrama de barras TORIA del Ejemplo 11. ‘ Ss acumulado para la variable CON; 0G i Los graficos seran: ees Diagrama do baras Dlagroma de bara scurisg iagrama de soctores 7 2.3 Variables cuantitativas continuas Por tiltimo, estudiemos cémo podemos organizar y representar gr ficamente los datos que nos proporcionan las variables cuantitativas Continuas. Recordemos que estas variables pueden tomar cualquier V lores de la recta real. 2.3.1 Tabla de frecuencias i si intentamos construir la tabla de frecuencias de la variable EDAD el Ejemplo 1.1 como variable discreta, observamos que, dada la ca" Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales 43 tidad tan grande de valores distintos que puede tomar la variable, la tabla de frecuencias no es adecuada, pues estaria formada por tantas filas casi como datos tenemos. Lo mismo ocurre si nuestra variable es continua donde, en principio, el mimero de valores distintos que puede tomar la variable son infinitos. En ambos casos, conviene configurar la tabla de frecuencias de otra forma: agrupando los datos en interva- los 0 clases. Esta agrupacién permitird el tratamiento de los datos de manera eficiente, aunque supondré cierta pérdida de informacién. Para constiuir esta tabla, tendremos en cuenta los siguientes aspectos: @ Escogeremos un ntimero adecuado k de intervalos. Aunque son muchas las formas de elegir este valor, nosotros tomaremos el numero entero mas cercano a y/n. [Cada uno de los intervalos viene definido por una pareja de valo- res: LI; y LS;, que son los limites inferior y superior del intervalo i, respectivamente. En el intervalo [L/;,L5i{ estarn todos los va- lores de X mayores 0 iguales que Li; y menores que LS;, excepto en el tiltimo intervalo: [Li L5,] en el que también se incluira el limite superior. @ A la diferencia a; = LS; —Lij, se le llama amplitud del interva- Jo. En nuestra construcci6n todos los intervalos tendran la misma amplitud a. No obstante, en ocasiones la naturaleza de los datos puede llevar a construcciones mas adecuadas con intervalos de distinta amplitud. | Al punto medio de cada intervalo “54, se le Hama marea de clase, la denotaremos como m.c.;, y sera el representante del intervalo. Se calculan, para cada uno de los intervalos, las frecuencias ab- solutas, absolutas acumuladas, relativas, relativas acumuladas, porcentajes y porcentajes acumulados, definidas anteriormente para las variables discretas. Escaneado con CamScanner completa que tabl me. Si | fi | pi “(th + L81)/2 | fi | fn | pr [eneesae | [de | a Tits | ee E72 | S| Se | n 1 | 100 BH Construccién de los intervalos Para determinar el ntimero de intervalos existen diferentes rios eomo por ejemplo la frmula de Sturges [22], el algorine Freedman-Diaconis [6] 0 el de Scott [19]. El conocimiento del crit, sty. rio acerca de su muestra puede inducir también a la eleccign dew mimero de intervalos de interés para el estudio en cuestién, En este texto escogeremos una forma sencilla para la elaboracién de la tab de frecuencias con intervalos de la misma amplitud. El proceso sete siguiente: 1. Calculamos el rango, R = Xmax —Xmin» €S decir, la diferencia entre el valor mas grande y el valor mas pequefio de la muestra 2. Calculamos el ntimero de intervalos, k = v/a, y se redondet entero mas cercano. » cho, serd constante y denotaremos por a. Para no dejar - Calculamos la amplitud de cada intervalo que, como hemos di- fuert ningtin valor de la muestra, el producto del mimero de interval Por su amplitud debe ser mayor o igual que el rango: ka>R. Por tanto, a > & - El valor de la amplitud podré tener deciles : ari undue en muchas ocasiones conviene redondear (n0 nee mente a un valor entero) para una presentacién més ¢! la distribucién, egante® Escaneado con CamScanner 45 BH OPCION 1: Si no redondeamos, es decir, si tomamos a= 8. entonces ka = R. & OPCION 2: Si redondeamos, deberd ser por exceso, de manera que a > j y ka > R. En este caso, aparece un “so- brante™ 0 “exceso” Sobrante = ka—R, ya que estamos cubriendo un recorrido superior a nuestro rango. Este “sobrante” se tendré que repartir a partes igua- les entre el primer y el tiltimo intervalo para que no recaiga todo en un solo intervalo. A la hora de escoger el redondeo de A intentaremos que su valor sea el ms adecuado para que este sobrante sea pequefio. 4. A partir de estos resultados, calculamos el Ifmite inferior del pri- mer intervalo: H OPCION 1: Lh = Xmin- Bt OPCION 2: Lh = Xmmin — 2". 5. Calculamos el resto de los intervalos: Ls, =Lh +a, Lp = Sj, LSp1 = Liz +4, 1= 1y----k-1- Una vez calculados los intervalos, podemos construir la tabla de frecuencias correspondiente. Asi, por ejemplo, la frecuencia absoluta Jj del intervalo [L;,LS;) sera el nimero de datos que son mayores 0 iguales que Ll; y menores que LS;. El resto de frecuencias y porcenta- cumuladas, porcentajes absolutos jes, es decir, frecuencias relativas y a I ido el mismo y porcentajes absolutos y acumulados se calculan siguien patr6n que para los datos sin agrupar. Escaneado con CamScanner_ M.D. Molina, J. Mutero, uy I. Nue i truye la tabla de f; a por intervalos y cons re Pai Pa able PESO del Ejemplo 1.1. UeNcigs Fs we R= Nea —Xnin = 90 50 = 40. wy kaya = V20 = 4.47. Tomamos k= 4 intervalos, 4 = 10, No es posible redondear, escogemos jo IP. a CION I. Sobrante = ka—R = 4040 = 0. Lh =Xmin — SE = 50-0 = 50. Su tabla de frecuencias sera: X [mel] fi| fi lm lA} |e j50,60,| 35 | 6 | 03 | 30 | 6 | 03 | 30 {,70[ | 65 | 6 | 03 | 30 | 12] 06 | 60 (70,80[ | 75 | 5 | 0.25] 25 [17] 0.85 | 85 {80,90} | 85 | 3 [0.15] 15 | 20] 1 | 100 IL 20] 1 | 100 Qe it io we ol ESE Agrupa por intervalos y construye la tabla de frecuencias P* rala variable ALTURA del Ejemplo 1.1. coe © R= Xnix —Xmin = 1.87 — 1.55 = 0.32. © k= Vn= V20 = 4.47. Tomamos k = 4 intervalos. B a=% =02 _ 098 = 0.08, | ee Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales 47 SA ___ En este caso, disponemos de las si iguicntes opciones: § OPCION 1: No redondear, es decir, tomar a= 0.08, No 1 sobrante, Lh = Xynin = 1.55. x me.| fi| fi_| pi | R| Fe |B {1.55,1.63[ | 1.59 [4 | 0.2 | 20 | 4 0.2 | 20 (1.63,1.71[ | 1.67 | 7 [035] 35 [11 0.55 | 55 z S | (1-71, 1-79[ [1.75 20_[ 15 | 0.75 | 75 (1-79, 1.87] | 1.83 | 5 [025 [25 [20] 1 [100 20; 1 100 | OPCION 2: Redondear y dejar un s6lo decimal, es decir, tomar a = 0.1. En este caso, si hay sobrante: Sobrante = ka—R = 0.40 —0.32 = 0.08. Ly = Xinin — SPE = 1,55 — 298 = 1,550.04 = 1.51. x mc. | fil fi | pi || Fi | PB (1.51, 1.61{ [1.56] 3 | 0.15[ 15 | 3 | 0.15] 15 (L61,1-71[ [1.66 | 8 [0.40 | 40 [11 | 0.55 | 55 (L71,181[ | 1-76 | 7 [0.35 | 35 [18 | 0.90 | 90 [181,191] [1.86] 2 | 01 | 10 [20 1 | 100 [ 20[ 1 | 100 2.3.2 Representaciones graficas A partir de la tabla de frecuencias con intervalos construiremos dos nuevos graficos: el histograma y el polfgono acumulativo. Ademés afiadimos el grafico tallo y hoja que sirve tanto para variables discretas como continuas. Escaneado con CamScanner MD. Melina J HALEY HS tay, 4 YA py, fm Histograma ntacién equivalente al grafico de barras de f, as cuantitativas discretas, Pero Cn este e Bis Ja repre: bles categ6r ee fas barras solapadas. con las barras 5 ay sorran ones basicas para un trazado Correct def py Las condiciones basicas p del Hist, son: a A) Shey tn En cl eje horizontal representaremos siempre los Nisnites de ly intervalos. © Las barras deben aparecer yuxtapuestas para respetar Jy on, nuidad de la variable. (© La medida de Ja base de cada rectangulo debe ser la amplitud é Ja clase correspondiente. © Si todos Jos intervals tienen Ja misma amplitud, en el eje vert. cal podemos representar las frecuencias absolutas, relativas 04 porcentaje. @ Si los intervalos son de distinta amplitud, en el eje vertical Presentaremos Ja densidad de frecuencia, obtenida para cae intervalo como a donde aj es amplitud del intervalo i, PETLea | ibuja el hi | Dibuja el histograma para la variable PESO del Ejempl 1 | 4 partir de la la de . z A ¢ la (abla de freeuencias construfda en el Ejet Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales y El histograma sera: Al 7 | |] A Se han contabilizado el mimero de dias que 45 delincuentes comunes han pasado por dependencias policiales en el iltimo afio. Los datos los tenemos resumidos en la siguiente tabla: x fi| ai \di 0-5 [15/5 [3 5—10 | 10] 5 [2 to-15{5| 5/1 15—30 | 15| 15[ 1 =~ 45 Dibuja su histograma. Escaneado con CamScanner M.D. Molina, J. Mulero, My ety g 30 pon cd 2,12 (continu: A s tienen diferentes amplitudes, En este caso, los eal eens amo oo que hemos calculado la nt sera: Histogram intervals dstnta ampltus © Poligono acumulativo ° i i i ‘mi inter: nuevo situaremos en el eje horizontal los limites de los ity valos, mientras que el eje vertical ser4 ocupado por las frecuencl luladas (las absolut: as, las relativas o el porcentaje). 7 Supongamos que vamos a Construir el poligono acumulativo i les frecuencias absolutas, Una vez situadoe tos ejes, marcaremos puntos (4h 0); (LS), (LS, F3) Representados estos Puntos, uniremos los puntos consecutivos ™ diante segmentos, (LS, Fi)- Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales Dibuja el poligono acumuls Ejemplo 1.1. yo para la variable PESO del eee A partir de la tabla de frecuenci: s construfda en el mplo 2.9: Dibuja el poligono acumulativo para los datos del Ejemplo 2.12. coe El polfgono acumulativo seré: Escaneado con CamScanner M.D. Molina, J. Mulero, MI. Nuedg v4 », a El grafico de tallo y h ruye a partir de los datos originale, Fste griifico se construy’ 1 Este g 10 discretas como continuas y eg = riables cuantitativas tant tacidn de la forma: dei, Tete 1/8 2 3/2 4 4/1 2 4 6 5/1 3 9 6{1 1 La utilidad de este grafico estriba en: Bi Presenta los datos ordenados, lo que sera titil para el céleulo ds algunas medidas que veremos posteriormente. Bi Silo giramos 90° hacia la izquierda, presenta la forma que tere el histograma, Para su construccién, hemos de tener en cuenta las siguientes ob- servaciones: - Los gréficos deben tener siempre de cuatro a doce filas. v Los datos deben tener el mismo ntimero de digitos (0 ciftas) {0 enteros como decimales, Si no es asf, afiadiremos ceros 4d recha o izquierda, segtin nos convenga, sin modificar los dao: Si los datos contienen decimales, una vez. consoguido el mi imo ntimero de digitos para todos ellos, procedemos ignot la coma decimal, Los datos ast conseguidos se dividen en dos partes: Ia de Ii quierda serd el tallo, la dela derecha, la hoja. s |. Las hojas si : jas siempre tienen que estar ordenadas de menor a Escaneado con CamScanner Estadistica aplicada a las Ciencias Sociales 53 5, Si queremos conseguir més filas en nuestro vidir cada tallo en dos filas 0 en cinco. En el caso de dividir cada tallo en dos filas, utilizamos el simbolo * para la primera mitad de las hojas posibles, es decir, las hojas que sean o empiecen por 0, 1, 2, 3, 64, y el simbolo - para el resto, es decir, las hojas que sean o empiecen por 5, 6, 7, 8 6 9, Para dividir cada tallo en cinco filas utilizamos los siguientes simbolos: grafico, podemos di- * para el 20% inicial de hojas: es decir, 0, 1; t para el 20% siguiente: 2, 3; f para el 20% siguiente: 4, 5; s para el 20 % siguiente: 6, 7; - para el tiltimo 20%: 8, 9. Los tallos intermedios que queden vacios no pueden ser elimi- nados, pero sf los que quedan al principio o al final. 2 En caso de que los datos contengan decimales, se indica en la parte inferior del gréfico. Por ejemplo, si los datos tienen un de- cimal, escribimos x0.1, si tienen dos, x0.01, y asf sucesivamen- te. DE ePa en Construye el diagrama de tallo y hojas para los datos: 5, 16, 23, 24, 31, 31, 34, 36, 42, 42, 45, 45, 49, 51, 56. Observamos en primer lugar que todos nuestros datos tienen dos Afgitos excepto el primero (el 5), por lo que le afiadiremos un cero ala izquierda con el objetivo de que no varfe (sigue siendo un 5), pero esté formado también por dos cifras (05). Escaneado con CamScanner MD. Molina, J. Mulero, M. J. Ny | Nueda y A.B, 4 og pi 2.15 ( Poo i) debemos identificar los tallos y Jas ina jnuacién, we A ae i A conti caso, Ja inica opcion es que el primer digito Sea el tal yond lb hoja. Asf, observamos seis tallos distintos Que eg) y el segul i j i lo. ‘ ‘den creciente junto a una |; 0 camos verticalmente en ort ne posicisn central. a Mediana eg Indica ta neg bre lay, Posicisn es, a represent Pero iad bilidad 5n escogido atividad de las sP Las medidas de dispersin absolutas vienen ex, at dependen de las unidades en que se ex stra, Las mas importantes son las sigu Presadas en unida- Presan los datos de icntes; ges ue 4 este mU g Rango gs una medida de dispersién global de los datos. Lo denotaremos como R y se calcula como la diferencia del maximo y de] cae javariable, es decir, R=Xmax — Xin unidades. fi Recorrido intercuartilico Es una medida de dispersién asociada a la mediana. Lo denotare- mos como RIQ y se calcula como la diferencia entre el primer y el lercer cuartil, es decir, RIQ = Q3— Q) unidades. Sieste valor eg muy pequefio significa que el 50 % de los datos centra- dosestén muy cercanos ala mediana y si este valor es grande es porque hay mucha dispersién de los datos centrales en torno a la mediana. © Varianza Es una medida de la dispersin de los datos en torno ala media, El harametro varianza se representa por 62. En cuanto al estadistico, lo nots ‘4mos por §?, y se calcula como: Escaneado con CamScanner een, S _ Mulery 106 lero, Ap La, — vey 16 ag n -X) YX? _ pe _ i=l a tng, no n—I Unidad, 2 o, si los datos estin agrupados en una tabla de Frecueng . tas: EGR) Banta i=l _ a tniidage.2 aol 7a Unidades Observemos que la varianza es siem partir de la formula, se deduce que si |; Gifieren mucho de la media, mientras q 4 mayor cercanfa a la media y, por tant pre mayor 9 igual Ue ca, ‘4 Varianza es Srande, eas lue pequefios Valores cont, fo, Menor dispersién, . B Desviacién tipica La varia iaci a inza y desviacién tipica son las medidas de dispesi* Olutas mgs Utilizadas, Se mide en las mis; epee ae rado, Mientras n las usmas Unidade: | 8 ‘Mas unidades que nuestros ae que la desviacién tipica si! 8 que nuestros datos. AY ladesyin . oul We cory, “esviacign “pica Siempre son mayores 0s" Escaneado con CamScanner cada a las Ciencias Sociales pl onl if mn Jas medidas de dispersién para | . la varia F distribucién de frecuencias 4 fable PESO con ‘alcula a ; el Ejemplo 2,9, ja tabla de eee ya vimos que Q; = 58.33 kg y Q; ~ 76 kg. = Rango: R= 90-50 =40 kg, © Recorrido intercuartilico: RIQ = 76 — 58.33 — 17.67 kg. ‘Varianza: mc. | fi | fixXi| X? | fixx? 55 | 6 | 330 | 3025] 18150 65 | 6 | 390 | 4225 | 25350 75 | 5 | 375 | 5625| 28125 85 | 3 | 255 | 7225 | 21675 20 | 1350 93300 Entonces, 2 93300=20 x 67.5% 2175 _ 144 gar 492, 19 19 © Desviaci6n tipica: S = V/114.4737 = 10.6992 kg. . : ijos de 50 fa- Sehaanalizado la distribuetén del ntimero de bie ies milias pertenecientes a dos regiones, obteniéndos' tes datos: Escaneado con CamScanner M.D. Molina, J. Mulero, M.J. Nued 7) “2A. Pay eu ead (conti Regién B Regién A Fie Calcula las medidas de dispersién absolutas de ambas regig. nes. eoe i Rango: Ry = 5—0=5 y Rp =5—0=S hifjos. © Recorrido intercuartilico: Para la region A, Q; = Xi =2 hijos y Q3 = X3g = 3 hijos. Por tanto, RIQ4 = Q3- Qi =3-2= 1 hijo. De la misma forma, se tiene que RIQz = 3 hijos. a Varianza: k AX? — x = Ete __ 384~50 x 2.44? n—1 30 = 1.7616 hijos”, Sh = 2.9229 hijos?. Ge ee Escaneado con CamScanner VAN iii acidn (pica: Sve VETO § | 4273 hijos, Spe v2 = V2.9229 = 1.7006 hijoy ray la desviaci6n tipica satisfacen | iacen La vari As sig Sigutientes prop) dades: |, Influencia de un cambio de origen: Si ato igen: Sia todos los vs llores de una na muestra SC Je suma (0 resta) una constante ©, la yar gesviacidn tipica de la nueva muestra no varfan mamas La: Si todos los valores de una un cambio de es muestra son multiplicados (0 divididos) por una constante la teva muestra queda multiplicada (0 dividida) por a al cuadrado y la desviaci6n tipica por 2, Influencia de arianza de lan dicha constante ¢ elevad; Jaconstante en valor absoluto. diana a partir de los da- Comprueba propiedades de la met tos 2, 3, 3, 6, 8, 14. En 7 desviacion tipica. En primer lugar, calculamos Ja varianza Y la tste caso, $2 = 20.4 y S= 4.5 166. Escaneado con CamScanner M.D. Molina, J. Mulero, M, Nueda y 4 Py 110 (continuacion). Si, por ejemplo, restamos 3 a los datos anteriores, Obten, 1. Rs 0,0,3,5, lly podemos comprobar que Para est, nuevos datos sigue siendo S* = 20.4 y $= 4.5166, ‘ i dividi los datos anteriores, 1, 3 . Sidividimos entre 2 : se tiene que Y =3, S? =5.1 y S= 2.2583, /2, 3/2, 3.47 3.2.2. Medidas de dispersién relativas Las medidas de posicién relativas son adimensionales des), caracteristica que les permite ser utilizadas para com tras de diferente naturaleza. Estudiaremos el de Pearson, (Sin unida. Iparar mus. Coeficiente de Vatiacién © Coeficiente de variacién de Pearson Es una medida de dispersion relativa que compara la desviacién tipica con la media. Cuanto men or sea el Coeficiente de variacfon, ma Yor significativa sera la media. Lo denotaremos como CV y se calcula como: nae ad Coeficiente de variacion Para la variable PESO con abla de distribucién de frecuencias del Ejemplo 2.9. Setiene que cy — S & 10.6999 Xx “6735~ = 0.1585, Escaneado con CamScanner - ae rica apticrda a las Ciencias Sociate, jos cocficientes de Variacign del mn que aparece ni cada region que ap £N Tos datos de PO de: i DON ™lo 324"'Pata se tiene que CV, demos ver qUe CN la region 4 |, NOY 05 ee enlaB 1 Media es my 1.0299, cenativa que ef Ia. B porque su cy eg ui" & much an metria de su distribucién, ‘Nor, By pre. En una empresa se determinan dos Magnitude; a) Elrendimiento medio, r, cala arbitraria, viaci6n tipica, de los trabajadores, sen ue da 80 puntos de media voy a ¥ 20 de des. b) Los ingresos, i, con 12.000 ew ros de media Yuna desyia- cién tipica de 2.400 euros, iQué magnitud tiene mayor variabilidad? Como las magnitudes estén expresadas en diferentes unidades, no Podemos comparar sus desviaciones. _ Sin embargo, el cAlculo de los coeficientes de variaci6n seria, Por ser una medida de dispersién relativa, una buena medida para Poder dar una respuesta a nuestra pregunta. . Los Correspondientes coeficientes de variacién son 20 — 2400 _ 92. CV, = 30 = 9259 CV = t3000 ii — Escaneado con CamScanner M.D. Molina, J. Mlero, My. Sa RP Amun eau Se tiene que CV; > CV; Y; por tanto, Ja magnitud con Mayor di persidn es lade rendimiento, 3.3. Medidas de forma Las medidas de forma ayudan a determinar la forma de la dis bucidn de la muestra sin necesidad de dibujarla. Estudiaremos ¢1.°° ficiente de asimetria y el de curtosis. Estas medidas se suelen ua en base a una referencia: la curva normal. Como ya indicamos en la Seccién 2.3.3 del capitulo antec, i distribuci6n normal juega un papel primordial en Inferencia Esta. ca pues permite modelar numerosos fenémenos naturales y Sociales y son muchos los métodos estadisticos que parten de la hipétesis de qu nuestros datos provienen de una poblacién que sigue esta distribucién, Por ello, es titil comparar ciertas caracteristicas de la distribucién de nuestros datos con las que tendria si la distribucién fuera normal. Dos de estas caracterfsticas son la simetria y el apuntamiento o curtoss, Aunque podemos encontrar numerosas medidas que valoran la sime- tria o asimetria de una distribucién asf como su apuntamiento, nosotros nos limitaremos s6lo una medida para cada una de estas caracteristicas. B Coeficiente de asimetria Las curvas de frecuencia que no son simétricas se denominan a métricas. Las distribuciones en las que la cola més larga es la dela derecha se denominan asimétricas a la derecha (Jos datos se 23" pan mayoritariamente a la izquierda de la distribuci6n), mientras 4 las distribuciones en las que la cola més larga es la de la izguierda® denominan asimétricas a la izquierda (los datos se agrupan mao" tariamente a la derecha de la distribucién). Escaneado con CamScanner sa ‘¢Lb'0- = ¥ oo “ly anb INE 0 10 fp “ET pros 101 a uvas90 SPU OVP [9 $9 JOLFOJUY aqussekpe ae “STI = S7E'E+ 76g = ‘g44t a a ‘SCOR =SSE+H C= gy O=y b= StS Sip 0- = ay = 1, ‘SLv'0- = StS'E— Sore = gy — lo=y ‘SPIOUOL] py wees SETXST= OlNX ST = "a7 sB[vOS9 ap sojey a “SET= 16 - =O1y SOOTTeNIAIU! OpLIO.Oy a c c Ve cctes y+ Cy 0 T= fF =F owoy 1G a 08 Feat Cyt Wy? ‘p= Fe =F own 16 o z z__, ‘cp=2 OC _ = — © _ = oe cptey Ox+ Ox g= é 5 a oulog :euRIpN Bh 1g] =u ‘oseo aysa Uy, coe LT¢'9 yg Es TS S'S I'S ‘LY 7 6 ‘sroe pe sp Pe LT Leet daa 4 say fi “ ” ead jo Byuasel . ny, oy sajo8iq-efea ooyv9 | 41s 501 aP apaed y ‘l PueIpaur ey] efnofes ‘soyep saquaIner soqjansot seurajqold 9 rel “Ove op PON TW avon pomjon CW 4 Escaneado con CamScanner “eysandsag ey evo: “peyuasordad sq]? “eptizo9aq epaur wpuL;sp zy ZR iA Bindpey ( So[Mayyaa ap orsUMNY | (“wy ap sazrut) BIOURSIG 2B]Qe} ayuaINgIs Bl ua Opefayar epanb ow AOjOUr Jap aavas OT[ey JoUNLAd Ja BIseY SOprIA0daI sojaWOLY, 9p OLUINU Ja aprut as A IeIpnysa uaramMb as anb seaystza}e2 ~8) se] @ Uapuodsar anb sojnsiyaa QS] ap BAySONU BUN 28009 O[[a Brg ‘opNIIYaA ap ody 0}.1919 a1qos OrpNysa uN AvZIeA! apuayaid A0}0W! Jap opunuT ja ua epEztperadso wys}Ao! Cun woo {BIOS so}OB1q efeo ooyysd J so1ep SOS? oe on 8 -sooidyre soz0re* go 10leA asa *¢z6'g = ZY ouog ‘Zy anb pends 0 FOU" 7% B ouwo1a9 spur oyep Jo so soyFadns aUooeAPP stl ‘sapp}a0g SvPH™ Escaneado con CamScanner sLV'0 | Ost | & | o8t | ooz-o0, 002-097 seo | ert | sz [opt fogimozy sez | st | ep | ont | ozoor sei _| 14 | se} 06 | 001-08 ses | 9¢ | 1z| 09 [ og-op sieo| st [st] 02 | oro » [a |e poul x seas | so qe) vr] ‘JOACUL vas pepisuop BAno O[PAIAIUT [OP ASL[9 9p voseUL ET VIDS Epo! v] ‘oIUE) 10g pmidwe vustu | UeueN ou sopeAsoyUT soy onb sourearas “JO ‘a1qeHeA B Op epOUT L] So oJUOUIAUANOAY spur JOJoU Jep eavs8 o[fey JourLid Ja aonposd as anb vy uo PIOURNSIP eT (q “vaneuosoidar ,s]uoweANrlay,, so upout el ‘OUR 10d ‘K Q ap vor ,ojUeUTATRIAL,, yISe aonb 9L6 xX oer = ee = MO LOLS'8E Ss BRS UOsIvag OP UOIOVLIBA ap O}UDIOYO0d [9 “BULIOY BISA OC So “LOLS'8E = XS : voidn ugroerasap 2 aUa}Go sowepod ‘erope|noyeo BI Opuesn ‘ayed eNO 10g “UY 9°L6 = X ‘Hoop so ‘erourysiq,, XeIqevwea vj op erpaut v so epLuogay vipout viourysip vy (e 10} Fogg te ona Oj[ey Aouad ns ap sayuL SOPHA0I.1 "UD] | [0001 soy uezadns aonb sojnoryaa ap afeyuoaaod ja vna[eD (P | *so]NINaA SO] poe operjey uey anb ey vaud vouEysip Bf EINIED (> Ole; “gyuauuajuaNda.y SBUT JOJOUT [ap dAvIB J*9uayad ja donpoad as anb vj ua voueysip B EINIVD (4 Te 1, | YOR EA iNT ‘puyon a W

También podría gustarte