Está en la página 1de 10

UNIDAD: ESTADISTICA

La estadstica se ocupa de recopilar datos, organizarlos en tablas y grficos y analizarlos con un determinado objetivo. La estadstica puede ser descriptiva o inferencial. La estadstica descriptiva tabula, representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones. La estadstica inferencial infiere propiedades de gran nmero de datos recogidos de una muestra tomada de la poblacin. Nosotros slo estudiaremos la estadstica descriptiva. siguientes etapas! a" #ecoleccin de datos b" $rganizacin de datos %"& 'abulacin %"( )raficacin c" *nlisis y medicin de datos a) Recoleccin de datos +ara esta etapa tomaremos los siguientes conceptos bsicos! Poblacin! conjunto de observaciones efectuadas Individ o! cada elemento de la poblacin. Atrib to! caracterstica investigada en la observacin. stos pueden ser cualitativos %se,o, religin, nacionalidad" o cuantitativos %estatura, peso, rea -estos son continuos, se miden en nmeros reales./ nmero de 0ijos, nmero de goles -discretos, se miden en nmeros enteros." +or ejemplo! si se desea realizar un estudio estadstico de las estaturas de los alumnos de tercer a1o, +oblacin! conjunto de estaturas 2ndividuo! cada estatura *tributo! la estatura 'eniendo presente la clasificacin, clasifica los siguientes atributos &. *filiacin poltica de los 0abitantes de la 3apital de 30ile. (. 3antidad de ganado vacuno en las provincias de la #o 4ueno y La 5nin. 6. #eligin de los padres de familia de la comunidad educativa 7anta 3ruz. 8. 2ngresos de los obreros. 9. 3antidad de alumnos de las diferentes carreras de la :acultad de 3iencias ,acta en la 5.L.*. ;. 7e,o de los alumnos de una escuela. <. stado civil de los 0abitantes de la ciudad de #o 4ueno. =. 3antidad de pelculas nacionales estrenadas durante un a1o. >. 3olor de cabellos de los alumnos de un curso. &?. +untaje obtenido por los alumnos que ingresan a la carrera de @edicina. b) !r"ani#acin de los datos $%) Tab lacin! puede ser a travAs de una serie simple, con la presentacin de los datos recogidos en forma de tabla ordenada, o a travAs de la agrupacin de datos, este mAtodo se utiliza cuando el nmero de observaciones es muy grande. n ella debemos tener en cuenta las

jemplo! n un curso de 8? alumnos, se desea estudiar el comportamiento de registrndose los siguientes valores! &,9( &,;8 &,98 &,;8 &,<6 &,99 &,9; &,9< &,9= &,9> &,96 &,;? &,;? &,;& &,;& &,;9 &,;6 &,<> &,;( &,;? &,;8 &,98 &,;9 &,;( &,;; &,<; &,<? &,<& &,<( &,<( &,99 &,<6 &,<6 &,<9 &,;< &,<= i& Serie si'ple! 3ompleta los cuadros siguientes, ordenando los datos obtenidos. *lumno 'alla *lumno 'alla *lumno 'alla & &,9( && (& ( &,96 &( (( 6 &,98 &6 (6 8 &,98 &8 (8 9 &,99 &9 (9 ; &,99 &; (; < &,9; &< (< = &,9< &= (= > &,9= &> (> &? &,9= (? 6?

la variable estatura, &,9= &,;6 &,;> &,;6

*lumno 6& 6( 66 68 69 6; 6< 6= 6> 8?

'alla

ii& A"r pacin de datos por serie o distrib cin de frec encias ! se registra la frecuencia de cada valor de la variable. La frecuencia puede ser absoluta %f", nmero que indica la cantidad de veces que la variable toma un cierto valor, relativa %fr", cociente entre la frecuencia absoluta de cada valor de la variable y el nmero total de observaciones/ relativa porcentual que es el porcentaje de la fr/ frecuencia *cumulada la suma de la fi y la acumulada porcentual, que el la suma de frB . Colviendo al ejemplo anterior, completa la tabla de serie de frecuencias. , %tallas" *bsoluta #elativa #. +orcentual *cumulada *c. +orcentual fi fr D fEn %&??.fr" B :a :a B &,9( & &E8? D ?,?(9 (,9 B & (,9B &,96 & &E8? D ?,?(9 (,9B ( 9B &,98 ( (E8? D ?,?9 9B 8 &?B &,99 &,9; &,9< &,9= &,9> &,;? &,;& &,;( &,;6 &,;8 &,;9 &,;; &,;< &,;= &,;>
2

&,<? &,<& &,<( &,<6 &,<8 &,<9 &,<; &,<< &,<= &,<> F* cunto es igual el total de la columna de frecuencias absolutasG F+or quAG ................................................................................................................................... F* cunto es igual el total de la columna de frecuencias relativasG F+or quAG ................................................................................................................................... FH el total de la columna de porcentajesG ................................................................................................................................... A"r pacin de datos por intervalos de clase ! intervalos iguales en los que se divide el nmero total de observaciones. s conveniente utilizar los intervalos de clase cuando se tiene un gran nmero de datos de una variable continua& F3mo saber cuntos intervalos considerarG F3mo determinar su amplitudG +rimero debemos determinar el rango de los datos, que es la diferencia entre el mayor y el menor de los valores obtenidos. Ran"o ( )'*) + )'n 3alcula el rango de los datos de nuestro ejemplo. .................................................................................................................................... Luego debemos establecer el nmero de intervalos %N" y determinar la amplitud %*" de los mismos. A ( ran"o , N %N tu lo eliges, pero es conveniente que no sea muy peque1o" 7i queremos trabajar con &? intervalos, Fcul es, para nuestro caso, la amplitud de cada uno de ellosG Ie ser necesario, podemos apro,imar el valor 0allado ...................................................................................................................................... 7iendo el primer intervalo J&,9( / &.99" completa la tabla con todos los restantes. $bserva que el e,tremo izquierdo del intervalo se usa un corc0ete K J K, lo que indica que tomamos este valor, en cambio en el derec0o usamos K " K que nos indica que el intervalo es abierto, o sea, no se toma este valor. La -arca de clase es el promedio aritmAtico de los e,tremos del intervalo. 'allas J&,9( / &.99" J&,99 / &,9=" J&,9= / &,;&" @arca de clase %@3" &,969 &,9;9 &,9>9 fi fr frB :a :aB

'otales 2nvestiga sobre el nmero de 0ermanos de cada alumno de tu curso y dispone los datos obtenidos en una serie o distribucin de frecuencias. stas son las notas obtenidas por los &?? candidatos que se presentaron a un concurso! 6= 9& 6( ;9 (9 (= 68 &( (> 86 <& ;( 9? 6< = (8 &> 8< =& 96 &; ;( 9? 6< 8 &< <9 >8 ; (9 99 6= 8; &; <( ;8 ;& 66 9> (& &6 >( 6< 86 9= 9( == (< <8 ;; ;6 (= 6; &> 9; =8 6= ; 8( 9? >= 9& ;( 6 &< 86 8< 98 9= (; &( 8( 68 ;= << 89 ;? 6& <( (6 &= (( <? 68 9 9> (? ;= 99 8> 66 9( &8 8? 6= 98 9? && 8& <;

+resenta dic0os datos en una tabla de intervalos de clase. n una cierta ciudad de la provincia de Caldivia, se registra el nmero de nacimientos ocurridos por semana durante las 9( semanas del a1o, siendo los siguientes los datos obtenidos! 8 &< && = ( && < &? = > &( &9 &= &; 9 6 &; &> > ( &? &= && &6 ; &= &9 > < &; > && 9 &8 8 &< &( &( & &6 = < ; &( > &? && =

; &( 6 <

3onfecciona una tabla de intervalos de clase. Las edades de veinte c0icos son &(, &6, &8, &?, &&, &(, &&, &6, &8, &(, &?, &(, &&, &6, &(, &&, &6, &(, &? y&9. $rganiza los datos en una tabla de frecuencias. FLuA porcentaje de c0icos tienen &( a1osG F3untos c0icos tienen menos de &8 a1osG n cada da del mes de enero, en el camping 2gl 0ubo la siguiente cantidad de turistas! &(, &8, &<, &;, &>, &9, &9, (&, (8, (;, (=, (8, (9, (;, (?, (&, 68, 69, 66, 6(, 68, 6=, 8?, 86, 8&, 89, 9?, 96, 9=. 3onstruye una tabla de frecuencias para estos datos.

$.) /r*ficos! la recopilacin de datos y la tabulacin pueden traducirse grficamente mediante representaciones convenientemente elegidas! barras, sectores circulares, mapas curvas, etc. Los grficos permiten visualizar e interpretar el fenmeno que se estudia, en forma ms clara. Las barras se utilizan generalmente para representar atributos cualitativos o cuantitativos discreto. La longitud es igual a la frecuencia de cada observacin. +ueden ser barras simples o mltiples, segn se trate de representar uno o ms atributos. Las barras pueden ser 0orizontales o verticales.

/r*f& de barras: Eval acin del "obierno :

ne tra ne"ativa positiva

32

42

62

/r*fico de barras co'p esto: Re' neraciones 'edias $a0o 1)

622 522 422 .22 322 %22 2 Enero 7ebrero -ar#o Ind strial 8ancario Ad'& P9blica Ed cativo Co'ercio

Los "r*ficos circ lares o "r*ficos de torta son tiles para comparar datos pues, en general, trabajan con porcentuales. l rea de cada sector representa el porcentaje que corresponde a la frecuencia de un cierto valor de la variable. sta representacin es conveniente cuando el nmero de sectores es peque1o y sus reas estn bien diferenciadas.

positiva ne"ativa ne tra

positiva ne"ativa ne tra

valuacin del gobierno M

l ;isto"ra'a se utiliza para representar una tabla de frecuencias de intervalos de clase. 7obre el eje 0orizontal se representan los intervalos de clase y sobre el eje vertical, las frecuencias de los intervalos. l grfico consiste en un conjunto de rectngulos adyacentes cuya base representa un intervalo de clase y cuya altura representa la frecuencia del intervalo. l pol"ono de frec encias se construye uniendo los puntos medios de los lados opuestos de las bases de cada rectngulo. 7i se quiere cerrar el rectngulo, se agregan dos intervalos! uno anterior y otro posterior al ltimo y se prolonga el polgono 0asta los puntos medios de estos intervalos. Las c rvas se utilizan generalmente para representar la variacin de una variable a travAs del tiempo %a1os, meses, 0oras, etc.". 7obre el eje 0orizontal figuran los perodos de tiempo. <ariacin del valor de las i'portaciones = e)portaciones de la Ar"entina en 'illones de dlares
%?22 %622 %422 %322 %222 ?22 622 422 322 2
65 66 %@ 6A %@ 6? %@ 6@ %@ %@

i'portacin de la Ar"entina e)portacin de la Ar"entina

stas son slo algunas de las formas posibles de graficacin y las que encontrars con ms frecuencia. 3onstruye el 0istograma y el polgono de frecuencias para la tabla del ejercicio de intervalos de clase, de la pgina 6, de las tallas... c) An*lisis = 'edicin de datos +ara describir un conjunto de datos, se calculan algunas medidas que resumen la informacin y que permiten realizar comparaciones. -edidas de posicin! se utilizan para encontrar un valor que represente a todos los datos. Las ms importantes son! la 'edia arit'>tica, la 'oda y la 'ediana. La 'edia arit'>tica o pro'edio $ x ) de varios nmeros se calcula como el cociente entre la suma de todos esos nmeros y la cantidad de nmeros que sumamos. La 'oda $-o) es el valor que ms se repite. +uede suceder que 0aya ms de una moda o ninguna %si todos los valores tienen igual frecuencia".

La 'ediana $-e) es el valor que ocupa el lugar central al ordenar los datos de menor a mayor . 7i la cantidad de datos es par, la mediana es el promedio entre los dos valores centrales.

Los sueldos de cinco empleados de una empresa son! N 8?????, N9?????, N89????, N;????? y N69?????. 3alcula el sueldo medio, la moda, si es que e,iste, y la mediana e indica cul representa mejor a los datos. l entrenador de un equipo de natacin debe elegir a uno de sus integrantes para la pr,ima competencia de estilo libre. 7egn los tiempos en segundos que obtuvieron los postulantes de las cinco ltimas carreras de &?? m de estilo libre, FquA nadador le conviene elegirG ;&,< ;&,9 ;?,< ;&,< ;(,> ;(,8 ;(,6 ;(,> ;(,< ;(,> ;6,< ;(,< ;6,& ;6,< ;6,(

Iiego 'oms 7ergio

+ara poder decidir, calcula las medidas de posicin de cada uno. promedio ;(,68 moda ;&,< mediana ;(,6

Iiego 'oms 7ergio

n promedio, los nadadores ms rpidos son ................................ y ................................., pero esto no significa que 0ayan tenido el mismo rendimiento/ por eso necesitamos las otras medidas de posicin! de ellos dos, tanto la moda como la mediana indican que ................................ fue ms veloz. 7in embargo, para elegir el nadador adecuado, no basta con considerar las medidas de posicin, ya que tambiAn es necesario que su rendimiento sea parejo, es decir, que los tiempos de sus &?? m libres no tengan mucha dispersin. -edidas de dispersin! nos informan cmo estn distribuidos los datos. La ms importante es el desviacin est*ndar $ )B que mide la dispersin de los datos con respecto al promedio . 3uanto menor es el desvo estndar, menos dispersos estn los datos con respecto al promedio. +ara calcular el desvo estndar, seguimos los siguientes pasos! 3alculamos la diferencia entre cada uno y el promedio. levamos al cuadrado cada una de las diferencias anteriores. 7umamos todos los valores 0allados en el paso anterior y dividimos el resultado por la cantidad de datos. *s obtenemos la varian#a. 3alculamos el desviacin est*ndar $ ) como la ra# c adrada de la varian#a.
=

(x
n i =1

n! nmero de datos

Iiego y 7ergio, dos de los nadadores del ejercicio anterior, obtuvieron el mismo promedio y sin embargo sus tiempos estn distribuidos de manera diferente. 3alcula los desvos estndares de los tiempos de los nadadores!

'iempos de Iiego ,i ;&,< ;&,< ;(,6 ;(,> ;6,& total


Diego =

'iempos de 7ergio %,i - ,"( ,i %,i - ," %,i - ,"(

%,i - ," .?,;8 .?,;8 .?,?8 ?,9; ?,<;

total

Sergio =

ntonces! +odemos ver que el desvo estndar de ................................... es menor que el de ................................., lo cual indica que el promedio representa mejor los datos de ................................., porque sus tiempos fueron menos dispersos. ntonces, aunque cinco datos son muy pocos para 0acer estadstica, si con esa informacin 0ay que elegir un nadador de ese equipo para la pr,ima competencia, conviene que sea ....................................... CACCUC!S DE ESTADI/RA7!S EN DAT!S TA8UCAD!S 7i los datos estn agrupados ya sea en tablas de frecuencias simples o en intervalos de clase, debemos utilizar un criterio diferente para calcular los distintos estadgrafos. *nalicemos el siguiente ejemplo! 3onsideremos la siguiente distribucin de frecuencias que corresponden a los puntajes de 9? alumnos en una prueba. 2ntervalos @.3. fi fO, :a %," J;? - ;9" ;(,9 9 6&(.9 9 J;9 - <?" ;<,9 9 66<.9 &? J<? - <9" <(,9 = 9=? &= J<9 - =?" <<,9 &( >6? 6? 2ntervalo mediano J=? - =9" =(,9 &; &6(? 8; 2ntervalo modal J=9 - >?" =<,9 8 69? 9? '$'*L 7 52 .?.2 La -edia Arit'>tica: x=

f x f

x=

3830 = 76.6 ptos. 50

<< ptos.

+ara calcular Ca -ediana necesitamos la siguiente frmula!

n Fa A 2 Me = L + fi

Donde: L es el lmite inferior del intervalo mediano. a es la fre!"en!ia a!"m"lada #asta antes del intervalo mediano. fi es la fre!"en!ia a$sol"ta del intervalo mediano. % es la %m&lit"d del intervalo.

en el ejemplo, la cantidad de datos es 9?, luego 9? ! ( D (9, y la :a (9 se encuentra en el intervalo J<9 - =?" ya que el (9 esta aqu, en cambio en la anterior %&=" no esta. Luego el intervalo mediano es J<9 - =?" ntonces! L D <9 %lmite inferior" fi D = *D9 %=? - <9 D 9" :a D &= %frecuencia acumulada del intervalo anterior"

50 18 5 2 = 75 + 75 = 75 + 4.375 = 79.375 Me = 75 + 8 8

<> ptos.

y finalmente, para calcular la -oda en datos agrupados, utilizamos la siguiente frmula, teniendo presente que la clase 'odal es la que tiene mayor frecuencia, y esta es la :recuencia @odal.

Mo = L +

d1 A d1 + d 2

L: Lmite real inferior de la !lase modal. d1: es la diferen!ia entre la fre!"en!ia modal ' la fre!"en!ia anterior. d2: es la diferen!ia entre la fre!"en!ia modal ' la fre!"en!ia si("iente. %: am&lit"d del intervalo

L D =? %intervalo modal J=? - =9", ya que la frecuencia es &;, que es la mayor" d&D &; - &( D 8 %diferencia con la frecuencia anterior" d(D &; - 8 D &( %diferencia con la frecuencia siguiente" *D9 Luego, Mo = 80 + 4 20 5 = 80 + = 81,25 puntos. 4 + 12 16

=& puntos.

7e estima que el valor ms repetido de los puntajes de esta prueba fue el =&. EDercicios &" Los siguientes datos numAricos corresponden a la cantidad de veces que cada alumno de un grupo 0a ido a un recital o concierto. (-8-6-(-&-&-;-6-?-6-(-8-;->-6-(-&-; 3alcula, sin tabular, @edia, moda, mediana, desviacin, n, rango.

(" n un diagnostico de educacin fsica se pidi a los alumnos de los cuartos medios que 0icieran abdominales durante 6 minutos. 7e obtuvieron los siguientes resultados! 8P *! 89 66 8P 4! 86 8& 6= 89 89 8> 86 88 88 8? (> 8& 6= 6< 68 68 68 68 ;? 6; 8; 88 98 68 86 8& (< 6( 66 (6 68 68 (= 9; ;( 9; 9< 89 8< 8= 98 98 8( 86 89 9< 88 6= 6= 6< 86 ;& 6= 6< 89 (= 8( 86

Fcul de los dos cursos tiene el rendimiento ms parejoG FquA distribucin estadstico permite comparar la distribucin de este tipo de datosG 6" * continuacin se presentan los resultados de ambos cursos en la prueba de diagnstico de salto largo. 8P * ! 6.( 6.9 8.> 9.? 6.& 8.& (.> (.= 6.= 8.9 8.6 8.9 8.& 9.= 6.> 6.; 8.( 8.; &.> (.= (.> 6.6 6.> 8.( 8.& 8.6 8.; 8.8 6.= 6.; 8P 4 ! 6.9 (.> &.6 &.< 6.; 9.; (.= 9.( 9.6 8.& 8.& 8.8 &.; 9.& 8.6 9.? 9.6 6.( (.= (.; 9.9 9.8 8.= 8.> 8.6 (.> 6.> 9.8 9.6 8.( a" 3alcula el promedio de ambos cursos. b" 3onstruye una tabla de frecuencias para cada curso c" 3ul de los dos cursos tuvo un rendimiento mas parejoG 8" 7e 0an medido <9 alumnos, en centmetros, obteniAndose los siguientes datos! &<9 &;< &<8 &;> &9; &;> &;= &;9 &<( &=( &;; &=? &9> &<? &<( &;; &;& &;> &<( &=8 &=9 &;< &9= &=6 &=; &<? &9> &<8 &>( &;( &;6 &<6 &<> &<( &;6 &;( &;6 &<& &;= &=9 &;8 &<8 &<8 &=> &<? &<& &<9 &;> &;8 &99 &9? &<6 &;< &<& &98 &<& &;= &<8 &<( &;= &<; &;; &<& &<? &9< &<? &<6 &<6 &<9 &;? &<9 &<< &<= &=? &<6

*grupa estos resultados en = intervalos y confecciona una tabla de frecuencias y calcula las medidas de tendencia central y de dispersin. *dems, grafica esta tabla. 9" * los mismos alumnos anteriores se les aplico una prueba de inteligencia, estos 0an sido! =< &?9 == &?6 &&8 &(9 &?= &?< &8& >( &6( &&( >< &69 &?& &?8 &?6 &6( &&? &&6 &?( &?> &(8 >= &&= &6= >> &?9 &&( >8 >; &6( &&= &&8 &(> &?? &?; &&6 &?9 &&& >8 &&9 => =( &6? >> &&8 >& &89 >9 &?& &&9 &?8 =< &?= &&9 &8? &?< >6 &?= &(( &&< &&8 &8& &&; &?= &?( &?& &&= &(6 &?= &6& &(< &?? >&

*grupa los datos en intervalos de amplitud =. y 0az lo mismo que en problema anterior.

10