Está en la página 1de 17

LAESTADSTICA La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una muestra representativa, ya sea

para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. Es transversal a una amplia variedad de disciplinas, desdelafsicahastalascienciassociales, desde las ciencias delasaludhastaelcontrolde calidad.Seusaparalatomadedecisionesen reasdenegociosoinstitucionesgubernamentales. POBLACIN

En estadstica, poblacin esel conjuntodecosas,personas, animales o situaciones que tiene una o varias caractersticas o atributos comunes,porejemplo: loshabitantesde El Salvador en el presente ao, las personas menores de edad en el ao 2001 los estudiantes de la Universidad, las reaccionesdeun nuevo medicamento,las diferencias entrelostratamientosdediferentesformulacionesdeinsecticidas,entreotras. Poblacin Finita:esel conjuntocompuestoporunacantidadlimitadadeelementos,como elnmerodeespecies,elnmerodeestudiantes,elnmerodeobreros. Poblacin Infinita: es la que tiene un nmero extremadamente grande de componentes, comoelconjuntodeespeciesquetieneelreinoanimal. Poblacin Real: es todo el grupo de elementos concretos, como las personas que en Europasededicanaactividadesartsticas. Poblacin Hipottica: es el conjunto de situaciones posibles imaginables en que puede presentarse un suceso, comoporejemplolas formas dereaccionarde una personaante unacatstrofe. Poblacin estable: es aquellaenque sus valoresocualidades no presentan variaciones, o stas, por pequeas que sean, son despreciables, como la rotacin de la tierra o la velocidaddelaluz. Poblacin inestable:esla quecontienen losvalores en constante cambio.Prcticamente la totalidad de las poblaciones corresponden a este tipo. El cambio de los valores se

presentaneneltiempooenelespacio.

Poblacin aleatoria: es la que presenta cambios ensuscolores debidos alazar, sinque existaunacausaaparente,comolasvariacionesenelcontenidodelproducto. Poblacin dependiente:esla quecambia sus valoresdebido aunacausadeterminaday medida.Ladependencia puedeser total,comolas variaciones obtenidasen una funcin matemtica,laregresinlineal,porejemplo. La dependencia es parcial cuando la causa influye en la variable dependiente en una proporcin menor a la total, por ejemplo,el incremento en las ventasproveniente de una mayorgastopublicitario.Estaltimainfluencianoesproporcional. Poblacin binomial es aquella en la que se busca la presencia o ausencia de una caracterstica,porejemplo,lapresenciadeozonoenelaire. Poblacin polinomial: es la que tiene varias caractersticas que deben ser definidas, medidas o estimadas, como la obediencia, la inteligencia y la edad de los alumnos de postgrado.
MUESTRA

Enestadstica unamuestraestadstica(tambinllamadamuestraaleatoriaosimplemente muestra)esunsubconjuntodecasosoindividuosdeunapoblacinestadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica lainclusindesujetos en lamuestra debe seguiruna tcnica demuestreo. Entalescasos,puedeobtenerseunainformacinsimilaraladeunestudioexhaustivocon mayorrapidezymenorcosto. Ejemplo La descripcin de una muestra, y losresultadosobtenidos sobre ella, puede ser deltipo mostradoenelsiguienteejemplo:
Dimensin de la poblacin: ej. 222.222 habitantes Probabilidad del evento: ej. Hombre o Mujer 50% Nivel de confianza: ej. 96%

Desviacin tolerada: Tamao de la muestra:

ej. 5% ej. 270

Resultado

ej. 196

Lainterpretacindeesosdatosseralasiguiente: Lapoblacin a investigartiene 222.222 habitantes y queremos saber cuntosson hombresomujeres. Estimamos enun50%paracadasexoyparaelpropsitodelestudio essuficiente un90%deseguridadconunnivelentre905y90+5. Generamos una tabla de 270 nmeros al azar entre 1 y 222.222 y en un censo numeradocomprobamoselgneroparalosseleccionados
INDIVIDUO

UnIndividuoobienunidadEstadsticaescadaunodeloselementosquecomponenla poblacin.hayquemencionarquecuandodecimosindividuonoexclusivamentenos estamosrefiriendoaunapersona. Vamosaverunejemplo,supongamosquedeseamosestudiarlosnegociosqueexisten ennuestralocalidad,cadaNegocioesequivalenteaunindividuoounidadEstadstica. porquelosNegociosentotalcomponenalaPoblacin.

VARIABLE

El conjunto de valores que constituyen un carcter estadstico se denomina variable estadstica. En trminos estrictos, se denomina variable estadstica a todo carcter cuantitativo de un individuo, mientras que los caracteres cualitativos se suelen llamar atributos.
Los atributos son aquellos caracteres que para su definicin precisan depalabras,esdecir,no lepodemosasignarunnmero.PorejemploSexoProfesin,EstadoCivil,etc. Asuvezlaspodemosclasificaren: Ordenables: Aquellasquesugierenunaordenacin,porejemplolagraduacinmilitar, Elnivelde estudios,etc. No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica, pero no establece ordenporsunaturaleza,porejemploelcolordepelo,sexo,estadocivil,etc.

VARIABLESCUALITATIVAS
Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin dedichos atributos.Lasvariablescualitativaspuedenserdicotmicascuandoslo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando puedenadquirirtresomsvalores.Dentrodeellaspodemosdistinguir: Variable cualitativa ordinal o variable cuasicuantitativa: Lavariablepuedetomardistintosvalores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre medicionesseauniforme,porejemplo:leve,moderado,fuerte. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio deordencomoporejemploloscolores.

VARIABLESCUANTITATIVAS
son las que se describen por medio de nmeros, como por ejemplo el peso, Altura, Edad, NmeroDeSuspensosAsuvezestetipodevariablessepuededividirendossubclases:

VariableDiscreta:Es lavariablequepresentaseparacionesointerrupciones enlaescala devalores que puedetomar.Estasseparaciones o interrupciones indicanlaausenciade valoresentrelosdistintosvaloresespecficosquelavariablepuedaasumir. Ejemplo:Elnmerodehijos(1,2,3,4,5). Variablecontinua:Es lavariableque puede adquirir cualquier valor dentrodeunintervalo especificadodevalores.Porejemplolamasa(2,3kg,2,4kg,2,5kg,...)olaaltura(1,64m, 1,65 m, 1,66 m,...), o el salario. Solamente se est limitadoporla precisin delaparato medidor,enteorapermitenquesiempreexistaunvalorentredos variables.
No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemoscomosifuesencontinuasyviceversa.

Variables unidimensionales:slo recogen informacin sobre una caracterstica (por ejemplo:edaddelosalumnosdeunaclase). Variables bidimensionales:recogen informacin sobre dos caractersticas de la poblacin(porejemplo:edadyalturadelosalumnosdeunaclase).

Variables pluridimensionales:recogen informacin sobre tres o ms caractersticas (porejemplo:edad,alturaypesodelosalumnosdeunaclase).


ESTADSTICADESCRIPTIVA La Estadstica es la ciencia que se encarga de recolectar datosde una poblacin o muestra. Los conceptos estadsticos se han trabajado intuitivamente desdela antigedad, las primeras culturas recopilaron datos poblacionales por medio decensoscomolosrealizadosEgiptoypor Moiss (segn consta la Biblia) y el empadronamiento que fue efectuado por los romanos en Judea, sloa partir del siglo pasado AdolfoQuetelec(17961874)crediferentesmtodospara realizarobservacionesconelfindedeterminareltipodedatosqueregulanalgunosfenmenos. La Estadstica descriptiva registra los datos en tablas y los representa en grficos. Calcula los parmetros estadsticos (medidas de centralizacin y de dispersin),quedescribenelconjunto estudiado. DISTRIBUCINDEFRECUENCIAS Presenta los valores de los datos y la frecuencia con que sepresentan, al ser mostrados en una tabla, los valores de los datos de los datos sepresentanenordeny,porlogeneral,elvalor del dato ms bajoapareceenlaparteinferior delatabla.Unadistribucindefrecuenciasotabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cadadatosufrecuenciacorrespondiente. Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase,queeslafrecuenciade clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con las frecuencias correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de frecuencias. CARACTERSTICAS Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir,engruposdevaloresquedescribenunacaractersticadelos[datos]ymuestra elnmerodeobservacionesdelconjuntodedatosquecaenencadaunadelasclases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentesen elconjuntodedatosjunto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la

frecuenciasimpleylafrecuenciaacumulada. La tabla de frecuencias puede representarse grficamente en un histograma (Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalosdevalores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de losdatosestadsticos,asignandoacadadatosufrecuenciacorrespondiente.

TIPOSDEFRECUENCIA
1. La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudioestadstico. Serepresentaporfi. La suma de las frecuencias absolutas es igual al nmero totalde datos,queserepresentapor N. f1+f2+f3+....+fn=N Para indicar resumidamente estas sumas se utiliza la letra griega(sigmamayscula)quese leesumaosumatoria. 2. La frecuencia relativa esel cociente entrelafrecuenciaabsolutadeundeterminadovaloryel nmerototaldedatos. Sepuedeexpresarentantosporcientoyserepresentaporni. Lasumadelasfrecuenciasrelativasesiguala1. 3. La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferioresoigualesalvalorconsiderado. SerepresentaporFi. 4. La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinadovaloryelnmerototaldedatos.Sepuedeexpresarentantosporciento. Ejemplo Duranteelmesdejulio,enunaciudadsehanregistradolassiguientestemperaturasmximas: 32, 31, 28,29, 33,32,31,30,31,31, 27,28,29,30,32,31,31,30,30,29,29,30,30,31,30,31, 34,33,33,29,29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la

segundahacemoselrecuentoyenlaterceraanotamoslafrecuenciaabsoluta. xi 27 28 29 30 31 32 33 34 Recuento I II IIIII IIIIII IIIIIII III III I fi 1 2 6 7 8 3 3 1 31 Fi 1 3 9 16 24 27 30 31 ni 0.032 0.065 0.194 0.226 0.258 0.097 0.097 0.032 1 Ni 0.032 0.097 0.290 0.516 0.774 0.871 0.968 1

DISTRIBUCINDEFRECUENCIASAGRUPADAS La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variablestomanunnmerograndedevaloresolavariableescontinua. Se agrupan los valores en intervalos que tengan la misma amplitud denomina dos clases. A cadaclaseseleasignasufrecuenciacorrespondiente. Lmitesdelaclase Cadaclaseestdelimitadaporellmiteinferiordelaclaseyellmitesuperiordelaclase. Amplituddelaclase Laamplituddelaclaseesladiferenciaentreellmitesuperioreinferiordelaclase. Marcadeclase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervaloparaelclculodealgunosparmetros. CONSTRUCCINDEUNATABLADEDATOSAGRUPADOS 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25,17, 7, 34, 36, 39, 44, 31,26,20,11,13,22, 27,47,39,37,34,32,35,28,38,41,48,15,32,13.

1.selocalizanlosvaloresmenorymayordeladistribucin.Enestecasoson3y48. 2. Se restan y se busca unnmero entero un poco mayor que ladiferencia y que sea divisible porelnmerodeintervalosdequeramosponer. Esconvenientequeelnmerodeintervalososcilaentre6y15. Enestecaso,483=45,incrementamoselnmerohasta50:5=10intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo,peroellmitesuperiornoperteneceintervalo,secuentaenelsiguienteintervalo. ci [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40) [40,45) [45,50) 2.5 7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 fi 1 1 3 3 3 6 7 10 4 2 40 Fi 1 2 5 8 11 17 24 34 38 40 ni 0.025 0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1 Ni 0.025 0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1

GRFICASESTADSTICAS DIAGRAMADEBARRAS Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipodiscreto.

Se representan sobre unos ejes de coordenadas,en el eje deabscisas se colocan losvalores delavariable,ysobreelejedeordenadaslasfrecuenciasabsolutasorelativasoacumuladas. Losdatosserepresentanmediantebarrasdeunaalturaproporcionalalafrecuencia. Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneohadadoelsiguienteresultado: Gruposanguneo A B AB 0 fi 6 4 1 9 20

POLGONOSDEFRECUENCIAS VARIABLESDISCRETAS Los polgonos de frecuencias se realiza trazando los puntos que representan lasfrecuenciasy unindosemediantesegmentos. Ejemplo Lastemperaturasenundadeotoodeunaciudadhansufridolassiguientesvariaciones: Hora 6 9 12 Temperatura 7 12 14

15 18 21 24

11 12 10 8

VARIABLESCONTINUASODATOSAGRUPADOS Los polgonos de frecuencias se realiza trazando los puntos formados las marcas de clase y lasfrecuencias,yunindosemediantesegmentos. Tambin se puede construir el polgono de frecuencia uniendo los puntos medios de cada rectngulodeunhistograma. Ejemplo Elpesode65personasadultasvienedadoporlasiguientetabla: ci [50,60) [60,70) [70,80) [80,90) [90,100) [100,110) [110,120) 55 65 75 85 95 110 115 fi 8 10 16 14 10 5 2 65 Fi 8 18 34 48 58 63 65

DIAGRAMADESECTORES Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentementeparalasvariablescualitativas. Los datos se representan en un crculo, de modo que el ngulodecadasector esproporcional alafrecuenciaabsolutacorrespondiente. Eldiagramacircularseconstruyeconlaayudadeuntransportadordengulos. Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3practicanlanatacin,9 jueganalftbol yelrestonopracticaningndeporte.

Alumnos Baloncesto Natacin Ftbol Sindeporte Total HISTOGRAMA 12 3 9 6 30

ngulo 144 36 108 72 360

Unhistogramaesunarepresentacingrficadeunavariableenformadebarras. Se utilizan para variables continuas o para variables discretas, con ungrannmerodedatos,y quesehanagrupadoenclases. En el ejeabscisasseconstruyenunosrectngulosquetienenporbaselaamplituddelintervalo, yporaltura,lafrecuenciaabsolutadecadaintervalo. Lasuperficiedecadabarraesproporcionalalafrecuenciadelosvaloresrepresentados. POLGONODEFRECUENCIA Para construir el polgono de frecuencia se toma la marca de clasequecoincide con el punto mediodecadarectngulo.

Ejemplo Elpesode65personasadultasvienedadoporlasiguientetabla: ci [50,60) [60,70) [70,80) [80,90) [90,100) [100,110) [110,120) 55 65 75 85 95 105 115 fi 8 10 16 14 10 5 2 65 Fi 8 18 34 48 58 63 65

HISTOGRAMAYPOLGONODEFRECUENCIASACUMULADAS Siserepresentanlasfrecuenciasacumuladasdeunatabladedatosagrupadosseobtieneel histogramadefrecuenciasacumuladasosucorrespondientepolgono. HISTOGRAMASCONINTERVALOSDEAMPLITUDDIFERENTE Para construir unos histogramas con intervalo de amplitud diferente tenemosque calcular las alturasdelosrectngulosdelhistograma. A.eslaalturadelintervalo B.eslafrecuenciadelintervalo C.eslaamplituddelintervalo Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente)obtenidasprungrupode50alumnos. fi hi

[0,5) [5,7) [7,9) [9,10)

15 20 12 3 50

3 10 6 3

MEDIDASDEPOSICIONAMIENTOCENTRAL MEDIA Vamos a estudiar en este apartado los distintos tipos de media que hemos detallado en el apartadoanterior. La media aritmtica de una variable se define como la suma ponderada de los valores de la variableporsusfrecuenciasrelativasylodenotaremosporysecalculamediantelaexpresin: xirepresentaelvalordelavariableoensucasolamarcadeclase. Propiedades: Si multiplicamos o dividimos todas las observaciones por un mismonmero,la mediaquedamultiplicadaodivididapordichonumero. Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha cantidad. Adems dela media aritmticaexistenotrosconceptosdemedia,comosonlamedia geomtricaylamediaarmnica. Media geomtrica: La media geomtrica de N observaciones eslarazdendiceNdelproducto detodaslasobservaciones.LarepresentaremosporG. Solo se puede calcular si no hay observaciones negativas. Esunamedida estadstica poco o nadausual. Media armnica: La media armnica de N observaciones es la inversa de la media de las inversasdelasobservacionesyladenotaremosporH Aligualqueenelcasodelamediageomtricasuutilizacinesbastantepocofrecuente. MEDIANA La mediana es el valor central de la variable, es decir, supuesta la muestraordenadaenorden creciente o decreciente, elvalor que divide en dos partes lamuestra. Paracalcular lamediana

debemostenerencuentasilavariableesdiscretaocontinua. Clculodelamedianaenelcasodiscreto: Tendremosencuentaeltamaodelamuestra. SiNesImpar,hayuntrminocentral,eltrminoqueserelvalordelamediana. SiNesPar,haydostrminoscentrales,lamedianaserlamediadeesosdosvalores Veamosunejemplo. NImpar Npar

1,4,6,7,8,9,12,16,20,24,25,27N=12

1,4,6,7,8,9,12,16,20,24,25,27,30N=13

TrminosCentralesel6y79y12

TrminoCentralel7,12

Me=12 Me=9+12/2=10,5

Clculodelamedianaenelcasocontino: Si la variable es continua, la tabla vendr en intervalos, por lo que se calcula de la siguiente forma:Nosvamosaapoyarenungrficodeunhistogramadefrecuenciasacumuladas. MODA Lamodaeselvalordelavariablequetengamayorfrecuenciaabsoluta,laquemsserepite,es la nica medida de centralizacin que tiene sentido estudiarenunavariablecualitativa, puesno precisalarealizacindeningnclculo. Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucinbimodalopolimodalsegnelcaso. Por lo tanto el clculo de la moda en distribuciones discretas o cualitativasno precisa de una explicacin mayor sin embargo, debemos detenernos un poco en el clculo de la moda para distribucionescuantitativascontinuas. MEDIDASDEPOSICIONAMIENTONOCENTRAL

CUARTILES Medidadelocalizacinquedividelapoblacinomuestraencuatropartesiguales. Q1=Valordelavariablequedejaalaizquierdael25%deladistribucin. Q2=Valordelavariablequedejaalaizquierdael50%deladistribucin=mediana. Q3=Valordelavariablequedejaalaizquierdael75%deladistribucin. Al igual que ocurrecon el clculo de la mediana, el clculode estos estadsticos, depende del tipodevariable. Caso I: Variable cuantitativa discreta: En este caso tendremos que observar el tamao de la muestra: NyparacalcularQ1oQ3procederemoscomosituvisemosquecalcularlamediana delacorrespondientemitaddelamuestra. Caso II: Variable cuantitativa continua: En este caso el clculo es ms simple:, sea la distribucinquesigue: (li2Li1) (Li1Li) ni1 ni Ni1 Ni

DECILES Medidadelocalizacinquedividelapoblacinomuestraen10partesiguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamosa versloparalasvariablescontinuas. dk = Decil ksimo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin. [Li2Li1) [Li1Li) ni1 ni Ni1 Ni

IntervalodondeseencuentraelDecilcorrespondiente:

k=1..9

PERCENTILES Medidadelocalizacinquedividelapoblacinomuestraen100partesiguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamosa versloparalasvariablescontinuas. pk = Percentil ksimo es aquel valor de la variable que deja a su izquierda el k % de la distribucin. [Li2Li1) [Li1Li) ni1 ni Ni1 Ni

Intervalodondeseencuentraelpercentilcorrespondiente: k=1..99 Ejemplo: Como se puede observar la forma de calcular estas medidas es muy similara ladel clculodelamediana. Veamoselclculodealgunasdeestasmedidasenelejemploqueestamosestudiando. VamosacalcularQ1,Q3,d3,yp45 Li1 45 55 65 75 85 Li 55 65 75 85 95 ni 6 10 19 11 4 Ni 6 16 35 46 50

Clculo de Q1: Buscamos enla columna delasfrecuencias Acumuladaselvalorquesupereal 25%deN=50,correspondeal2intervalo.(50/4=12.5)

Anlogamente calculemos Q3, Buscamos ahora enlamismacolumnaelcorrespondienteal75 %deNqueenestecasoesel4intervalo(3.50/4=37.5) Veamosahoraeldecil3.(Correspondeal30%350/10=15)serael2intervalo. Porltimoveamoselpercentil45(4550/100=22.5)Correspondealintervalo3

También podría gustarte