Está en la página 1de 5

AnlisisExploratoriodeDatos

AdministracinyDireccindeEmpresas1263EstadsticaEmpresarial1182

ESTADSTICADESCRIPTIVA.Temas13

Tema1.Introduccin:EstadsticaDescriptiva
Resumenyobjetivos
MaterialesdeEstudio
Tema2.Tablasdefrecuenciasydescriptivosgrficos
Resumenyobjetivos
MaterialesdeEstudio
Tema3.Medidasdelocalizacin,dispersinyforma.Grficos.
Resumenyobjetivos
Materialesdeestudio
Prcticasymaterialesdeapoyo
Ejercicioscomplementarios

Tema1.Introduccin:EstadsticaDescriptiva
Resumenyobjetivos

En este primer tema se introduce la nomenclatura y conceptos bsicos relacionados con el


anlisisestadsticodelainformacinrecogidaenunestudioeconmico,socialoexperimental.
En primer lugar se hace ver al estudiante mediante diferentes ejemplos como el estudio y
anlisis de decisiones y comportamientos anteriores puede ayudar a tomar las decisiones con
menor error o riesgo en el futuro, que es el concepto bsico sobre el que se fundamenta la
estadstica. A continuacin, se muestra a losestudiantes comolagrancantidad deinformacin
disponible en los momentos actuales hace necesario que el periodista deje de ser un
trasportador de informacin para convertirse, cuando sea necesario, en un procesador de
informacin.
A travs de diferentes ejemplos se muestra que para la realizacin de cualquier anlisis
estadstico de un estudio social es necesario establecer en primer lugar el objetivo que se
persigue, a la hora de establecer el proceso de recogida de informacin (proceso de medida),
sujetos que se van a medir y lascaractersticasovariablesquesevanamedir sobrecadauno
delossujetosdelestudio.
A partir de los ejemplos se establecen los diferentes tipos de variables (categricas y
numricas), especificando los posibles resultadosovaloresdeunamedicinquecorresponden
a la variable de inters,ycomoelconjuntode todalainformacinrecogida, sujetosyvariables,
conforma lo que denominamos datos del estudio o como se ve en el punto siguiente datos

Autores:J.Morales,J.Aparicio,X.Barber,A.M.Mayoral
Depto.Estadstica,MatemticaseInformtica

AnlisisExploratoriodeDatos
AdministracinyDireccindeEmpresas1263EstadsticaEmpresarial1182

muestrales. Finalmente se establecen los conceptos de poblacin y muestra, mostrandocomo


en la mayora de estudios es necesario obtener una muestra para poder realizar el anlisis
estadstico,yaqueesmaterialmenteimposiblemediratodalapoblacin.
Sin embargo, se muestra tambin como una seleccin inadecuada de la muestra puede
invalidar los resultados de cara a su generalizacin a toda la poblacin bajo estudio. Por ese
motivo se hace necesaria la introduccin de los procedimientos de muestreo probabilstico,
para una seleccin adecuada (representativa) de los sujetos que conformaran finalmente la
muestrabajoestudio.
A continuacin se muestran las fases que componen un estudio o anlisis estadstico,
estableciendo los objetivos que persiguetantolaestadsticadescriptiva(faseI),ylaestadstica
inferencial(faseII).
Se define la estadstica descriptivacomolosmtodosestadsticos,medidas,otcnicasusadas
para resumir (numricamente, a travs de tablas y/o grficamente) la informacin
proporcionadaporunconjuntodedatos.
Se define la estadstica inferencialcomo lapartedelaEstadsticaquecomprendelosmtodos
y procedimientos para deducir propiedades (hacer inferencias) de una poblacin, a partir de
unapequeapartedelamisma(muestra).

MaterialesdeEstudio

DiapositivasdelaPresentacindelTema1
VdeoLec001Introduccin.EstadsticaDescriptiva

MsvdeosnocientficosamododetanteodeloqueopinalagentesobrelaEstadstica.

Vdeo1:LaEstadsticadelbocata
Vdeo2:LasencuestasdeQuequ
Video3:MonlogoBuenafuente
Vdeo4:Unodecada10hombresesgay
Vdeo5:Estadsticas:1decada4esunhijodeputa.

Tema2.Tablasdefrecuenciasydescriptivosgrficos

Autores:J.Morales,J.Aparicio,X.Barber,A.M.Mayoral
Depto.Estadstica,MatemticaseInformtica

AnlisisExploratoriodeDatos
AdministracinyDireccindeEmpresas1263EstadsticaEmpresarial1182

Resumenyobjetivos

Una vez recogida la informacin de un estudio todo anlisis estadstico se inicia con una
primera fase descriptiva de los datos. Puesto que en la mayora de las situaciones la
informacin recogida tiene carcter individual el primer objetivo que se plantea es sintetizar la
informacin mediante la elaboracin de tablas defrecuenciasyrepresentacionesgrficasdela
informacin obtenida.Elprimerpasodeesteproceso eslaordenacinnumricaoalfabticade
la informacin recogida. La tabla de frecuencias no es ms que la tabulacin o conteo de la
informacin ordenada. Sin embargo, tanto para la ordenacin, tabulacin einformacin quese
puede extraer de dicha tabla es necesario tener en cuenta el tipo de variable a analizar:
categricanominal,categricaordinalonumrica.
En el caso de una variable categrica nominal, para la que el orden las categoras no tiene
ninguna importancia, se establece la tabla de frecuencias a partir de las denominadas
frecuencias absolutas y frecuencias relativas. Las primeras representan el nmero de sujetos
observados en cada una de las categoras o de la variable, mientras que las segundas
representan la proporcin de sujetos observados en cada una de lascategorasdelavariable,
calculada como el cociente entre la frecuencia absoluta de cada clase y el nmero total de
sujetos. Asociadas con las frecuencias obtenidas se introducen los grficos de barras y
sectorespararepresentarlainformacinobtenida.
Para una variable categrica ordinal, para la que el orden de las categoras s que resulta
relevante, aparte de las frecuencias anteriores se definen las frecuencias absolutas y relativas
acumuladas. Esta frecuencias viene definidas a partir del orden inducido por las categorasde
la variable, acumulando (sumando) la informacin hasta unacategoradadadelasfrecuencias
absolutas y relativas. Debido al carcter ordinal de la variable, estas frecuencias sirven para
calcular porcentajes de clasificacin de sujetos en diferentes clases consecutivas. Desde el
punto de vistadelosprocedimientos grficosseintroducenlos grficosdelneasycombinados
debarrasylneaspararepresentarlainformacinaportadaporlasfrecuenciasacumuladas.
Paraunavariablenumricalaconstruccindelatabladefrecuenciasnoesinmediatayaquela
informacin ordenada no se encuentra clasificada en categoras. Por este motivo, el siguiente
paso es la determinacin de clases o categoras de valores para la agrupacin de la
informacin ordenada. Dichas clases se denominan intervalos, introduciendo adems los
conceptos de amplitud del intervalo, como la diferencia entre el valor mximo y mnimo, y la
marcadeclase,comoelpuntomediodedichointervalo.
La principal dificultad estriba en la eleccindelnmero, extremosyamplitud delosintervalosa
considerar. Dichas elecciones dependen del nmero de datos observados, pero para tamaos
de muestrapequeos(menos de50datos)serecomiendaconstruirnomsdecincointervalos.
Para determinar la amplitud globalseconsideranrespectivamentevaloresenterospordebajoy
por encima del valor mnimo y mximo observados. La amplitud de cada intervalo se obtiene
como la amplitud global divididaporelnmerodeintervalosconsiderados,procurandosiempre
que los extremos de los intervalos sigan siendo nmero enteros. Una vez establecidos los
intervalos los clculos de frecuencias son anlogos a los realizados para una variable

Autores:J.Morales,J.Aparicio,X.Barber,A.M.Mayoral
Depto.Estadstica,MatemticaseInformtica

AnlisisExploratoriodeDatos
AdministracinyDireccindeEmpresas1263EstadsticaEmpresarial1182

categrica ordinal, ya que como se hace notar alosestudiantes,lavariableagrupadaobtenida


puedeserconsideradaenestemomentounavariablecategricaordinal.
Desde el punto de vista grfico se introduce el histograma como un grafico de barras SIN
separacin entre las categoras yaquelavariablesubyacenteesdetiponumrico.Sevecmo
dicho grfico sirve para representar tanto las frecuencias relativas como las relativas
acumuladas. De esta forma, se comienzan a introducir, desde el punto de vista grfico, las
aproximaciones a la funcin de densidad y de distribucin de la variable aleatoria
correspondientealainformacinobservada.

MaterialesdeEstudio

DiapositivasdelaPresentacindelTema2
VideoLec002Tablasdefrecuenciasydescriptivosgrficos
VdeoLec003QueselINE.Obtenerinformacin

Tema3.Medidasdelocalizacin,dispersinyforma.Grficos.

Resumenyobjetivos

En este tema se plantean los procedimientos de anlisis que comprende la estadstica


descriptiva basada en la obtencin de medidas que permitan sintetizar, mediante un nico
nmero,lainformacindeunbancodedatos.
Es evidente que la elaboracin de la tabla defrecuenciasesunprimerpasoenlaorganizacin
y comprensin de los datos recogidos, sin embargo, a la hora de extraer conclusiones
referentes a un banco de datos, lo habitual es tratar deresumirlainformacin enunaseriede
indicadoresnumricosquepermitanconocerconmsdetallecmoseorganizanydistribuyen.
Lo que se desea de estos indicadores es: a) que sean definidos objetivamente a partir de los
datos de la serie, b) de significado sencillo y fcil de entender, c) de clculo rpidoyfcil,yd)
pocosensiblealasfluctuacionesdelamuestrarecogida(valorparecidoaldelapoblacin).
Esosindicadoresnumricosseorganizanentresapartados:

Medidas de localizacin: Los conjuntos de datos muestran una tendencia definida a


agruparse o resumirse en torno a cierto punto, por lo que para cualquier conjunto
particular de datos, es posible seleccionar un valor tpico para describir, representar o
resumir todo el conjunto de datos.Lamedidashabitualessonlamedia,mediana,moda,
ypercentiles.
Medidas de dispersin: Tratan de cuantificar la cantidad de variacin, diseminacin o

Autores:J.Morales,J.Aparicio,X.Barber,A.M.Mayoral
Depto.Estadstica,MatemticaseInformtica

AnlisisExploratoriodeDatos
AdministracinyDireccindeEmpresas1263EstadsticaEmpresarial1182

agrupamiento en los datos. El objetivo fundamental es conocer si los datos seagrupan


en torno a cierto valor o si por el contrario se reparten sobre el rango posible de
observaciones. Por lo tanto, se usan para establecer la fiabilidad sobre las medidas de
localizacin. La medidas habituales son el rango, rango intercuartlico, varianza y
desviacintpica..
Medidas de forma: Tratan de determinar si los datos se organizan deformasimtricao
asimtrica, o si se encuentran ms o menos concentrados en torno a cierto valor. Las
medidasmshabitualessonelsesgoylakurtosis.
Puesto que los datos pueden venir tanto en formato agrupado como noagrupado,definiremos
las medidas anteriores tanto en un caso como en otro. Aunque de forma habitual slo se
calculan este tipo de medidas para variables de tipo numrico o numricas tabuladas, en
muchasocasionessepuedenrealizarestosclculosconvariablescategricasordinales.
Lo nico que se debe hacer es asignar un cdigo numrico, que respete el orden de las
categorasoclases,deformasimilaracomosefijalamarcadeclase.
Todoslosclculossemuestransobrediferentesejemplosalolargodeltema.

Materialesdeestudio

DiapositivasdelaPresentacindelTema3
VideoLec004.MedidasdeLocalizacin,DispersinyForma
(3946).

Prcticasymaterialesdeapoyo

PrcticaEstadsticaDescriptiva
DatosPrcticaED
FormularioPrcticaEDTema2
FormularioPrcticaEDTema3
VideotutorialEjercicio1PrcticaED
VideotutorialEjercicio2PrcticaED
VideotutorialEjercicio3PrcticaED
VideotutorialEjercicio4PrcticaED

Ejercicioscomplementarios

EjerciciosComplementariosED
DatosEjerciciosComplementariosED

Autores:J.Morales,J.Aparicio,X.Barber,A.M.Mayoral
Depto.Estadstica,MatemticaseInformtica

También podría gustarte