Está en la página 1de 22

GLOSARIOESTADSTICO

Fuente:MurrayR.Spiegel,Estadstica,McGrawHill. y p g , ,
CONCEPTOSY
DEFINICIONESESPECIALES
Es el estudio cientfico de los
Laestadsticaposeetrescampos
mtodos para recoger, organizar,
resumir y analizar los datos de una
informacin, as como para obtener
conclusiones vlidas con rigor y
biendefinidos:
Descriptiva
tomar decisiones razonables
apoyadas en tal anlisis.
Con esta herramienta es posible
trabajar en forma objetiva, permite
Inferencial
TeoradeProbabilidades.
vincular causas y efectos, presentar
resultados con claridad y orden. Es
un insumo esencial para interpretar
informacin numrica y luego
construir diseos curriculares.
Estadstica Descriptiva EstadsticaDescriptiva
Tratadelosestudiosquesehacensobreeltotaldeindividuosdeunapoblacinconelfinde
establecerlasprincipalescaractersticasdeintersparaelinvestigador.
EstadsticaInferencial
Serefierealosestudiosquesehacensobreunapartedelapoblacin(muestra),conelfin
de obtener (inferir) conclusiones sobre las caractersticas de inters de toda la poblacin Es deobtener(inferir)conclusionessobrelascaractersticasdeintersdetodalapoblacin.Es
uncaminodededuccinconriesgo,conprobabilidaddeerror.
TeoradeProbabilidades
Esunaramadelamatemticadegranimportanciaenlosestudiosinferenciales,dadoque
losvaloresqueseobtienensobreelanlisisdeunamuestranosonexactamenteigualesa
loscorrespondientesparmetrosdetodalapoblacin.Estudiaelcomportamiento p p p p
matemticodelazarconuncontroldelosfenmenosaleatorios.
Poblacin
Grupocompletodeindividuosuobjetosqueconstituyenlabasedeintersparaunestudio
estadstico.Eselconjuntodetodosloselementosquecumplenunadeterminadacaractersticaque
deseamosmediryestudiar.
Muestra Muestra
Parterepresentativadeunapoblacin.Estodosubconjuntodeunapoblacinsobreelquesevaa
realizarelestudio.Elnmerodeelementosdelamuestrasedenominatamao delamuestra.
Individuo
Enestadsticaseconsideraindividuo(objeto)acadaunodeloselementosdelapoblacin.
Carcter Carcter
Cadaunodelosaspectosopropiedadesquesepuedenestudiarenlosindividuosdeunapoblacin
recibeelnombredecarcteroestadstico.Estopermiteclasificaralosindividuos.
Elcarcterpuedesercuantitativo sisepuedemedirobiencualitativo sinosepuedemedirperose
puedecomparar.
Dato
Valor o forma que asume una variable para un individuo determinado Valoroformaqueasumeunavariableparaunindividuodeterminado.
Estimadores Estimadores
Caractersticascuantificablesqueposeeunamuestra,yqueseutilizanparacalcularlos
parmetrosdelapoblacin.
Distribuciones Distribuciones
Formasdeorganizacinyrepresentacintabulardelosdatos.
ExperimentoEstadstico
Cualquier proceso que genera un conjunto de datos numricos Cualquierprocesoquegeneraunconjuntodedatosnumricos.
EspacioMuestral
Conjuntodetodoslosposiblesresultadosdeunexperimentoestadstico.
Variable
Elconjuntodevaloresquepuedetomaruncarcterestadsticosellamavariableestadstica.Son
atributosqueposeenoselepuedenasignaralosindividuosdeunapoblacinyquedifierende
uno a otro unoaotro.
ClasificacindeVariables
Cualitativas: Lasquedefinencualidadesdelosindividuos;usualmentepuedensubdividirseen
categoras.
Ejemplo:Variable:Sexo.Categoras:M.F.
Indicadoras: ValoresnumricosqueseleasignanalascategorasdeunaVariableCualitativa.
Cuantitativas:Cuandolosatributosquelasdefinensoncuantificablesomediblesnumricamente.
LasVariablesCuantitativaspuedenserDiscretasoContinuas.
Discretas: Cuandolasvariablesslopuedentomardeterminadosvalores,(asumenvaloresdeunoen
uno);esdecirpuedentomarunnmerofinitoobieninfinitonumerabledevalores.
Continuas:Cuandopuedenasumircualquiervalorentredosenterosconsecutivos,esdecirpueden
tomartodoslosvaloresdeunintervaloytanprximoscomosequiera.
IntervalosdeClase
Seledenominaintervalodeclaseacadaunodelosintervalosenquepueden
agruparse los datos de una variable estadstica. Permiten obtener una idea ms agruparselosdatosdeunavariableestadstica.Permitenobtenerunaideams
clarayconcretadelarealidad.Alagruparlosvaloresdeunavariableestadstica
yclasificarlaporintervalos,lavariablepasaaserconsideradacontinua.
E i t it i l i i t d i Existensituacionescomolassiguientesquepuedenocurrir:
Haydemasiadosdatos,paraunasolavariable.
Puedenserpocosdatos,perosusvaloresmuydispersos. p , p y p
Interesaunaclasificacinparticulardelosresultados.
En estos casos el agrupamiento de los datos resulta una buena tcnica para el Enestoscasoselagrupamientodelosdatosresultaunabuenatcnicaparael
anlisisdelasvariablesdentrodeunestudioestadstico.
IntervalosdeClase MtododeTrabajoI
1 Aplicar una tcnica de recoleccin de datos por ejemplo: Tronco y Hoja
m M
D D R =
1.Aplicar una tcnica de recoleccin de datos, por ejemplo: Tronco y Hoja
2.Determinar el Rango de la informacin: .
Donde y
3.Determinar la Amplitud de los intervalos: Se divide el rango obtenido en
DatoMayor D
M
= DatoMenor D
m
=
R
dos por el Nmero de intervalos en los que deseo agrupar
Donde: A: Amplitud; R:Rango e I:Cantidad de intervalos en los que deseo agrupar
I
R
A =
4.Si la amplitud no me da un nmero entero, se puede realizar el siguiente ajuste:
4.1.Ajusto la amplitud obtenida al entero siguiente.
4 2 Con la amplitud anterior y el nmero de intervalos (I) hallo un nuevo rango(NR) 4.2.Con la amplitud anterior y el nmero de intervalos (I), hallo un nuevo rango(NR).
4.3.Establezco la diferencia: NR-VR; donde VR es el viejo rango.+
4.4.Ajusto los datos originales de acuerdo con la diferencia anterior.
Intervalos de Clase Mtodo de Trabajo II
5.Establezco los intervalos, partiendo del primer dato (o del primer dato ajustado), y
sumando la amplitud hasta cubrir el nmero de intervalos previamente definidos
Intervalos deClase MtododeTrabajoII
sumando la amplitud hasta cubrir el nmero de intervalos previamente definidos
6.Se calcula la Marca de Clase para cada intervalo
2
sup inf
L L
Mc
i
+
=
donde = Marca de Clase del intervalo i; = Lmite inferior del intervalo i;
= Lmite superior del intervalo i.
i
Mc
inf
L
sup
L
La Marca de Clase es un valor que representa a todos los del intervalo o clase.
Es el punto medio entre los extremos de cada intervalo.
7.Se realiza la distribucin de frecuencias
Observaciones:
Elnmerodeintervalos,puededefinirsepreviamenteacriteriodelosinvestigadores,oaplicandoalgunastcnicas e o de te a os, puede de se p e a e te a c te o de os est gado es, o ap ca do a gu as tc cas
sugeridasparaellodeacuerdoconeltipodeestudio;unafrmulaempleadaconfrecuenciaesladeSturges:I=1+
(3.3logN),dondeN=Totaldedatos.
Encualquiercasoserecomiendaqueelnmerodeintervalosnoseainferiora5,nisuperiora20.
Siemprequeserealizaesteagrupamientohayunaprdidadeinformacin,setieneencuentalapertenenciaono
d d d t l i t l l t decadadatoalintervaloperonosuvalorexacto.
Asimismoseproduceunerrorenelclculoposteriordelosparmetrosestadsticos.Losvaloresquepertenecenal
intervalosevenrepresentadosporsumarcadeclase,yellospuedensermayoresomenoresquesta
Definiciones
FrecuenciaAbsoluta ()
Eslacantidaddevecesqueapareceyserepiteelvalordato.
f
i
FrecuenciaAbsolutaAcumulada ()
Sedenominafrecuenciaabsolutaacumuladadeunvaloralasumadetodaslasfrecuenciasabsolutas
F
A

delosvaloresmenoresoigualeshastaelvalorconsiderado.
Distribucindefrecuencias
F
A
= f
i

Representacintabulardelosdatoscorrespondientesaunavariable,queincluye:
FrecuenciaRelativa () f
r
Sedenominafrecuenciarelativadeunvaloralcocienteentresufrecuenciaabsolutayelnmerototal
dedatosqueintervienenenelexperimento.
FrecuenciaRelativaAcumulada ()
Sedenominafrecuenciarelativaacumuladadeunvaloralasumadetodaslasfrecuencias
l ti d l l i l l id d T bi d l l
F
R
F =
F
A
relativasdelosvaloresmenoresoigualesalconsiderado.Tambinpuedecalcularsecomo: F
R
=
N
Presentacin de datos: Tablas, Grficos y Presentacindedatos:Tablas,Grficosy
Diagramas
Existenmuydiversostiposyestilosdeherramientasutilizadaspararepresentarlosdatos
correspondientes a una variable estadstica Es fundamental que sean claros fcil de correspondientesaunavariableestadstica.Esfundamentalqueseanclaros,fcilde
entendereinterpretar,debenajustarseestrictamentealarealidadquerepresentan.
HaydostiposdegrficaspararepresentarDistribucionesAgrupadasporintervalos:
Histograma:Grficodebarrasverticalespegadasconigualamplitudycentradasenlamarca
declase.Asocianacadaintervalounrectngulodesuperficieproporcionalalafrecuencia
correspondienteadichointervalo.Lasalturasdeesosrectngulossonloscocientesentrelas
frecuencias absolutas y las longitudes de los intervalos que le corresponden A intervalos de frecuenciasabsolutasylaslongitudesdelosintervalosquelecorresponden.Aintervalosde
claseiguales,lasalturassondirectamenteproporcionalesalasfrecuencias.
Polgonodefrecuencias:Grficodetrazosolneas,cerrado,queseconstruyeuniendolos
puntos extremos medios superiores de un histograma es decir los puntos correspondientes puntosextremosmediossuperioresdeunhistograma,esdecirlospuntoscorrespondientes
alasfrecuenciasdecadavalor.
AlgunasHabilidadesCognitivas:
Observar,Analizar,Ordenar,Clasificar,
Representar,Memorizar,Evaluar.
GrficodeTrazosoLneas
Sonutilizadosparaunaovariasvariablescuantitativasdiscretas.
Grficodebarras(Verticalesyhorizontales)
Esungrficoqueasociaacadavalordelavariableunabarra(verticaluhorizontal),proporcionalala
frecuenciaquelecorresponde.Esapropiadoparavariablescualitativassolasoencomparacin.
Dentro de la representacin en barras se encuentran las Barras en Porcentaje por componente muy Dentrodelarepresentacinenbarras,seencuentranlasBarrasenPorcentajeporcomponente, muy
tilescuandosetratadepoblacionescontamaosmuydiferentes.
SectoresCircularesodePastel
Paraunasolavariablecualitativaocuantitativa.Sontilespararepresentarlasdistintaspartesdeuntodo,
losdiversoscomponentesdeuncarcter.Cadasucesoserepresentaporunsectorcirculardeuna
amplitudproporcionalasufrecuencia
Pictogramas
Representacionesusualmentedebarras,queseapoyanenlasfacilidadesquebrindanlosgrficospor
computador.Juntoalgrficodelosdatossepuedeverunaimagenrelativaoreferidaalosobjetosquese
id miden.
Cartogramas
Son representaciones de los datos sobre un mapa. Sonrepresentacionesdelosdatossobreunmapa.
ParmetrosEstadsticos
Caractersticasnumricascuantificablesqueposeeunapoblacin.Seobtienenmedianteunprocesode
clculoapartirdedatosmedibles.Sonnmerosquedescribenelcomportamientoylascaractersticas
generales de un conjunto de datos estadsticos. Se los agrupa en dos categoras: centralizacin y generalesdeunconjuntodedatosestadsticos.Selosagrupaendoscategoras:centralizaciny
dispersin.
MedidasdeTendenciaCentral
Valoresnumricosquesepuedenobtenerdeladistribucindeunavariablecuantitativa,ycuyos
resultadosseubicanporelcentrodelamismadistribucin;ellasson:
LaModa(),laMediana(),ylaMedia(X ). M
o
M
ed
Moda ()
Eseldatoquesepresentaconmayorfrecuenciaabsolutadentrodeunadistribucin.Sienuna
distribucinaparecendosModas,sehabladeunaDistribucin.Bimodal;sisonmsdedosmodassedir
Di t ib i M lti d l E l d i bl ti t l d tid
M
o
unaDistribucinMultimodal.Enelcasodeunavariablecontinuaestevalorcarecedesentido.
Mediana()
Se denomina mediana al valor central de los datos cuando stos se han organizado ordenadamente de
M
ed
Sedenominamedianaalvalorcentraldelosdatoscuandostossehanorganizadoordenadamentede
menoramayor.Esunvalorquedividealadistribucinendospartesiguales,cadaunadelascuales
contieneel50%delosdatospordebajoyelotro50%porencima.
M di ( X ) Media (X )
Sedefinecomolasumadetodoslosvalores(datos)queasumeunavariable,divididaporelnmerototal
dedatos.
FrmulasdeclculodelasMedidas
de Tendencia Central deTendenciaCentral
1 Para distribuciones no agrupadas 1. Para distribuciones no agrupadas
* Moda: Basta con observar la distribucin, e identificar el dato que se presenta
con la mayor frecuencia absoluta.
*Mediana: Dependiendo si el total de datos es impar o par:
1 + n
* Si el total de datos es impar, la mediana ser aquel dato que ocupe el lugar
* Si el total de datos es par, la mediana ser el promedio de los datos que ocupen las
posiciones y , es decir los valores que ocupan las posiciones centrales.
2
1 + n
|
|

|
n
|
|

|
+1
n
*Media: La definicin conduce a la siguiente frmula, que es la ms utilizada en
el clculo de la media:
|
.

\
2
|
.

\
+1
2
n n
; si los datos estn agrupados se puede calcular como:
donde : Dato isimo; : frecuencia absoluta del dato isimo; : total de datos
n
x
X
n
i
i
=
=
1
n
f x
X
n
i
i i
=
=
1
i
x f n
donde : Dato isimo; : frecuencia absoluta del dato isimo; : total de datos
de la informacin.
i
f
2. Para distribuciones agrupadas g p
(Con intervalos de igual amplitud)
L
Se emplean las siguientes frmulas:
MODA A L M
o
|
|
.
|

\
|
A + A
A
+ =
2 1
1
inf
inf
L
A
ci
M
:Lmite inferior del intervalo de clase
:Amplitud de los intervalos
:Marca de clase del intervalo i.
MEDIANA
. \ 2 1
A
f
f
n
L M
ant
ed
|
|
|
|

|

+ =

2
inf
1
A
:Diferencia entre la frecuencia
absoluta del intervalo modal y la
frecuencia absoluta del intervalo
MEDIA
f
abs
|
|
.

\
f M

2
A
anterior
:Diferencia entre la frecuencia
absoluta del intervalo modal y la
*Mtodo largo
n
f M
X
i ci
=

f
i
|
|

.
ca
M
frecuencia absoluta del intervalo
siguiente
:Marca de clase arbitraria
*Mtodo corto
A
n
f
M X
i
ca
|
|
.
|

\
|
+ =

.

:Nmero de veces la amplitud de


los intervalos, a partir de la marca
de clase arbitraria.
Medidasdedispersin
Son valores numricos que nos dan informacin sobre los esparcidos o aglutinados,
ed das de d spe s
donde se encuentran los datos correspondientes a una variable cuantitativa dentro de
un estudio estadstico. Permiten obtener una imagen del alejamiento de los datos
respecto de las medidas de centralizacin. Pueden existir series de datos con iguales
medidas de centralizacin pero con aspecto muy diverso segn sea la dispersin de medidas de centralizacin pero con aspecto muy diverso, segn sea la dispersin de
sus datos.
Las medidas de dispersin ms usadas son:
*Los Rangos:
Comn o amplitud: Se define como la diferencia entre los datos
extremos de una variable cuantitativa, as: Dato Mayor-Dato Menor extremos de una variable cuantitativa, as: Dato Mayor Dato Menor
Intercuartil: Q3-Q1; proporciona informacin sobre el 50% central de la
variable.
Percentil: P90-P10; se utiliza cuando se quieren excluir algunos datos
t d i f i i f i b l 90% t l d l extremos de informacin; recoge informacin sobre el 90% central de los
datos.
*La Varianza:
( )
2
o
*Las desviaciaciones: La Desviacin Media y la Desviacin Tpica o Standard (S.D.)
( ) o
C fi i t d i i Coeficiente de variacin
Es un valor que da informacin global sobre el grado de dispersin de la medida
estadstica utilizada; cuando la medida empleada es la media aritmtica se define
como:

=
SD
cv
Es muy til para comparar estadsticamente dos poblaciones o dos muestras
x
Es muy til para comparar estadsticamente dos poblaciones o dos muestras
diferentes. Nos muestra la variacin relativa de cada poblacin. Quien posea el
coeficiente de variacin mayor ser la ms heterognea.
Medidasdeposicin:LosCuantiles
Se denominan as a ciertos valores dentro de una informacin, que permiten dividirla , q p
en partes iguales. Hemos visto que la Mediana es el valor que divide al conjunto de
datos en dos partes iguales, pues bien a las medianas de cada una de estas dos
partes iguales que nos han quedado, los denominamos Cuartiles.
Los cuantiles ms usados son Los cuantiles ms usados son
Los Cuartiles (Q):
Se utilizan para dividir la informacin en cuatro (4) partes iguales, cada una de las p ( ) p g
cuales contiene un 25 % del total de los datos. Son 4 cuartiles notados como: Q
l
- Q
2
-
Q
3
- y - Q
4
.
Los Deciles (D): Los Deciles (D):
Se usan para dividir una informacin en diez (10) partes iguales, cada una de las
cuales contiene un 10 % de los datos. Son 10 Deciles notados como: D
1
- D
2
- - - D
10
Los Percentiles (P):
Se usan para dividir una informacin en cien partes iguales, cada una de las cuales
contiene un 1 % de los datos. Son cien percentiles notados como: P
1
- P
2
- P
3
- - -P
100
L V i
( )
2
Brinda informacin global sobre la forma en cmo varan los datos; juega un papel
La Varianza
( )
2
o
g ; j g p p
trascendental en la estadstica inferencial cuando de hacer estimaciones se trata; ya
que del anlisis de la varianza de una informacin cuantitativa se pueden deducir
muchos resultados sobre el comportamiento general de los parmetros de una
poblacin Se define como la media de los cuadrados de las desviaciones medias poblacin. Se define como la media de los cuadrados de las desviaciones medias.
Permite descubrir la variacin que existe entre dos muestras de la misma o de
diferentes poblaciones.
La varianza se define como:
I) ; para datos sin agrupar.
n
f x x
x Var
i i
2
2
) (
) (

= = o
II) ; para datos agrupados.
n
f x M
x Var
i ci
2
2
) (
) (

= = o
III) Como frmula alterna de la varianza, la que se emplea comnmente es la siguiente:
2
2
2
2
) (
|
|

|
=
|
|
|

|
=


x x
f x f x
x Var
i i i
) (
|
.

\
=
|
|
.

\
= x x
n n
x Var
Una desviacin se define como la diferencia entre el valor del dato y alguna
Las Desviaciones
Una desviacin se define como la diferencia entre el valor del dato y alguna
medida estadstica; las desviaciones ms comunes se toman con respecto a la
media aritmtica, pero se pueden tomar desviaciones respecto a la moda, a la
mediana, a uno de los cuantiles,
La Desviacin Media
Se define como el promedio - la media aritmtica - de las desviaciones absolutas Se define como el promedio la media aritmtica de las desviaciones absolutas
de una variable, tomadas en valor absoluto, con respecto a la media aritmtica de
la variable; en frmulas ser:
x x
i

f x x
i i

n
DM =
n
DM =
D i i T i E t d
S d fi l d d d l i f l
Desviacin Tpica o Estndar
Se define como la raz cuadrada de la varianza; en frmula ser:
,para datos sin agrupar.
f x x
SD
i

= =
2
) (
o
,p g p
para datos agrupados
n
SD o
f x Mc
i i

2
) (
,para datos agrupados.
n
f
SD
i i
= =
) (
o
Observacin:
Lamediaeselvalordelpromedio,fsicamentepuedepensarsecomoelcentrodegravedaddel
conjuntodedatos.Sepuedeimaginarcomoelvalorequitativoqueseobtendraalrepartireltodo
entresuselementos.
Ladesviacintpicaesunamedidadeloequitativoqueseharealizadoladistribucin.Haymenor
equilibrio cuando hay mayor desviacin tpica equilibriocuandohaymayordesviacintpica
GLOSARIOESTADSTICO:
Fuente:MurrayR.Spiegel,
Estadstica,McGrawHill.