0 calificaciones 0% encontró este documento útil (0 votos) 130 vistas 54 páginas Estadística I - 2DO AÑO MIL
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido,
reclámalo aquí .
Formatos disponibles
Descarga como PDF o lee en línea desde Scribd
Ir a elementos anteriores Ir a siguientes elementos
Guardar Estadística I - 2DO AÑO MIL (1) para más tarde
UNIVERSIDAD MILITAR DE LAS FUERZAS ARMADAS
FACULTAD DE CIENCIAS Y ARTES MILITARES AERONAUTICAS
COLEGIO MILITAR DE AVIACION
GRUPO ACADEMICO
BOLIVIA
CURSO:
DOCENTE: Iy.52./igal. £ $2I0P ACU peeeeenEsramsuicas
Nybade dee, usbadistiea
I wicha Chengase
Oe gladis Vita, des evi ViMa concep es
NOCIONES GENERALES DE LA ESTADISTICA “Apr Cats ane
Rihine oye Caldercn”
1.1. Introduccidn,
Soe seeeddddcin
se sucle pensar en una relacién de datos
Cuando coloquialmente se habla de estadistica
numéricos presentada de forma ordenada y sistemdtica. Csta idea es la consecuencia del
concepto popular que existe sobre el término y que cada vez esté mis extendido debido a
la influencia de nuestro entorno, ya que hoy dia es cas! imposible que cualquier medio de
difusién, periddico, radio, televsién, etc., no nos aborde diariamente con cualquier tipo de
informacién estadistica.
‘Sélo cuando nos adentramos en un mundo mas especifico como es el campo de la
investigacién de las Ciencias Sociales: Medicina, Biologia, Psicologia, percibimos que la
Estadistica se convierte en la Unica herramienta que permite dar luz y obtener resultados, y
por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su
sede
POO SS SVSS SEE EEUU SEE SUUESLE
variabilidad intrinseca, no puedan ser abordadas desde la perspectiva de las leyes
deterministas.
Desde un punto de vista mas amplio, podemos decir que la Estadistica se utiliza como
tecnologia al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte
de su naturaleza.
La Estadistica es la rama de las matemdticas aplicadas que permite estudiar fendmenos
‘cuyos resultados son en parte inciertos, Al estudiar sistemas bioligicos, esta incertidumbre
se debe al desconocimiento de muchos de los mecanismos fisioldgicos, a la incapacidad de
medir todos los determinantes de la enfermedad y a los errores de medida que
inevitablemente se producen. Asi, al realizar observaciones en clinica 0 en salud publica, los
resultados obtenidos contienen una parte sistemstica o estructural, que aporta informacién
sobre las relaciones entre las variables estudiadas, y una parte de “ruldo” aleatorio. Cl objeto
de la estadistica consiste en extraer la maxima informacién sobre estas relaciones
estructurales a partir de los datos recogidos.
a RNR
Sein. Jou Miguel Expnoz Tejera Pigina?: ESTADISTICA
1.2, Historia de la Retadisticn:
Su raiz: STATUS®cosas del estado, Durante e/ siglo pasado, era considerada como la Crancia
del Estado.
Sus origenes: EI recuento,
Las eivilzaciones antiguas recogian datos sobre poblacién, producctdn agricola y renta.
Tal cantided de informacidn debia ser resumida en valores numdricos para su interpretacion
y uso en la toma de decisiones politicas,
61.3. Definicién:
La Estadistica se ocupa de los métodos y procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre y cuando a variabilidad ¢ incertidumbre
sea una causa intrinseca de los mismos; as{ como de realizar inferencias a partir de ellos,
con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones,
“La estadistica es la ciencia que permite tomar decisiones en situaciones de
incertidumbre”
A qué nos referimos cuéndo hablamos de variabilidad?
Cuando nos referimos a una determinada caracteristica ([Link] de dcido Grico) en los
individuos de una poblacién nos estamos refiriendo a una distribucién de valores. La
observacién de un determinado grupo de pacientes nos proporciona informacién acerca de
esta distribucién. Los resultados que observamos se relacionan con la distribucién
poblacional. Sin embargo, observaciones distintas proporcionan resultados distintos
(aunque compatibles), por ejemplo, un mismo tratamiento aplicado a grupos distintos de
pacientes proporcionard resultados distintos.
La Bivestadistica es la rama de’la estadistica que estudia la utiizacién de métodos
estadisticos en problemas médicos y biolégicos. Ensefia y ayuda a investigar en todas las
reas de las Ciencias de la Vida donde la variabilidad no es la excepcidn sino la regla.Cote ui ESTADISHEAL
1.4, Divisidn de ta Estadistica
bretenden ic mas alli del conjunto de datos, ¢ inferencial cuando el objetivo del estudio es
derivar las conclusiones pbtenidas a un conjunto de datos mis amplio.
@ 1.4.1, Estadistica Descriptiva:
Describe, analiza y representa un grupo de datos utilizando métodos numéricos y
gréficos que resumen y presentan la informacién contenida en ellos.
1.4.2. Estadistica Inferencial
Apoyaindose en el cilculo de probabilidades y a partir de datos muestrales, efectia
estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto
mayor de datos. Su tarea fundamental es la de hacer inferencias acerca de la
°
~
2
.
.
.
2 Podemos clasiticar la Estadistica en descriptiva, cuando tos resultados del andlisis nw
>
>
>
>
>
>
,
?
)
)
)
poblacién a partir de una muestra extraida de la misma.
El andlisis de una base de datos siempre partird de técnicas simples de resumen de
los datos y presentacidn de los resultados. A partir de estos resultados iniciales,
yen
funcién del disefio det estudio y de las hipétesis preestablecidas, se aplicarén las
técnicas de inferencia estadistica que permitirin obtener conclusiones acerca de las
relaciones entre las variables estudiadas. Las técnicas de estadistica descriptiva no
Precisan de asunciones para su interpretacién, pero la informacién que proporcionan
no es fdcilmente generalizable. La estadistica inferencial permite esta generalizacién,
ero requiere ciertas asunciones que deben verificarse para tener un grado razonable
de seguridad en las inferencias.
1.5. Conceptos Basicos
‘Vamos a definir algunos conceptos basicos y fundamentales a los cuales haremos referencia
continuamente:
) Unidad estadistica, Individué Elemento: personas u objetos que contienen cierta
E informacidn que se desea estudiar y que pertenecen a la poblacién en estudio
Poblacién: conjunto de individuos 0 elementos que’ camplen ciertas propiedades y entre
: ‘
los cuales se desea estudiar un determinado fenémeno.
aT Pagina
Seng loud Miguel spoons Tefrnausers ~ nai a
i SubEONIUNtY "representative: de una poblacidn,
‘Stadisti
leo: f
= ‘nein defrida sobre os valores ‘uméricos de una muestra.
rametro: 1
y funcidn de
4a Poblacién, NcISN detinida sobre los Valores numéricos de caracterlsticas medibles
Caracteristica observable que varfa entre los diferentes individuos de una poblac
‘8s variables pueden dividirse en cualitativas y cuantitativas,
Modalidades o categorias: posible valores de une variable. Las modalidades deben ser a la
ez exhaustivas y mutuamente excluyentes (cada elemento Pose una y sélo una de las
Modalidades Posibles), Las Modalidades pueden agruparse en clases (intervalos),
1.6.1 Tipos de Variables
Variables Cualitativas:
Se usan con datos que representan categorias que son mutuamente excluyentes, aunque
Se utilcen ndmeros para cada categoria no representan cantidades, Para su medicién
usamos escalas:
Nominales
No hay relacién entre las categoias. Una scala nominal slo permite daitear (ng
Jerarquizar ni ordenar). Ej: Género, nacionalidad, stuacién geogrsfica Distinguimos dog
tipos de variables cualitativas o categéricas nominal
Pagina 5
oc
ppp999900eoee"|
OCbbdd ddd
édeed
e
eeseee
DVVVIVS SVS VeSVUEVHYOHEHEUY
(RAR Pe
Dicotdmicas o binarias
Sano/enfermo, hombre/mujer
Policotémicas (con varias categorins): grupo sanguineo (A/1/AB)
Ordinales
Sus posibles categorias se encuentran jerarquizadas y ordenadas. Cj.: Mejoria 2?
tratamiento, satisfaccién de un usuario, grado de dolor
Es buena idea codifcar las variables cualitativas asignando un cédigo mumérico 9 cade
categoria (“etiqueta”) para poder procesarlas con facilidad.
iOjo! Aunque se codifiquen como mimeros, debemos recordar siempre ef
significado
verdadero tipo de as variables con las que estamos trabajando ys
cuando vayamos a usar programas estadisticos.
iNo todo esta permitido con cualquier tipo de variable!
Variables Cuantitativa:
Se usan con datos que se expresan mediante cantidades numéricas que permiten hacer
operaciones matematicas. Existen los siguientes tipos:
« Discretas: sélo puede tomar valores enteros. Ej.: N° de hijos, n° de intervenciones
lores estén en un conjunto infinito. Las poder
Ej
* Continuas: Si sus posibles val meg
categorizar en intervalos (trataremos este tema en la clase prictica con SPSS)
Edad, peso, tensidn arterial
En la tabla se resumen los distintos tipos de variables y su utilidad:
TIPO DE VARIABLE PARA QUE SIRVE
Cualitativa Nominal | Clasificar
Cualitativa Ordinal ~_Derarquizar
‘Cuantitativa Discreta Contar.
‘Cuantitativa Continua Medir
Pagina 6
Se. ng. Jud Miguel Espinoza TejrinaESTADISTICA
1.7, Muestreo
Cuando se decide cuantificar sdlo una parte delas unidades de una poblacién y a partir de
esta Informacién estimar sus pardmetros, entonces estamos planteando un problema de
mucstreo.
La estadistica habitualmente estudia sélo una muestra de individuos. Se entiende por
‘muestra al subconjunto de una poblacién de mayor tamafio, Se entiende por poblacién 0
Universo al conjunto de todos los individuos o elementos (unidades de anilisis) que cumplen
Giertas caracteristicas. Al procéso de extraccién de una muestra a partir de una poblacién
Se le denomina muestreo. A la interpretacién del tratamiento estadistico de unos datos que
acaba generalizéndolos a toda la poblacién se le llama INFERENCIA,
El muestreo es una herramienta de la investigacién cientifica, su funcién bisica es
determinar qué parte de la realidad en estudio (poblacién o universo) debe de examinarse
Con fa finalidad de hacer inferencias sobre el todo de la que procede.
Un proceso inductive (que va de lo particular a lo general) se asocia inevitablemente a la
Posibilidad de cometer errores.
El error es mayor en la medida que la muestra sea mas
pequelfa, y sobre todo,
Cuando la muestra no refleja o “representa” la realidad sobre la que
Fecaen las conclusiones de la inferencia,
Eleerror que se comete debido al hecho de que se sacan conclusiones sobre cierta poblacién,
@ partir de la observacién de sélo una parte de ella, se denomina error de muestreo,
Dentro del proceso de seleccién de una muestra, la poblacién suele dividirse en unidades
de muestreo las cuales deben de cubrir por entero a la poblacién, en otras palabras, todo
Pagina 7
aagaacessaasssss tte
\
Peececeooosas
®
oe
PPPPPP PR PR eCoC VT VOLE LEE DOLOLO DV VUNNIIddddddbbb bbb bbbbddn
SStTADISHEAY
mmiembra de la poblacién o unidhad de analisis perte
© 8 una y sto
9 una ¥ sdl0 Una Unidad de
muestreo.
Una unidad! de muestreo puede contener un conjunto de unidades de andtsis, incluso, un
conjunto de unidades de muestreo correspondientes a una etapa posterior. La lista de tas
unidades de muestreo, recibe el nombre de marco muestral.
Ejemplo 1.1,
‘Supongamos que se estudia una poblacién de escolares a fin de conocer la prevalencia de
cierta dolenci
listado de escolares, se tiene un listado de colegios (alguno de los cuales se elegirs
Cada escolar es una unidad de andlisis, pero, en lugar de contar con un
n para
el estudio). Una vez hecha esta seleccién, se toman algunas aulas de los colegios elegidos.
Finalmente, dentro de estas ultimas se eligen alumnos que integran la muestra definitiva.
El listado de colegios primero, el de las aulas que tiene cada colegio seleccionado y el de
hifios, correspondiente a cada aula elegida dentro de los colegios de la muestra, constituyen
el marco muestral del estudio.
Puesto que hay tres procesos escalonados de seleccidn, existen en este caso las llamadas
unidades de muestreo de primera, segunda y tercera etapa.
Podemos resumir en estos cuatro puntos las ventajas que la utilizacién de muestras presenta
con respecto a la enumeracién completa de la poblaci
Coste reducido. Si los datos se obtienen de una pequeiia fraccidn del total, los gastos de
recogida y tratamiento de los datos se reducen, Incluso si la obtencién de informacién en
toda la poblacién es factible, suele ser mucho mas eficiente la utilizacién de técnicas de
muestreo.
Mayor rapidez. Los datos pueden ser mas facilmente recolectados y estudiados si se utiliza
una muestra que si se emplean todos los elementos de la poblacién. Por tanto, el uso de
a
Se. ng José Miguel Eplnara Terie Pagina 8ESTADISTICA
téenieas de muestreo es especialmente Important cuando se necesita la Informaciin con
cardeter urgente,
Mayor Mexibitidad y mayores posibilidaties de estudio, La disponibilidad de registros
conyptetos es linitada, Muy @ menudo, la Unica alternativa posible para ta realizacién de un
estudio es la obtencidn de datos por muestreo,
Mayor control de calidad del proceso de recogida de datos. Al recoger datos en un
numero menor de efectivos, resulta may facil recoger un numero mayor de variables por
‘ndeviduo, asi conta tener un mejor control de ta calidad del proceso de recogida de datos,
La teoria de muestreo persigue un doble objetivo,
Por un lado, estudia las técnicas que permiten obtener muestras representativas de la
poblacién de forma eficiente, Por otro lado, indica cémo utilizar los resultados del muestreo
bara estimar los pardmetros poblacionales, conoclendo a la vez el grado de incertidumbre
de las estimaciones,
Asi, la teoria de muestreo pretende dar respuesta a varias preguntas de interés:
éCémo se eligen a los individuos que componen la muestra?
+ éCudntos individuos formardn parte de la muestra?
eCémo se cuantifican las diferencias existentes entre los resultados obtenidos en la
muestra y los que hubiéramos obtenido si el estudio se hubiera llevado a cabo en
toda la poblacién?
icas de Muestreo
La caracteristica mas importante de una muestra es que debe ser Fepresentativa de la
Poblacién objeto de estudio para poder extrapolar los resultados a la poblacién total
Las noclones de muestra representativa y de muestra probabilistica suelen identiicarse
errdneamente como una y la misma, Como consecuencia puede ocurrir que, al admitir que
Ja muestra no fue seleccionada por via del azar,
el investigador sienta que su estudio carece
del rigor cientifico necesario,
La nocién que mejor sintetiza la idea de representatividad es la siguiente:
“Lo que debe procurarse es que la muestra tenga internamente el mismo grado
de diversidad que la poblaciétr’
name a mene
(MSc. Ing. Joué Miguel Espinoze Tejerina eae
aaaqaceee?
ESTHET TES
a9
reeWt tf
Z
;
P
Sooo e Cov ov eevreseeV NUNN Kdb dsb bbbbbbOEbbbdS
ewes
SSTADISTIEAS
1.9. Tipos de Muestreo,
Puntos a considerar
1+ Defi claramente a poblaiin de estudlo. Pueden ser personas, clicas, fuentes de
abastecimiento de agua.
2. Enfoque del estudio. Serd a nivel nacional, regional, local
Entre mayor sea la muestra tendrd a ser mds representativa y menor serd ef error de
muestreo,
St se desea hacer cruces de variables se recomienda no tener menos de 50 casos en cfu de
las subcategorias de la variable principal
Los métodos para seleccionar una muestra representativa son numerosos,
dasificarlos en:
Probabilistico x
podernos,
‘+ Aleatorio Simple
+ Estratificado
+ Sistemdtico
+ Por Conglomerado
No Probabilistico
+ Por conveniencia
+ Por cuota
+ Accidental o Bola de Nieve
1.9.1. Probabilistico:
Es requisito que todos y c/u de los elementos de la poblacién tengan ta misma probabilidad
de ser seleccionados (azar) Se debe tener disponible un listado completo de todos los
elementos de la poblacién, a esto se le llama MARCO DE MUESTREO.
MSc, ng José Miguel Espinons Torna Pagina 10
|_ESTADISTICA
Aleatorio Simple (Muestreo Simple al Azar)
Cada sueto tiene Una probabilidad igual de ser seleccionado para el estudio.
‘Se necesita una lista numerada de las unidades de ta poblacién que se quiere mi
Opciones:
+ Fichas de loteria o bolitas numeradas:
+ Tabla de niimeros aleatorios
Ateatorio Simple/Muestreo Simple al Azar,
Pasos:
+ Determinar el tamafio de ta muestra
+ Numerar los individuos de 1a n
+ Tirar unidades al azar (probabilidad igual)
Ejemplo:
Cobertura de la vacuna anti-sarampién entre 1200 nifios de una escuela X :
+ Muestra = 60
+ Hacer una lista de todos los nifios
+ Numerarlos de 1 a 1200
* Seleccién aleatoria de 60 nimeros
Muestreo Aleatorio Sistematico,
Se toman todes los indviduos de la lista y se selecciona c/3, c/7, 0 cualquier otro ndmero,
Para comenzar se utiliza un nimero al azar
Ejempio:
Poblacisn (N): 12,000
Muestra requerida (n): 600
Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20
Escoger el Ler numero al azar (1 -20}=>1era unidad
Afiadir k para escoger la siguiente unidad y asi sucesivamente hasta completar n,
123456789 10 11 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
33-34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51653 5455...
ler# =12
K=20
SC
MSc. ng, Jo4é Miguel Espinoze Tajerine
e
e
e
e
e
e
~bb bbb 06h h6 6
sed6
CCU OH SHOVES SS vO VOVETEHEES
J"
EStADIENICAL
Mucstreo tstratificada,
Cuando t
Westra incluye subgrupos representatives (estratos) de los vlementos de estudio
con eaactensticas especficas: urbano, rural, nivel de instruccién, afio académicy, conver,
SeXO, Grupo dtnico, edad, paridad etc.
Fn cada estrato para obtener el tamatio de la muestra se puede utlizar ef inves
© sistematico,
Ejempio:
Cadetes del Colegio Militar de Aviacién 2018
Lago militar =20%
1 aito militar =18%
MI aifo militar =15%
treo aleatorio
1V ao militar =12%
Muestreo por Conglomerados
Son unidades geogréficas (distritos, pueblos, organizaciones, linicas)
Facultad de Ciencias Econémicas
Facultad de Ciencias Juridicas y Sociales
Facultad de Quimica y Farmacia
Umitantes: financieras, tiempo, geografia y otros obstaculos,
Se reducen costos, tiempo y energia al considerar que muchas veces las unidades de analisis
Se encuentran encapsuladas 0 encerradas en determinaclos lu:
igares fisicos © geogréficos:
Conglomerados
Unidad de analisis: sujeto o sujetos
Unidad Muestral en este caso: conglomerado a través del cual se logra el acceso a la unidad
de anilisis,
Seleccién en 2 etapas:
+ Los racimos © conglomerados
+ En los racimos se seleccionan a los sujetos a ser medidos,
Poblacién, Localidades, Viviendas. Croquis.
Pégina 12
(MSc. ng. José mtigul Espinoze Tajerina igisss .
—Staorsmeas
1.0.2. to Prabebitistice:
2 cece de lon indivi no depende de Wo probabsidad, sina del proceso de tome
om decmores del trvestigador (ls uestras selectionedes por decisiones subjetves
erator a estar sesgantas).
+ Muestreo par convenience
‘= Muestreo por custas,
Accidental © bola de nieve
Muestreo por Conveniencia
Es fa muestra que esti disponible en el tiempo © pentodo de investigacién.
Semple: Todos fos pacientes que asistan a una dinica en particular cierto dia, semana,
ueden ser requerides para participar.
Desventaja: la muestra puede ser poco representativa de la poblaciin que se desea
estudiar,
Nuestreo por Cuotas
‘Todos los elementos conocidos de la poblacién tienen que aparecer en la muestra.
Se debe asegurar que estos aparezcan en la misma proporcién que en la poblacén.
Elinvestigador entrevista a todas las personas de cada categoria que pueda encontrar hasta
‘que haya lienado la cuota
Muestreo Accidental o Bola de Nieve
‘Se aprovecha o utiliza personas disponibles en un momento dado que se corresponda con
el propésito del estudio. De los tres tipos de muestreo no probabilistico resulta ef mas
deficiente
<€Cudl es el tamatio apropiado de la muestra?
Depende del paradigma o enfoque:
*Enfoque Cuantitativo Cualitativo
*Muestreo probabilistico 0 no probabilistico
(MSc. ng. ld Diguel Espinoza Tojorina
Pagina 13
aaaee? qeeee
«
«
e
e
Ls
«
«
©
«
€
©
e
e
e
S
:
s
:
«
«
ea
”
°
fst9msnen
tog UNIDAD IT
2 DISTRIBUCION DE FRECUENCIAS
2 2.4, INTRODUCCION
+
~~ Cuando el niimero de datos recolectados es pequetio, no hay ningdin problema para hallar
~~ una informacién representativa 0 para tener una idea significativa det grupo, en cambio
~~ cuando ta informacidn es muy grande, es necesarlo distribulr esta informacién en cases o
~~ categorias y determinar el nimero de datos que pertenecen a cada clase, nimero que
> constituye la frecuencia de la clase.
» Un cuadro de distribucién de frecuencias es una tabla en la cual, se agrupan en clases fos
» valores posibles de una variable y se registra el nimero de valores observados que
» corresponden a cada clase.
>
> Los datos organizados en un cuadro de frecuencia se denominan datos agrupados, por el
, contrario, para los datos no agrupados, se enumeran todos los valores observados en
» una variable aleatoria. :
>
» Distribucin de. frecuencias: Agrupamiento de datos en categorias mutuamente
» | excluyentes, que indican el ntmero,de observacianes en [Link], i
° eee SS Ane loge DES sends a cafege site
» 2.2. DISTRIBUCION DE FRECUENCIAS RELATIVAS
.
> Puede resultar conveniente convertir las frecuencias de clase en frecuencias de clase
° relativas para mostrar el porcentaje de! numero total de observaciones en cada clase.
®
Para convertir una distribucién de frecuencias en una distribucidn de frecuencias relativa,
cada frecuencia de clase se divide entre el nimero total de observaciones.
+ Laorganizacién de datos mediante distribucién de frecuencias, utilizada para resumir
°
2
>
: los datos originales y facilitar su comprensién, tiene como principal ventaja el
> obtener una imagen visual répida de la forma de la distribucién, sin realizar célculos
2 adicionales, es decir, se puede ver dénde se concentran los datos, y determinar si
> hay valores extremadamente grandes 0 sumamente pequefios.
>
>
>
>
>
>
a eR ACRE NS A RENT
Pagina 14
(MS Ing Jord Miguel Eplnozs Teferna|
Space rteaa AAOTTD EAC tei,
——_£sta0rsneas
sin embargo, existen dos desventajas de utilizar tales formas de
€ on
se plerde la Wdentidad exacta de cada valor, y (2) na se sabe bien ety
Jos valores dentro de cada clase.
Ejemplo:
En la tabla siguiente se tienen los tiempos de horas de vuelo que requieren 39
ganizacién: (1)
10 5¢ distribuyen
Oficiales de la FAB, para poder obtener el brevete como Aviador Militar,
Supsngase que se desea organizar estos datos en 5 clases de tamafios iguales.
Construir una tabla de distribucidn de frecuencias.
Tiempo que requieren 30 oficiales dela FAB
10 14 15 3 7.
16 12 14 i 13
15, 18 9 14 14
9 15 Fry 13 i
10 10, 37 16 32
i 16 2 14 15
2.3. PASOS PARA LA CONSTRUCCION DE UN CUADRO DE FRECUENCIAS
Para elaborar una distribucién de frecuencias es necesario seguir una serie de pasos. EL
primero de ellos es anotar los datos en una tabla que muestre las clases (categorias) y el
niimero de observaciones en cada categoria. EI objetivo final es obtener una tabla que
muestre a simple vista la forma de los datos.
PASO 1: Ordenar los datos (Organizar la tabla anterior)
Se debe organizar los datos en el orden magnitud creciente o decreciente, por comodidad
uno organiza los datos de menor a mayor
Tiempo que requieren 30 oficiales de la FAB
9 Fry 13 14 16
9 a 13 14 16
10 a 13 15, 16
10 12 4 15, 17
10 12 14 15 17
11 2 14 35 18
ST
MS ng, oud Miguel Eplnoze Tejera Pagina 15
evrereer
Bee ee kk OOOO Oe CSREES
|bbddcscddddddddes
y
eee dds
vue
PASO 2: Rango o Amplitud(R)
ves extremos del conjunto de datos
Rango® Vous Vial
Es la diferencia de tos
R= i-9
Reo
PASO 3: Determinar ef mimero de clases (K)
El objetivo es usar suficientes grupos, 0 clases, que Indiquen la forma de ta distribucién.
Aqui se necesita algin criterlo, Demasiadas clases 0 muy pocas pueden no revelar la forma
basica del conjunto de datos.
La forma de cémo agrupar los datos muchas veces depende del objeto de estudio para el
cual se realiza el anilisis de los datos, con lo cual, no hay una Unica manera de presentar
los datos en intervalos de clase.
‘Sin embargo, si a priori no se sabe cémo agrupatlos, existe una técnica que sirve para
determinar la forma en que podriamos presentar dichos datos de manera agrupada (o en
dlases),
Dicha técnica es la siguiente:
‘+ El primer paso consiste en determinar fa cantidad de intervalos (k). Por lo general
se utiizan 2 formas, que dependen del tamafio de la muestra, es decir, de n.
Sin < 100, entonces
= 1433" login)
Sin> 100, entonces
kad
(Como dichas formas no garantizan un n° entero, se recomienda utilizar el redondeo
estadistico). En nuestro ejemplo ya nos indica el mimero de clases que es igual a
5 clases.
Pagina 16ESTADISTICAL
PASO 4: Determinar el interyalo 0 amplitud(C)
* _Etintervato de clases indica el rango de los valores incluidos dentro de una dase y
‘Puede ser determinado restando el mite Superior de la clase del limite Inferior
Generalmente et intervalo o amplitud de clases debe ser el mismo para todas ellas. Todas
Tas clases juntas deben cubrir por lo menas la distancia que hay desde el menor hasta el
mayor valor que Se tiene en los daros sin procesar,
2 formula que puede utiizarse para determinar el Intervalo de Clases aproximado es:
R
k
PASO 5: Establecer los limites de cada clase
Es necesario establecer los limites de clase claros de manera que cada observacién
ertenezca a solo una clase. Esto significa
Sobrepongan 0 que no sean claros,
cifras,
que se deben evitar los limites de clase que se
Por ejemplo, estableciendo una forma de redondear
2) Limites Nominales inferior o superior
Indican los valores incluidos dentro de la clase. Ademas siempre debemos ‘aseguramos que
cada elemento quede solo en una clase siempre que sea
posible haremos que las clases
tengan fa misma longitud,
€s decir haremos que abarquen intervalos iguales,
Unites wominaies | ton
Ue ba
19-10), m
[11 - 12) vil
[13 = 14) vil
[15 - 16) Vil
(07 - 18) ul
MSc. ng ond MigulEspinote Teron
Pégina 17ESTADISHIEAL
b) Limites Reales 0 fronteras de clase
1 los puntos especificos de la escola de medicidn, que sirven para separar clases
‘adyacentes cuando se trata de variables continuas, Los limites reales de cada clase
pueden determinarse, identificarse los puntos que estin tos puntos que estén a fa mitad
entre los limites superior e inferlor, respectivamente de las clases adyacentes.
Para determinar los timites reales se suma el valor de 0,5 al limite superior de ta clase y
el mismo valor le restamos al limite inferior de la clase,
Siguiendo con nuestro ejemplo.
Umites Reales
bee ba
18,5 - 10,5/
[10,5 = 12,5]
[22,5 - 14,5)
[14,5 - 16,5[
(26,5 - 18,5, *
PASO 6: Marca de Clase 0 Punto Medio (X\)
También conocido-como marcas de clase, se localiza a la mitad entre los limites inferiores.
de dos clases consecutivas. Se puede calcular sumando el limite inferior de la clase al limite
superior de la misma, y dividiendo el resultado entre 2.
Lm Lie 85+ 10,5
ee aes
OO0 886 66 664 bbb Hobe EESSES+EébbEbLCD
- 2 2
= Umites
2 Lmites Nominales | conteg| ‘wenle |Marca de Close
» eb ee
2 [2 - 10) im _| [5 - 10,51 95
» [11 - 12) vin_| (40,5 - 12,5[| 11,5
2 (a3 - 14) vin |f12,5 - 14 s{| 13,5
= (15 - 16) vi_| (145 - 16,51) 15,5
” figcaey Nes agai 73
2 aR RUS TBS DT TT IRS
Pagina 18
Tere
2
2
»
a«) Frecuencia Absoluta (1.)
| frecuencia absoluta de ta dase f, es el nimero de observaciones del conjunto original
de datos.
ESTADISTICA
Miner Nominaes | conten | mites Reoles| marco de | Frecuencle Absoluta
Us ba tie bas Close he
= Xi
(9 = 19) a | 05 - 10,51 35 a
[4 = 12) ww | i905 -125¢[ 145 £
[13-147 ww | 1125-145 [135 8
115-36) wi [145 - 165) | 155 z
37 - 18) m_| 65-185; [17.5 a
| N= Ee =30
+) Frecuencia Relativa (1,)
Frecuencia relativa (7,)es la proporcién que representa la frecuencia absoluta en relacién
con el total.
Son erneee cogs, | hme meskes | laces oc Frecuencia | Frecuencia Absolute
Ue bs ole tt Clase Absoluta t
x fe
[9 - 10) m 185 - 10.51 35 4 O33
[21 = 12) vn | yos- i257 | 145 @ 0.266
[13 - 14) wm | 25-145; [135 a 0,266
[15 ~ 16) vi 14s - 165; | _ 155 7 0233
[17 - 18) im 1165 -1asp | 175 3 010
N=it=30 1 =0,988
"Nota: Es importante tomar por To manos 3 alfa Higa despuds dela coma decimal
9 Frecuencia Relativa porcentual(1.)
Frecuencia relativa porcentual (.)
relativa,
esta se convierte en porcentaje,
es aquella
ue al multiplicar por 100 a la frecuencia
PEPLRRRARARAREENEETS?
POOOROREES- Feraowniens
ei maven de | trecuencin | trecuencta
wmotes | canteo | Hater Reales |” Cinte | “abvonna | manent
ears etal ” te t
Freewencha Nelation
Porcentual
tw
wot | im | fas 10.5 - a
way | wn | pos sas | ne a aie
arg |v | as sys | ee 0 0.266
uss wn | pas 15 | thd 7 a
acta || jas as | a2 1 a0
Hf, 0,08
a8
66666666 6b456b5
PASO 8: Frecuencias Acumuladas Absolutas, Relativas y Porcentual
Frecvencias absolutas acumulada: para poder calcular este tipo de frecuencias hay que
tener en cuenta que la varlable estadistica ha de ser cuantitativa o cualitativa ordenable,
sée6
En otro caso no tiene mucho sentido el cdlculo de esta frecuencia. La frecuencia absoluta
acumutada de un valor de la variable, es el niimero de veces que ha aparecido en la muestra
lun valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular,
en la tabla estadistica) en orden ascendente (fat) o descendente (fal).
Una distribucién de frecuencias acumuladas, identifica el nimero de observaciones
acumuladas incluidas bajo el limite exacto superior de cada clase de a distribucién. Puede
determinarse la frecuencia acumulada para una clase, agregando la frecuencia observada
ara dicha clase a la frecuencia acumulada a la clase precedente.
Frecuencia | Frecuencia | Frecuencia | Freeuencla | Frecuencia Absoluta ‘Frecuencia
Absoluta | Relative Relativa Absoluta fe Relativa
f Porcentual fe Porcentual
to ts
W6éees+ey‘'y?‘VPyregmerfreree.°rT.,.
Voooeoe drove EESEEEEd
O33 33 4
0266 266 [ave 0133-0,266 | 13,34 26,6
0266 26,6 |12+8 = 20 _[0,39900,266 = 0,665 | 39,9 +26,6>66,5
0233 23,3 [2007 = 27 [006510233 =0,898 [66,5423 -89,8
0,10 7 2743 = 30 | 0,89800,10 = 0,998 |89,80 10 >93,8
=0,908 sae
Tat
L} a
wevves
Pagina 20Cuando se construyen cuadros de distribucién de frecuendias, principalmente para
Sondensar grandes cantidades de datos y de exhibirlos de manera fécil, suele ser
Sconsejable, presentarlos en forma gréfica y estos son:
@) Histograma
‘Se utitza para representar una tabla de frecuencias de intervalos de clase.
Sobre el eje horizontal se representan los Limites Reales y sobre ef eje vertical, fas
frecuencias de los intervalos.
El gréfico consiste en un conjunto de recténgulos adyacentes cuya base representa un
intervalo de clase y cuya altura representa la frecuencia del intervalo,
—
_— f
TEMPO DE ESPERA DEL CLIENTE
ediciones de madis hors por un a
4) Poligono de frecuencia
Se construye uniendo los puntos medios de los la
rectangulo. Si se quiere cerrar el recténgulo,
otro posterior al Ultimo y se prolonga el pol
intervalos, hasta formar una figura de varios
dos opuestos de las bases de cada
se agregan dos intervalos: uno anterior y
ligono hasta los puntos medios de estos
Frecuencia Absoluta
eee
MSc. ng Jo Miguel epnossTeorine Pégina 21bbb boobed,
¢) Ojiva
i Es una gréfica de distribucién de frecuencias acumuuladas se denomina OJIVA. Para
= distribucién de frecuencias acumuladas del tipo menor que esta grafica indica la
»> frecuencia acumulada debajo de cada limite exacto de cada clase de la distribucién
> de frecuencias.
2 Cuando dicha grafica de linea esta suavizada, Se denomina ojiva.
> Para el eje de las X se toma los limites reales y para el eje de las Y se toma la
» frecuencia absoluta acumulada,
> 12
> 1
2
» os
:
* od
»
» a2
»
ad
2
a
D>
»
n ; a
=
2
2
DSESTADISTICAL
2.4, CURVAS DE FRECUENCIAS
Una curva de frecuencias es un poligono de frecuencia
2.4.1. Tipos de Curvas de una Distribucién de Frecuencias
2.5. OTRAS REPRESENTACIONES GRAFICAS
Las representaciones graficas anteriores
Poseen un fuerte atractivo visual. Es decir, estén
disefiados para captar la atencién del le
ctor. Pero existen también otras representaciones,
Entre las més utilizadas se encuentran la graf
ca de barras, la grafica circular y la gréfica
de lineas;
tas cuales suelen aparecer en publicaciones de periddicos o revistas, Las
2.5.1. Grafica de Barras
Es especialmente itil para mostrar cual
de intervalo o de raz6n (0 cociente). As
manera vertical u horizontal,
barras existen espacios entre
nominal,
Quiera de los niveles de medicién: nominal, ordinal,
simismo, la gréfica de barras puede realizarse de
Una diferencia con los histogramas es que en los Graficos de
las barras debido a que los datos se miden en la escala
MSc. ng oud Miguel Espincza Torin
Pagina 23
PAPHHHMEH AEE HE SEG AAAAARERKERAAT HS,’
>
,
>
2
»
»
,
>
>
>
,
>
>
>
»
>
>
>
»
>
>
>
>
>
>
»
>
>
>
.
.
2
>
>
.
°
2
°
2
2
>
a
a
a
a
ae
fstab nen
Gration do Darran compuosto: Remwuneracionas medias (ato 7)
necta
«G485ET
2.5.2. Grafica Circular
Es especialmente util para mostrar los datos del nivel nominal. Para elaborarlo es nececario
™arcar los porcentajes de manera uniforme sobre un citculo. Se trazan lineas desde ef
centro del circulo y se divide este en sectores. El drea, sector 0 “rebanada” obtenida
representan los porcentajes.
2.5.3. Grafica Lineal
‘Son especialmente efectivas en los negocios porque se puede mostrar el cambio en una
variable a través del ti
mpo. Con frecuencia, en la misma gréfica de lineas se representan
1800
41600 |
4400
1200 —
1000
‘200
‘600
400
200
dos 0 més series de cifras. Por tanto, una gr
fica puede mostrar la tendencia de varias
series, lo cual permite su comparacién répida en un periods o intervalo de tiempo.
:
sc, ng Jord Miguel Espnore Terie Pagina 24ESTADISTICAT
UNIDAD IIT
MEDIDAS DE TENDENGIA CENTRAL Y DE POsIcion
3.4, INTRODUCCION
En el capitulo anterior se estudié la manera de como agrupar,
simple y abrevieda un conjunto de datos abtenidos por medio
estos datos tabulados se los presento mediante graficos, en
deseripeiones fundamentales de la variable y de su distriby
tendencia central y los métodos para encontrarlas.
1 Calcular y analizar en forma
de una investigacion, Ademas,
este tema, encontraremos otras
ucIGN Como ser: las medidas de
3.2. DEFINICION
Una medida de tendencia central o de posicién, debe su nombre al hecho de que sus valores
re el menor y el mayor valor de un
Conjunto de datos, es decir brindan de alguna manera info
distribucién,
tienden a ocupar posiciones centrales o intermedias ent
entre las mas importantes y las més utilizadas son:
La Media Aritmética,
la Mediana, la Moda, la Media Geométrica, la Media Arménica, y ta
Media Cuadratica,
3,3. MEDIA ARITMETICA
E la medida de tendencia central més conocida, de mayor uso y facil de calcular, suele
Namarse simplemente Media y es igual a la suma de los valores observados dividida por el
numero total de observaciones,
3.3.1. Media Aritmética para datos no agrupados
Sea el siguiente conjunto de datos x1, x2; Xs,
Xa
[MEAD + x34 xn
ie Nn
H Poblacién
Fenn ee 5
{MS Jud ig apo Torn arent
SOCORRO SHOHRKRORKRARRARARHRAREREASBEBAABSZAAAAAAa-.«er Ee ee ee Ne ete
FATADIERIER
* Muestra +
Ejemplo:
En una casa comercial de venta de artefactos electrodomésticos, se verde fos primeros 5
ins del mes de mayo los siguientes montos:
Miércoles
Jueves
Viernes
31
4.567+9.203 +20.708+4.053418.300
w
= 11.1462 Bs/dia
3.3.2. Media Aritmética Ponderada
La media aritmética ponderada es una media aritmética, en fa cual se considera a cada uno
de los valores de acuerdo con su importancia en el grupo. Las férmulas para encontrar la
media aritmética ponderada, tanto para una poblacién como para una muestra, son
exactamente las mismas.
+++ Xai los valores observados
Sea el siguiente conjunto de datos x1, X2, Xs.
Sea el siguiente conjunto de datos P1, P2, Ps, P,: factores de ponderacién (pesos)
Pix + Pxy + By tee t Py
B+P, +P, +....P,
(MSc. ng ore Miquel Espinoza Tejrina Pagina 26_ESTADISTICA |
Las cakficactones en una clase de lenguaje tienen cuatro componentes, con los pesos
indicados: tectura (25 %), lectura comprensiva (45 %), ortografia (20 %) y elaboraciin de
trabajo (10%). Si un alumna fue calificado respectivamente con un: 6, 5, 7 y 9. Cul seré
‘su nota media? Halla su nota media si todos los componentes tuvieran el mismo peso.
éCémo conseguiria sacar mayor nota?
100
3.3.3. Media Aritmética para datos agrupados
En una distribucién de frecuencia la media aritmética es igual al cociente de la
sumatoria del producto de cada marca de clase por sus respectivas frecuencias
absolutas, dividido entre el numero total de observaciones.
marca de clase
Sea el siguiente conjunto de datos X1y Xay Xs,
frecuencia absoluta
Sea el siguiente conjunto de datos fr, far fay
[Poblacién w=
> Muestra
J ae tg Dud gue! taper Tefre Pagina 27»
»
~~» ESTADISTICAL
a as ae
* Ejemplo:
2
2 Hallar la media aritmética de la siguiente tabla de frecuencia
a
>
: tate tenn | wnras [mmese] pas y
be ba Clase Absoluta 7
2 co t
> [8,5 - 10,5] 95 4 38
> [10,5 - 12,5[ 14,5 8 92h
> (12,5 - 14,5, 13,5 8 108
[245 - 165/ 15,5 7
> 65 - 13, 5/ 175 3 52,5 _|
> N=30
>
>
>
, > 2 = 133
» 30 ¥
Ventajas y desventajas de Ia Media Aritmética
. Entre las ventajas y las desventajas de la Media Aritmética tenemos:
. ~ [Link] concepto ampliamente conocido y empleado en todas las actividades,
Es un valor fécilmente calculable por simple suma o divisién entre sus datos
observados,
,
Es un valor Gnico, es decir que un conjunto de datos posee solo una media
aritmética,
% Es muy sensible a los valores extremos
* El cdlculo de la media aritmética de una dlasificacién de datos, solo es una
aproximacién del valor que se obtenda, respect al célcuo si los datos no estaban
clasificados
* No se puede caicular la Media Aritmética de una dlasificacién de datos abierta, por
elem, cuando el primer intervalo no posee extreme inferior o el utimo intervalo
no pose extremo superior
Pogina 2nESTADISTICA
3.4, MEDIANA (A/, )
Es otra medida de tendencia central que se utiliza con mucha frecuencia es la median, que
es el valor situado al centro de un. Conjunto de observaciones ordenadas por magnitud
reciente o decreciente, ademés la mediana es una medida promedio, que divide al ‘conjunto
de observaciones en dos partes iguales, 50% para un lado y 50% al otro fado.
3.4.1. Mediana para datos no agrupados
En un Conjunto de datos no agrupados la mediana se calcula de la siguiente manera.
2) Cuando el niimero de datos en impar
Inicialmente se debe ordenar los datos,
en el orden de magnitud creciente o
decreciente,
Para luego determinar la mediana utilizando la siguiente formula
x
= Xena
Ejemplo:
@Dadbo el conjunto de datos hallar la mediana?
Pe EASE Tae Qi a ekg
ler Paso: ordenar
Sees a eS
ee,
Be ae Me te AES
Me= Xoo > D> Mn=4
») Cuando el niimero de datos en par
Inicialmente se debe ordenar los datos,
decreciente, para luego calcular la Median
105 dos valores del conjunto de datos,
Ejemplo:
éDado el conjunto de datos hallar la mediana?
2 5 7 6 4
Jer Paso: ordenar
Peed Be giitg Vig c,
xX % MM Ke ing agg
en el orden de magnitud creciente o
'a, la mediana es la media aritmética de
aT ine ey
(MSc. ng. 3004 Miguel Espinoza Tejerine
Pogina 29
PAAAOOnese
99998
°1, Mediana para datos agrupados
fos agrupades se suele utilizar ef método de
distribucién de frecuencias
Para encontfar Ta” mediana ae
interpolacién, que exige la construccién de una tabla dk
acumuladas absolutas.
4
2
»
>
>
.
2 En primer lugar, se localiza la clase que con
>
°
.
>
>
)
)
iene el valor de ta mediana, para después
determinar la posicién de la mediana dentro dela clase, mediante interpolacién. La clase
que contiene la mediana, es la dase cuyo frecuencia acumulada absoluta sea
inmediatamente superior al valor de la mitad del total de abservaciones, una vez que $e
identifica a esta clase, utilizando ta siguiente
formula:
se determina el valor de la mediana
ane ye
5 Fac
2
5 7
Me
te inferior del intervalo de fa clase
Foc Es la frecuencia acumulada absoluta que precede (antes) ala clase que contiene 18
mediana
C: intervato de fa clase.
fa: Frecuencia absoluta del intervalo de la clase
Pdgina 30
igual Espinoza TeerLimites Nominoles
us bn
$3,5{
5 43,5
[43,5 = 54,5
(54,5 - 65,51
[65,5 - 7651 _|
[76,5 - 87,5
Me =
er Paso: Localizamos la clase que contiene la Mediana
42
«2-2
Faery
f= 15 Me= 54s E117},
Ventajas y desventajas de la Mediana
I ==> Me=57,43
7 La mediana es facil de comprender y puede ser rapidamente calculada a pattir de
cualquier tipo de datos
¥ La mediana esta afectada por el nimero de observaciones y no por la magnitud de
‘cualquier valor extremo
Y Se puede calcular la mediana inclusive de datos de una variable cualitativa ordinal
* Para calcular la mediana antes se debe ordenar los datos,
‘cuando el ntimero de datos es alto,
€s fécil comprender que
esto significara un gran consumo de tiempo
NN
‘MSc. ne Sou Miguel Espinozs Tjorne Pagina 31ESTADISTICA!
x _Qertos proceeimientos estadisticns que usan la mediana, son mis complejos que
con ke media,
x La mediana no es adecuada para manipulacione:
3.8, MODAN)
algebraicas posteriores
Es otra medikta de tendencia central es la moda o modo y es el valor que ocurre con mas
‘alta frecuencia en un conainto de observaciones. En algunos conjuntos de datos, la moda
puede no exist, ono ser Unica en otros casos,
3.5.1, Moda para datos no agrupados
Esta dado por el valor mas repetido en el conjunto de observaciones.
Bjemplo
Hallar fa moda del siguiente conjunto de datos.
ae Se Ml a et A OS OR eo 2 oe
My=2
3.5.2. Moda para datos agrupados
Para datos agrupados en una distribucién de frecuencias con intervalos de clases iguales,
la moda se obtiene mediante el método de interpolacién, que esta dada por la siguiente
formula.
\
\
Dende:
1.,:Es el limite inferior det intervato de ta clase
‘dy Diferencia entre ta far de la clase modal y la_fi: de ta clase precedente (anterior)
ds Diferencia entre la_fu de ta clase modal y la fi! de ta clase siguiente
C: intervalo de ta clase.
Sc, tg tout Miguel Espnoze TeleingESTADISTICAL
Ejempio
Dado la tabla de frecuencias hallar la Moda?
Frecuencia
Lmites Nominales Marca de | Frecuencia | Absoluta
be ba Clase | Absoluta | Acumulada
Mi fo Fa
[24,5 32,5) 27 4 4
(32,5 - 43,5, 38 4 8
(43,5 - 54,5, 49 9 17
(54,5 - 65,51 60 15 32
(65,5 - 76,5, 74 5 37
(76,5 - 87,5[ 82 5 42
Ne42
Mo= L,+ a
eG)
Jer Paso: Localizamos la clase que contiene la Moda
Datos:
Losas
q=6 i
d, =10
Cnat Mo= 545 +(e Mo ~58,62
3.6. RELACION ENTRE LA MEDIA, MEDIANA Y MODA }
En el caso de distribuciones unimodales, la mediana esta con frecuencia comprendida entre
la media y la moda (incluso més cerca de la media).
En distribuciones que presentan cierta inclinacién,
es mas aconsejable el uso de la mediana,
Sin embargo,
en estudios relacionados con propésitos estadisticos y de inferencia suele ser
inds apta fa media,
LY
fina 33
(MSc. Ing. Joué Miguel Espinoze Tejerine: Pagi°
°
°
°
>
>
>
>
>
)
)
)
)
)
,
)
,
}
)
;
)
E
hides se ESTADISTICAL
Cuando una distribucién de frecuencia es simétrica, ta media, mediana y moda coinciden en
Su vator (X= Me = Mo), En el caso de una distribucién binomial sinétrica, es necesario
calcular et promedio de las mod
En una distribucidn sesgada a fa izquierda, la moda ¢s menor a ta mediana, y esta a su vez
menor que la media (X < Mo < Me)
En una distribucién sesgada a la derecha la relacién se invierte, fa moda es mayor a la
‘mediana, y esta a su vez mayor que la media (Mo
>
: suele utilizar cuando el simbolo d
absoluto del elemento. Por ejemplo, para calcular la media de errores de medida.
La media cuadritica de un conjunto de observaciones: x1, 12, [Link]-- Xn es fa raiz
cuadrada de la Ma de los cuadrados de las observaciones.
3.8. FRACTILES
Los fractiles son medidas que nos permiten dividir el conjunto de observaciones en partes
iguales, los fractiles mas utilizados son:
3.8.1. Los Cuartiles (0, )
Divide el conjunto de observaciones en 4 partes iguales. Q1, Q2 y Q3 determinan los
valores correspondientes al 25%, al 50% y al 75% de los datos
nn 2 Rn A RRR
: Pagina 36ESTADISTICAL
a) Los Cuartiles para datos no agrupados
b) Los Cuartiles para datos agrupados
! aee
fa
3.8.2, Los Deciles (D, )
Divide el conjunto de observaciones en 10 partes iguales. Los deciles dan los valores
correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.
a) Los Deciles para datos no agrupados
p= e,t
‘ 10 "2.
b) Los Deciles para datos agrupados
3.8.3. Los Percentiles (7)
Divide el conjunto de observaciones en 100 partes iguales. Los percentiles dan los valores
correspondientes al 1%, al 2%... y al 99% de los datos. PSO coincide con la mediana,
a) Los Percentiles para datos no agrupados
itn
naa 10 +4
b) Los Percentiles para datos agrupados
100)
fa
(-sarrc
Pot, +10
Me. ag Jd gue Eapnone Teer —
Pagina 37
TRSeegqaagagqaeaes
=
e
co
e
;
eTNTTTS
rerrrr?Ejemplo
1, Segdin el siguiente Cuadro de Distribucidn de Frecuencia,
a) La Media Aritmética
b) La Mediana
©) La Moda
d) Termino de Asimetria
e) Cuartil 3
f) Decil 8
9) Percentil 85
630 > F 2 15375
80
b) La Mediana
er Paso: Localizamos la clase que contiene ta Mediana
as a 345 25 Me=7545
Il
(MSc. ng. José Miguel Espinoze
ESTADISTICA |ESTADISTICAL
——____tstaoisnica
Ree NCL: Septet aie et
c) La Moda
/
Mo= 1b, +(e
aed,
‘Aer Paso: Localizamos la clase que contiene la Moda
Datos:
Ne sas
d= 2-12 =9
d, = 21-6 =15
=5
9
Mo =74,54(—2_)+
‘ Syp"s Mo
76,37
d) El término de Asimetria
x
.
°
°
>
°
°
°
>
>
°
.
>
.
>
,
,
»
,
J
»
>
»
>
>
>
>»
>
)
>
>
)
)
»
)
»
>
»
»
>
>
»
>
ESTADISTICA|
Ejempto
Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviacién media de estos
valores,
OM=1,8
4.3.1, Desviacién Media para datos agrupados
Para datos agrupados,
en cuadro de distribucién de frecuencias la Desviat
calcula utilizando la siguiente formulas:
Sea el siguiente conjunto de datos x1, x2, Xs). Xu: Marca de clase
Sea el siguiente conjunto de datos f., fa, fay fy: frecuencia absoluta
Deviacién Media Muestral y Poblacional
pu, = Saal 24.
Avi gy Zest
4 n NS e NRE
4.4, La Varianza
La Varianza es la principal medida de dispersién,
¢s la mas precisa y de mayor uso,
més amplio es en la estadistica inferencial.
SU uso
Esta medida se obtiene calculando la media aritmética de la ‘muestra, y luego realizando ta
sumatoria de las diferencias al cuadrado de todos los valores con respecto de la neces
Luego se divide por el numero de observaciones.
the
Pégina 424.4.1, Varianza para datos no agrupados
Sea ef sigulente conjunto de datos x1, Xa Xa
formula es la siguiente:
ates)
net
Xn: datos observados, su
Hee
Varianza Poblacional: 7? = Raalhony
4.4.1, Varianza para datos agrupados
Para datos agrupados, en cuadro de distribucién de frecuencias la Varianza se calcula
utilizando la siguiente formulas:
Sea el siguiente conjunto de datos x1, Xa, Xs,
Sea el siguiente conjunto de datos f1, fay fs.
ini Marca de clase
frecuencia absoluta
Ejemplo.
4.5. Desviacién Estandar (Desviacién Tipica)
La desviacién esténdar es la medida de dispersién més comin, que indica qué tan
dispersos estén los datos con respecto a la media. Mientras mayor sea la desviacién
estandar, mayor serd la dispersién de los datos.
El simbolo o (sigma) se utiliza frecuentemente para representar la desviaci6n estandar
de una poblacién, mientras que §se utiliza para representar la desviacin estandar de
una muestra. Son las raices cuadradas de la Varianza de una Poblacién o Muestra
respectivamente.
0 estan sesgados a la derecha;
‘si P = 0 estan distribuidos normalmente.
Para ef caso de los datos del ejemplo anterior se tiene:
_ 118.7-78.33) _ 9 03
P
12.14 Los datos estan un poco sesgados hacia la derecha.
5.1.1. Coeficiente de asimetria de Fisher
Otra estimacidn del sesgo o coeficiente de asimetria se hace a través de momentos
estadisticos (diferencias cohtra la media) como lo sugiere Fisher:
LTA AN LI
MSc. ng oud Miguel Eplnons Tajrine Pagina 49_ESTADISTICAL
My
Sesgo= 2, “ayrT
BO) Para la distribucién normal debe
ser 0.
trica si 7! °, asinétrica hacia la
Se puede considerar que una distribucién es sin
izquierda con ¥1<0 0 hacia la derecha YI> 0.
Por ejemplo:
be una distribucién con sesgo negativo 0 sesgada hacia la izquierda con Sesgo
ret Nee ON se
1.01
Ejemplo
De una distribucién conESTADISTICAI
5.2, CURTOSIS,
Ota caracteristica a medir de una curva de frecuencias es su perfil con respecto a la Curva
Normal. & la curva normal se llama Mesocurtica,
ala mas delgada Leptocurtica y la mas
achatada Platicurtica,
En la distribucién normal si no es acampanada Y es mas picuda o aplanada de lo normal se
dice que tiene una Curtosis diferente de cero que es lo normal, si es mayor es mas picuda
‘© més plana al revés,
Leptocurtica Mesocurtica Platicurtica
&2>0 g2=0 R<0
COEFICIENTE DE CURTOSIS
Mide ef grado de
abstabuciin de Arecueneia,
distabucion normal (que
thataniient dhe ke
Fespecto a Mt cura de
tiene eveticremte igual at
L soe ‘
la Gs ~ 89
mes
st
12 distribucién es mesocirtica (plana normal) si ¥2=0 leptocirtica si ¥2>0 mag
Puntiaguda que la normal o platicirtica (mas plana que la normal) con 72 <0,
(MSW. Jud Miquel Eaptncan Tejera
Pagina $1ee ee ee re aa ee es ERE ES Pees fee Sat ed ale Rest oe oe ee ee, ee
5.2.1, Coeficiente de Curtosis de Fisher
CAF evaltia la proximidad de los datos a su media x. Cuanto mayor sea la surna (xi
x)3, mayor serd la asimetria, Sea el conjunto X=(x1, x2,..., xN), entonces la férmula
de la asimetria de Fisher es:
siendo 7 la media y 8, la desviacidn tipica
Cuando los datos estén agrupados 0 agrupados en intervalos, la formula del coeficiente de
asimetria de Fisher se convierte en:
Siendo x, uno de los datos 0,
en datos agrupados en intervalos, la marca de clase,
¥ la media, ny la frecuencia absoluta de ¥, 0 de cada intervalo i
i S, la desviacién tipica
+ Si CAF
>
>
>
>
>
>
J
)
)
Giencias de la conducta (Editorial Trillas).
William Mendenhall; Robert J., Beaver; Barbara M Beaver. Introduccién a la
probabilidad y estadistica. Editorial Color S.A. México. 2004.
Diferentes publicaciones de Revistas Cientificas, Informes técnicos, Boletines y
. v
publicaciones varias erin consultadas en el transcurso de la materia segin el
tema.
ANEXOS
se, ng. José Miguel Expinoze Tejerina Pagina 54
También podría gustarte 01) Mendenhall, W., Scheaffer, R. L., Wakerly, D. D. (2006) - "¿Qué Es Estadística - " en Estadística Matemática Con Aplicaciones. México Grupo Editorial Iberoamérica, Pp. 1-14. PDF
Aún no hay calificaciones
01) Mendenhall, W., Scheaffer, R. L., Wakerly, D. D. (2006) - "¿Qué Es Estadística - " en Estadística Matemática Con Aplicaciones. México Grupo Editorial Iberoamérica, Pp. 1-14.
14 páginas
Cap 1 - Est PDF
Aún no hay calificaciones
Cap 1 - Est
16 páginas