Está en la página 1de 22

1

UNIVERSIDAD NACIONAL DE JULIACA

CARRERA:

GESTION PUBLICA Y DESARROLLO


SOCIAL

PROFESOR: JULIO GALLEGOS


ALUMNOS:

YESICA PACOMPIA MAMANI


JOSE CARLOS GUTIERREZ SANCHO

JULIACAPER
JUNIO 2016

DEDICATORIA:
A nuestras familias por su apoyo y por darnos la herencia ms noble: nuestra
educacin y el apoyo incondicional,
que desde la infancia nos forjaron y nos dieron una personalidad
y futuro con gran cambio, por ser el apoyo para la realizacin de nuestras
metas.

INTRODUCCIN

Las sociedades modernas son ricas en datos: la prensa escrita, la televisin y la radio,
Internet y las intranets de las organizaciones ofrecen cantidades inmensas de datos que
pueden ser procesados y analizados. Esto convierte a la estadstica en una ciencia
interesante y til puesto que proporciona estrategias y herramientas que permiten obtener
informacin a partir de dichos datos. Adems, gracias a la evolucin de la tecnologa
(ordenadores y software estadstico) hoy en da es posible automatizar gran parte de los
clculos matemticos asociados al uso de tcnicas estadsticas, lo que permite extender su
uso a un gran rango de profesionales en mbitos tan diversos como la biologa, las ciencias
empresariales, la sociologa o las ciencias de la informacin.
La prctica de la estadstica requiere aprender a obtener y explorar los datos tanto
numricamente como mediante grficos, a pensar sobre el contexto de los datos y el
diseo del estudio que los ha generado, a considerar la posible influencia de observaciones
anmalas en los resultados obtenidos, a discutir la legitimidad de los supuestos requeridos
por cada tcnica y, finalmente, a validar la fiabilidad de las conclusiones derivadas del
anlisis. La estadstica requiere tanto de conocimientos sobre los conceptos y tcnicas
empleados como de la suficiente capacidad crtica que permita evaluar la conveniencia de
usar unas u otras tcnicas segn el tipo de datos disponible y el tipo de informacin que se
desea obtener.

INDICE:
CAPTULO I: MEDIA ARITMETICA..5
CAPTULO II: MEDIA PONDERADA8
CAPTULO III: MEDIANA...8
CAPITULO IV: MODA.9
CAPITULO V: MEDIA GEOMETRICA, CUADRATICA Y ARMONICA9
CAPITULO VI: CUARTILES, DECILES Y PERCENTILES .9
CAPITULO VII: VARIANZA11
CAPITULO VIII: RANGO INTERCUARTILICO.11
CAPITULO IX: COEFICIENTE DE VARIACION12
DESVIACION ESTANDAR13
DISTRIBUCIONES BIDIMENSIONALES14
VARIABLES15
GRAFICOS VARIABLE CUANTITATIVO..16
GRAFICOS VARIABLE CUALITATIVOS...17
TABLA ESTADISTICA..19
Bibliografa...22

CAPTULO I: MEDIA ARITMETICA

Media (mean): la media (tambin conocida por valor promedio o valor esperado) de un
conjunto de observaciones muestrales se representa con el smbolo x. Intuitivamente, la
media simboliza el centro de masas o punto de equilibrio central del conjunto de
datos considerado. El par-metro asociado, la media poblacional, se representa por .
Para calcular la media de un conjunto de datos se usa la siguiente expresin:
x x ... x
1

n xi
i1

Ejemplo: la media de los cinco datos siguientes {6, 3, 8, 6, 4} es


2
63864
7
x

5,4
5
5
(Alicia Vila, ngel A. Juan; pag.18) (A. Vila)

CONCEPTO (PROPOSITO)
La media aritmtica es una medida de tendencia central: Casi siempre, cuando nos
referimos al promedio de algo, estamos hablando de la media aritmtica. Es el valor
resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el nmero
total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.

FORMULA
Para escribir las frmulas correspondientes a estas dos medias, combinamos los smbolos
matemticos y los pasos que utilizamos para determinar la media aritmtica. Si se suman
los valores de las observaciones y esta suma se divide entre el nmero de observaciones,
obtendremos:

(Levin y Rubin, 2004 p.60-61)

Ventajas y desventajas de la media aritmtica


La media aritmtica, como un solo nmero que representa a un conjunto de datos completo,
tiene importantes ventajas. Primero, se trata de un concepto familiar para la mayora de las
personas y es intuitivamente claro. Segundo, cada conjunto de datos tiene una media; es
una medida que puede calcularse y es nica debido a que cada conjunto de datos posee una
y slo una media. Por ltimo, la media es til para llevar a cabo procedimientos estadsticos
como la comparacin de medias de varios conjuntos de datos (procedimiento que se
estudiar en el captulo 9). Sin embargo, como cualquier medida estadstica, la media
aritmtica tiene desventajas que debemos conocer. Primero, aunque la media es confiable
en cuanto a que toma en cuenta todos los valores del conjunto de datos, puede verse
afectada por valores extremos que no son representativos del resto de los datos. Observe
que si los siete miembros de un equipo de atletismo tienen las marcas de tiempo que se
muestran en la tabla 3-6 para cierta carrera, el tiempo medio es:

Sin embargo, si calculamos el tiempo medio para los primeros seis corredores y excluimos
el valor de 9.0 minutos, la respuesta aproximada es 4.7 minutos. El valor extremo 9.0
distorsiona el valor que obtenemos para la media. Sera ms representativo calcular la
media sin incluir el valor extremo. Un segundo problema con la media es el mismo que
encontramos con los 600 saldos de cuentas de cheques. Resulta tedioso calcular la media
debido a que utilizamos cada uno de los datos en nuestro clculo (a menos, desde luego,
que usemos el mtodo corto que consiste en utilizar datos agrupados para determinar la
media aproximada). La tercera desventaja es que somos incapaces de calcular la media para
un conjunto de datos que tiene clases de extremo abierto en la parte inferior o superior de la
escala. Suponga que los datos de la tabla 3-6 se clasifican en la distribucin de frecuencias
de la tabla 3-7. No podemos calcular un valor para la media de estos datos debido a la clase
de extremo abierto 5.4 o ms. No tenemos forma de saber si el valor de la observacin de
esta clase es 5.4, cercano a 5.4 o mucho mayor que 5.4. (Levin and Rubin, 2004 pag.65)

CAPTULO II: MEDIA PONDERADA

La media ponderada nos permite calcular un promedio que toma en cuenta la importancia
de cada valor con respecto al total. Considere, por ejemplo, la compaa cuyos datos
presentamos en la tabla 3-8; sta utiliza tres niveles de trabajo no calificado,
semicalificado y calificado para la produccin de dos de sus productos finales. La
compaa desea saber el promedio del costo de trabajo por hora para cada uno de los
productos. (Levin and Rubin, 2004 pag.69)

CAPTULO III: MEDIANA


Mediana (median): la mediana de un conjunto de observaciones muestrales suele
representarse con el smbolo x. En el caso de una poblacin, el parmetro mediana se
denota con M. Una vez se ordenan todos los datos de menor a mayor, la mediana es aquel
valor que deja a su izquierda la mitad de las observaciones (es decir, es aquel valor tal que
el nmero de observaciones ms pequeas que l coincide con el nmero de observaciones
mayores que l). Los pasos para calcular la mediana son: (1) ordenar los da-tos de menor a
mayor, (2) calcular la posicin i que ocupa la mediana en el conjunto ordenado de datos, i =
n+1/2 (3) seleccionar la observacin x (la que ocupa la posicin determinada en el paso
anterior). Cabe observar que si el nmero de datos n es impar (p. ej.: n = 6), la posicin i
ser un nmero no entero (p. ej.: i = 3,5), en cuyo caso la mediana vendr dada por el
promedio de los dos valores que ocupan las posiciones enteras ms cercanas a i (en este
caso por el promedio de los valores que ocupan las posiciones 3 y 4).
Ejemplo: dado el conjunto de ocho datos {5, 11, 7, 8, 10, 9, 6, 9}, lo prime-ro es
ordenarlos de menor a mayor, con lo que se obtiene la serie {5, 6, 7, 8, 9, 9, 10, 11}; ahora,
la posicin de la mediana vendr dada por i = 8 + 1 / 2 = 4,5 , es decir, la mediana estar
entre los valores que ocupan las 2 posiciones 4 y 5, por lo que se calcula el promedio de
ambos para dar el valor de la mediana, es decir: x = 8 + 9 / 2 = 8,5.2
Es importante destacar que la media es muy sensible a la existencia de va-lores extremos
(outliers), es decir, la inclusin o no de un valor que est muy alejado del resto de los datos

puede cambiar considerablemente el valor resultante de la media. Por el contrario, la


mediana se ve mucho menos afectada por la presencia de dichos valores, lo que significa
que la mediana es un centro ms estable que la media en el sentido de que se ve menos
afectado por la presencia de valores extremos en los datos.

CAPITULO IV: MODA


la moda de un conjunto de datos es el valor que ms veces se repite (el de mayor
frecuencia).
Ejemplo: la moda de la serie de datos {6, 3, 4, 8, 9, 6, 6, 3, 4} es 6, puesto que es el valor
que ms veces aparece en la serie.
(Alicia Vila, ngel A. Juan;pag.19)

CAPITULO V: MEDIA GEOMETRICA, CUADRATICA Y ARMONICA


Una tercera medida de tendencia central: la media geomtrica Algunas veces, cuando
trabajamos con cantidades que cambian en cierto periodo, necesitamos conocer una tasa
promedio de cambio, como la tasa de crecimiento promedio en un periodo de varios aos.
En tales casos, la media aritmtica simple resulta inapropiada, pues proporciona resultados
equivocados. Lo que debemos encontrar es la media geomtrica, llamada simplemente la
M.G. (Levin and Rubin, 2004 pag.74)

CAPITULO VI: CUARTILES, DECILES Y PERCENTILES

Cuartiles (quartiles): en un conjunto de n observaciones ordenadas de menor a


mayor valor, se pueden considerar tres valores numricos concretos llama-dos
cuartiles que dividen el conjunto en cuatro partes, cada una de ellas conteniendo una
cuarta parte de las observaciones (figura 12). El primer cuartil, Q1, es el valor que
deja la cuarta parte de los datos ordenados a su izquierda (es decir, un 25% de los
datos muestran valores inferiores a l y un 75% de los da-tos muestran valores
superiores a l). Por su parte, el segundo cuartil, Q2, es aquel valor que deja la mitad

10

de los datos ordenados a su izquierda (es decir, un 50% de los datos muestran
valores inferiores a l y un 50% de los datos muestran valores superiores a l).
Finalmente, el tercer cuartil, Q3, es aquel valor que deja tres cuartas partes de los
datos ordenados a su izquierda (es decir, un 75% de los datos muestran valores
inferiores a l y un 25% de los datos muestran valores superiores a l).
Cuartiles de un conjunto ordenado de datos(figura 12,pag.19)

Obsrvese que, en realidad, el cuartil segundo o Q2 coincide con el concepto de mediana


presentado anteriormente. Los cuartiles son muy tiles a la hora de clasificar una
observacin en una determinada franja del conjunto de datos, por ejemplo, si la
observacin es inferior a Q1 significa que sta se encuentra situada entre el 25% de valores
ms bajos; si la observacin es superior a Q3 significa que est situada entre el 25% de
valores ms altos, etc.( Alicia Vila y ngel A. Juan,pag.21)

11

CAPITULO VII: VARIANZA


La varianza de una muestra se representa por el smbolo s2. En el caso de una poblacin, el
parmetro varianza se representa con el smbolo . La varianza muestral ser mayor
cuanto mayor sean las diferencias entre cada una de las observaciones xi y la media de los
datos x, en concreto:

Esto significa que la varianza es una medida de la dispersin de los datos con respecto a su
media, es decir, cuando menor sea la varianza, tanto ms agrupados estarn los datos
alrededor de su valor promedio. Por el contrario, cuanto mayor sea la varianza, tanto ms
dispersos estarn los datos.
Ejemplo: la varianza muestral de la serie de 5 datos {6, 3, 8, 5, 3} es:

CAPITULO VIII: RANGO INTERCUARTILICO


El rango de un conjunto de datos es la diferencia entre el valor mximo y el mnimo de los
mismos.
Ejemplo: dado el conjunto de datos {2, 3, 8, 3, 5, 1, 8}, su rango es 8 (8) = 16

12

CAPITULO IX: COEFICIENTE DE VARIACION


DESVIACION ESTANDAR
COEFICIENTE DE VARIACION
Desviacin estndar (standard deviation): la desviacin estndar (o tpica) de una
muestra se representa con el smbolo s, mientras que la desviacin estndar de una
poblacin se representa con . La desviacin estndar es la raz cuadrada positiva de la
varianza, esto es: s s2 (o, dicho de otro modo, la varianza es el cuadrado de la desviacin
estndar).
Ejemplo: para los datos del ejemplo

anterior, s =

Al igual que ocurra con la varianza, a mayor desviacin estndar ms dispersin en los
datos y viceversa.(Alicia Vila y ngel A. Juan,pag.20)

KURTOSIS
Cuando medimos la curtosis de una distribucin, estamos midiendo qu tan puntiaguda es.
En la figura 3-5, por ejemplo, las curvas A y B difieren entre s slo en que una tiene un
pico ms pronunciado que la otra. Tienen la misma posicin central y la misma dispersin,
y ambas son sim- tricas. Los estadsticos dicen que tienen un grado diferente de curtosis.

13

DISTRIBUCIONES BIDIMENSIONALES
Son aquellas en las que a cada individuo le corresponden los valores de
dos variables, las representamos por el par (x i , y i ).

Si representamos cada par de valores como las coordenadas de un punto,


el conjunto de todos ellos se llama nube de puntos o diagrama de
dispersin .
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo
mejor posible, llamada recta de regresin .
Ejemplo:
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemtica

Fsic

14

10

10

10

VARIABLES

15

Variable cualitativa o categrica: variable que categoriza o describe cualitativamente un


elemento de la poblacin. Suele ser de tipo alfanumrico, pero incluso en el caso en que sea
numrica no tiene sentido usarla en operaciones aritmticas. Ejemplos: (a) el telfono o el
correo electrnico de un estudiante; (b) la direccin IP de un peridico en lnea; (c) el ISSN
de una revista, etc.
Variable cuantitativa o numrica: variable que cuantifica alguna propiedad de un
elemento de la poblacin. Es posible realizar operaciones aritmticas con ella. Ejemplos:(a)
el importe de la beca que recibe un estudiante;(b) los ingresos que genera un peridico en
lnea; (c) el nmero de revistas publicadas por una editorial, etc.
Variable cuantitativa discreta: variable cuantitativa que puede tomar un nmero finito o
contable de valores distintos. Ejemplos: (a) edad de un estudiante; (b) nmero de enlaces a
otras fuentes de informacin que ofrece un peridico en lnea; (c) calificacin que obtiene
una revista en una escala entera de 1 a 5, etc.
Variable cuantitativa continua: variable cuantitativa que puede tomar un nmero
infinito (no contable) de valores distintos. Ejemplos: (a) altura o peso de un estudiante; (b)
tiempo que transcurre entre la publicacin de una encuesta en lnea y el instante en que ya
la han completado un centenar de internautas; (c) factor de impacto (sin redondear) de una
revista, etc.
Distribucin de una variable: en sentido amplio, una distribucin es una tabla, grfico o
funcin matemtica que explica cmo se comportan o distribuyen los valores de una
variable, es decir, qu valores toma la variable as como la frecuencia de aparicin de cada
uno de ellos. Ejemplo: dada una muestra aleatoria de revistas, la distribucin de la variable
factor de impacto de una revista puede representarse mediante una tabla de frecuencias o
mediante una grfica como se aprecia en la figura 2. Se observa que trescientas cuarenta y
dos de las revistas consideradas tienen un factor de impacto entre 0 y 1, cuatrocientas
cincuenta y dos de las revistas tienen un factor de impacto entre 1 y 2, etc.Pag.09-10

GRAFICOS VARIABLE CUANTITATIVO

16

En el caso de datos cuantitativos, su representacin grfica o mediante tablas permite


apreciar la forma de su distribucin estadstica, es decir, la forma en que se comporta la
variable de inters (cules son los valores medios o centrales, cules son los valores ms
habituales, cmo vara, cmo de dispersos son los valores, si muestra algn patrn de
comportamiento especial, etc.).
Uno de los grficos ms sencillos de elaborar es el llamado grfico de puntos (dotplot). Se
trata de un grfico en el que cada punto representa una o ms observaciones.
Los puntos se apilan uno sobre otro cuando se repiten los valores observados (figura 7).
Figura 7. Grfico de puntos para las calificaciones de un curso

Un grfico similar, aunque algo ms elaborado y con una orientacin transpuesta de los
ejes, es el llamado diagrama de tallos y hojas (stem-and-leaf). En l tambin se representan
los valores observados pero usando los propios valores numricos en lugar de puntos, lo
que proporciona un mayor nivel de detalle. La figura 8 muestra un ejemplo de grfico de
tallos y hojas para los mismos datos empleados en la figura 7. Se observa que el grfico se
ha construido a partir de una muestra de cincuenta calificaciones y quese ha usado una
unidad de hoja (leaf) de 0,1. Esto significa que la segunda columna del grfico representa la
parte entera de la calificacin, mientras que cada uno de los nmeros situados a su derecha
representa la parte decimal de una observacin con dicha parte entera. As, se pueden leer
las siguientes calificaciones por orden de menor a mayor: 1,4, 2,9, 3,0, 3,5, 3, 9, 4,0, 4,3,
etc.

17

Cuando las observaciones generan un nmero elevado de valores distintos, resulta


recomendable agruparlos en clases o intervalos disjuntos de igual tamao. De ese modo,
cada observacin se clasifica en una clase o intervalo segn su valor. La tabla 2 muestra un
ejemplo de tabla de frecuencias en el que se han agrupado los datos en intervalos. La
frecuencia de cada intervalo viene determinada por el nmero de observaciones cuyos
valores estn en dicho intervalo. La marca de clase representa el valor medio del intervalo.

Pag.14-15

18

GRAFICOS VARIABLE CUALITATIVOS

Un grfico que tambin suele usarse bastante para describir datos cualitativos es el llamado
diagrama de Pareto. Este grfico est compuesto por: (a) un diagrama de barras en el que
las categoras estn ordenadas de mayor a menor frecuencia y (b) una lnea que representa
la frecuencia relativa acumulada (figura 6).

Los diagramas de Pareto son muy tiles para detectar cundo un porcentaje reducido de
categoras (p. ej.: un 20% de las categoras) acapara o representa un porcentaje alto de
observaciones (p. ej.: un 80% de los datos). Estos fenmenos de excesiva representatividad
por parte de unas pocas categoras suelen darse con frecuencia en contextos
socioeconmicos (p. ej.: un porcentaje reducido de los ciudadanos de un pas acapara un
alto porcentaje de la renta), educativos (p. ej.: un porcentaje reducido de causas generan la
mayor parte de los abandonos del curso) o de ingeniera de la calidad (p. ej.: un alto
porcentaje de fallos son debidos a un nmero muy reducido de causas). Identificar aquellas
pocas categoras que representan una gran parte del porcentaje total puede servir para
corroborar ciertos desequilibrios distributivos como una distribucin poco equilibrada de

19

las rentas en un pas o de los sueldos en una empresa, o para proporcionar pistas sobre los
principales factores de causa de un problema como el alto nivel de abandono de un curso o
un elevado nivel de fallos en un servicio o producto.
Pag.14

TABLA ESTADISTICA
Descripcin de datos mediante tablas y grficos
Cuando se dispone de un conjunto de observaciones procedentes de una muestra conviene
hacer un primer anlisis exploratorio de stas mediante grficos y tablas que ayuden a
interpretar los datos y a extraer informacin de los mismos. Existen diferentes tipos de
grficos que pueden usarse en esta fase exploratoria y el uso de unos u otros dependern en
gran medida del tipo de datos de los que se disponga (cualitativos o cuantitativos), as
como de la informacin que se desee visualizar. En este apartado se presentaran algunos de
los grficos y tablas ms habituales para la descripcin de datos univariantes.
Grficos y tablas para datos cualitativos o categricos
Si se dispone de datos cualitativos o categricos, pueden sintetizarse mediante una tabla
que recoja, para cada categora: el nmero de veces que aparece (frecuencia absoluta), el
porcentaje de apariciones sobre el total de observaciones (frecuencia relativa), as como los
acumulados de ambos valores. La tabla 1 muestra esta informacin para la variable
nmero de hotspots (conexiones wi-fi) identificados en cada comunidad autnoma.

20

Adems de mediante una tabla de frecuencias, suele ser habitual representar datos
categricos mediante el uso de grficos circulares (figura 3) o bien mediante diagramas de
barras (figura 4).

21

22

Bibliografa
A. Vila, A. J. (s.f.). estadistica descriptiva y univariante. catalua: uoc.
Levin, R. and Rubin, D. (2004). Estadistica para administracion y economia. Mxico: Pearson Educacin.