Está en la página 1de 32

CONCEPTOS BASICOS DE

ESTADISTICA

DEISY YANETH HENAO VILLALOBOS


52 884 041

TRABAJO

GERARDO AVENDAÑO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


FACULTAD DE CIENCIAS BÁSICAS E INGENIERÍA
INGENIERÍA DE SISTEMAS
GRUPO 41
BOGOTÁ
2005
INTRODUCCION

Una vez que la fase inicial del proceso de investigación se ha ejecutado


adecuadamente, se puede investigador e iniciar el diseño del proyecto de la
investigación e identificar las fuentes de datos apropiadas para el estudio.

La Principal tarea fue buscar los 500 datos del proyecto para en la pagina Web,
encontrando así un ceso realizado en Brasil en el año 2000. Este incluye un
análisis detallado de las fuentes básicas de datos de mercadeo:

Sirve para extractar alguna característica de su población. Conociendo los valores


de dos variables que utilice, se pudo tener una idea suficientemente clara de su
población.

Se utilizo las medidas de centralización, medidas de dispersión y medidas de


posición:

En las medidas se tomo como el centro de la misma. Que son la media, la mediana
y la moda.

Las medidas de dispersión se indico los valores. Que son la desviación típica y la
varianza.

Las medidas de posición sirvió para indicar la proporción de individuos de la


distribución que hay antes y después de un determinado valor. Que son los
cuartiles y los percentiles o centiles.

De acuerdo a la distribución de los valores se utilizo asimétrica para indicar su


posición negativa o positiva

Para indicar la relación entre las variables: se utilizo la covarianza, el coeficiente de


correlación y el coeficiente de regresión.

2
OBJETIVOS

Los objetivos que se pretenden conseguir con el trabajo es realizar la estadística


con múltiples y variados conceptos. A continuación se enumeran algunos puntos
que tuve en cuenta:

 Las nuevas formas de expansión estadística en la sociedad de la información.


 Las Bases de Datos
 Reflexiones sobre la difusión de datos estadísticos en pequeñas áreas.
 Interrelaciones entre difusión y cultura estadística.
 Características fundamentales de la demanda de información estadística.
 La enseñanza de la estadística por demográficas
 Recursos para la enseñanza de la estadística: software, recursos multimedia.
La enseñanza de la estadística a través de Internet. ¿Con qué recursos
contamos en la red?.
 La consultoría estadística ¿Una ayuda a la enseñanza estadística?.

Estos estudios proporcionan los datos necesarios para hallar la población, y así
poder modificar tendencias demográficas y conseguir objetivos económicos y
sociales.

Las fuentes estadísticas proporcionan el material de base para investigar las


causas y las consecuencias de los cambios de población. La fuente más habitual
es el censo de población, que contabiliza en un cierto momento todas las personas
de un área determinada, con sus datos personales y características sociales y
económicas específicas. Su fiabilidad depende de lo veraces que sean los
ciudadanos al proporcionar los datos. En el muestreo se utiliza una selección
estadística representativa de la población total.

3
TABLA DE CONTENIDO

CONCEPTOS PRELIMINARES
1. GENERALIDADES Y CONCEPTOS BASICOS
1.1 Conceptualizaciòn de términos estadísticos
1.1.1 Estadística
1.1.2 Población
1.1.3 Muestra
1.1.4 Variable
1.1.5 Dato
1.1.6 Parámetro o estimador

2. INVESTIGACION ESTADISTICA
2.1 Plantación
2.1.1 Objeto de la investigación
2.1.2 Tipo de la Investigación

2.2 Recolección
2.2.1 Ceso
2.2.2 Muestreo probabilistico
2.2.3 Muestreo no probabilistico

2.3 Organización de la información


2.3.1 Combinación de ordenada
2.3.2 Arreglo de tallo y hojas
2.3.3 Serie estadística
2.3.4 Marca de clase
2.3.5 Frecuencia
2.3.6 Distribución de frecuencias

2.4 Presentación de la información


2.4.1 Componentes de una grafica
2.4.2 Histograma
2.4.3 Polígono de frecuencias
2.4.4 Ojiva
2.4.5 Gráficos de puntos
2.4.6 Gráficos de líneas
2.4.7 Gráficos de barras
2.4.8 Gráficos circulares

4
2.4.9 Pictogramas
2.4.10 Mapas estadísticos

MEDIDAS ESTADISITCA
1. MEDIDAS ESTADISTICAS UNIVARIANTES
1.1 Medidas de tendencia central
1.1.1 Media aritmética
1.1.2 Mediana
1.1.3 Moda
1.1.4 Media Aritmética
1.1.5 Características, usos , ventajas y desventajas de las medidas de
tendencia central

1.2 Medidas de dispersión


1.2.1 Rango
1.2.2 Varianza
1.2.3 Desviación estándar
1.2.4 Coeficiente de variación
1.2.5 Puntaje estandarizado
1.2.6 Desviación media
1.2.7 Recorrido intercuartilico
1.2.8 Desviación Cuartel
1.2.9 Recorrido interdecil
1.2.10 Importancia de las medidas de dispersión

1.3 Medidas de deformación


1.3.1 Asimetría
1.3.2 Curtosis

2. MEDIDAS ESTADISITCAS BIVARIANTES

2.1 Regresión y correlación


2.1.1 Regresión lineal simple
2.1.2 Coeficiente de determinación
2.1.3 Regresión lineal ponderada
2.1.4 Regresión lineal múltiple
2.1.5 Correlación lineal
2.1.6 Coeficiente de correlación

2.2 Números índice


2.2.1 Construcción de números índice
2.2.2 Índices simple
2.2.3 Índices compuestos o ponderados
2.2.4 Aplicaciones de los números índice

5
CONCEPTOS PRELIMINARES

1. GENERALIDADES Y CONCEPTOS BÁSICOS

1.1 CONCEPTUALIZACIÓN DE TÉRMINOS ESTADÍSTICOS

1.1.1ESTADÍSTICA:

La estadística estudia los métodos científicos para recoger, organizar, resumir y


analizar datos, así como para sacar conclusiones validas t tomar decisiones
razonables basados en tal análisis. En un sentido menos amplio, el termino
ESTADISTICA se usa para denotar los propios datos, o números derivados de
ellos, tales como los promedios. Así se habla de estadística de empleo, estadística
de accidentes, etc.

1.1.2 POBLACIÓN:

Una población puede ser finita o infinita. Por ejemplo la población consiste en todas
las fuerzas producidas por una fabrica un cierto día es finita, mientras que la,
determinada por todos los posibles resultados(caras, cruces) de sucesivas tiradas
de una moneda, es infinita.

1.1.3 MUESTRA:

Son los subconjuntos formados por algunos individuos de la población. A partir del
estudio de la muestra se pretende inferir aspectos relevantes de toda la población.
Cómo se selecciona la muestra, cómo se realiza la inferencia, y qué grado de
confianza se puede tener en ella son aspectos fundamentales de la estadística
inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de
estadística, probabilidad y matemáticas.

6
1.1.4 VARIABLE:

Una variable que puede tomar cualquier valor entre dos valores dados. Se dice
que es variable continua: en caso contrario diremos que la variable es discreta.

1.1.5 DATO:

Son los valores cualitativos o cuantitativos mediante los cuáles se miden las
características de los objetos sucesos o fenómenos a estudiar.

1.1.6 PARÁMETRO:
Números que sintetizan los aspectos más relevantes de una distribución
estadística.

1.1.7 ESTIMADOR O ESTADIGRAFO:

La descripción numérica de una característica correspondiente a los elementos de


una muestra, se denomina estadígrafo. De una población se puede obtener M
numero de muestras posibles, y en cada una de ellas se puede cuantificar las
característica, obteniéndose por lo general, valores diferentes para cada muestra a
pesar de ser utilizada al mismo estadígrafo o medida.

7
2. INVESTIGACIÓN ESTADÍSTICA

2.1 PLANEACIÓN

2.1.1 OBJETO DE LA INVESTIGACIÓN:

Es el resultado que depende en gran parte de la finalidad que se persiga de la


naturaleza de los fenómenos que se desean y de la facilidad que se tenga para
observar los elementos.

2.1.2 TIPOS DE INVESTIGACIÓN:

Investigación Interna: Datos registrados de una empresa los cuáles se facilitan en


el análisis y comparación con periodos anteriores.
Investigación Externa: Es en la que se analizan datos internos organizado de tal
forma que se pueda comparar con la competencia y su objetivo es establecer la
posición de la empresa en el mercado.
Investigación Exhaustiva: Es aquella investigación donde se observan todos los
elementos que contribuyen a la población objeto.
Investigación Parcial: Se realiza una parte de los elementos que contribuyen la
población objetivo denominándose muestra, el objeto no consiste en examinarlo
sino a estudiar la población a través de ella.

8
2.2 RECOLECCIÓN

2.2.1 CENSO:

El censo de población, que contabiliza en un cierto momento todas las personas de


un área determinada, con sus datos personales y características sociales y
económicas específicas. Un registro civil es la contabilización continua, por parte
de las administraciones locales, de los nacimientos, fallecimientos, migraciones,
matrimonios y divorcios. Su fiabilidad depende de lo veraces que sean los
ciudadanos al proporcionar los datos. En el muestreo se utiliza una selección
estadística representativa de la población total.

2.2.2 MUESTREO PROBABILISTICO:

Simple: Permite la selección de todos los elementos que constituyen la población ,


tengan la misma posibilidad de ser incluidos en la muestra.

Estratificado: Consiste en determinar en primer lugar un intervalo igual al valor,


obtenido de dividir al tamaño de la población por el de la muestra ; luego se
observa aleatoriamente una observación.

2.2.3 MUESTREO NO PROBABILISTICO:

Se toma la muestra de cualquier tamaño y los elementos son seleccionados de


acuerdo con la opinión o juicio que tenga el investigador en la población.

2.3 ORGANIZACIÓN DE LA INFORMACION

2.3.1 COMBINACIÓN ORDENADA

Es un conjunto de datos arreglados en orden ascendente.

2.3.2 ARREGLO TALLO Y HOJAS:

Es un conjunto de números arreglados en una clasificación numérica tal que las


cabezas de cada renglón y los valores de la unidad de la clase están listados a la
derecha de él.

9
2.3.3 MARCA DE CLASE:

Es un rango de números definidos arbitrariamente por los números más altos y los
más bajos de ella.

2.3.4 FRECUENCIA:

Se refiere al número de veces que ocurre un valor particular o fenómeno.

2.3.5 DISTRIBUCIÓN DE FRECUENCIA:

Es un arreglo sistemático de los valores agrupados en intervalos de clase, se usan


para resumir datos de tal modo que la frecuencia de cada intervalo este claramente
mostrada y pueda calcularse fácilmente la frecuencia relativa de cada intervalo.

EJEMPLO 1

  FRECUENCIAS FRECUENCIA ACUMULADA


MARCA DE
RANGO CLASE HOMBRES MUJERES HOMBRES MUJERES
0-
5000 2500 278 274 278 274
5000 -
10000 7500 160 158 160 158
10000 -
15000 12500 56 59 56 59
15000 -
20000 17500 6 9 6 9
500 500

10
2.4 PRESENTACION DE LA INFORMACION

2.4.1 COMPONENTES DE UNA GRAFICA:

La mejor gráfica es la más simple


Si hay más de dos gráficas deben ser numeradas
Toda gráfica debe llevar un título
Las líneas que llevan escalas deben dibujarse más gruesas que las coordenadas ,
a su vez, las líneas que representan los datos o la variable deben ser más gruesas
que las de las escalas .
La línea vertical denominada ordenada debe comenzar en cero.
En toda grafica se debe explicar la fuente donde fueron obtenidos los datos.
Cuándo la grafica representa más de una variable deberá hacerse una muy clara
diferenciación por medio de leyendas, notas o signos convencionales.

2.4.2 HISTOGRAMA:

Es una representación gráfica de una tabla de frecuencias; esta muestra datos


cuantitativos. Los intervalos de clase que pueden ser o no pueden ser iguales,
están marcados sobre el eje horizontal, las frecuencias relativas son marcadas
sobre el eje vertical.

EJEMPLO 1

HISTOGRAMA DE FRECUENCIAS HISTAGRAMA DE FRECUENCIAS

300 278 300 274


250 250
0 - 1000 0 - 1000
200 160 200 158
FRECUENCIAS

1000 - 2000 1000 - 2000


150
S

150
IA

2000 - 3000 2000 - 3000


ENC

100 100
U

56 59
C

3000 - 4000 3000 - 4000


RE

50 50
F

6 9
0 0
1 1
HOMBRES MUJERES

11
2.4.3 POLÍGONO DE FRECUENCIA:

Se puede dibujar el polígono de frecuencia , en primer lugar se establecen los


puntos medios en la parte superior de cada rectángulo , luego se unen dichos
puntos mediante una línea, prolongándose en el primero y último rectángulo.

EJEMPLO 1

POLÍGONO POLÍGONO

300 278 300 274


250 250
0 - 1000 0 - 1000
200 160 200 158

FRECUENCIAS
1000 - 2000 1000 - 2000
FRECUENCIAS

150 150
2000 - 3000 c 2000 - 3000
100 56 100 59
3000 - 4000 3000 - 4000
50 6 50 9
0 0
1 1
HOMBRES MUJERES

2.4.4 OJIVA:

En primer lugar se ubican los puntos en el plano cartesiano, dichos puntos se


determinan teniendo en cuenta el límite superior de cada intervalo y las respectivas
frecuencias absolutas o relativas acumuladas; luego se unen esos puntos partiendo
desde el límite inferior del primer intervalo.

EJEMPLO 1

OJIVA OJIVA

300 278 300 274

250 250
0 - 1000 0 - 1000
FRECUENCIAS

200 160 200 158


1000 - 2000
FRECUENCIAS

1000 - 2000
150 150
2000 - 3000 2000 - 3000
100 56 100 59
3000 - 4000 3000 - 4000
50 6 50 9
0 0
1 1
HOMBRES MUJERES

12
2.4.5 GRAFICA DE PUNTO:

Es el adecuado para ilustrar el comportamiento de los valores individuales en


relación con el conjunto de esos valores. Se traza una línea horizontal con una
escala para la variable cuantitativa, pues el valor numérico de cada medida del
conjunto de datos esta representado sobre la escala horizontal sobre un punto.
Cuando los valores se repiten los puntos son colocados uno encima del otro,
formando una pila en aquella localización particular en la cual se hace una liste de
los valores de la variable que interesa.

EJEMPLO 1

GRÁFICO DE PUNTOS GRÁFICO DE PUNTOS

300 300
278 274
250 250
200 200
FRECUENCIAS 150 160 Serie1 FRECUENCIAS 150 158 Serie1
100 100
50 56 50 59
0 6 0 9
0 1 2 3 4 5 0 1 2 3 4 5
HOMBRES M UJERES

2.4.6 GRAFICA DE LINEAS:

Cuando una de las variables es el tiempo, esta se coloca en el eje horizontal y el


diagrama de dispersión se llama grafico secuencial o de línea.
EJEMPLO 1

GRÁFICO DE LÍNEAS GRÁFICO DE LÍNEAS

300 300
278 274
250 250
200 200
FRECUENCIAS 150 160 Serie1 FRECUENCIAS 150 158 Serie1
100 100
50 56 50 59

0 6 0 9
1 2 3 4 1 2 3 4
HOMBRES MUJERES

13
2.4.7 GRAFICOS DE BARRAS:

Ilustra comparaciones entre categorías, estas son organizadas verticalmente, pues


los valores se disponen horizontalmente para destacar la comparación de los
valores y dar menos énfasis al tiempo.

EJEMPLO 1

GRÁFICO DE BARRAS GRÁFICO DE BARRAS

6 9
Serie4 Serie4
56 59 Serie3
Serie3
HOMBRES 1 MUJERES 1
160 Serie2 158 Serie2
Serie1 Serie1
278 274

0 50 100 150 200 250 300 0 50 100 150 200 250 300
FRECUENCIAS FRECUENCIAS

2.4.8 GRAFICOS CIRCULARES:

Se utiliza con mucha frecuencia para representar características cualitativas y sirve


para resaltar las diferencias de las proporciones o porcentaje en que esta dada la
distribución.

EJEMPLO 1

GRÁFICO DE CÍRCULAR GRÁFICO DE CÍRCULAR

56 6 9
59

1 1
2 2
3 3
160 278 274
4 158 4

14
2.4.9 PICTOGRAMAS:

Es una forma de representar las cantidades estadísticas por medio de dibujos,


utilizando para ello objetos y figuras.

EJEMPLO 1

PICTOGRAMA PICTOGRAMA

350 350
300 300
278 274
250 250
200 Serie1 200 Serie1
FRECUENCIAS FRECUENCIAS
150 Serie2 150 Serie2
100 100
50 56 50 59
0 0
0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2
HOM BRES M UJERES

2.4.10 MAPAS ESTADÍSTICOS:

Son la representación de una información estadística por medio de mapas, dentro


de los cuales se ubican símbolos o figuras; en algunos casos se le incluyen
gráficos para indicar la localización geográfica así como la importancia del valor
de la variable observada en relación con el conjunto.

15
MEDIDAS ESTADISTICAS

1. MEDIDAS ESTADISTICAS UNIVARIENTES

1.1 MEDIDAS DE TENDENCIA CENTRAL

Son números que se aplican en la recolección, organización, presentación, análisis


e interpretación de datos numéricos

1.1.2 MEDIA ARITMETICA

Son los cálculos respectivos se harán para datos sin agrupar, como para datos
agrupados en distribuciones de frecuencias.
FORMULA: X = SUMATORIA Xi
n
EJEMPLO 1
(HOMBRES)X = SUMATORIA(679…+…15.676)/500 = 5327

EJEMPLO 2
(MUJERES) X = SUMATORIA(629…+…16.344)/500 = 5397

16
1.1.3 MEDIANA

Es un conjunto como el valor tal. Si los datos de un conjunto están ordenándola por
magnitud entonces la mediana es el valor central si el conjunto tiene un número
impar de datos.
FORMULA: Me = MEDIANA(Xi…Xn)

EJEMPLO 1
(HOMBRES) Me = MEDIANA(679…15.676) = 4.384

EJEMPLO 2
(MUJERES) Me = MEDIANA (629…16.344) = 4.449

1.1.4 MODA

Es aquel que tiene la frecuencia mayor. Cuando los datos están agrupados en
clases, el modo se define como el punto medio de la clase con mayor frecuencia.
FORMULA: Md = MODA(Xi…Xn)

EJEMPLO 1

(HOMBRES) Md = MODA(679…15.676) = 1.371

EJEMPLO 2
(MUJERES) Md = MODA (629…16.344) = 1.280

17
1.1.5 MEDIA GEOMETRICA

La media geométrica de dos números, es igual a las raíces cuadradas de su


producto.

FORMULA: Mo = MEDIA.GEOM(Xi…Xn) o Mo : RAIZ(Xi ..*.. Xn)

EJEMPLO 1
(HOMBRES) Mo = MEDIA.GEOM(679…15.676) = N/A

(HOMBRES) Mo = RAIZ(679…*…15.676) = N/A

EJEMPLO 2
(MUJERES) Mo = MEDIA.GEOM (629…16.344) = N/A

(MUJERES) Mo = RAIZ(629…*…16.344) = N/A

18
1.1.6 CARACTERISTICAS, USOS Y VENTAJAS DE LAS MEDIDAS DE
TENDENCIA CENTRAL

 Un promedio es un valor en la escala de las X correspondiente a una


distribución de frecuencias este valor se selecciona para representarla en
calidad de medida típica del grupo.
 Algunas condiciones esenciales para que este valor pueda cumplir su cometido.
 Debe estar representada por una sola cifra.
 Debe ser objetiva y definida por una formula algebraica de tal manera que,
cualquiera que sea la persona que trabaje con la distribución, se obtenga el
mismo valor.
 Debe ser descriptiva de los datos en forma que un significado sea fácil de
entender.
 No debe ser abstracción matemática que únicamente pueda ser entendida por
personas muy versadas en esta ciencia ya que en una de las condiciones de la
estadística, es simplificar los datos y no hacerlos más complejos
 Debe ser fácil de calcular.
 Debe depender de cada uno de los elementos del grupo , de tal manera que si
se altera alguno de estos consecuentemente se altera el valor del promedio ya
que por definición, esta es representante típica de todos los miembros del
grupo y no solamente de alguno de ellos.
 A pesar de cada uno de los valores de los elementos del grupo debe tener
influencia en el valor de la medida, esta debe ser de tal calidad que no se deje
influenciar demasiado o algunos pocos valores.
 Debe tener lo que los estadísticos llaman estabilidad para el muestreo
 Debe ser de uso fácil para cálculos matemáticos posteriores.

19
1.2 MEDIDAS DE DISPERSION

Son aquellos que nos determinan como se agrupan o se dispersan los datos
alrededor de un promedio

1.2.1 RANGO

Se calcula determinando la diferencia entre los datos mayor y menor del conjunto.
30 DATOS 500 DATOS

RANGO
0 - 1000
1000 - 2000

1.2.2 VARIANZA

Es la medida aritmética de los cuadrados de las desviaciones respecto a su media.


FORMULA: S2 = SUMATORIA ( Xi – X)2
n
EJEMPLO 1
(HOMBRES) S2 = SUMATORIA (679…- 5327)2 =0
500
EJEMPLO 2
(MUJERES) S2 = SUMATORIA (629…- 5397)2 =0
500

20
1.2.3 DESVIACION TIPICA

Mide la desviación de una observación con respecto a la media aritmética,


determinando la posición relativa de una observación dada.

FORMULA: S = RAIZ ( S2 )

EJEMPLO 1
(HOMBRES) S = RAIZ( 0) =0

EJEMPLO 2
(MUJERES) S = RAIZ( 0) =0

1.2.4 COEFICIENTE DE VARIACION

Generalmente podemos encontrar, al hacerlo, que ambas series están expresadas


en diferentes unidades. Pero nos interesa determinar la variación respectiva de una
base

FORMULA: d = S x 100
X
EJEMPLO 1
(HOMBRES) d = ( 0 / 5327)x100 =0

EJEMPLO 2
(MUJERES) d = ( 0 / 5397)x100 =0

21
1.2.5 PUNTAJE ESTANDARIZADO

Sirve para comparar dos o más datos individuales, aunque pertenezcan a


distribuciones diferentes y aún en casos en que la media y/o varianza no
coincidan.
FORMULA : Z = X – X
S
EJEMPLO 1
(HOMBRES) Z = ( 2.663.508 -…5327)/ 0 = N/A

EJEMPLO 2
(MUJERES) Z = ( 2.698.587 - …5397)/0 = N/A

EJEMPLO 3
(HOMBRES) Z = ( 31.473 - …1049)/ 0 = N/A

1.2.6 DESVIACION MEDIA

La desviación media, es un promedio de los valores absolutos de las desviaciones,


de cada elemento, de la distribución respecto a su media.
FORMULA : Da = SUMATORIA( Xi – X)
n
EJEMPLO 1
(HOMBRES) Da = SUMATORIA (679… - 5327)/500 = -19

EJEMPLO 2
(MUJERES) Da = SUMATORIA(629… - 5397)/500 = 0

22
1.2.7 RECORRIDO INTERCUARTILICO

Es la diferencia entre el tercer cuartel y el primero.

FORMULA: QD = Q3 – Q1
EJEMPLO 1
(HOMBRES) QD = (7.382 – 2.379) = 4.983

EJEMPLO 2
(MUJERES) QD = (7.593 – 2.412) = 5181

1.2.8 DESVIACION CUARTIL

Se obtiene, mediante el cálculo del recorrido intercuartílico dividido por dos.


FORMULA: QD2 = Q3 – Q1
2

EJEMPLO 1
(HOMBRES) DR = (4.983)/2 = 2.492

EJEMPLO 2
(MUJERES) DR = (5181)/2 = 2.591

1.2.9 RECORRIDO INTERDECIL

Corresponde a la diferencia entre el noveno y el primer decil.


FORMULA: DR = D9 – D1
EJEMPLO 1
(HOMBRES) D2 = (10.813 - 1457) = 9.356

EJEMPLO 2
(MUJERES) D2 = (11.068 – 1.442) = 9.626

23
1.2.10 IMPORTANCIA DE LAS MEDIDAS DE DISPERSION

Su objetivo es estudiar las medidas que se utilizan para determinar cuan bien
representan los promedios a la distribución considerada.

1.3 MEDIDAS DE DEFORMACION

1.3.1 ASIMETRIA

Si la media aritmética es menor que la mediana y está menor que la moda se dice
que la distribución es asimetría negativa. En la distribución asimétrica positiva la
curva presenta ago que tenga alargamiento hacia la derecha y en la negativa el
alargamiento se presenta hacia la izquierda.

FORMULA: As = producto de 3: Mi – Me
S
EJEMPLO 1

(HOMBRES) As =3* (5327… -4384)/ 0 = 2.86

EJEMPLO 2
(MUJERES) As =3* (5397… - 4449)/ 0 = 2.97

1.3.2 CURTOSIS

Es la variación de algunas distribuciones que en su grado de agudeza en la cima


de la curva se representa una agudeza en la región de la moda comparando las
condiciones halladas para la moda situada en la curva normal. Eso quiere decir
que es la medida de la altura de la curva.
FORMULA : g2 = n (Xi - X ) 2;
( Sumatoria(Xi - X) 2) 2
EJEMPLO 1
(HOMBRES) g2 = 500(679…- 5327)2 =0
(((679- 5327)+(688-5327))2 )2
EJEMPLO 2
(MUJERES) g2 = 500(629…- 5397)2 =0
(((629- 5397)+(646-5397))2 )2

24
2. MEDIDAS ESTADISTICAS BIVARIANTES

2.1 REGRESION Y CORRELACION

Entre las dos variables que determinan una distribución bidimensional puede existir
una relación más o menos estrecha que se llama correlación. Suministra un
número que resume el grado de relación entre dos variables. Es útil en un trabajo
exploratorio, cuando el investigador o el analista trata de determinar cuales
variables son las potencialmente importantes.

2.1.1 REGRESION LINEAL SIMPLE

La regresión lineal marca la tendencia de la nube de puntos. Si la correlación es


fuerte (tanto positiva como negativa) y, por tanto, los puntos de la nube están
próximos a una línea, ésta es una línea de regresión.

FORMULAS :
CYX = Y – X BYX
CXY = X – Y BXY
m xy = byx S2 x
b yx = m xy y b xy = m xy
S2 x S2 y

EJEMPLO 1

Mxy = 21.121.559.072 – (5327)*(5397) = 42.242.518-28.750.832= 13.491.686


500

S2y = 21.542.984.263 - 28.377.099 = 13.050.306


500

bxy = 13.956.481 = 1 ; byx = 13.050306 = 1


13.050.306 13.956.481

byx = 500(21.121.259.072) – (2.663.508)(2.698.587) = 1


500 ( 20.713.702.936) – (20.713.702.936)

25
byx = 500(21.121.259.072) – (2.663.508)(2.698.587) = 1
500 ( 2.698.587) – (21.542.984.2639

Cyx = 5.398 – 5.327 ( 1) = 73


Cxy = 5327 – 5397 (1) = -68

EJEMPLO2

Mxy = 33.366.813 – (1049)*(1022) = 66.734-27= 66.707


30

S2y = 32.635.940 - 1.045.438 = 42.427


30

bxy = 37.205 = 1 ; byx = 42427 = 1


42427 37.205

byx = 30(33.366.813) – (31.473)(30.674) = 1


30 ( 34.134.467) – (31.473)

byx = 30(33.366.813) – (31.473)(30.674) = 1


500 ( 32.635.940) – (30.674)

Cyx = 1022 – 1.049 ( 1) = -28


Cxy = 1.049 – 1.022 (1) = 25

2.1.2 COEFICIENTE DE DETERMINACION

Es número que varia entre 0 y 1. Representa la proporción de la variación total


presente en los valores de Y que es quitada por la ecuación de regresión
FORMULA:
R2 = POTENCIA(r ; 2 ) o sea el cuadrado del coeficiente de correlación
EJEMPLO 1

R2 = POTENCIA(0,32;2) = 1,10

EJEMPLO 2

R2 = POTENCIA(0,04;2) = 0

2.1.3 REGRESION LINEAL PONDERADA

26
Cuando el número par de observaciones es grande, parece aconsejable su
agrupación mediante tablas de frecuencia. Esta ultima forma de presentación
permite observar que el uso de los momentos bidimensionales, por la simbología
empleada, antes de crear una tarea del alumno, dificulta el cálculo de los
estimativos de X y de Y.

FORMULAS:

b yx = covarianza de xy ; b xy = covarianza de xy

varianza de x2 varianza de y2
covarianza = sumatoria(Xi – X) (Yi – Y)
n

varianza = sumatoria (Xi – X)2 ; varianza = sumatoria (Yi – Y)2


n n

EJEMPLO 1

Covarianza XY = (679…- (-4.648)) (629…-(-4.768)) = 0 =0


500 500

varianza X = (679…-(-4.648))2 = 0 =0
500

varianza Y = (629…(-4.768))2 = 0 =0
500

b YX = 0 = 0
0

EJEMPLO 2
Covarianza XY = (679…- (-370) (629…-(-393)) = 0 =0
30 30

varianza X = (679…-(-370)2 = 0 =0
30

varianza Y = (629…(-393))2 = 0 =0
30

b YX = 0 = 0
0

27
2.1.4 REGRESION LINEAL MULTIPLE

Se trabaja con tres o más variables simultáneamente, determinándose el grado de


relación entre si.

2.1.5 CORRELACION LINEAL

Es también denominada origen en la ordenada en otras palabras la estructura de la


perpendicular levantada en el punto de origen.
FORMULA:

b = n sumatoria XY – (X) (Y)


n sumatoria X – X2

EJEMPLO 1
(HOMBRES)
n= 500

mX = sumatoria X = 5327
n
mY = sumatoria Y = 5397
n
b = n* sumatoria XY – (X) (Y)=500(21.121.259.072) – (2.663.508)*(2.698587)
n sumatoria X – X2 ( 500(20.713.702.936) – 13.050.306

= 3.372.921.472.804 = 0.33
10.356.838.417.694

EJEMPLO 2
(HOMBRES)

n= 30

mX = sumatoria X = 1.049
n
mY = sumatoria Y = 1.022
n
b = n* sumatoria XY – (X) (Y)=30(33.366.813) – (31.473)*(30.674)
n sumatoria X – X2 ( 30(34.134.467) – 42.427

= 35.601.588 = 0.03
1.029.996.805

28
2.1.6 COEFICIENTE DE CORRELACION

Es el ajuste rectilíneo que se puede aplicar directamente en el cálculo del


coeficiente

FORMULA:
r = n sumatoria XY – (SUMATORIA X) (SUMATORIA Y)
RAIZ ( n sumatoria X2 – (sumatoria X)2) x RAIZ (n sumatoria Y2 – (sumatoria Y)2)

EJEMPLO 1

r = 500 (21.121.259.072) – (7.187.708.063.196)

500(20.713.702.936)-(20.713.702.936) 500(21.542.984.263)-(21.542.984.263)

r = 10.560.629.536.000 – 7.187.708.063.196 = 3.372.921.472.804

10.336.137.765 10.749.949.147.237 (3.214.986) (3.278.712)

r = 3.372.921.472.804 = 0,32
10.541.013.013.619

EJEMPLO 2

r = 30 (33.366.813) – (965.402.802)

30(34.134.467)-(34.134.467) 30(32.635.940)-(32.635.940)

r = 1.001.004.390 – 965.402.802 = 35.601.588

1.024.034.010 1979.078.200 (32.001) (31.290)

r= 35.601.588 = 0,04
1.001.303.838

2.2 NUMEROS INDICE

29
2.2.1 CONSTRUCCION DE NUMEROS INDICE

Es una cifra relativa , expresada en términos porcentuales que sirve para indicar
variaciones , que sufre una variable con respecto a un valor de la misma la cuál es
tomada como caso de referencia y que se denomina base .

2.2.2 INDICES SIMPLE

Se obtiene dividiendo cada precio, cantidad o valor de un periodo anual, mensual,


semanal, etc., por un precio, cantidad C valor de imperio fijo considerado base,
multiplicándolo luego por cien.

2.2.3 INDICES COMPUESTOS O PONDERADOS

Se cuenta con numerosas formulas para calcular índices cuyo empleo depende de
su destino. Se recomienda utilizar aquella formula que refleje en la formula más
aproximada las variaciones que se desee cuantificar.

2.2.4 APLICACIONES DE LOS NUMEROS INDICE

Lo habitual es que la producción se calcule utilizando números índices


(relacionados, por ejemplo, con la producción y las horas trabajadas), y ello permite
averiguar la tasa en que varía la productividad. Los datos más fiables en este
sentido provienen de la industria, porque es en este sector donde resulta más fácil
medir la producción, a diferencia de, por ejemplo, una empresa de servicios
financieros.

30
CONCLUSION

La estadística consiste en conjuntos de números obtenidos al contar o medir


elementos. Al recopilar datos estadísticos se ha de tener especial cuidado para
garantizar que la información sea completa y correcta.

La estadística analiza, estudia y describe a la totalidad de individuos de una


población. La finalidad de este trabajo es obtener información, analizarla, elaborarla
y simplificarla lo necesario para que pueda ser interpretada cómoda y rápidamente
y, por tanto, pueda utilizarse eficazmente para el fin que se desee. El proceso que
seguí consta de los siguientes pasos:

 Selección de dos variables hombres y mujeres.


 Mediante la averiguación de encuestas de censos encontré; un censo realizado
en Brasil en el año 2000, y obtuve el valor de cada ciudad
 Elaboración de tablas de frecuencias, mediante la adecuada clasificación de la
poblaciòn.
 Representación gráfica de los resultados (elaboración de gráficas estadísticas).
 Obtención de parámetros estadísticos, números que sintetizan los aspectos
más notables de una distribución estadística.

31
BIBLIOGRAFIA

BEJARANO BARRERA, Hernán (1995). Estadística Descriptiva. Santafé de


Bogotá: UNISUR.

LOPES, Paulo Afonso (2000). Probabilidad & Estadística: Conceptos, Modelos,


Aplicaciones en Excel. Santafé de Bogotá: Prentice Hall, Pearson Educación.

MARTÍNEZ BENCARDINO, Ciro (2004). Estadística Básica Aplicada. Santafé de


Bogotá: ECOE Ediciones.

MARTÍNEZ BENCARDINO, Ciro (2003). Estadística y Muestreo. Santafé de


Bogotá: ECOE Ediciones.

SPIEGEL, Murria R. (1991). Estadística. Serie de compendios Schaum. México:


McGraw Hill

INTERNET, www.censobrasil.com

32

También podría gustarte