Está en la página 1de 19

1

Colegio de Estudios Cientficos Y


Tecnolgicos del Estado de Mxico
Plantel Tepotzotln

Bases de Estadstica

Alumnos:
Danes Farrel de la Torre Cruz
Gilberto Vzquez Martnez
Juan Castillo Meza
Miguel ngel Elizondo Herrera

Materia:
Probabilidad y Estadstica

Profesora:
Diana Lozano

Grupo:
604
2

ndice

Introduccin........................................................................................................ 3
Medidas de dispercion........................................................................................ 3
1. Rango........................................................................................................ 4
2. Desviacion media......................................................................................... 4
3. Desviacion tipica....................................................................................... 4
4. Varianza..................................................................................................... 4
5. Recuperacin de informacin....................................................................5
Muestreo............................................................................................................. 5
Muestreo probabilstico....................................................................................... 6
Muestreo Aleatorio Simple............................................................................... 6
Muestreo Sistemtico...................................................................................... 6
Muestreo aleatorio estratificado......................................................................7
Muestreo por conglomerados..........................................................................7
Distribucin de Frecuencias................................................................................ 8
Frecuencia Absoluta (fi)................................................................................... 8
Frecuencia Acumulada (fai)............................................................................. 8
Frecuencia Relativa (fri)................................................................................... 8
Frecuencia Relativa Acumulada (frai)..............................................................8
Mtodos Grficos................................................................................................ 9
Definicin De Medida De Tendencia Central......................................................11
Tipos De Medidas De Tendencia Central........................................................11
Media Aritmetica........................................................................................... 11
Media Geometrica......................................................................................... 12
Media Armonica............................................................................................. 12
Mediana......................................................................................................... 12
Moda.............................................................................................................. 13
Aplicaciones Practicas....................................................................................... 14
Problema 1.................................................................................................... 14
Problema 2.................................................................................................... 14
Qu Aprendi?................................................................................................... 15
Referencias Bibliogrficas (Cibergrafias).......................................................15
3

Introduccin
La siguiente investigacin se analiza, describe y explica distintos
conceptos bsicos de la estadstica como lo es: rango, desviacin
media, desviacin tpica ,varianza ,sesgo , apuntamientos ,momentos ,
coeficiente de correlacin , recta de regresin , error estndar de
estimacin.

As mismo presentando ejemplos de la vida cotidiana de la aplicacin de


cada uno de los conceptos mencionados.

Medidas de dispersin

Rango
El rango da la idea de proximidad de los datos a la media. Se calcula
restando el dato menor al dato mayor.

Este dato permite obtener una idea de la dispersin de los datos, cuanto
mayor es el rango, ms dispersos estn los datos de un conjunto.

Ejemplo:

Se pregunt a 9 familias cuntas bicicletas tenan en total, dieron las


respuestas ordenadas en la siguiente tabla:

- Cmo hallaras el rango?

Se resta el dato mayor al dato menor: 3 - 0 = 3; Por lo tanto el rango


sera 3 en este caso.

Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el


rango es muy amplio, es conveniente agruparlos y ordenarlos
en intervalos o clases.

La amplitud o tamao de cada intervalo se puede calcular dividiendo el


valor del rango por la cantidad de intervalos que se desean obtener.

Desviacin media
Desviacin media
4

La desviacin media es la media aritmtica de los valores absolutos de


las desviaciones respecto a la media.

La desviacin media se representa por

Desviacin respecto a la media

La desviacin respecto a la media es la diferencia en valor absoluto


entre cada valor de la variable estadstica y la media aritmtica.

Di = |x - x|

Ejemplo:

Calcular la desviacin media de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresin


de la desviacin media es:
5

Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.

Es decir, la raz cuadrada de la media de los cuadrados de las


puntuaciones de desviacin.

La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que


son equivalentes a las anteriores.

Ejercicios de desviacin tpica

Ejercicio 1:

Calcular la desviacin tpica de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18
6

Propiedades de la desviacin tpica

1 La desviacin tpica ser siempre un valor positivo o cero, en el caso


de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se


les suma un nmero la desviacin tpica no vara.

3 Si todos los valores de la variable se multiplican por


un nmero la desviacin tpica queda multiplicada por dicho nmero.

4 Si tenemos varias distribuciones con la misma media y conocemos sus


respectivas desviaciones tpicas se puede calcular la desviacin tpica
total.

Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica

1 La desviacin tpica, al igual que la media y la varianza, es un ndice


muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco ser posible


hallar la desviacin tpica.

3 Cuanta ms pequea sea la desviacin tpica mayor ser


la concentracin de datos alrededor de la media.

Varianza.
7

La varianza es la media aritmtica del cuadrado de las desviaciones


respecto a la media de una distribucin estadstica.

La varianza se representa por .

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes


expresiones que son equivalentes a las anteriores.

Ejemplo:

Calcular la varianza de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Propiedades de la varianza

1 La varianza ser siempre un valor positivo o cero, en el caso de que las


puntuaciones sean iguales.
8

2 Si a todos los valores de la variable se les suma un nmero la varianza


no vara.

3 Si todos los valores de la variable se multiplican por


un nmero la varianza queda multiplicada por el cuadrado de
dicho nmero.

4 Si tenemos varias distribuciones con la misma media y conocemos sus


respectivas varianzas se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza

1 La varianza, al igual que la media, es un ndice muy sensible a las


puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco ser posible


hallar la varianza.

3 La varianza no viene expresada en las mismas unidades que los datos,


ya que las desviaciones estn elevadas al cuadrado.

Medidas de forma

Sesgo
Sesgo: se puede decir que es como un error que aparece en dicho
resultado de alguna investigacin , esto puede deberse a los factores
que dependen de la recoleccin de datos que nos podran conducir a
conclusiones que pueden ser verdaderas o falsas de lo podramos llamar
la realidad.

Asimetra: esta medida nos permite identificar si los datos que se estn
analizando o investigando se distribuyen de alguna forma uniforme,
existen tres tipos de estado las cuales pueden ser:
9

Asimetra positiva: se dice que esta ocurre cuando la mayora de los


datos recolectados se encuentran por encima del valor de la media
aritmtica.
Simetra: esta sucede cuando los datos recolectados se distribuyen de
una forma igual de ambos lados aproximadamente quedan con los
mismos datos de los dos lados con respecto a la media.
Asimetra Negativa: en este caso es cuando la mayora de los datos
recopilados se juntan o aglomeran en los valores menores que la media.

Ejemplo de los 3 tipos de Asimetra:

Apuntamientos
La curtosis (o apuntamiento) es una medida de forma que mide cun
escarpada o achatada est una curva o distribucin.

Este coeficiente indica la cantidad de datos que hay cercanos a


la media, de manera que a mayor grado de curtosis, ms escarpada (o
apuntada) ser la forma de la curva.

La curtosis se mide promediando la cuarta potencia de la diferencia


entre cada elemento del conjunto y la media, dividido entre
la desviacin tpica elevando tambin a la cuarta potencia. Sea el
conjunto X=(x1, x2,, xN), entonces el coeficiente de curtosis ser:
10

En la frmula se resta 3 porque es la curtosis de una distribucin


Normal. Entonces la curtosis valdr 0 para la Normal, tomndose a sta
como referencia.

Tipos de curtosis

Momentos

Ahora veremos que la media y la varianza son casos particulares


de cantidades ms generales llamadas momentos.

Consideremos la funcin g(X) = Xk, k =1, 2, A la esperanza


matemtica de Xk se le denomina k-simo momento de X.

[4.6]

Si k = 1 , se tiene que el primer momento de X es la media de X, es


decir

E[X1] = (compare con la definicin de la seccin


11

Si g(X) = (X- )k,, obtenemos el k-simo momento central de X. Esto es:

Si el primer momento central existe, debe ser igual a cero.

El segundo momento central de X es la varianza (compare con la


definicin de varianza de la seccin 4.4). Por lo tanto la varianza de
puede obtener como el segundo momento de X menos el cuadrado de la
media.

[4.10]

[4.11]

Obsrvese que de aqu se llega a

[4.12]

FUNCION GENERATRIZ DE MOMENTOS

En algunos casos se pueden calcular los momentos directamente usando


la definicin, sin embargo, habr ocasiones en que resulta ms sencillo
si usamos una funcin auxiliar, y calculamos su esperanza, esto
es:
12

Derivando esta expresin

Derivando k veces, se tiene:

Cuando t = 0, la expresin del lado derecho es el k-simo momento de X

Cuando t = 1,

Medidas de Correlacin

Coeficiente de correlacin
Para poder contar con un indicador que nos permita, por un lado
establecer la covariacin conjunta de dos variables, y por otro, que
tenga la universalidad suficiente para poder establecer comparaciones
entre distintos casos, se utiliza el coeficiente de correlacin (lineal, de
Pearson).La correlacin es, pues una medida de covariacin conjunta
que nos informa del sentido de esta y de su relevancia, que est acotada
y permite la comparacin entre distintos casos.

El coeficiente de correlacin entre dos variables puede definirse como


la covarianza existente entre sus dos variables tipificadas y tiene por
expresin de clculo:
13

Interpretacin:

**Si r < 0 Hay correlacin negativa : las dos variables se correlacionan


en sentido inverso.A valores altos de una de ellas le suelen corresponder
valor bajos de la otra y viceversa.Cunto ms prximo a -1 est el
coeficiente de correlacin ms patente ser esta covariacin extrema.Si
r= -1 hablaremos de correlacin negativa perfecta lo que supone una
determinacin absoluta entre las dos variables ( en sentido inverso):
Existe una relacin funcional perfecta entre ambas(una relacin lineal de
pendiente negativa).

** Si r > 0 Hay correlacin positiva: las dos variables se correlacionan en


sentido directo.A valores altos de una le corresponden valores altos de la
otra e igualmente con los valores bajos.Cunto ms prximo a +1 est el
coeficiente de correlacin ms patente ser esta covariacin.Si r = 1
hablaremos de correlacin positiva perfecta lo que supone una
determinacin absoluta entre las dos variables (en sentido
directo):Existe una relacin lineal perfecta ( con pendiente positiva).

** Si r = 0 se dice que las variables estn incorrelacionadas: no puede


establecerse ningn sentido de covariacin.

Propiedad importante: Si dos variables son independientes estarn


incorrelacionadas aunque el resultado recproco no es necesariamente
cierto.

Coeficiente de correlacin lineal

El coeficiente de correlacin lineal es el cociente entre la covarianza y el


producto de las desviaciones tpicas de ambas variables.

El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades

1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.


14

Es decir, si expresamos la altura en metros o en centmetros el


coeficiente de correlacin no vara.

2. El signo del coeficiente de correlacin es el mismo que el de


la covarianza.

Si la covarianza es positiva, la correlacin es directa.

Si la covarianza es negativa, la correlacin es inversa.

Si la covarianza es nula, no existe correlacin.

3. El coeficiente de correlacin lineal es un nmero real comprendido


entre 1 y 1.

1 r 1

4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la


correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.

5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la


correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.

6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la


correlacin es dbil.

7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o


decreciente. Entre ambas variables hay dependencia funcional.

Recta de regresin
Llamamos linea de regresin a la curva que mejor se ajusta a nube de
puntos, es una curva ideal en torno a la que se distribuyen los puntos de
la nube.
Se utiliza para predecir la variable dependiente (Y) a partir de la
independiente (X).
La diferencia entre el valor real (yi) y el terico (yi*) se llama residuo.

En nuestro caso esta linea es una recta que se calcula imponiendo dos
condiciones:

Debe pasar por el punto (x,y), centro de gravedad de la distribucin.


15

La suma de los cuadrados de los residuos debe ser mnima.

Con esto obtenemos la ecuacin de la


RECTA de REGRESIN de Y sobre X:

La pendiente de esta recta es el llamado

COEFICIENTE de REGRESIN=

Error estndar de estimacin.

El error estndar nos permite deducir la confiabilidad de la ecuacin de


regresin que hemos desarrollado.
Este error se simboliza Se y es similar a la desviacin estndar en
cuanto a que ambas son medidas de dispersin.

El error estndar de la estimacin mide la variabilidad, o dispersin de


los valores observados alrededor de la lnea de regresin y su frmula es
la siguiente

= media de los valores de la variable dependiente


Y = valores de la variable dependiente
n = numero de puntos de datos

Mtodo de atajo para calcular el error estndar de la estimacin

Dado que utilizar la ecuacin anterior requiere una serie de clculos


tediosos, se ha diseado una ecuacin que puede eliminar unos de estos
pasos, la ecuacin es la siguiente:
X = valores de la variable independiente
Y = valores de la variable dependiente
a = interseccin en Y
b = pendiente de la ecuacin de la estimacin
n = numero de puntos de datos

Interpretacin del error estndar de la estimacin

Como se aplicaba en la desviacin estndar, mientras ms grande sea el


error estndar de estimacin, mayor ser la dispersin de los puntos
alrededor de la lnea de regresin. De manera que inversa, si Se = 0,
16

esperemos que la ecuacin de estimacin sea un estimador perfecto de


la variable dependiente. En este caso todos lo puntos deben caer en la
lnea de regresin y no habra puntos dispersos.

Usaremos el error estndar como una herramienta de igual forma que la


desviacin estndar. Esto suponiendo que los puntos observados estn
distribuidos normalmente alrededor de la lnea de regresin, podemos
encontrar un 68% de los puntos en + 1 Se, 95.5% en + 2 Se y 99.7% de
los puntos en + 3 Se. Otra cosa que debemos observar es que el error
estndar de la estimacin se mide a lo largo del eje Y, y no
perpendicularmente de la lnea de regresin.

Intervalos de confianza utilizando desviacin estndar

En estadstica, la probabilidad que asociamos con una estimacin de


intervalo se conoce como el nivel de confianza Esta probabilidad nos
indica que tanta confianza tenemos en que la estimacin del intervalo
incluya al parmetro de la poblacin. Una probabilidad mas alta significa
mas confianza.
El intervalo de confianza es el alcance de la estimacin que estamos
haciendo pero a menudo hacemos el intervalo de confianza en trminos
de errores estndar, para esto debemos calcular el error estndar de la
media as:

Donde es el error estndar de la media para una poblacin infinita, es la


desviacin estndar de la

poblacin. Con frecuencia expresaremos los intervalos de confianza de


esta forma: en la que:
= limite superior del intervalo de confianza
= limite inferior del intervalo de confianza

Relacin entre nivel de confianza e intervalo de confianza.

Podra pensarse que deberamos utilizar un alto nivel de confianza, como


99% en todos los problemas sobre estimaciones, pero en algunos casos
altos niveles de confianza producen intervalos de confianza alto por lo
tanto imprecisos.

Debe tenerse un intervalo de confianza que vaya de acuerdo al tema


que se este estimando.
17

intervalos de prediccin aproximados


Una forma de ver el error estndar de la estimacin es concebirla como
la herramienta estadstica que podemos usar para hacer un enunciado
de probabilidad sobre el intervalo alrededor del valor estimado de ,
dentro del cual cae el valor real de Y.
Cuando la muestra es mayor de 30 datos, se calcula los intervalos de
prediccin aproximados de la siguiente manera. Si queremos estar
seguros en aproximadamente 65% de que el valor real de Y caer dentro
de + 1 error estndar de . Podemos calcular los limites superior e inferior
de este intervalo de prediccin de la siguiente manera:

= Limite superior del intervalo de prediccin


= Limite inferior del intervalo de prediccin

Si, en lugar decimos que estamos seguros en aproximadamente 95.5%


de que el dato real estar dentro de + 2 errores estndar de la
estimacin de . Podramos calcular los limites de este intervalo de la
siguiente manera:

= Limite superior del intervalo de prediccin


= Limite inferior del intervalo de prediccin

y por ultimo decimos que estamos seguros en aproximadamente el


99.7% cuando usamos + 3 errores estndar de la estimacin de
Podramos calcular los limites de este intervalo de la siguiente manera:

= Limite superior del intervalo de prediccin


= Limite inferior del intervalo de prediccin
Como ya habamos mencionado solo se usa para grandes muestras
(mayores de 30 datos) para muestras ms pequeas se usan la
distribucin T. Debemos poner nfasis en que los intervalos de
prediccin son solo aproximaciones, de hecho los estadsticos pueden
calcular el error estndar exacto para la prediccin Sp, usando la
formula en la que:

Qu Aprendi?
Comentario 1

En conclusin, la estadstica es una rama muy amplia que abarca casi


todos los aspectos de la vida, desde la resolucin de un problema a
travs de datos especficos y un conjunto infinitesimal, para comprender
18

la estructura del universo y que posibles alcances tenemos de prosperar


como civilizacin tecnologa

Comentario 2

La estadstica se basa en las probabilidades de que un acontecimiento o


problema, para esto es necesario tener una muestra, a la cual se le
pueden implementar ms tcnicas para obtener una estadstica como lo
es el caso de la media o promedio.

Comentario 3

Respecto a esta investigacin adquirimos nuevos conocimientos bsicos


y avanzados sobre las bases de la estadstica, lo cual nos facilit y ayudo
a comprender las distintas aplicaciones que tiene esta misma en
diversos mbitos.

Comentario 4

Como conclusin tenemos que la probabilidad la encontramos en


situaciones en las que se encuentra distintas pasividades, y la
estadstica contiene datos reales y concretos.

Referencias Bibliogrficas (Cibergrafias)


https://wape23.jimdo.com/unidad-5/5-5-erro-est%C3%A1ndar-de-
estimaci%C3%B3n/

https://www.astm.org/SNEWS/SPANISH/SPND12/datapoints_spnd12.html_
E7

http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo
7/B0C7m1t5.html

http://www.universoformulas.com/estadistica/descriptiva/curtosis/

https://prezi.com/z1ruueecwmj2/sesgo-estadistico/

http://mariaavila-maria.blogspot.mx/2009/05/sesgo-y-curtosis.html

http://www.vitutor.com/estadistica/bi/coeficiente_correlacion.html

https://www.uv.es/ceaces/base/descriptiva/curtosis.html

http://matematicasblecua.ftp.catedu.es/bacmat/temario/bac1/mat1_11re
gresion_te1.htm
19

http://www.vitutor.com/estadistica/descriptiva/a_14.html

https://www.uv.es/ceaces/base/descriptiva/coefcorre.htm

También podría gustarte