Está en la página 1de 22

ASIGNATURA: ESTADISTICA Y PROBABILIDADES

PLAN TEMATICO:
UNIDAD I: ESTADSTICA DESCRIPTIVA

UNIDAD II: INTRODUCCIN A LA TEORA DE LAS PROBABILIDADES


UNIDAD III: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES
UNIDAD IV: ESTIMACION Y PRUEBA DE HIPOTESIS
FORMA DE EVALUACION:
UNIDAD I SEMANA 1 SESION # 1
Contenido: Definicin e importancia de la Estadstica.
Partes de la Estadstica.
Formas de recopilacin de datos.
Clasificacin de los datos
Objetivos:
Conocer algunos conceptos bsicos de estadstica para el uso adecuado de
los trminos estadsticos en la solucin de problemas.
Emplear las diferentes formas de recopilacin de datos as como su
clasificacin en informacin estadstica de un problema o fenmeno dado.

INTRODUCCION
La estadstica se remonta a pocas en que los gobernantes requeran de tcnicas
para poder controlar sus propiedades y a las personas.
Posteriormente el desarrollo de los juegos de azar propici el estudio de mtodos
matemtico para su anlisis dando origen a la teora de probabilidades que hoy en
da es el sustento formal d la estadstica.
Actualmente sirve de soporte en todas las ciencias e investigacin cientfica.
Es de gran utilidad para la toma de decisiones en un entorno de incertidumbre.
IMPORTANCIA
La importancia de la estadstica en la ingeniera ha quedado manifiesta al
involucrarse en la industria con la mejora de la calidad.
Muchas compaas se han dado cuenta de que la baja calidad del producto,
manifestada en defectos de fabricacin y en la baja confiabilidad del producto
asociadas con su desempeo de campo, afectan directamente a la
productividad global, a su mercado accionario y a su posicin competitiva y, en
consecuencia, a sus ganancias. La estadstica propicia un criterio para lograr
mejoras, debido a que sus tcnicas se pueden usar para describir y comprender la
variabilidad.
En general, la variabilidad es resultado de los cambios que ocurren en las
condiciones en las cuales se hacen las observaciones. Dentro del contexto de la
manufactura, estos cambios pueden ser diferencias en los materiales de
muestras, diferencias en la forma de trabajar del agente, diferencias en las
variables del proceso, tales como temperatura, presin, o duracin del proceso,
as como diferencias en los factores ambientales, como la humedad relativa.
La variabilidad tambin ocurre debido al sistema de medida empleado. Por
ejemplo, el peso obtenido en una bscula puede depender del lugar en donde se
coloque, en el plato, el objeto por pesar.

Ramas de la estadstica
Las tcnicas estadsticas son tan diversas que los estadsticos, por lo general, las
dividen en dos grandes categoras: estadstica descriptiva y estadstica
inferencial.
Suponga que un profesor de una determinada materia calcula la calificacin
promedio de uno de sus grupos. Como la estadstica describe el desempeo del
grupo, pero no hace ninguna generalizacin acerca de los diferentes grupos.
Podemos decir que el profesor est utilizando estadstica descriptiva.
Suponga ahora que el profesor decide utilizar el promedio de calificacin obtenido
por uno de sus grupos en una unidad, para estimar la calificacin promedio del
grupo en las diez unidades del curso. El proceso de estimacin de tal promedio
sera un problema concerniente a la estadstica inferencial.
Los mtodos y las tcnicas de la inferencia estadstica se pueden utilizar tambin
en una rama de la estadstica conocida como teora de probabilidad o de
decisiones. Es de gran importancia para tomar decisiones en condiciones de
incertidumbre, cuando, por ejemplo, un fabricante de aparatos de sonido no puede
especificar precisamente la demanda de sus productos, o en una escuela se
deben asignar grupos y definir horarios sin tener el conocimiento preciso del
nmero de estudiantes que entrarn al primer grado.
Definiciones bsicas:
Estadstica: estudia los mtodos cientficos para recoger, organizar, resumir y
analizar datos, para sacar conclusiones vlidas y tomar decisiones razonables
mediante el anlisis.

Estadstica descriptiva: tcnicas para recopilar, organizar y presentar datos


obtenidos en una muestra.
Estadstica inferencial: tcnicas para la obtencin de resultados a partir de la
informacin tomada de las muestras.
Poblacin o universo: conjunto total de individuos u objetos con alguna
caracterstica de inters de estudio.
Muestra: subconjunto de la poblacin cuya informacin es usada para estudiar a
la poblacin misma.
Variable: caracterstica observable de los elementos de una poblacin y que
puede tomar diferentes valores.
Tipos:
Variable cualitativa: sus valores no se pueden asociar a un nmero.
Nominales: si sus valores no se pueden ordenar.
Ordinales: si sus valores se pueden ordenar.
Variable cuantitativa: si sus valores son numricos.
Discreta: si toma valores enteros.
Continua: si entre dos valores son posibles infinitos valores intermedios.
Dato: es cada valor incluido en la muestra. Se pueden obtener mediante
observacin o medicin.
Parmetro: caracterstica de la poblacin en estudio y que es de inters conocer.
Ejemplo: valor promedio de la altura de un grupo de estudiantes.

Fuentes de datos Estadsticos:

Los datos estadsticos necesarios para la comprensin de los hechos pueden


obtenerse a travs de fuentes primarias y fuentes secundarias.

Fuentes de datos primarias: es la persona o institucin que ha recolectado


directamente los datos.
Fuentes secundarias: son las publicaciones y trabajos hechos por personas o
entidades que no han recolectado directamente la informacin.

Mtodo para la recoleccin de datos:

La entrevista personal: consiste en enviar un entrevistador o agente,


directamente a la persona investigada.

Cuestionarios por correo: consiste en enviar por correo el cuestionario


acompaado por el instructivo necesario, dando en este no solo las instrucciones
pertinentes para cada una de las preguntas, sino tambin una breve explicacin
del objeto de la encuesta con el fin de evitar interpretaciones errneas.

Entrevista por telfono: consiste en telefonear a la persona a entrevistar y


hacerle una serie de preguntas. Este mtodo es bastante simple y econmico, ya
que el entrenamiento y supervisin de las personas encargadas de efectuar las
preguntas es siempre fcil.

Presentacin de datos.

Todos los todos los cuadros y grficos estadsticos, ya sea para una presentacin
pblica o algn informe escrito deben tener:
Un nmero de figuras, para una identificacin rpida.
Un ttulo, que describa qu se presenta como se clasifica la informacin,
cmo, qu, cundo y dnde ocurri el fenmeno.
Al pie de la figura se debe indicar la fuente de informacin (libro,
investigacin cientfica, revista boletn, etc.
Los cuadros estadsticos se clasifican segn el nmero de variables a presentar, si
solo hay una variable se les llama cuadro de frecuencia, si son dos o ms
variables se les llama cuadro de asociacin.
Ejemplo: cuadro de asociacin deporte vs baile
Los datos que se obtienen al momento de la medicin se le llaman frecuencia
absoluta u observada.
Para la construccin de tablas de frecuencia se procede de la siguiente manera:
Identificar las unidades de medidas de los datos.
Encontrar el Rango. (se recomienda ordenar los datos). Si el rango es
pequeo, podemos presentar para cada valor del rango su frecuencia.
Rango = dato mayor dato mayor.
Seleccionar el nmero K de clases. 5 15
Si K es el nmero de intervalos del mismo tamao C (Amplitud) entonces:
+
=

La tabla de distribucin debe contener la siguiente informacin


clase Limites M fi fr Fi fr% Fi%
reales
(a,b) Distancia Marca de clase Conteo F1=f1 frX100 Fr,1 %
media del + de fr1+fr,2
lmite = datos F2=f1+f2 .
2
superior e F3=
inferior de f1+f2+f3
las clases
sucesivas.
n 1.00 100

En los siguientes datos se recogen los pesos de 40 estudiantes varones de una


universidad con precisin de 1 lb
138 164 150 132 144 125 149 157
146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 130 156 145 128
Construir una tabla de distribucin.
Primer paso ordenar los datos
119, 125, 126, 128, 130, 132, 135, 135, 135, 136, 138, 138, 140, 140, 142, 142,
144, 144, 145, 145, 146, 146, 147,147, 148, 149, 150, 152, 153, 154, 156, 157,
158, 161, 163, 164, 165, 168, 173, 176.

Representacin grfico de conjuntos de datos


1. HISTOGRAMA: Consiste en un conjunto de rectngulos con bases en el
eje X con igual longitud a los tamaos de los intervalos de clases,
centro en las marcas de clases. Las alturas de los rectngulos son
proporcionales a las frecuencias de clases.
2. Polgono de frecuencia: se obtiene conectando los puntos medios de
los extremos superiores de los rectngulos del histograma.
3. Ojiva: La ojiva es la polgona frecuencia acumulada, es decir, que permite ver
cuntas observaciones se encuentran por encima o debajo de ciertos valores,
en lugar de solo exhibir los nmeros asignados a cada intervalo

La ojiva apropiada para informacin que presente frecuencias mayores que el dato
que se est comparando tendr una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendr una pendiente
positiva.

4. Diagramas circulares : Son utilizados en aquellos casos donde nos


interesa no slo mostrar el nmero de veces que se da una
caracterstica o atributo de manera tabular sino ms bien de manera
grfica, de tal manera que se pueda visualizar mejor la proporcin en
que aparece esa caracterstica respecto del total.

5. Diagrama de barras

Este grfico consiste de una serie de barras horizontales overticales asignadas a


cada categora de la variable cualitativa cuyas alturas son dadas por la frecuencia
de la categora. A continuacin se dan algunas sugerencias para la elaboracin de
grficas de barras.

Para respuestas categricas cualitativas, las barras se deben disear en


forma horizontal y para respuestas categricas numricas, en forma
vertical.
Todas las barras deben ser del mismo ancho para no confundir al lector.
Los espacios entre barras deben ser igual a la mitad del ancho de las
barras.
Se deben incluir las escalas y algunas indicaciones para que ayuden a la
lectura de las grficas.
Los ejes de las grficas se deben identificar en forma clara.
Se deben incluir dentro del cuerpo de la grfica, o debajo, todo tipo de
``claves'' para la interpretacin de las grficas.

Son de gran utilidad para distribucin de variables cualitativas.


TERCERA SESION

Semana # 2

Unidad I

Encuentro #1

Contenido: Medidas de tendencia central

media,
mediana,
moda para un conjunto de datos agrupados.

Objetivos: Analiza datos estadstica calculando parmetros de medidas de


tendencia central o valores promedios para emitir una conclusin en la
toma de decisiones de una situacin dada.

MEDIDAS DE TENDENCIA CENTRAL


Un promedio es un valor tpico o representativo de un conjunto de datos.
Como tales valores suelen situarse hacia el centro de conjuntos de datos
ordenados se les conoce como medidas de tendencia central.

Media Aritmtica: la media aritmtica o simplemente media de un


conjunto de datos N no agrupados 1 , 2 , 3,

1 + 2 + 3+ +
=1
= =

Datos con frecuencia

1 1 + 2 2 + 3 3+ +
=1
= =
1 + 2 + 3 + +

Media aritmtica para datos agrupados: similarmente al caso anterior

1 1 + 2 2 + 3 3+ +
=1
= =
1 + 2 + 3 + +

Moda: Es el valor que ocurre con mayor frecuencia en un conjunto de


datos. Puede no existir ser nica o multimodal.

Para datos agrupados: En este caso la moda puede deducirse con la


frmula:

1
= + ( )
1 + 2

Li= lmite inferior de la clase modal.

1=Exceso de la frecuencia modal sobre la de la clase inferior inmediata

2 = Exceso de la frecuencia modal sobre la de la clase superior inmediata.

= amplitud

Mediana: En un conjunto de datos ordenados es el valor central (N-impar) o


la media de los dos valores centrales (N-par).

Para datos agrupados: La mediana viene dado por



= + ( 2 )

=lmite inferior de la clase de la mediana

= frecuencia acumulada anterior a la de la mediana

=frecuencia observada de la mediana.

ENCUENTRO # 2

Contenido: Otros tipos de mediadas de tendencia central

cuartiles,
decles,
percentiles para un conjunto de datos agrupados,
diagrama de caja, interpretacin.

Objetivo: Aprende otras mediadas de posicin tanto para datos agrupados como
para datos no agrupado as como su debida interpretacin de acuerdo al anlisis
de datos dado.

CUANTILES

Los cuantiles son medidas de posicin que se determinan mediante un mtodo


que determina la ubicacin de los valores que dividen un conjunto de
observaciones en partes iguales.
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es
decir, en intervalos que comprenden el mismo nmero de valores. Cuando la
distribucin contiene un nmero alto de intervalos o de marcas y se requiere
obtener un promedio de una parte de ella, se puede dividir la distribucin en
cuatro, en diez o en cien partes.

Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes;
los deciles, cuando dividen la distribucin en diez partes y los centiles o
percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los
deciles y los percentiles, son en cierta forma una extensin de la mediana .
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q2. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.

Para Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes frmulas:

El primer cuartil:
Cuando n es par:

Cuando n es impar:

Para el tercer cuartil

Cuando n es par:
Cuando n es impar:

Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un nmero


grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La frmula para el clculo de los
cuartiles cuando se trata de datos agrupados es la siguiente:
k= 1,2,3
Donde:
Lk = Lmite real inferior de la clase del cuartil k
n = Nmero de datos
Fk= Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k

Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.

DECILES
Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al
conjunto de datos ordenados en diez partes iguales, son tambin un caso
particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen
primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento acadmico.

Datos Agrupados
Para datos agrupados los deciles se calculan mediante la frmula.

k= 1, 2,3,... 9
Donde:
Lk= Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk= Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k

Frmulas Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes frmulas:

Cuando n es par:

Cuando n es impar:
Siendo A el nmero del decil.

CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de
ubicacin o clasificacin de las personas cuando atienden caractersticas tales
como peso, estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados
en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en
cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,...
P99), ledos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan
mediante la frmula:

k= 1,2,3,... 99
Donde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:

Frmulas Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes frmulas:
Para los percentiles, cuando n es par:

Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.

Diagrama de Caja y Bigotes

Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una


presentacin visual que describe varias caractersticas importantes, al mismo
tiempo, tales como la dispersin y simetra.

Para su realizacin se representan los tres cuartiles y los valores mnimo y


mximo de los datos, sobre un rectngulo, alineado horizontal o verticalmente.

Construccin:

Una grfica de este tipo consiste en una caja rectangular, donde los lados ms
largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relacin con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente

Ejemplo distribucin de edades

Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que


representan la edad de un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

Ordenar los datos

Para calcular los parmetros estadstico, lo primero es ordenar la distribucin

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Q1=(24 + 25) / 2 = 24,5

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la


distribucin. En nuestro caso, como 3N / 4 = 15, resulta

Q3=(39 + 39) / 2 = 39

Dibujar la Caja y los Bigotes

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmx).

Informacin del diagrama


Podemos obtener abundante informacin de una distribucin a partir de estas
representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere
decir que las edades comprendidas entre el 25% y el 50% de la poblacin
est ms dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por
ello el 25% de los ms jvenes estn ms concentrados que el 25% de los
mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin
est comprendido en 14,5 aos.

ANEXO

Comparar distribuciones

Comparacin distribucin de edades

Anlogamente a lo realizado con los diagramas de tallo y hojas, comparamos,


mediante estos diagramas, esta distribucin con la del otro ejemplo de distribucin
de edades.

35 38 32 28 30 29 27 19 48 40

39 24 24 34 26 41 29 48 28 22
A partir de dicha comparacin puede obtenerse bastante informacin de ambas
distribuciones.

Comparacin clasificacin liga

Las puntuaciones de los equipos de la liga de futbol BBVA de las temporadas


10/110 y 11/12 se pueden comparar con un diagrama caja y bigotes, como
aparece aqu,
SEMANA 3

ENCUENTRO # 1
Contenido: Formas de las distribuciones: simtricas y anti-simtricas,
medidas de dispersin: rango, varianza, desviacin estndar. Coeficiente de
variacin,
teorema de Chebyshev.
Otras medidas especiales.

OBJETIVO: Analiza la dispersin de los datos con respecto al valor central


a travs del clculo de las medidas de dispersin.

Formas de distribucin
Simtricas: Cuando su curva de frecuencia es simtrica con respecto al
centro de los datos.

Media y mediana coinciden en las distribuciones simtricas. Si slo hay una


moda (distribucin unimodal), el valor de sta tambin ser igual a las dos
anteriores. En distribuciones unimodales, el nivel de simetra se suele
describir de acuerdo a tres grandes categoras: distribuciones simtricas,
distribuciones asimtricas positivas (o sesgada a la derecha) y distribuciones
asimtricas negativas (o sesgada a la izquierda). Tomando como eje de
referencia a la moda, estas categoras de asimetra vienen definidas por el
diferente grado de dispersin de los datos a ambos lados (colas) de ese eje
virtual. La cola ms dispersa en el lado de los valores altos de la variable
caracteriza a la asimetra positiva; si en el lado de los ms bajos, a la
asimetra negativa; y si la dispersin es igual o muy similar a ambos lados,
a una distribucin de frecuencias simtrica.
En caso de asimetra, los valores de la media, mediana y moda difieren. En
concreto si la asimetra es positiva: media>mediana>moda. Si la asimetra
es negativa: media<mediana<moda.

MEDIDAS DE DISPERSION
INTRODUCCION
Para el tratamiento de cierta enfermedad se quieren probar 3 drogas. Para
esto se seleccionan a 15 pacientes que estn en similares condiciones a 5
pacientes le aplican un tipo de droga, luego, se mide el tiempo que transcurre
hasta observar cierta manifestacin. Los resultados fueron:
60, 60, 60, 60, 60
60, 58, 61, 59, 62
40, 70, 50, 60, 80
La media para los 3 casos es 60. Entonces se podra pensar que los tratamientos
son igualmente efectivos.

Por todo esto necesitamos de una medida que nos permita comparar el grado de
dispersin de los datos con respecto al promedio.

Medidas de dispersin:
Existe otro tipo de medidas que indican la tendencia de los datos a dispersarse
respecto al valor central.
Algunas de las medidas de dispersin ms usuales son:
a) Rango, amplitud o recorrido (R)
b) Desviacin estndar (S , muestral; s , poblacional ).
c) Varianza (S , s )
d) Desviacin media (DM).
e) Coeficiente de Variacin (C. V.
Rango: es la diferencia del valor mximo y el valor mnimo de los datos.
Una desventaja del rango es que slo considera los valores extremos y no la
dispersin de los datos a nivel interno.
Desviacin media: es un promedio de las distancia de las observaciones a la
media.

=1| |
Para datos no agrupados =


=1| |
Para datos agrupados =

VARIANZA: Es la medida que cuantifica la variabilidad de los datos respecto al


valor de la media.
( )2
Para datos sin agrupar: 2 = 1

2
=1( )
Para datos agrupados: 2 = 1

DESVIACION ESTANDAR: Es la raz cuadrada positiva de la varianza. Mide la


variabilidad de los datos en las unidades en que se midieron originalmente. Los
smbolos son: s, si es si es una muestra y si es una poblacin.

Para datos no agrupados: = 2

Caractersticas de la desviacin estndar:


1. Siempre es un valor positivo
2. Est influenciada por todos los valores de la muestra o poblacin.
3. Mayor influencia ejercen los valores extremos debido a que son elevados al
cuadrado en el clculo.
4. Sirve para definir la dispersin de los datos alrededor de la media.
Dos grupos teniendo la misma media podemos identificar el ms disperso.
Cuando las medias son diferentes, para identificar cul es el ms variado se tiene
que hacer utilizando el COEFICIENTE DE VARIACIN.

COEFICIENTE DE VARIACIN: Medida de variabilidad relativa: Se usa para


comparar la variabilidad entre dos o ms muestras medidas en las mismas
unidades o no.

= 100

Si el coeficiente es:
< 10 % poca dispersin
10 33% aceptable
34 50% alta dispersin
> 50% muy alta

La regla de Chebyshev
Es una regla que pone un lmite sobre la dispersin de la mayora de los datos en
torno de la media.
Teorema. Para cualquier conjunto de datos, la proporcin de datos que distan
menos de m desviaciones estndar de la media es como mnimo.
1
1
2
Dice, por ejemplo, que por lo menos 75% de las observaciones estn a menos de
m=2 desviaciones estndar de la media y por lo menos, 88.88% de las
observaciones estn a menos de m=3 desviaciones estndar de la media.
Ejemplo: Los siguientes datos son los nmeros de cras nacidas conjuntamente
para 18 parejas de ratones campestres.
365657576665554564
Calculando la media 5.33 y la desviacin estndar 1.03. Luego, la regla de
Chebyshev dice que por los menos un 75% de los datos estn contenidos en el
intervalo (3.27, 7.39) y que el intervalo 5.333x1.03=(2.24, 8.42) contiene por lo
menos un 88.88% de los datos.
( 2, + 2)

También podría gustarte