I: CONCEPTOS GENERALES
II.2.-MEDIANA
II.3.-MODA
II.4.-MEDIA GEOMETRICA
II.5.-MEDIA ARMONICA
III.1.-AMBITO o rango
III.2.-DESVIACION MEDIA
III.3.-DESVIACION TIPICA
III.4.-VARIANZA
IV.-MEDIDAS DE FORMA
IV.1.-SESGO
IV.2.-APUNTALAMIENTO
IV.3.-MOMENTOS
V.1.-COEFICIENTE DE CORRELACION
V.2.-RECTA DE REGRECION
I.1.-ANTECEDENTES HISTORICOS
“LA ESTADISTICA LA CIENCIA DE LOS DATOS”
La palabra ESTADISTICA proviene de una voz latina statista (Que significa “Estadista”) La acuño a
Morlborough y Gottingen.
Aparentemente fue usada por vez primera en 1672 por Helenus Pálitanos (De Fráncfort) en un
escrito satírico titulado “Microscepiun statisticum”
Pero en la Edad media (Ojo no la que está en el malecón) los gobiernos empezaron a asentar en
do-cumentos la propiedad del suelo.
En el año 762 d.d.C. El Emperador Carlo Magno pidió Descripciones pormenorizadas de las
propie-dades de la iglesia.
A principios del siglo XIX, Termino un censo estadístico acerca de los esclavos que Vivian
vinculados a la tierra.
Hacia el año 1086, Guillermo El Conquistador ordeno la redacción del libro Domesday Book, un do-
cumento de la propiedad, extensión y valor de las tierras de Inglaterra y esta obra fue el primer
com-pendio Estadístico de Inglaterra.
Debido al temor que Enrique VIII tenía sobre la Peste Bubónica, en Inglaterra empezaron a
registrarse las Defunciones en el año de 1532.
Los Estadísticos seleccionan sus observaciones de manera que todos los grupos relevantes ..
.. estén representados en los datos.
Los datos provienen de observaciones reales o de documentos que se conservan para usos .
.. …..ordinarios.
Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien
Fundamentadas acerca de las causas y, por lo tanto, sobre los efectos probables de
Cuando los datos se organizan en forma compacta y útil, los encargados de la toma de
Decisiones se allanan información confiable del ambiente y se valen de ella para llegar
Los estadísticos extraen datos de las muestras. Y esta información les sirve para hacer inferencias
sobre la población que la muestra representa. Así pues Muestra y Población son términos relativos.
La población es un todo mientras que la Muestra es un parte o segmento (Del Todo).
La población es una colección de todos los elementos que estamos estudiando, y de los cuales in-
tentamos extraer conclusiones. Y debemos definirla de modo que quede claro si un elemento es o
no miembro de ella.
La muestra es una colección de algunos de los elementos que componen una población.
• Si se trata de números , podemos listar los puntos de datos por orden ascendente de valor
nu-mérico.
Una manera útil de organizar los datos, consiste en dividirlos en categorías o clases similares y
luego contar el número de observaciones que caen dentro de cada categoría.
Una tabla o una distribución de Frecuencias es una manera de sintetizar los datos,
Frecuencia absoluta Acumulada.- Es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado, representa por Fi.
La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas.
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
EJEMPLO 2:
E n e l e j e m p lo 1 in h e r e n t e s a l r e g i s t r o d e l a s t em pe r a t ur a s m á xi m a s e n
c i e r t a c i u d a d , s u m u e s t r a n l a s d if er e n t e s Fr e c u e n c i a s i n vo l u c r a d a d et e r m i n e l a s
f r e c u e n c i a s a c um u l a d a s y F r e c u e n c i a s r e l a t i va s
xi fi Fi FRA
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
GRAFICACION DE UNA DISTRIBUCION DE FRECUENCIAS.
HISTOGRAMAS
CLASE O CATERGORIA.- Una clase es una manera de analizar con mayor facilidad un
conjunto de datos o números sin que se tenga que considerar a cada uno de ellos, Una
categoría o Clase recibe el nombre de Intervalo de clase.
Para hallar el Limite Real Inferior se suma el límite inferior más el número anterior y esto se
divide entre dos.
Para hallar el Limite Real Superior se suma el límite superior más el número que le sigue y
esto se divide entre dos.
Tamaño o anchura de la Clase.- Basta con realizar la diferencia entre los Limites Reales
considerando primero el superior
Marca de la Clase.- Esta se obtiene sumando el límite superior e inferior y esta suma la
dividimos en-tre dos.
Se tiene el número de accidentes que ocurren día a día durante un periodo de 50 días
En la Autopista Acayucan-Veracruz.
Con los construye una tabla de frecuencias:
2 9 6 7 0 8 2 5 4 2
4 4 5 4 4 2 5 6 7 3
8 3 8 4 4 7 4 7 5 6
4 7 3 5 1 7 3 8 0 6
1 5 2 3 0 6 5 6 3 6
Existen varios métodos que nos permiten generar variables aleatorias. Lo normal es que
existan varias opciones para generar una misma variable aleatoria. La elección del método
adecuado se puede basar en una serie de factores como:
La distribución normal es una distribución de variable continua que queda especificada por
dos parámetros de los que depende su función de densidad y que resultan ser la
desviación típica de la distribución típica de la distribución. Su estudio teórico suele
introducirse directamente a partir de su función de densidad.
Es, con mucho, la más importante de todas las distribuciones de probabilidad. Es una
distribución de variable continua, con campo de variación (-∞, ∞ ).
1. La curva tiene un solo pico, por tanto es unimodal. Tiene forma de campana.
2. La media de una población distribuida normalmente cae en el centro de su curva
normal.
3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la
moda de la distribución se encuentran también en el centro; en consecuencia, para
una curva normal, la media, la mediana y la moda tienen el mismo valor.
4. Los dos extremos de la distribución normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal.
Existen dos parámetros estadísticos x y σ (La media aritmética y La Desviación Estándar) , los
cuales son suficientes para interpretar a la curva de distribución normal.
Consideraciones:
_
1.- L a aproximación normal para x , por lo gral será buena si n 30 sin importar la forma
de la población
Un cierto tipo de Batería de almacenamiento Tiene una vida útil en promedio de 3 años, con una
1
x Año. Suponga además que las duraciones de las Baterías se Distribuye Normalmente,
2
Determine la probabilidad de que una Batería dada dure al menos 2.3 Años.
EJEMPLO 2:
a).- Determina la Probabilidad de que su tiempo medio requerido por el cajero, sea a lo máximo 2.7
Minutos.
b).- . . . .Al menos 3.2 Minutos pero menos de 3.4 Minutos.
IV.-MEDIDAS DE FORMA: Asimetría y Curtosis
Para entender Las medidas de forma primero veamos las Medidas de Posición, las cuales se usan para
describir la posición que tiene un valor de datos específicos En relación con el resto de los datos.
Tres de las Medidas de posición mas conocidas son: los Cuartiles los deciles y los Percentiles.
Cuartiles.- Son los valores de la variable que dividen en cuartos a los Datos Ordenados .
El primer cuartil, Q1, es un número tal que cuando mucho el 25% de los datos es menor en valor que Q1.
Y cuando mucho el 75% de los datos es mayor que Q1.
El tercer cuartil, Q3, es un numero tal que cuando mucho el 75% de los datos es menor en valor que Q3
y cuando mucho el 25% de los datos es mayor que Q3.
25 % 25 % 25 % 25 %
Min Q1 Q2 Q3 Max
El intervalo intercuartil es la diferencia entre los valores del Primer y el Tercer Cuartil = Q 3
– Q1
¼ de Elementos ¼ de Elementos
Q3 Q1
Desviación Cuartil = .- La desviación Cuartil mide, pues, el intervalo promedio de
2
un cuarto de datos.
Las medidas de forma son necesarias para determinar el comportamiento de los datos y
así, poder adaptar herramientas para el análisis probabilístico
1) ASIMETRÍA
Es una medida de forma de una distribución que permite identificar y describir la manera
como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de
la distribución. Permite identificar las características de la distribución de datos sin
necesidad de generar el gráfico.
1.1) TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los
datos está en la parte izquierda de la media. Este tipo de distribución presenta un
alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la
izquierda una cola más larga que a la derecha. También se dice que una distribución es
simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es
menor que la mediana y éste valor de la mediana a su vez es menor que la moda, en
símbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la
simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma
cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo.
Se representa por una curva normal en forma de campana llamada campana de Gauss
(matemático Alemán 1777-1855) o también conocida como de Laplace (1749-
1827).También se dice que una distribución es simétrica cuando su media aritmética, su
mediana y su moda son iguales, en símbolos Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los
datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un
alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la
derecha una cola más larga que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo
cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la
mediana a su vez es mayor que la moda, en símbolos
2) CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la
distribución normal, es decir, mide cuán puntiaguda es una distribución.