Está en la página 1de 11

ESTADISTICA

I: CONCEPTOS GENERALES

I.1.1.- ANTECEDENTES HISTORICOS

I.1.2.-REPRESENTACION e INTERPRETACION DE GRAFICAS.

I.1.3.- ELEMENTOS FUNDAMENTALES

I.1.4.- DISTRIBUCION DE FRECUENCIAS

I.1.5.- ORGANIZACIÓN DE LA INFORMACION

II.-MEDIDAS DE TENDENCIA CENTRAL O DE CENTRALIZACION

II.1.-MEDIA ARITMETICA O PROMEDIO

II.2.-MEDIANA

II.3.-MODA

II.4.-MEDIA GEOMETRICA

II.5.-MEDIA ARMONICA

III.- MEDIDAS DE DISPERCION O DE ASIMETRIA

III.1.-AMBITO o rango

III.2.-DESVIACION MEDIA

III.3.-DESVIACION TIPICA

III.4.-VARIANZA

IV.-MEDIDAS DE FORMA

IV.1.-SESGO

IV.2.-APUNTALAMIENTO

IV.3.-MOMENTOS

V.- MEDIDAS DE CORRELACION.

V.1.-COEFICIENTE DE CORRELACION

V.2.-RECTA DE REGRECION

V.3.-ERROR ESTANDAR DE ESTIMACIO

I.1.-ANTECEDENTES HISTORICOS
“LA ESTADISTICA LA CIENCIA DE LOS DATOS”

Según el diccionario, la ESTADISTICA es “La ciencia que se ocupa de la colección, clasificación ,


análisis e interpretación de Datos Numéricos”. En pocas palabras La Estadística Es La Ciencia De
Todos Los Datos.

La palabra ESTADISTICA proviene de una voz latina statista (Que significa “Estadista”) La acuño a
Morlborough y Gottingen.

Aparentemente fue usada por vez primera en 1672 por Helenus Pálitanos (De Fráncfort) en un
escrito satírico titulado “Microscepiun statisticum”

El Dr E. A. W. Zimmerman introduzco el término en Inglaterra, y su uso lo divulgo Sir. John Sinclair


en su obra titulada “Statistical account of Scotland 1791-1799”. Aunque ya mucho antes del siglo
XVIII se acostumbraba a registrar y a emplear datos.

El origen de la estadística como actividad de recolección sistemática de datos se remonta a la


china antigua 3000 años Ac. Es preciso mencionar que casi todas las civilizaciones antiguas usaron
esta actividad, en mayor o menor escala.

En el antiguo testamento encontramos varias relaciones de censos. Los gobiernos de Babilonia,


Egipto y Roma reunían registros detallados acerca de la población y de los recursos.

Pero en la Edad media (Ojo no la que está en el malecón) los gobiernos empezaron a asentar en
do-cumentos la propiedad del suelo.

En el año 762 d.d.C. El Emperador Carlo Magno pidió Descripciones pormenorizadas de las
propie-dades de la iglesia.

A principios del siglo XIX, Termino un censo estadístico acerca de los esclavos que Vivian
vinculados a la tierra.

Hacia el año 1086, Guillermo El Conquistador ordeno la redacción del libro Domesday Book, un do-
cumento de la propiedad, extensión y valor de las tierras de Inglaterra y esta obra fue el primer
com-pendio Estadístico de Inglaterra.

Debido al temor que Enrique VIII tenía sobre la Peste Bubónica, en Inglaterra empezaron a
registrarse las Defunciones en el año de 1532.

I.2.- REPRESENTACION INTERPRETACION DE GRAFICAS

Los Estadísticos seleccionan sus observaciones de manera que todos los grupos relevantes ..
.. estén representados en los datos.

Los datos provienen de observaciones reales o de documentos que se conservan para usos .
.. …..ordinarios.

Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien

Fundamentadas acerca de las causas y, por lo tanto, sobre los efectos probables de

Ciertas características en algunas situaciones.

Cuando los datos se organizan en forma compacta y útil, los encargados de la toma de

Decisiones se allanan información confiable del ambiente y se valen de ella para llegar

a decisiones inteligentes. Actualmente el uso de las computadoras permiten a los

estadísticos reunir enormes volúmenes de observaciones y condensarlas


Instantáneamente en tablas, graficas y números

Diferencia entre Muestras y Poblaciones

Los estadísticos extraen datos de las muestras. Y esta información les sirve para hacer inferencias
sobre la población que la muestra representa. Así pues Muestra y Población son términos relativos.
La población es un todo mientras que la Muestra es un parte o segmento (Del Todo).

La población es una colección de todos los elementos que estamos estudiando, y de los cuales in-
tentamos extraer conclusiones. Y debemos definirla de modo que quede claro si un elemento es o
no miembro de ella.

La muestra es una colección de algunos de los elementos que componen una población.

Existen muchas maneras de clasificar los datos.

• Podemos simplemente reunirlos y conservarlos en orden

• Si se trata de números , podemos listar los puntos de datos por orden ascendente de valor
nu-mérico.

• Si se trata por ejemplo de trabajadores clasificados, (Digamos, Operarios, Mecánicos,


Carpinteros, etc.) se organizaran de modo distinto. Tendremos que representar los puntos
graficados de datos por orden alfabético o por algún otro principio organizador.

Una manera útil de organizar los datos, consiste en dividirlos en categorías o clases similares y
luego contar el número de observaciones que caen dentro de cada categoría.

Este método da origen a una distribución de Frecuencias.

Una tabla o una distribución de Frecuencias es una manera de sintetizar los datos,

¿Entonces cual es la diferencia entre esto y arreglo?

Una distribución de frecuencias muestra el número de observaciones provenientes del conjunto de


datos que caen dentro de cada una de las clases. Por lo que algunos términos relacionados con la
Distribución de frecuencias son:

Definimos a una Frecuencia como el número de observaciones o repeticiones de un evento o dato.

Frecuencia Absoluta.- La frecuencia absoluta es el número de veces que aparece un determinado


valor en un estudio estadístico. Se representa por fi y se expresa con respecto al total de valores:

Frecuencia absoluta Acumulada.- Es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado, representa por Fi.

Frecuencia Relativa.- Es el cociente entre la frecuencia absoluta de un determinado valor y el


número total de datos.

La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado


valor y el número total de datos.

Se representa por FRA, Se puede expresar en tantos por ciento.


Ejemplo 1:

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas.

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.

, Construya una tabla de frecuencias

EJEMPLO 2:

E n e l e j e m p lo 1 in h e r e n t e s a l r e g i s t r o d e l a s t em pe r a t ur a s m á xi m a s e n
c i e r t a c i u d a d , s u m u e s t r a n l a s d if er e n t e s Fr e c u e n c i a s i n vo l u c r a d a d et e r m i n e l a s
f r e c u e n c i a s a c um u l a d a s y F r e c u e n c i a s r e l a t i va s

xi fi Fi FRA

27 1

28 2

29 6

30 7

31 8

32 3

33 3

34 1
GRAFICACION DE UNA DISTRIBUCION DE FRECUENCIAS.

Las graficas de una distribución de frecuencias ofrecen datos en una representación


Bidimensional, sobre el eje Horizontal, se muestran los valores de la Variable (Es decir, la
característica que estamos midiendo); por ejemplo la edad de los alumnos del 5º C. y sobre
el eje vertical marcamos las frecuen-cias de las clases mostradas sobre el Eje Horizontal.

Las graficas de una distribución de frecuencias y de distribución de frecuencias relativas


nos son útiles porque ponen de relieve y aclaran las tendencias que no se captan tan
fácilmente en las tablas.

HISTOGRAMAS

El Histograma es una serie de rectángulos, todos ellos de anchura proporcional a la gama


de valores dentro de una clase y también de altura proporcional a los elementos que caen
dentro de la clase. Si las clases que empleamos en la distribución de frecuencias tienen el
mismo ancho, las barras verticales del Histograma lo tendrán también.

La altura de la barra de cada clase corresponde al número de elementos de esta última.

Un Histograma que se sirve de la Frecuencia Relativa de las observaciones de datos en


cada una de las clases y no del número real de observaciones recibe el nombre de
histograma de frecuencias relativas.

CLASE O CATERGORIA.- Una clase es una manera de analizar con mayor facilidad un
conjunto de datos o números sin que se tenga que considerar a cada uno de ellos, Una
categoría o Clase recibe el nombre de Intervalo de clase.

INTERVALO DE CLASE. Los valores extremos de de un Intervalo de Clase reciben el


Nombre de Limites de Clase. (Inferior y Superior). Aunque existen otros límites de gran
importancia llamados limites Reales de Clase.

Para hallar el Limite Real Inferior se suma el límite inferior más el número anterior y esto se
divide entre dos.

Para hallar el Limite Real Superior se suma el límite superior más el número que le sigue y
esto se divide entre dos.

Tamaño o anchura de la Clase.- Basta con realizar la diferencia entre los Limites Reales
considerando primero el superior

Marca de la Clase.- Esta se obtiene sumando el límite superior e inferior y esta suma la
dividimos en-tre dos.

Se tiene el número de accidentes que ocurren día a día durante un periodo de 50 días
En la Autopista Acayucan-Veracruz.
Con los construye una tabla de frecuencias:
2 9 6 7 0 8 2 5 4 2
4 4 5 4 4 2 5 6 7 3
8 3 8 4 4 7 4 7 5 6
4 7 3 5 1 7 3 8 0 6
1 5 2 3 0 6 5 6 3 6

CON LOS CONSTRUYE UNA TABLA DE FRECUENCIAS:

DE LA TABLA OBTENEMOS LA SIGUIENTE INFORMACION:

1.- FRECUENCIA DE LA TERCER CLASE:

2.- LÍMITE INFERIOR DE LA CUARTA CLASE:

3.- ANCHO DE CLASE PARA LA TERCER CLASE =

4.- LIMITE INFERIOR PARA LA QUINTA CLASE =

5.- LIMTE REAL IN FERIOR PARA LA TECER CLASE =

6.- LIMITE REAL IN SUPERIOR PARA LA CUARTA CLASE =

7.- TAMAÑO DE LA TERCER CLASE =

8.- MARCA DE LA CUARTA CLASE =


DISTRIBUCIÓN NORMAL O DE GAUSS
La generación de cualquier variable aleatoria se va a basar en la generación previa de una
distribución uniforme (0,1).

Existen varios métodos que nos permiten generar variables aleatorias. Lo normal es que
existan varias opciones para generar una misma variable aleatoria. La elección del método
adecuado se puede basar en una serie de factores como:

Exactitud, se prefiere un método exacto frente a métodos aproximados, como soluciones


numéricas.
Velocidad. Uno de los datos que se toma en consideración es el tiempo de generación de
la variable.

Espacio. Necesidades de memoria del método utilizado. En general, los métodos no


consumen mucha memoria.
Simplicidad.

La distribución normal es una distribución de variable continua que queda especificada por
dos parámetros de los que depende su función de densidad y que resultan ser la
desviación típica de la distribución típica de la distribución. Su estudio teórico suele
introducirse directamente a partir de su función de densidad.

Es, con mucho, la más importante de todas las distribuciones de probabilidad. Es una
distribución de variable continua, con campo de variación (-∞, ∞ ).

Características de la distribución normal de probabilidad

1. La curva tiene un solo pico, por tanto es unimodal. Tiene forma de campana.
2. La media de una población distribuida normalmente cae en el centro de su curva
normal.
3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la
moda de la distribución se encuentran también en el centro; en consecuencia, para
una curva normal, la media, la mediana y la moda tienen el mismo valor.
4. Los dos extremos de la distribución normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal.

La mayor parte de las poblaciones reales no se extienden de manera indefinida en ambas


direcciones; pero para estas poblaciones, la distribución normal es una aproximación
conveniente. No hay una sola distribución normal, sino una familia de curvas normales.
Para definir la distribución normal de probabilidad necesitamos definir solo dos parámetros:
la media (µ) y la desviación típica o estándar (σ).
Teorema: Si y es una variable aleatoria normal con media µ y varianza σ2, entonces:

Es una variable aleatoria normal con media 0 y varianza 1.

Quizás la más importante distribución continua no uniforme es la distribución normal con


media 0 y desviación típica 1. Dicha distribución es llamada, a menudo, distribución normal
unidad o estándar.
La inversa de su función de distribución no es fácil de calcular, pero hay otros métodos
para obtener valores de ella.
LA CURVA DE DISTRIBUCION NORMAL.

Existen dos parámetros estadísticos x y σ (La media aritmética y La Desviación Estándar) , los
cuales son suficientes para interpretar a la curva de distribución normal.

Si x es la media de una muestra aleatoria de tamaño n (o N) tomada de una población con


media µ
y Varianza finita σ2 , Entonces la forma límite de la Distribución de Z es: .
__
u 2
x 
b
1
2 a
Z  e 2
du

n
Lo anterior se cumple siempre y cuando n , y a la que llamamos Distribución Normal
Estándar n (Z; 0, 1)

Consideraciones:
_
1.- L a aproximación normal para x , por lo gral será buena si n  30 sin importar la forma
de la población

2.- Si n  30, Entonces la aproximación no es Normal, a menos que la Población no sea


muy diferente de una Distribución Normal.

3.- Cuando la Población sigue un patrón de distribución Normal. La Distribución muestral de


_
x Seguirá una Distribución Normal exacta, no importa que tan pequeño sea el Tamaño de
la muestra.

PROPIEDADES EXP. MAT


1).- La Distribución de Muestreo Tiene una
Media aritmética igual a la media x  
poblacional
2).- La Distribución de Muestreo tiene una
Desviación estándar (0 error Estándar) 
igual a la Desviación Estándar de la  __ 
x n
población, Dividida entre la Raíz
cuadrada del Tamaño de la muestra.
3).- La Distribución de Muestreo esta
Distribuida normalmente, es decir, es
unidimensional y simétrica. 
EJEMPLO 1:

Un cierto tipo de Batería de almacenamiento Tiene una vida útil en promedio de 3 años, con una
1
x  Año. Suponga además que las duraciones de las Baterías se Distribuye Normalmente,
2
Determine la probabilidad de que una Batería dada dure al menos 2.3 Años.

EJEMPLO 2:

El tiempo Promedio que el cajero de BANAMEX localizado en Abasolo y Malpica (Crucero de la


Muerte) en la Cd. De Coatzacoalcos, es una variable Aleatoria con  = 3.2 Minutos y  = 1.6
Minutos y el cual atiende a los clientes desde el Automóvil, para lo cual se realizo un muestreo
aleatorio con 64 clientes.

a).- Determina la Probabilidad de que su tiempo medio requerido por el cajero, sea a lo máximo 2.7
Minutos.
b).- . . . .Al menos 3.2 Minutos pero menos de 3.4 Minutos.
IV.-MEDIDAS DE FORMA: Asimetría y Curtosis

Para entender Las medidas de forma primero veamos las Medidas de Posición, las cuales se usan para
describir la posición que tiene un valor de datos específicos En relación con el resto de los datos.

Tres de las Medidas de posición mas conocidas son: los Cuartiles los deciles y los Percentiles.

Cuartiles.- Son los valores de la variable que dividen en cuartos a los Datos Ordenados .

El primer cuartil, Q1, es un número tal que cuando mucho el 25% de los datos es menor en valor que Q1.
Y cuando mucho el 75% de los datos es mayor que Q1.

El segundo Cuartil es la Media.

El tercer cuartil, Q3, es un numero tal que cuando mucho el 75% de los datos es menor en valor que Q3
y cuando mucho el 25% de los datos es mayor que Q3.

Datos Ordenados crecientemente

25 % 25 % 25 % 25 %

Min Q1 Q2 Q3 Max

El intervalo intercuartil es la diferencia entre los valores del Primer y el Tercer Cuartil = Q 3
– Q1

¼ de Elementos ¼ de Elementos

Observación 1er Cuartil 2º Cuartil 3er Cuartil Observación


Mas Baja Mas Alta.

Q3  Q1
Desviación Cuartil = .- La desviación Cuartil mide, pues, el intervalo promedio de
2
un cuarto de datos.

Las medidas de forma permiten comprobar si una distribución de frecuencia tiene


características especiales como simetría, asimetría, nivel de concentración de datos y nivel
de apuntamiento que la clasifiquen en un tipo particular de distribución.

Las medidas de forma son necesarias para determinar el comportamiento de los datos y
así, poder adaptar herramientas para el análisis probabilístico

1) ASIMETRÍA

Es una medida de forma de una distribución que permite identificar y describir la manera
como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de
la distribución. Permite identificar las características de la distribución de datos sin
necesidad de generar el gráfico.
1.1) TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los
datos está en la parte izquierda de la media. Este tipo de distribución presenta un
alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la
izquierda una cola más larga que a la derecha. También se dice que una distribución es
simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es
menor que la mediana y éste valor de la mediana a su vez es menor que la moda, en
símbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la
simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma
cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo.
Se representa por una curva normal en forma de campana llamada campana de Gauss
(matemático Alemán 1777-1855) o también conocida como de Laplace (1749-
1827).También se dice que una distribución es simétrica cuando su media aritmética, su
mediana y su moda son iguales, en símbolos Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los
datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un
alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la
derecha una cola más larga que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo
cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la
mediana a su vez es mayor que la moda, en símbolos

2) CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la
distribución normal, es decir, mide cuán puntiaguda es una distribución.

2.1) TIPOS DE CURTOSIS

La curtosis determina el grado de concentración que presentan los valores en la región


central de la distribución. Así puede ser:

Leptocúrtica.- Existe una gran concentración.

Mesocúrtica.- Existe una concentración normal.

Platicúrtica.- Existe una baja concentración.