Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Prob y Esta
Prob y Esta
ESTADISTICA DESCRIPTIVA
02/05/2011
Conceptos básicos:
Definición: La Estadística es la rama de la Matemática que se ocupa de
recopilar datos (en censos, encuestas, etc), de organizarlos para una
mejor comprensión del fenómeno que se desea estudiar y de
analizarlos con un determinado objetivo.
La estadística se aplica a todas las ciencias, pues facilita el estudio de
hechos del mundo o de la sociedad.
Se puede decir que la Teoría de decisión es una de las ramas que sirve para que al
dar un paso, no se vaya a dar en falso, porque si se conoce de esta no hay el
porqué de equivocarse.
Población: El concepto de población en estadística va más allá de lo que
comúnmente se conoce como tal. Una población se precisa como un
conjunto finito o infinito de personas u objetos que presentan características
comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica
común". Cadenas (1974)
Muestra aleatoria: Es una muestra sacada de una población de unidades,
de manera que todo elemento de la población tenga la misma probabilidad
de selección y que las unidades diferentes se seleccionen
independientemente.
Parámetros aleatorios: es aquello que toma diversos valores o conjuntos de
valores con distintas probabilidades. Existen 2 características importantes de una
variable aleatoria, sus valores y las probabilidades asociadas a esos valores.
DESCRIPCION DE DATOS:
Datos agrupados y no agrupados: Cuando la muestra que se ha tomado de
la población o proceso que se desea analizar, es decir, tenemos menos de 20
elementos en la muestra, entonces estos datos son analizados sin necesidad de
formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no
agrupados.
Frecuencia de clases:
Frecuencia relativa:
[editar]Tipos de frecuencia
En estadística se pueden distinguir hasta cuatro tipos de frecuencias (véase fig.1), estas son:
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento
(pi) que presentan esta característica respecto al total de N, es decir el 100% del conjunto.
Frecuencia absoluta acumulada (Ni), es el número de veces ni en la muestra N con un
valor igual o menor al de la variable. La última frecuencia absoluta acumulada deberá ser
igual a N.
Punto medio: Para fines de análisis de datos, los valores de las clases se representan a
través del punto medio de clase o marca de clase. El punto medio de clase se define como la semi-
suma de los límites de clase. El punto medio de clase se identifica como Xi, donde Xi = ½ (límite
superior + límite inferior).
Límites: Son los valores extremos que tiene el intervalo de clase, inferior y superior,
entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
Límite Superior (LS) : es el “tope” del rango de una o un conjunto de mediciones, y
se construye sumando la desviación (S) al promedio (X).
Límite Inferior (LI) : igual pero en el otro extremo, equivale a restar del promedio la
desviación estándar (X-S).
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo
número. Para tal fin, desde luego, no se usará el valor mas elevado ni el valor mas pequeño
como único representante, ya que solo representan los extremos. mas bien que valores típicos.
Entonces sería mas adecuado buscar un valor central.
Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse
medidas de tendencia central..Es importante tener en cuenta que estas medidas se aplican a
grupos mas bien que a individuos. un promedio es una característica de grupo, no individual.
MEDIANA: Otra medida de tendencia central que se utiliza con mucha frecuencia es
la mediana, que es el valor situado en medio en un conjunto de observaciones
ordenadas por magnitud.
MODA: Otra medida de tendencia central es la moda. La moda es el valor que ocurre
con mas frecuencia en un conjunto de observaciones.
MEDIDAS DE DISPERSION: Las medidas de dispersión nos
Rango o recorrido
distribución estadística.
Ecuación 5-8
Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente
de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en
gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de
ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520)
gramos respectivamente.
Por lo que su media es:
La varianza sería:
Por lo tanto la desviación estándar sería:
Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una
tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le
permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de
peso en los empaq
DESVICION MEDIA: La desviación respecto a la media es
D i = x - x
Si estas diferencias son muy grandes, entonces estamos ante un caso de gran variabilidad, y si
son pequeñas se espera que la variabilidad sea pequeña.
Naturalmente que el criterio que parece más apropiado es agrupar las discrepancias individuales y
tratarlas en conjunto.
Un agrupamiento natural sería una suma de ellas, pero el sólo uso de las diferencias no garantiza
que se pueda medir discrepancias porque algunas (prácticamente la mitad) serán menores que la
mediana, con diferencias negativas, y el resto mayores que la mediana, con diferencias positivas, y
al sumar dichos valores habría compensaciones entre valores negativos y positivos.
Por lo tanto, una salida a esta dificultad es considerar el valor absoluto de la diferencias calculadas
y promediarlos.
Dado un conjunto de datos, x1, ..., xn su desviación mediana d.m., está definida por :
Puede verse entonces que, cuanto mayor sea la dispersión existente entre los datos, tanto mayor
tenderá a ser el promedio del valor absoluto de las diferencias de los datos, respecto de la mediana
muestral.
Esta estadística se encuentra medida en la misma escala que los datos originales, lo que facilita su
comprensión.
distribución estadística.
PARAMETROS PARA DATOS AGRUPADOS:
• En el estudio de las distribuciones de datos, la estadistica selecciona
un conjunto de los mismos de forma que sean representativos de
todos los de la distribución.
La media:
La desviación típica:
cada dato su frecuencia correspondiente .
Tipos de frecuencia
Frecuencia absoluta
Se representa por f i .
Frecuencia relativa
Frecuencia acumulada
Se representa por F i .
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
48 47 44 43 42 41 39 39 38 38
48 47 44 43 42 41 39 39 38 38
Por lo tanto:
Rango = 48 – 38 = 10
Son los puntos medios entre límites de clases adyacentes. Los límites de una clase
estarán siempre contenidos entre las fronteras de la misma clase y tendrán mayor
aproximación que los datos, y por lo tanto también que los límites.
Rango
48 – 38 / 2 = 5
Los intervalos de clase se emplean si las variables toman un número grande de valores o
la variable es continua.
El diagrama de Pareto, es una gráfica para organizar datos de forma que estos queden
en orden descendente, de izquierda a derecha y separados por barras.
INTRODUCCION
Al tomar varias muestras de una población, las estadísticas que calculamos para
cada muestra no necesariamente serían iguales, y lo más probable es que
variaran de una muestra a otra.
TEORIA:
Muestreo probabilístico
Forman parte de este tipo de muestreo todos aquellos métodos para los que
puede calcularse la probabilidad de extracción de cualquiera de las muestras
posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque
en ocasiones no es posible optar por él. En este caso se habla de muestras
probabilísticas, pues no es en rigor correcto hablar de muestras representativas
dado que, al no conocer las características de la población, no es posible tener
certeza de que tal característica se haya conseguido.
Muestreo estratificado
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está
compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra
que contenga también esos mismos porcentajes de hombres y mujeres.
Muestreo sistemático
Muestreo de juicio
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra,
y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en
los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de
estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias
naturales y exactas. Y permite la comparación de los resultados de un proceso.
BIBLIOGRAFIA
http://www.mitecnologico.com
http://gonzalomeza.wordpress.com/2008/09/01/clase-estadisticas-frecuencias-relativas-y-
acumuladas/
http://www.ditutor.com/estadistica/limites_clase.html
http://www.vitutor.net/2/11/distribucion_frecuencias.html
http://www.monografias.com/trabajos30/conceptos-de-estadistica/conceptos-de-
estadistica.shtml#estadist
http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/histograma.html
https://docs.google.com/viewer?url=https%3A%2F%2Fwww.itescam.edu.mx%2Fprincipal
%2Fsylabus%2Ffpdb%2Frecursos%2Fr65945.DOC
INTRODUCCION
Fácil