Prob y Esta

INSTITUTO TECNOLÓGICO DE LEÓN
ING. SISTEMAS COMPUTACIONALES
JAVIER ALBERTO MANRIQUE MENDOZA
JOSE ALEJANDRO RODRIGUEZ RENTERIA
ESTADISTICA DESCRIPTIVA
02/05/2011
Conceptos básicos:
 Definición: La Estadística es la rama de la Matemática que se ocupa de
recopilar datos (en censos, encuestas, etc), de organizarlos para una
mejor comprensión del fenómeno que se desea estudiar y de
analizarlos con un determinado objetivo.
La estadística se aplica a todas las ciencias, pues facilita el estudio de
hechos del mundo o de la sociedad.
 Teoría de decisión: Los estudios de casos reales, que se sirven de la

inspección y los experimentos, se denominan teoría descriptiva de decisión;
los estudios de la toma de decisiones racionales, que utilizan la lógica y la
estadística, se llaman teoría preceptiva de decisión. Estos estudios se hacen
más complicados cuando hay más de un individuo, cuando los resultados de
diversas opciones no se conocen con exactitud y cuando las probabilidades
de los distintos resultados son desconocidas. La teoría de decisión comparte
características con la teoría de juegos, aunque en la teoría de decisión el
‘adversario’ es la realidad en vez de otro jugador o jugadores.
se puede decir que al tomar una decisión sobre un problema en particular,

se debe tener en cuenta los puntos de dificultad que lo componen, para así
empezar a estudiarlos uno a uno hasta obtener una solución que sea acorde
a lo que se está esperando obtener de este, y si no, buscar otras soluciones
que se acomoden a lo deseado.
La teoría de decisión, no solamente se puede ver desde el punto de vista de un

sistema, sino en general, porque esta se utiliza a menudo para tomar decisiones
de la vida cotidiana, ya que muchas personas piensan que la vida es como una de
las teorías; La teoría del juego, que para poder empezarlo y entenderlo hay que
saber jugarlo y para eso se deben conocer las reglas de este, para que no surjan
equivocaciones al empezar la partida.
Se puede decir que la Teoría de decisión es una de las ramas que sirve para que al
dar un paso, no se vaya a dar en falso, porque si se conoce de esta no hay el
porqué de equivocarse.
 Población: El concepto de población en estadística va más allá de lo que
comúnmente se conoce como tal. Una población se precisa como un
conjunto finito o infinito de personas u objetos que presentan características
comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica
común". Cadenas (1974)
 Muestra aleatoria: Es una muestra sacada de una población de unidades,
de manera que todo elemento de la población tenga la misma probabilidad
de selección y que las unidades diferentes se seleccionen
independientemente.
 Parámetros aleatorios: es aquello que toma diversos valores o conjuntos de
valores con distintas probabilidades. Existen 2 características importantes de una
variable aleatoria, sus valores y las probabilidades asociadas a esos valores.
DESCRIPCION DE DATOS:
 Datos agrupados y no agrupados: Cuando la muestra que se ha tomado de
la población o proceso que se desea analizar, es decir, tenemos menos de 20
elementos en la muestra, entonces estos datos son analizados sin necesidad de
formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no
agrupados.
Cuando la muestra consta de 20 o más datos, lo aconsejable es agrupar los datos en

clases y a partir de estas determinar las características de la muestra y por
consiguiente las de la población de donde fue tomada.
Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución

que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de
ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al
tamaño de las unidades originales. En estas distribuciones cada dato mantiene su
propia identidad después que la distribución de frecuencia se ha elaborado. En estas
distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo
un orden lógico con sus respectivas frecuencias.
Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella

distribución en la que la disposición tabular de los datos estadísticos se encuentran
ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de
varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.
No existen normas establecidas para determinar cuándo es apropiado utilizar datos

agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total
de datos (N) es igual o superior 20, se utilizará la distribución de frecuencia para datos
agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar
gráficos lineales como el histograma, el polígono de frecuencia o la ojiva. La razón
fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor
comunicación acerca del patrón establecido en los datos y facilitar la manipulación de
los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar
o hacer que la información obtenida de una investigación sea manejable con mayor
facilidad.
 Frecuencia de clases:
 Frecuencia relativa:
Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.
Se suelen representar con histogramas y con diagramas de Pareto.
[editar]Tipos de frecuencia
En estadística se pueden distinguir hasta cuatro tipos de frecuencias (véase fig.1), estas son:
 Frecuencia absoluta (ni) de una variable estadística Xi, es el número de veces que

aparece en el estudio este valor . A mayor tamaño de la muestra, aumentará el tamaño de la
frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total
de la muestra estudiada (N).
 Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la

muestra (N). Es decir,
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en

una distribución de frecuencias (ver fig.1 y (fig.2).
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento
(pi) que presentan esta característica respecto al total de N, es decir el 100% del conjunto.
 Frecuencia absoluta acumulada (Ni), es el número de veces ni en la muestra N con un
valor igual o menor al de la variable. La última frecuencia absoluta acumulada deberá ser
igual a N.
 Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta

acumulada y el número total de datos, N. Es decir,
Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)),

que al igual que Fi deberá de resultar al final el 100% de N.
 Punto medio: Para fines de análisis de datos, los valores de las clases se representan a
través del punto medio de clase o marca de clase. El punto medio de clase se define como la semi-
suma de los límites de clase. El punto medio de clase se identifica como Xi, donde Xi = ½ (límite
superior + límite inferior).
 Límites: Son los valores extremos que tiene el intervalo de clase, inferior y superior,
entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
 Límite Superior (LS) : es el “tope” del rango de una o un conjunto de mediciones, y
se construye sumando la desviación (S) al promedio (X).
 Límite Inferior (LI) : igual pero en el otro extremo, equivale a restar del promedio la
desviación estándar (X-S).
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo
número. Para tal fin, desde luego, no se usará el valor mas elevado ni el valor mas pequeño
como único representante, ya que solo representan los extremos. mas bien que valores típicos.
Entonces sería mas adecuado buscar un valor central.
Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse
medidas de tendencia central..Es importante tener en cuenta que estas medidas se aplican a
grupos mas bien que a individuos. un promedio es una característica de grupo, no individual.
MEDIDA ARITMETICA, GEOMETRICA Y PONDERADA:

ARITMETICA: La medida de tendencia central mas obvia que se puede elegir, es el simple
promedio de las observaciones del grupo, es decir el valor obtenido sumando las observaciones
y dividiendo esta suma por el número de observaciones que hay en el grupo.
GEOMETRICA: La media geométrica de un conjunto de observaciones es la raíz n ésima de
su producto. El cálculo de la media geométrica exige que todas las observaciones sean
positivas.
PONDERADA: En ciertas circunstancias no todas las observaciones tienen igual peso. En

general si se tienen observaciones con sus respectivos pesos es:
 MEDIANA: Otra medida de tendencia central que se utiliza con mucha frecuencia es
la mediana, que es el valor situado en medio en un conjunto de observaciones
ordenadas por magnitud.
 MODA: Otra medida de tendencia central es la moda. La moda es el valor que ocurre
con mas frecuencia en un conjunto de observaciones.
MEDIDAS DE DISPERSION: Las medidas de dispersión nos
informan sobre cuánto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una
distribución estadística.
VARIANZA: La varianza es la media aritmética del cuadrado de las
desviaciones respecto a la media de una distribución estadística.
La varianza se representa por .
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes
expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados
DESVIACION ESTANDAR: . Desviación estándar o Típica

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos
respecto a su punto central o media. La desviación estándar nos da como resultado un valor
numérico que representa el promedio de diferencia que hay entre los datos y la media. Para
calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su
ecuación sería:

Ecuación 5-8

Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente
de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en
gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de
ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520)
gramos respectivamente.

Por lo que su media es:

La varianza sería:

Por lo tanto la desviación estándar sería:

Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una
tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le
permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de
peso en los empaq
DESVICION MEDIA: La desviación respecto a la media es
la diferencia entre cada valor de la variable estadística y la media aritmética .
D i = x - x
La desviación media es la media aritmética de los valores absolutos
de las desviaciones respecto a la media .
La desviación media se representa por
Desviación media para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión
de la desviación media es:
DESVIACION MEDIANA: El criterio que guía esta estadística, radica en el uso de

diferencias de cada dato respecto a la mediana muestral m.
Si estas diferencias son muy grandes, entonces estamos ante un caso de gran variabilidad, y si
son pequeñas se espera que la variabilidad sea pequeña.
Naturalmente que el criterio que parece más apropiado es agrupar las discrepancias individuales y
tratarlas en conjunto.
Un agrupamiento natural sería una suma de ellas, pero el sólo uso de las diferencias no garantiza
que se pueda medir discrepancias porque algunas (prácticamente la mitad) serán menores que la
mediana, con diferencias negativas, y el resto mayores que la mediana, con diferencias positivas, y
al sumar dichos valores habría compensaciones entre valores negativos y positivos.
Por lo tanto, una salida a esta dificultad es considerar el valor absoluto de la diferencias calculadas
y promediarlos.
Esto conduce a la definición siguiente:
Dado un conjunto de datos, x1, ..., xn su desviación mediana d.m., está definida por :
donde m representa la mediana de los datos.
Puede verse entonces que, cuanto mayor sea la dispersión existente entre los datos, tanto mayor
tenderá a ser el promedio del valor absoluto de las diferencias de los datos, respecto de la mediana
muestral.
Esta estadística se encuentra medida en la misma escala que los datos originales, lo que facilita su
comprensión.
 RANGO: Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una
distribución estadística.
PARAMETROS PARA DATOS AGRUPADOS:
• En el estudio de las distribuciones de datos, la estadistica selecciona
un conjunto de los mismos de forma que sean representativos de
todos los de la distribución.
• Estos datos seleccionados se denominan características de la

distribución o parámetros estadísticos.
La media:
• En matemáticas y estadística una media o promedio es una medida

de tendencia central que según la Real Academia Española resulta al
efectuar una serie determinada de operaciones con un conjunto de
números y que, en determinadas condiciones, puede representar por
sí solo a todo el conjunto. Existen distintos tipos de medias, tales
como la media geométrica, la media ponderada y la media armónica
aunque en el lenguaje común, el término se refiere generalmente a la
media aritmética.
• La media aritmética es un promedio estándar que a menudo se

denomina "promedio".
• La media se confunde a veces con la mediana o moda. La media

aritmética es el promedio de un conjunto de valores, o su
distribución; sin embargo, para las distribuciones con sesgo, la media
no es necesariamente el mismo valor que la mediana o que la moda.
La media o moda son elementos intuitivos de medir los datos. Es a
veces una forma de medir el sesgo de una distribución tal y como se
puede hacer en las distribuciones exponencial y de Poisson.
La desviación típica:
• La desviación típica es la raíz cuadrada de la varianza.
• Es decir, la raíz cuadrada de la media de los cuadrados de las

puntuaciones de desviación.
La desviación típica se representa por σ
• 1 La desviación típica será siempre un valor positivo o cero, en el caso

de que las puntuaciones sean iguales.
• 2 Si a todos los valores de la variable se les suma un número la

desviación típica no varía.
• 3 Si todos los valores de la variable se multiplican por un número la

desviación típica queda multiplicada por dicho número.
• 4 Si tenemos varias distribuciones con la misma media y conocemos

sus respectivas desviaciones típicas se puede calcular la desviación
típica total.
DISTRIBBUCION DE FRECUENCIAS
Una distribución de frecuencias o tabla de frecuencias es
una ordenación en forma de tabla de los datos estadísticos , asignando a
cada dato su frecuencia correspondiente .
Tipos de frecuencia
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un
determinado valor en un estudio estadístico.
Se representa por f i .
La suma de las frecuencias absolutas es igual al número total de datos,
que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma
mayúscula) que se lee suma o sumatoria.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos .
Se puede expresar en tantos por ciento y se representa por n i .

La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales alvalor considerado.
Se representa por F i .
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia
acumulada de un determinado valor y elnúmero total de datos . Se puede
expresar en tantos por ciento.

TECNICAS DE AGRUPACION DE DATOS
Se parte de la información de datos no agrupados y se expresa el valor de cada dato, y
cuantas veces se repite.
• 1.7.1 LIMITES DE CLASE
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
Ejemplo: Teniendo los siguientes datos Determinar limite superior e inferior:
48 47 44 43 42 41 39 39 38 38
• LIMITE SUPERIOR: 48.(Dato de mayor valor)
• LIMITE INFERIOR: 38. (Dato de menor Valor)
• 1.7.2 RANGO DE CLASE
Es la diferencia entre el limite superior y el limite inferior y a esto se le conoce como

Rango de datos.
Por ejemplo, Teniendo los siguientes datos determinar el rango de clase.
48 47 44 43 42 41 39 39 38 38
Rango = Limite superior – Limite inferior
Por lo tanto:
Rango = 48 – 38 = 10
• 1.7.3 FRONTERAS DE CLASE
Son los puntos medios entre límites de clases adyacentes. Los límites de una clase
estarán siempre contenidos entre las fronteras de la misma clase y tendrán mayor
aproximación que los datos, y por lo tanto también que los límites.
• 1.7.4 MARCA DE CLASE
La marca de clase es el punto medio de cada intervalo.

La marca de clase es el valor que representa a todo el intervalo para el cálculo de
algunos parámetros.
Rango
( limite inferior , limite superior) MARCAS DE CLASE

38 48 (= limite superior+ limite inferior/ 2)

48 – 38 / 2 = 5
• 1.7.5 INTERVALO DE CLASE
Los intervalos de clase se emplean si las variables toman un número grande de valores o
la variable es continua.
El Intervalo se utiliza para trabajar con grandes cantidades de datos.
• 1.7.6 DIAGRAMA DE TALLOS Y HOJAS
Un diagrama donde cada valor de datos es dividido en una "hoja" (normalmente el

último dígito) y un "tallo" (los otros dígitos). Por ejemplo "32" sería dividido en "3"
(tallo) y "2" (hoja).
• 1.7.7 DIAGRAMA DE PARETO
El diagrama de Pareto, es una gráfica para organizar datos de forma que estos queden
en orden descendente, de izquierda a derecha y separados por barras.
• 1.7.8 DIAGRAMA DE PUNTOS
Un gráfico de puntos que muestra la relación entre dos conjuntos de datos.

En este ejemplo, cada punto representa el peso de una persona y la altura de la misma
persona.
TECNICAS DE MUESTREO
INTRODUCCION
En estadística un muestreo es la técnica para la selección de una muestra a partir

de una población. En el muestreo, si el tamaño de la muestra es más pequeño que
el tamaño de la población, se puede extraer dos o más muestras de la misma
población. Al conjunto de muestras que se pueden obtener de la población se
denomina espacio muestral. La variable que asocia a cada muestra su
probabilidad de extracción
El muestreo: es una herramienta de la investigación científica. Su función básica

es determinar que parte de una realidad en estudio (población o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha población
El Muestreo es más que el procedimiento empleado para obtener una o más

muestras de una población; el muestreo es una técnica que sirve para obtener una
o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral representativo

de la población, se procede a la selección de los elementos de la muestra aunque
hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para
cada muestra no necesariamente serían iguales, y lo más probable es que
variaran de una muestra a otra.
TEORIA:
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no

aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en
el proceso de selección). Cuando este último cumple con la condición de que
todos los elementos de la población tienen alguna oportunidad de ser escogidos
en la muestra, si la probabilidad correspondiente a cada sujeto de la población es
conocida de antemano, recibe el nombre de muestreo probabilístico. Una muestra
seleccionada por muestreo de juicio puede basarse en la experiencia de alguien
con la población. Algunas veces una muestra de juicio se usa como guía o
muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.
Muestreo probabilístico
Forman parte de este tipo de muestreo todos aquellos métodos para los que
puede calcularse la probabilidad de extracción de cualquiera de las muestras
posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque
en ocasiones no es posible optar por él. En este caso se habla de muestras
probabilísticas, pues no es en rigor correcto hablar de muestras representativas
dado que, al no conocer las características de la población, no es posible tener
certeza de que tal característica se haya conseguido.
Sin reposición de los elementos: Cada elemento extraído se descarta para la

subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población"
de bombillas para estimar la vida media de las bombillas que la integran, no será
posible medir más que una vez la bombilla seleccionada.
Con reposición de los elementos: Las observaciones se realizan con

reemplazamiento de los individuos, de forma que la población es idéntica en todas
las extracciones. En poblaciones muy grandes, la probabilidad de repetir una
extracción es tan pequeña que el muestreo puede considerarse sin reposición
aunque, realmente, no lo sea.
Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir

una extracción es tan pequeña que el muestreo puede considerarse sin
reposición. Cada elemento extraído se descarta para la subsiguiente extracción.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la

extracción de números aleatorios mediante ordenadores, calculadoras o tablas
construidas al efecto.
Muestreo estratificado
Consiste en la división previa de la población de estudio en grupos o clases que se

suponen homogéneos con respecto a alguna característica de las que se van a
estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría
el número de miembros del mismo que compondrán la muestra. Dentro de cada
estrato se suele usar la técnica de muestreo sistemático, una de las técnicas de
selección más usadas en la práctica.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno

de los estratos, existen dos técnicas de muestreo estratificado:
 Asignación proporcional: el tamaño de la muestra dentro de cada estrato

es proporcional al tamaño del estrato dentro de la población.
 Asignación óptima: la muestra recogerá más individuos de aquellos

estratos que tengan más variabilidad. Para ello es necesario un
conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está
compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra
que contenga también esos mismos porcentajes de hombres y mujeres.
Para una descripción general del muestreo estratificado y los métodos de

inferencia asociados con este procedimiento, suponemos que la población está
dividida en h subpoblaciones o estratos de tamaños conocidos N1, N2,..., Nh tal que
las unidades en cada estrato sean homogéneas respecto a la característica en
cuestión. La media y la varianza desconocidas para el i-ésimo estrato son
denotadas por mi y s12, respectivamente.
Muestreo sistemático
Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse

en el tiempo. Primero hay que identificar las unidades y relacionarlas con el
calendario (cuando proceda). Luego hay que calcular una constante, que se
denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n
el tamaño de la muestra. Determinar en qué fecha se producirá la primera
extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en
adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es
conveniente tener en cuenta la periodicidad del fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la
población y queremos escoger de esa población un número más pequeño el cual
es la muestra, dividimos el número de la población por el número de la muestra
que queremos tomar y el resultado de esta operación será el intervalo, entonces
escogemos un número al azar desde uno hasta el número del intervalo, y a partir
de este número escogemos los demás siguiendo el orden del intervalo.
Muestreo por estadios múltiples
Esta técnica es la única opción cuando no se dispone de lista completa de la

población de referencia o bien cuando por medio de la técnica de muestreo simple
o estratificado se obtiene una muestra con unidades distribuidas de tal forma que
resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la
población en varios niveles ordenados que se extraen sucesivamente por medio
de un procedimiento de embudo. El muestreo se desarrolla en varias fases o
extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en

un país determinado, éstos pueden subdividirse en unidades primarias
representadas por circunscripciones didácticas y unidades secundarias que serían
los propios profesores. En primer lugar extraemos una muestra de las unidades
primarias (para lo cual debemos tener la lista completa de estas unidades) y en
segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de
cada una de las primarias seleccionadas en la primera extracción.
Muestreo por conglomerados
Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población

se encuentra dividida, de manera natural, en grupos que se supone que contienen
toda la variabilidad de la población, es decir, la representan fielmente respecto a la
característica a elegir, pueden seleccionarse sólo algunos de estos grupos o
conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por

ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición
a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar
a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de
simplificar la recogida de información muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos

individuos para integrar la muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer
método funciona mejor cuanto más homogénea es la población respecto del
estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo
contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben
ser muy parecidos entre sí.
Muestreo de juicio
Aquél para el que no puede calcularse la probabilidad de extracción de una

determinada muestra. Se busca seleccionar a individuos que se juzga de
antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se
considera que la información aportada por esas personas es vital para la toma de
decisiones.
Muestreo por cuotas
Es la técnica más difundida sobre todo en estudios de mercado y sondeos de

opinión. En primer lugar es necesario dividir la población de referencia en varios
estratos definidos por algunas variables de distribución conocida (como el género
o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es
decir, la parte proporcional de población que representan. Finalmente se multiplica
cada peso por el tamaño de n de la muestra para determinar la cuota precisa en
cada estrato. Se diferencia del muestreo estratificado en que una vez determinada
la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de
cada estrato.
Muestreo de bola de nieve
Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas

pero en contacto entre sí. Consiste en identificar sujetos que se incluirán en la
muestra a partir de los propios entrevistados. Partiendo de una pequeña cantidad
de individuos que cumplen los requisitos necesarios estos sirven como
localizadores de otros con características análogas.
Muestreo subjetivo por decisión razonada
En este caso las unidades de la muestra se eligen en función de algunas de sus

características de manera racional y no casual. Una variante de esta técnica es el
muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal
forma que la media de la muestra para determinadas variables se acerque a la
media de la población.
HISTOGRAMAS
Un histograma es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje
vertical se representan las frecuencias, y en el eje horizontal los valores de las variables,
normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están
agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra,
y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en
los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de
estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias
naturales y exactas. Y permite la comparación de los resultados de un proceso.
BIBLIOGRAFIA
http://www.mitecnologico.com
http://gonzalomeza.wordpress.com/2008/09/01/clase-estadisticas-frecuencias-relativas-y-
acumuladas/
http://www.ditutor.com/estadistica/limites_clase.html
http://www.vitutor.net/2/11/distribucion_frecuencias.html
http://www.monografias.com/trabajos30/conceptos-de-estadistica/conceptos-de-
estadistica.shtml#estadist
http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/histograma.html
https://docs.google.com/viewer?url=https%3A%2F%2Fwww.itescam.edu.mx%2Fprincipal
%2Fsylabus%2Ffpdb%2Frecursos%2Fr65945.DOC
INTRODUCCION
Una de las ramas de la Estadística más accesible a la mayoría de la población es la

Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y
tratamiento mecánico de la información para su presentación por medio de tablas y de
representaciones gráficas, así como de la obtención de algunos parámetros útiles para
la explicación de la información.
La Estadística Descriptiva es la parte que conocemos desde los cursos de educación

primaria, que se enseña en los siguientes niveles y que, por lo general, no pasa a ser
un análisis más profundo de la información. Es un primer acercamiento a la
información y, por esa misma razón, es la manera de presentar la información ante
cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que
carezca de metodología o algo similar, sino que, al contrario, por ser un medio
accesible a la mayoría de la población humana, resulta de suma importancia considerar
para así evitar malentendidos, tergiversaciones o errores.
CONCLUSION
la estadística descriptiva nos ayuda a comprender de manera expedita, la

información, la cual es importante para tomar las decisiones más acertadas al
afrontar determinada situación.
En general, la estadística busca encontrar una conclusión, para poder resolver un

problema que se planteó en los datos que se obtuvieron, organizaron, analizaron y
presentaron.
Fácil

Prob y Esta

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Prob y Esta

Cargado por

Copyright:

Formatos disponibles

INSTITUTO TECNOLÓGICO DE LEÓN

ING. SISTEMAS COMPUTACIONALES

JAVIER ALBERTO MANRIQUE MENDOZA

JOSE ALEJANDRO RODRIGUEZ RENTERIA

 Teoría de decisión: Los estudios de casos reales, que se sirven de la

se puede decir que al tomar una decisión sobre un problema en particular,

La teoría de decisión, no solamente se puede ver desde el punto de vista de un

Cuando la muestra consta de 20 o más datos, lo aconsejable es agrupar los datos en

Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución

Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella

No existen normas establecidas para determinar cuándo es apropiado utilizar datos

Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.

Se suelen representar con histogramas y con diagramas de Pareto.

 Frecuencia absoluta (ni) de una variable estadística Xi, es el número de veces que

 Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en

 Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta

Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)),

MEDIDA ARITMETICA, GEOMETRICA Y PONDERADA:

PONDERADA: En ciertas circunstancias no todas las observaciones tienen igual peso. En

informan sobre cuánto se alejan del centro los valores de la distribución.

Las medidas de dispersión son:

El rango es la diferencia entre el mayor y el menor de los datos de una

VARIANZA: La varianza es la media aritmética del cuadrado de las

desviaciones respecto a la media de una distribución estadística.

La varianza se representa por .

Varianza para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes

expresiones que son equivalentes a las anteriores.

DESVIACION ESTANDAR: . Desviación estándar o Típica

la diferencia entre cada valor de la variable estadística y la media aritmética .

La desviación media es la media aritmética de los valores absolutos

de las desviaciones respecto a la media .

La desviación media se representa por

Desviación media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión

de la desviación media es:

DESVIACION MEDIANA: El criterio que guía esta estadística, radica en el uso de

Esto conduce a la definición siguiente:

donde m representa la mediana de los datos.

 RANGO: Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una

• Estos datos seleccionados se denominan características de la

• En matemáticas y estadística una media o promedio es una medida

• La media aritmética es un promedio estándar que a menudo se

• La media se confunde a veces con la mediana o moda. La media

• La desviación típica es la raíz cuadrada de la varianza.

• Es decir, la raíz cuadrada de la media de los cuadrados de las

• 1 La desviación típica será siempre un valor positivo o cero, en el caso

• 2 Si a todos los valores de la variable se les suma un número la

• 3 Si todos los valores de la variable se multiplican por un número la

• 4 Si tenemos varias distribuciones con la misma media y conocemos

Una distribución de frecuencias o tabla de frecuencias es

una ordenación en forma de tabla de los datos estadísticos , asignando a

La frecuencia absoluta es el número de veces que aparece un

determinado valor en un estudio estadístico.

La suma de las frecuencias absolutas es igual al número total de datos,

que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma

mayúscula) que se lee suma o sumatoria.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un

determinado valor y el número total de datos .

Se puede expresar en tantos por ciento y se representa por n i .