Está en la página 1de 37

Probabilidad y estadstica

Direccin General de Educacin Superior Tecnolgica


INSTITUTO TECNOLOGICO DE SALINA CRUZ

Probabilidad y Estadstica
Ing. Beatriz Elena Nieto Camacho Salina Cruz, Oaxaca.

ITSAL

Probabilidad y estadstica

Direccin General de Educacin Superior Tecnolgica


INSTITUTO TECNOLOGICO DE SALINA CRUZ TEMA: Esta CARRERA: Ingeniera electrnica OPCIN: Comunicaciones MATERIA Probabilidad y Estadstica CATEDRTICO: Ing. Beatriz Elena Nieto Camacho SEMESTRE: II GRUPO: C-2

Salina Cruz Oaxaca a 16 de abril del 2007.

ITSAL

Probabilidad y estadstica

Estadstica descriptiva y teora de muestreo.

Objetivo. Aplicar los fundamentos bsicos de muestreo; representar y analizar los datos obtenidos a partir de una situacin especifica. ndice Temas Pg.

Introduccin.. 5 Distribucin de frecuencia relativa y frecuencia acumulada.... 6 Medidas de tendencia central 8 Media. 8 Mediana. 11 Moda.. 14 Promedio ponderado, mvil, media geomtrica, media armnica, cuantiles Cuarteles, deciles y percentiles 14 Medidas de dispersin 16 Rango o amplitud de variacin........................................................ 16 Desviacin media. 19 Varianza o desviacin estndar. 20 Momentos y courtosis.. 25 Muestreo aleatorio 26 Simple. 26 Sistemtico. 27

ITSAL

Probabilidad y estadstica

Estratificado 28 Por conglomerados 29 Muestreo no aleatorio 30 Dirigido. 30 Por cuotas 33 Deliberado 33 Conclusiones 37

ITSAL

Probabilidad y estadstica

Introduccin Para aplicar los fundamentos bsicos de muestreo, tenemos conocer ciertos pasos para conocer detalladamente las diferentes frecuencias relativas y acumuladas, como primer paso , conoceremos las definiciones de estos aspectos, seguiremos con las medidas de tendencia central. Al calcular el promedio de un valor determinado nos enfoca a estar haciendo una caracterstica aritmticamente, nosotros podemos llegar a una conclusin bajo calculos o smbolos que utilizeriamos en un problema. En este espacio se relata cada una de estos temas sabiendo desarrollar y entendiendo detenidamente al contenido de este tema.. Aprenderemos a determinar lo que nos enfoca y desarrollar problemas, gracias a estos temas, los conceptos basicos de muestreo son los que a continuacin veremos. Vamos a compartir el aprendizaje de este tema, ya que gracias a este entraremos al mundo del conocimiento ms al fondo.

ITSAL

Probabilidad y estadstica

DISTRIBUCION DE FRECUENCIA, FRECUENCIA RELATIVA Y ACOMULADA

Una distribucin de frecuencias es una herramienta estadstica muy til para organizar un grupo de observaciones. Distribucin de frecuencias: es una serie de datos agrupados en categoras o intervalos de clase en las cuales se muestra el nmero de observaciones que contiene cada categora. En donde (F) denota la frecuencia y (N) el nmero total de la muestra. En algunos casos, al agrupar la informacin en distribucin de frecuencia, sta resulta insuficiente para dar respuesta a todas las preguntas inicialmente planteadas, como: el porcentaje de cada clase en la poblacin, la cantidad de elementos que estn por arriba o debajo de una determinada clase. Por tal motivo, se construyen distribuciones acumuladas relativas y relativas acumuladas. FRECUENCIA RELATIVA La frecuencia relativa de un intervalo, la cual denotaremos como (Fr), se define como: la fraccin del total de datos que representa la frecuencia de la clase, es decir: Fr=F/N Cuando esta cantidad es elevada a porcentaje porcentual o frecuencia porcentual: Fr (100%) se llama frecuencia relativa

ITSAL

Probabilidad y estadstica

De manera anloga a la frecuencia relativa, definiremos ahora la frecuencia relativa acumulada como: el cociente de las frecuencias acumuladas y el nmero total de elementos de la muestra, esto es: Fra=Fa/N Y al igual que la frecuencia relativa, cuando sea elevada a porcentaje le llamaremos frecuencia relativa acumulada porcentual: Fra (100%)

FRECUENCIA ACUMULADA Se puede clasificar en: frecuencia acumulada menor que y frecuencia acumulada o ms. La frecuencia acumulada menor que de una clase se define como: La suma de la frecuencia de dicha clase con todas las frecuencias de la clase cuyos intervalos son menores que el lmite real superior de tal clase.

La frecuencia acumulada o ms se define como: La suma de las frecuencias de clases de los intervalos que son mayores que el lmite real inferior de la clase.

ITSAL

Probabilidad y estadstica

MEDIDAS DE TENDENCIA CENTRAL

Estadstica sumaria. Podemos usar una serie de nmeros conocidos como estadstica sumaria para describir las caractersticas del conjunto de datos. Dos de estas caractersticas son de particular importancia para los responsables de tomar decisiones: la de tendencia central y la de dispersin. Tendencia central: la tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia central se conocen como medidas de posicin. Dispersin: se refiere a la extensin de los datos en una distribucin, es decir, al grado en que las observaciones se distribuyen. Sesgo: las curvas que representan los puntos de datos de un conjunto de datos pueden ser simtricas o sesgadas. Las curvas simtricas, tienen una forma tal que una lnea vertical que pase por el punto ms alto de la curva dividir el rea de sta en dos partes iguales. Cada parte es una imagen espejo de la otra. En las curvas sesgadas, los valores de su distribucin de frecuencias estn concentrados en el extremo inferior o en el superior de la escala de medicin del eje horizontal. Los valores no estn igualmente distribuidos. Las curvas pueden estar sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda (negativamente sesgadas). La media aritmtica. Cuando nos referimos al "promedio" de algo, estamos hablando de la media aritmtica. Para encontrar la media aritmtica, sumamos los valores y el resultado lo dividimos entre el nmero de observaciones.

ITSAL

Probabilidad y estadstica

Smbolos convencionales. Una muestra de una poblacin consiste en n observaciones, con una media de x (lase equis testada). Las medidas que calculamos para una muestra se conocen como estadstica. La notacin es diferente cuando calculamos medidas para la poblacin entera, es decir, para el grupo que contiene a todos los elementos que estamos describiendo. La media de una poblacin se simboliza con (letra griega mi). El nmero de elementos de una poblacin se denota con la letra mayscula cursiva N. Por lo general, en estadstica utilizamos letras del alfabeto latino para simbolizar la informacin sobre las muestras y letras del griego para referirnos a la informacin sobre poblaciones. Clculo de la media a partir de datos no agrupados. Media de la poblacin: = x / N x = x / n Para calcular esta media, sumamos todas las observaciones. Los estadsticos se refieren a este tipo de datos como datos no agrupados. Clculo de la media de datos agrupados: Una distribucin de frecuencias consta de datos agrupados en clases. Cada valor de una observacin cae dentro de alguna de las clases. No sabemos el valor individual de cada observacin. A partir de la informacin de la tabla, podemos calcular fcilmente una estimacin del valor de la media de estos datos agrupados. De haber usado los datos originales sin agrupar, podramos haber calculado el valor real de la media.

ITSAL

Probabilidad y estadstica

Para encontrar la media aritmtica de datos agrupados, primero calculamos el punto medio de cada clase. Para lograr que los puntos medios queden en cifras cerradas, redondeamos las cantidades. Despus, multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos todos los resultados y dividimos esta suma entre el nmero total de observaciones de la muestra. x = (f x) / n f = frecuencia de observaciones de cada clase x= punto medio de cada clase de la muestra n = nmero de observaciones de la muestra Codificacin: Mediante esta tcnica, podemos eliminar el problema de tener puntos medios muy grandes o inconvenientes. En lugar de utilizar los puntos medios reales para llevar a efecto nuestros clculos, podemos asignar enteros consecutivos de valor pequeo, conocidos como cdigos, a cada uno de los puntos medios. El entero cero puede ser asignado a cualquier punto medio, pero para que nuestros enteros sean pequeos, asignaremos cero al punto medio de la parte media de la distribucin (o la parte ms cercana a sta). Podemos asignar enteros negativos a los valores menores a dicho punto medio y enteros positivos a los valores ms grandes. Los estadsticos usan xo para representar el punto medio al que se le ha asignado el cdigo 0 y u para el punto medio codificado: x = xo + w [(u f)] / n w = ancho numrico del intervalo de clase u = cdigo asignado a cada punto medio de clase

ITSAL

10

Probabilidad y estadstica

Ventajas y desventajas de la media aritmtica. La media aritmtica, en su carcter de un solo nmero que representa a un conjunto de datos completo, tiene importantes ventajas: Se trata de un concepto familiar para la mayora de las personas y es intuitivamente claro. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es nica debido a que cada conjunto de datos posee una y slo una media. Es til para llevar a cabo procedimientos estadsticos como la comparacin de medias de varios conjuntos de datos. Desventajas: Puede verse afectada por valores extremos que no son representativos del resto de los datos. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro clculo. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala. SUGERENCIA: La media aritmtica, a menudo, puede mal interpretarse si los datos no entran en un grupo homogneo. La mediana. La mediana es un solo valor calculado a partir del conjunto de datos que mide la observacin central de stos. Esta sola observacin es la ms central o la que est

ITSAL

11

Probabilidad y estadstica

ms en medio en el conjunto de nmeros. La mitad de los elementos estn por encima de este punto y la otra mitad est por debajo. Clculo de la mediana a partir de datos no agrupados: Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un nmero impar de elementos, el de en medio en el arreglo es la mediana. Si hay un nmero par de observaciones, la mediana es el promedio de los dos elementos de en medio. Mediana = (n + 1) / 2 Clculo de la mediana a partir de datos agrupados: Encontrar qu observacin de la distribucin est ms al centro (Mediana = (n + 1) / 2). Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento ms central. Determinar el nmero de elementos de la clase y la localizacin de la clase que contiene al elemento mediano. Determinar el ancho de cada paso para pasar de una observacin a otra en la clase mediana, dividiendo el intervalo de cada clase entre el nmero de elementos contenido en la clase. Determinar el nmero de pasos que hay desde el lmite inferior de la clase mediana hasta el elemento correspondiente a la mediana. Calcular el valor estimado del elemento mediano multiplicando el nmero de pasos que se necesitan para llegar a la observacin mediana por el ancho de cada paso. Al producto sumarle el valor del lmite inferior de la clase mediana.

ITSAL

12

Probabilidad y estadstica

Si existe un nmero par de observaciones en la distribucin, tomar el promedio de los valores obtenidos para el elemento mediano calculados en el paso nmero 6. Un mtodo ms sencillo: m = {[(n + 1) / 2 (F + 1)] / fm} w + Lm m = mediana de la muestra n = nmero total de elementos de la distribucin F = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase mediana fm = frecuencia de la clase mediana w = ancho de intervalo de clase Lm = lmite inferior del intervalo de clase mediano Ventajas y desventajas de la mediana: Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fcil de entender y se puede calcular a partir de cualquier tipo de datos incluso a partir de datos agrupados con clases de extremo abierto a menos que la mediana entre en una clase de extremo abierto. Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas, en lugar de nmeros. Ciertos procedimientos estadsticos que utilizan la mediana son ms complejos que aquellos que utilizan la media. Debido a que la mediana es una posicin promedio, debemos ordenar los datos antes de llevar a cabo cualquier clculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran nmero de elementos. Por consiguiente, si deseamos utilizar una estadstica de muestra para estimar un parmetro de poblacin, la media es ms fcil de usar que la mediana.

ITSAL

13

Probabilidad y estadstica

La moda. La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana, pues en realidad no se calcula mediante algn proceso aritmtico ordinario. La moda es aquel valor que ms se repite en el conjunto de datos. En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor ms frecuente del conjunto de datos. Es por esta razn que rara vez utilizamos la moda de un conjunto de datos no agrupados como medida de tendencia central. Por esta razn, siempre que utilizamos la moda como medida de tendencia central de un conjunto de datos, debemos calcular la moda de datos agrupados (buscar la clase modal). Clculo de la moda de datos agrupados: Cuando los datos ya se encuentran agrupados en una distribucin de frecuencias, podemos poner que la moda est localizada en la clase que contiene el mayor nmero de elementos, es decir, en la clase que tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal: Mo = Lmo + [d1 / (d1 + d2 )] w Lmo = lmite inferior de la clase modal. d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por debajo de ella. d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por encima de ella. w = ancho del intervalo de la clase modal.

ITSAL

14

Probabilidad y estadstica

Ventajas y desventajas de la moda: La moda, al igual que la mediana, se puede utilizar como una posicin central para datos tanto cualitativos como cuantitativos. Tambin, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos. Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos el valor ms frecuente del conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qu tan grandes o qu tan pequeos sean los valores del conjunto de datos, e independientemente de cul sea su dispersin.

Comparacin entre la media, la mediana y la moda. Cuando trabajamos un problema de estadstica, debemos decidir si vamos a utilizar la media, la mediana o la moda como medidas de tendencia central. Las distribuciones simtricas que slo contienen una moda, siempre tienen el mismo valor para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia central, pues ya est hecha la seleccin. En una distribucin positivamente sesgada (es decir, sesgada hacia la derecha), la moda todava se encuentra en el punto ms alto de la distribucin, la mediana est hacia la derecha de la moda y la media se encuentra todava ms a la derecha de la moda y la mediana. En una distribucin negativamente sesgada, la moda sigue siendo el punto ms alto de la distribucin, la mediana est hacia la izquierda de ella y la media se encuentra todava ms a la izquierda de la moda y la mediana. Cuando la poblacin est sesgada negativa o positivamente, con frecuencia la mediana resulta ser la mejor medida de posicin, debido a que siempre est entre la moda y la media. La mediana no se ve altamente influida por la frecuencia de
ITSAL

15

Probabilidad y estadstica

aparicin de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores extremos como la media. SUGERENCIA La seleccin de la media, la mediana o la moda, en ocasiones, depende de la prctica comn de una industria en particular (salario medio de los obreros, precio mediano de una casa, familia modal para el diseo de automviles). La dispersin. Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su dispersin, extensin o variabilidad. La dispersin es importante porque: Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos. Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos problemas. Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de valores con respecto al centro de distribucin o esto presenta Medidas de dispersin.

ITSAL

16

Probabilidad y estadstica

La dispersin puede medirse en trminos de la diferencia entre dos valores seleccionados del conjunto de datos. Las medidas de distancia son: el alcance, el alcance interfractil y el alcance intercuartil.

Alcance.

Es la diferencia entre el ms alto y el ms pequeo de los valores observados.

Alcance = valor de la observacin ms alta valor de la observacin ms pequea

El alcance es fcil de entender y de encontrar, pero su utilidad como medida de dispersin es limitada. Slo toma en cuenta los valores ms alto y ms bajo de una distribucin y no considera ninguna otra observacin del conjunto de datos. Ignora la naturaleza de la variacin entre todas las dems observaciones, y se ve muy influido por los valores extremos.

Las distribuciones de extremo abierto no tienen alcance, pues no existe un valor ms alto o ms bajo en la clase de extremo abierto.

ITSAL

17

Probabilidad y estadstica

Alcance interfractil. En una distribucin de frecuencias, una fraccin o proporcin dada de los datos cae en un fractil o por debajo de ste. La mediana, por ejemplo, es el fractil 0,5, puesto que la mitad de los datos es menor o igual a este valor. Los fractiles son parecidos a los porcentajes. En una distribucin cualquiera, el 25% de los datos est en el fractil 0,25 o por debajo de ste; igualmente, 25% de los datos cae en el vigsimo quinto percentil o por debajo de ste. El alcance interfractil es una medida de la dispersin entre dos fractiles de una distribucin de frecuencias, es decir, la diferencia entre los valores de los dos fractiles.

Los fractiles tienen nombres especiales, dependiendo del nmero de partes iguales en que se dividen los datos. Los fractiles que los dividen en 10 partes iguales se conocen como deciles. Los cuartiles dividen los datos en cuatro partes iguales. Los percentiles dividen el conjunto de datos en 100 partes iguales.

Alcance intercuartil.

El alcance intercuartil mide aproximadamente qu tan lejos de la mediana tenemos que ir en cualquiera de las dos direcciones antes de que podamos recorrer una mitad de los valores del conjunto de datos. Para calcular este alcance, dividimos nuestros datos en cuatro partes, cada una de las cuales contiene 25% de los elementos de la distribucin. Los cuartiles son, entonces, los valores ms alto y ms bajo de estas cuatro partes, y el alcance intercuartil es la diferencia entre los valores del primer cuartil y el tercer cuartil.

ITSAL

18

Probabilidad y estadstica

SUGERENCIA

El punto fractil es siempre el punto en el o debajo del cual cae la proporcin establecida de valores.

Medidas de desviacin promedio.

Las descripciones ms comprensivas de la dispersin son aquellas que tratan con la desviacin promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son la varianza y la desviacin estndar. Ambas medidas nos dan una distancia promedio de cualquier observacin del conjunto de datos con respecto a la media de la distribucin.

Varianza de la poblacin.

Cada poblacin tiene una varianza, que se simboliza con s

(sigma cuadrada). Para

calcular la varianza de una poblacin, dividimos la suma de las distancias al cuadrado entre la media y cada elemento de la poblacin entre el nmero total de observaciones de dicha poblacin. s 2 = (x - m )2 / N

ITSAL

19

Probabilidad y estadstica

s 2 = varianza de la poblacin. x = elemento u observacin. m = media de la poblacin. N = nmero total de elementos de la poblacin. Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son intuitivamente claras o fciles de interpretar. Por esta razn, tenemos que hacer un cambio significativo en la varianza para calcular una medida til de la desviacin, que sea menos confusa. Esta medida se conoce como la desviacin estndar, y es la raz cuadrada de la varianza. La desviacin estndar, entonces, est en las mismas unidades que los datos originales. Desviacin estndar de la poblacin. La desviacin estndar de la poblacin, o s , es simplemente la raz cuadrada de la varianza de la poblacin. Como la varianza es el promedio de las distancias al cuadrado que van desde las observaciones a la media, la desviacin estndar es la raz cuadrada del promedio de las distancias al cuadrado que van desde las observaciones a la media. La desviacin estndar est en las mismas unidades que las que se usaron para medir los datos. La raz cuadrada de un nmero positivo puede ser tanto positiva como negativa. Cuando tomamos la raz cuadrada de la varianza para calcular la desviacin estndar, los estadsticos solamente consideran la raz cuadrada positiva. Para calcular la varianza o la desviacin estndar, construimos una tabla utilizando todos los elementos de la poblacin.

ITSAL

20

Probabilidad y estadstica

Usos de la desviacin estndar. La desviacin estndar nos permite determinar, con un buen grado de precisin, dnde estn localizados los valores de una distribucin de frecuencias con relacin a la media. El teorema de Chebyshev dice que no importa qu forma tenga la distribucin, al menos 75% de los valores caen dentro de + 2 desviaciones estndar a partir de la media de la distribucin, y al menos 89% de los valores caen dentro de + 3 desviaciones estndar a partir de la media.

Con ms precisin: Aproximadamente 68% de los valores de la poblacin cae dentro de + 1 desviacin estndar a partir de la media. Aproximadamente 95% de los valores estar dentro de + 2 desviaciones estndar a partir de la media. Aproximadamente 99% de los valores estar en el intervalo que va desde tres desviaciones estndar por debajo de la media hasta tres desviaciones estndar por arriba de la media. MEDIDAS DE DISPERSIN: Son indicadores estadsticos que muestran la distancia promedio que existe entre los datos y la media aritmtica. Las medidas de dispersin nos indican la distancia promedio de los datos respecto a las medidas de tendencia central. As podremos diferenciar dos conjuntos de datos que poseen iguales medias, siendo los datos de uno ms dispersos del otro.

Rango:

ITSAL

21

Probabilidad y estadstica

Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribucin,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayora de los casos, pero indudablemente es muy fcil de calcular. Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media. Desviacin: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di . No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin. La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos siempre va a ser 0.

Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas. Para resolver este problema, tenemos dos caminos:

Tomar el valor absoluto de las desviaciones. Desviacin media Elevar al cuadrado las desviaciones. Varianza.

Desviacin media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por d m.

ITSAL

22

Probabilidad y estadstica

Varianza: El cuadrado de la desviacin estndar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvos de la totalidad de las observaciones, respecto de la media aritmtica de la distribucin, es menor que la suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea la media aritmtica. Si observamos, veremos que la varianza no es msque el desvo estndar al cuadrado. Precisamente la manera de simbolizarla es . Por lo mismo, el desvo estndar puede definirse como la raz cuadrada de la varianza

Es la media de los cuadrados de las desviaciones, y la denotaremos por tambin por .

Aunque tambin es posible calcularlo como:

ITSAL

23

Probabilidad y estadstica

Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2. Desviacin estndar o tpica (S o ): Es igual a la raz cuadrada de la varianza. La S representa la desviacin estndar de una muestra, mientras que la desviacin para todos los datos de una poblacin. Ampliando las frmulas tenemos Aplicamos el mismo procedimiento a las frmulas para las tablas de frecuencias tipo A. Y para las tablas de frecuencias tipo B.

La desviacin estndar soluciona el problema obteniendo la raz cuadrada de la varianza, consiguiendo as, un valor similar a la desviacin media.

Es la raz cuadrada de la varianza, se denota por Sx o s x.

Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente.

ITSAL

24

Probabilidad y estadstica

MEDIDAS DE APUNTAMIENTO O CURTOSIS: COEFICIENTE DE CURTOSIS DE FISHER

Con estas medidas nos estamos refiriendo al grado de apuntamiento que tiene una distribucin; para determinarlo, emplearemos el coeficiente de curtosis de Fisher.

MOMENTO: En estadstica el momento centrado de orden k de una variable aleatoria X es la esperanza matemtica E[(X E[X])k] donde E es el operador de la esperanza. Si una variable aleatoria no tiene media el momento centrado es indefinido. Normalmente la letra griega para el momento centrado es . El primer momento centrado es zero y el segundo se llama varianza () donde es la desviacin estndar. MOMENTOS Y COURTOSIS La deformacin del eje horizontal de una distribucin de frecuencias se conoce como courtosis o aplastamiento. Una medida cualitativa de la forma de las distribuciones de frecuencias las clasifica en: Leptocrticas: sus datos se concentran en un reducido intervalo de valores Mesocrticas: estas presentan una concentracin de valores alrededor de la media, y una reduccin de estos hacia los extremos. A estas se les Conoce como distribuciones normales o de campana

ITSAL

25

Probabilidad y estadstica

Platicrticas: En ellas los datos se redistribuyen de manera relativa uniform en todo el rango de valores El momento de courtosis puede calcularse por medio de los momentos de la distribucin de frecuencias,

MUESTREO ALEATORIO SIMPLE, MUESTREO ALEATORIO SISTEMTICO, MUESTREO ALEATORIO ESTRATIFICADO, MUESTREO ALEATORIO POR CONGLOMERADOS
Muestreo: Proceso por el cual se seleccionan los individuos que formarn una muestra.
El tamao de la muestra depende de la precisin que se quiera conseguir en la estimacin que se realice a partir de ella. Para su determinacin se requieren tcnicas estadsticas superiores, pero resulta sorprendente cmo, con muestras notablemente pequeas, se pueden conseguir resultados suficientemente precisos.

Muestreo Aleatorio Una muestra se dice que es extrada al azar cuando la manera de seleccin es tal, que cada elemento de la poblacin tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es tambin llamada una muestra probabilstica son generalmente preferidas por los estadsticos porque la seleccin de las muestras es objetiva y el error muestral puede ser medido en trminos de probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemtico, muestreo estratificado y muestreo de conglomerados. Muestreo aleatorio simple Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamao tiene igual probabilidad de ser seleccionada de la poblacin. Para obtener una muestra aleatoria simple, cada elemento en la poblacin tenga la misma probabilidad de ser seleccionado, el plan de muestreo puede no

ITSAL

26

Probabilidad y estadstica

conducir a una muestra aleatoria simple. Por conveniencia, este mtodo pude ser reemplazado por una tabla de nmeros aleatorios. Cuando una poblacin es infinita, es obvio que la tarea de numerar cada elemento de la poblacin es infinita, es obvio que la tarea de numerar cada elemento de la poblacin es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos ms comunes de muestreo aleatorio modificado son sistemticos, estratificados y de conglomerados. El muestreo aleatorio simple puede ser de dos tipos: Sin reposicin de los elementos: cada elemento extrado se descarta para la subsiguiente extraccin. Por ejemplo, si se extrae una muestra de una "poblacin" de bombillas para estimar la vida media de las bombillas que la integran, no ser posible medir ms que una vez la bombilla seleccionada. Con reposicin de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la poblacin es idntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que el muestreo puede considerarse sin reposicin aunque, realmente, no lo sea. Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin de nmeros aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.

Muestreo sistemtico. Una muestra sistemtica es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la seleccin depende del nmero de elementos incluidos en la poblacin y el tamao de la muestra. El nmero de elementos en la

ITSAL

27

Probabilidad y estadstica

poblacin es, primero, dividido por el nmero deseado en la muestra. El cociente indicar si cada dcimo, cada onceavo, o cada centsimo elemento en la poblacin va a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemtica puede dar la misma precisin de estimacin acerca de la poblacin, que una muestra aleatoria simple cuando los elementos en la poblacin estn ordenados al azar. El riesgo de los muestreos sistemticos es el de las periodicidades ocultas. Supongamos que queremos testear el funcionamiento de una mquina, para lo cul vamos a seleccionar una de cada 15 piezas producidas. Si ocurriera la desgracia de que justamente 1 de cada 15 piezas fuese defectuosa y el error de la mquina fuera defectuoso peridicamente, tendramos dos posibles resultados mustrales: Que falla siempre Que no falla nunca.

Muestreo Estratificado Para obtener una muestra aleatoria estratificada, primero se divide la poblacin en grupos, llamados estratos, que son ms homogneos que la poblacin como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un mtodo sistemtico de cada estrato. Las estimaciones de la poblacin, basadas en la muestra estratificada, usualmente tienen mayor precisin (o menor error muestral) que si la poblacin entera muestreada mediante muestreo aleatorio simple. El nmero de elementos seleccionado de cada estrato puede ser proporcional o desproporcional al tamao del estrato en relacin con la poblacin. Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas de muestreo estratificado:

ITSAL

28

Probabilidad y estadstica

Asignacin proporcional: el tamao de cada estrato en la muestra es proporcional a su tamao en la poblacin. Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin.

Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. As, si la poblacin est compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra que contenga tambin esa misma proporcin.

Muestreo de conglomerados. Para obtener una muestra de conglomerados, primero dividir la poblacin en grupos que son convenientes para el muestreo. En seguida, seleccionar una porcin de los grupos al azar o por un mtodo sistemtico. Finalmente, tomar todos los elementos o parte de ellos al azar o por un mtodo sistemtico de los grupos seleccionados para obtener una muestra. Bajo este mtodo, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria. Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisin de las estimaciones acerca de la poblacin) que una muestra aleatoria simple del mismo tamao. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir en otra rea. No todas las reas son muestreadas en un muestreo de reas. La variacin entre los elementos obtenidos de las reas seleccionadas es, por lo tanto, frecuentemente mayor que la obtenida si la poblacin entera es muestreada mediante muestreo

ITSAL

29

Probabilidad y estadstica

aleatorio simple. Esta debilidad puede reducida cuando se incrementa el tamao de la muestra de rea. El incremento del tamao de la muestra puede fcilmente ser hecho en muestra muestra de rea. Los entrevistadores no tienen que caminar demasiado lejos en una pequea rea para entrevistar ms familias. Por lo tanto, una muestra grande de rea puede ser obtenida dentro de un corto perodo de tiempo y a bajo costo. Por otra parte, una muestra de conglomerados puede producir la misma precisin en la estimacin que una muestra aleatoria simple, si la variacin de los elementos individuales dentro de cada conglomerado es tan grande como la de la poblacin.

MUESTREOS NO ALEATORIOS

Cuando hemos reunido los resultados de una muestra no aleatoria a partir de una poblacin, lo normal es que queramos generalizar nuestros resultados. Generalizar significa que afirmamos que los resultados son ciertos no slo para la muestra, sino tambin respecto a la poblacin. Es posible evaluar la credibilidad de tal declaracin? La cuestin crucial en la evaluacin es si la muestra se desva de la poblacin en aspectos relevantes. Por relevantes entendemos aquellas cuestiones que medimos o que se incluyen en nuestra hiptesis o en los objetivos del proyecto. Habitualmente la nica manera de estimas esto sera investigar otra muestra de la misma poblacin, lo que en la mayor parte de los casos ira ms all de los recursos disponibles. Como un dbil sucedneo del examen arriba descrito, podramos plantearnos el estudiar si nuestra muestra no aleatoria se desva de la poblacin respecto a aspectos distintos de los puntos relevantes arriba mencionados. Con frecuencia podremos examinar archivos pblicos y descubrir por ejemplo la conformacin demogrfica, edad o estructura por sexos de nuestra poblacin y comparar estas cifras con nuestra muestra. Si encontramos desviaciones, tenemos que plantearnos si stas nos dan

ITSAL

30

Probabilidad y estadstica

razones para sospechar sobre desviaciones tambin en las variables relevantes arriba aludidas. Para ayudarnos a la hora de plantearnos esto, podramos calcular las correlaciones entre la variable demogrfica que aparece desviada y nuestras variables relevantes (si son numricas). Por ejemplo, si la distribucin por sexos no es igual a la distribucin por sexos de la poblacin, calcularemos las correlaciones entre sexo y nuestras variables relevantes en la muestra. Una correlacin alta indica que nuestra muestra estaba sesgada. El muestreo no aleatorio, llamado opintico puro, consiste en la eleccin de una muestra segn el juicio del equipo investigador. Naturalmente, la calidad del muestreo no puede valorarse ni a priori ni objetivamente, pues depende de los criterios utilizados para escoger a los componentes de la muestra. A veces, razones de economa y rapidez lo hacen aconsejable. En ocasiones se completa el muestreo con el denominado sistema de cuotas, que consiste en realizar cierto nmero de encuestas entre cada uno de los distintos grupos en que se divide el universo. As, se puede exigir que haya X entrevistas a familias que tengan dos hijos, Y entrevistas a familias que vivan los padres con ellos... Esas especificaciones se determinan teniendo en cuenta las caractersticas conocidas del universo. Dentro de este apartado, tenemos el muestreo denominado semialeatorio consistente en la obtencin al azar de ciertos grupos del colectivo para dejar, a criterio del entrevistador, la eleccin del elemento que se va a elegir. Un muestreo, bastante utilizado en las entrevistas y que segn algunos autores puede resultar prcticamente aleatorio, es el denominado muestreo por rutas en el que partiendo de unos puntos determinados (calle, nmero...), los agentes van siguiendo su itinerario y efectan las entrevistas de acuerdo con un ritmo (por ejemplo, cada 10 edificios) y unas normas (para la eleccin de viviendas). Una variante de muestreo no aleatorio, que suele utilizarse frecuentemente en determinados casos, son las reuniones de grupo o grupos de discusin. Su

ITSAL

31

Probabilidad y estadstica

importancia en determinados estudios es tal que hemos considerado oportuno incluirlo como tema independiente al final del captulo.

CARACTERSTICAS til cuando se quiere cualificar.

Todos los casos no tiene la misma probabilidad de ser seleccionados para la muestra.

El investigador elige los casos que ms le interesan para una informacin ms rica.

TIPOS

Requiere un conocimiento elevado de la poblacin.

Permite hacer inferencias lgicas.

Muestreo

de

conveniencia:

en

los

lmites

perifricos

del

muestreo

metodolgico. Muestreo por cuotas: estructura de muestreo probabilstico.

Muestreo intencional: desarrolla la potencialidad de un muestreo no probabilstico.

En cuanto a encuestas sociales se suelen usar los dos primeros.

ITSAL

32

Probabilidad y estadstica

MUESTREO POR CUOTAS Tambin denominado en ocasiones accidental. Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms representativos o adecuados para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul. Es una serie bastante amplia de variantes la mayora de las cuales se asemeja bastante a una muestra aleatoria estratificada con fijacin proporcional. Todo muestreo por cuotas rompe el proceso de aleatoriedad en la fase de extraccin del elemento muestral (la seleccin del entrevistado) PASOS: 1. Seleccin de unas caractersticas de control tales como: edad, sexo...etc. Las variables de control se escogen porque se cree que estn relacionadas con la variable a investigar, Se emplean para estratificar la poblacin determinar que proporcin e ella tiene cada estrato. 2. Se adopta una representacin general de cada estrato en la muestra final. 3. Eleccin del entrevistado (con las caractersticas que deben reunir de acuerdo con las variables de control que se emplearon para estratificar a la poblacin y fijar la muestra).

ITSAL

33

Probabilidad y estadstica

4. Este mtodo asume que una muestra que se parece a la poblacin con respecto a caractersticas importantes, lo har de igual forma respecto a las dems que se quieren estudiar (una funcin bastante arriesgada).

VENTAJAS DEL MUESTREO POR CUOTAS

Bajo coste. Asegura la heterogeneidad y proporcionalidad de la muestra

INCONVENIENTES DEL MUESTREO POR CUOTAS Dificultad de disear un sistema de estratificacin (para construir las cuotas) que considere ms de tres variables de control. (Esto se debe a que el n de variables a considerar acta como una funcin multiplicativa de cada una de las categoras dentro de la variable) A cada entrevistador se le adjudica una cuota de personas a entrevistar. El hecho de poder elegir los entrevistados siempre que renan los requisitos adecuados, puede llevar a error (entrevistas a amigos en proporcin excesiva, a las salida de mercados, universidades...etc.) Son muchas las estrategias para reducir los sesgos al seleccionar entrevistados (control sobre los barrios a investigar xej).Una de las opciones es llevar a cabo un muestreo probabilstico polietpico con cluster, seleccionando a los entrevistadores mediante cuotas en la ltima etapa.

ITSAL

34

Probabilidad y estadstica

MUESTREO INTENCIONAL El muestreo intencional constituye una estrategia no probabilstica vlida para la recoleccin de datos, en especial para muestras pequeas y muy especficas. TIPOS Muestreo de casos extremos: seleccionar slo aquellos casos cuyos valores se encuentren en el extremo del rango de una variable. Muestreo de casos poco usuales: Seleccionar aquellos elementos cuyos valores en el rango de una variable son poco frecuentes. Muestreo de casos con mxima variacin: pretende construir una muestra los ms heterognea posible. Esto que en muestras pequeas representa un problema, se convierte en este tipo de muestreo en una potencialidad. Muestreo de subgrupos homogneos: Escoger una muestra pequea lo ms homognea posible, si surge la necesidad de recoger informacin sobre uno o varios grupos. Rene una serie de individuos de condiciones sociales y experiencias semejantes. Muestreos estructurales: Los individuos que componen la muestra son seleccionados en virtud de sus posiciones sociales, situacin en una red social, en una jerarqua...etc.

ITSAL

35

Probabilidad y estadstica

Muestreos con informantes estratgicos: Este tipo de muestreo es un compuesto del homogneo y del estructural, y parte de que el conocimiento y la informacin estn desigualmente distribuidos. Tiene 2 subtipos: -Bola de nieve o en cadena: Usado en poblaciones especiales o de difcil acceso. Se pide a una serie de informantes iniciales que suministren los nombres de otros miembros potenciales de la muestra. -Experto: Mandar a un experto escoger individuos tpicos, ciudades

representativas...etc. No se debe generalizar a partir de la experiencia de los individuos que componen la muestra. Muestreo de criterio: Selecciona para su estudio a aquellos casos que se ajustan a algn criterio predeterminado (xej un estudio sobre conducta desviada). Muestreo de casos crticos: Trata casos que en relacin al tema de estudio, pueden servir de referencia lgica para el resto de la poblacin o parte de ella. estos muestreos hacen posible las generalizaciones lgicas derivadas del peso de la evidencia que puede llegar a producir incluso un solo caso. Muestreo de casos confirmatorios y contradictorios: Es interesante cuando la investigacin est avanzada; ya que muestrea especficamente en busca de casos que sirvan para confirmar o contradecir el trabajo que se ha efectuado.

ITSAL

36

Probabilidad y estadstica

Conclusin Ahora que ya sabemos el contenido de este tema, podremos llevarlo a cabo a la prctica,gracias al aprendizaje, nuestro conocimiento sera ms abierto al realizarlo. Esperemos que estos temas se haya comprendido satisfactoriamente, al poder entender el desarrollo de cada una de estos temas nosotros seremos fuertes, analizando estratgicamente y poder realizar un trabajo bien hecho. Ya sabemos como trabajar a partir de la situacin especifica que te propongan en el problema poder llevar a cabo estos pasos o bien dicho temas que nos ayuden a realizarlo correctamente. El resultado de tus ejercicios sera gracias al apoyo de este contenido, escrito para que en cualquier tipo de situacin podremos definirlo correctamente. Estos temas fueron analizados cada una de ellas, para incrementar nuestro aprendizaje, nos ayudaran mucho, este trabajo fue realizado por todo el grupo en general.

ITSAL

37

También podría gustarte