Está en la página 1de 15

Ejercicios propuestos

Ejercicios & definiciones


Distribucion Binomial
Distribucion de Poisson
Capitulo N10: Muestreo
Ejercicios propuestos: Definir

1.1Estadstico

Es una cantidad numrica calculada sobre una muestra que resume su informacin sobre algn
aspecto

Si un estadstico se usa para aproximar un parmetro tambin se le suele llamar estimador

Posicin

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.

Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles.

Centralizacin

Indican valores con respecto a los que los datos parecen agruparse.

Entre ellos cabe destacar: Media, mediana y moda

Dispersin

Indican la mayor o menor concentracin de los datos con respecto a las medidas de
centralizacin.

Entre ellos: Desviacin tpica, coeficiente de variacin, rango, varianza

Forma

Dan una idea de cmo se distribuyen los datos

Entre ellos: Asimetra, Apuntamiento o curtosis

1.2 Variables
Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de
una poblacin.

Tipos de variable estadsticas

Variable cualitativa

Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas
con nmeros. Podemos distinguir dos tipos:

o Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numricas que no admiten


un criterio de orden.
o Variable cualitativa ordinal o variable cuasi cuantitativa

Una variable cualitativa ordinal presenta modalidades no numricas, en las que existe
un orden.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden
realizar operaciones aritmticas con ella. Podemos distinguir dos tipos:

o Variable discreta

Una variable discreta es aquella que solo puede tomar un nmero finito de valores entre
dos valores cualesquiera de una caracterstica.

o Variable continua

Una variable continua es aquella que puede tomar un nmero infinito de valores entre
dos valores cualesquiera de una caracterstica.

1.3 Medias de tendencia Central:


Las medidas de tendencia central sirven como puntos de referencia para interpretar las calificaciones
que se obtienen en una prueba.

El propsito de las medidas de tendencia central es:

Mostrar en qu lugar se ubica la persona promedio o tpica del grupo.


Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el
puntaje central o tpico.
Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms grupos.

Las medidas de tendencia central ms comunes son:

La media aritmtica : comnmente conocida como media o promedio . Se representa por


medio de una letra M o por una X con una lnea en la parte superior.
La mediana : la cual es el puntaje que se ubica en el centro de una distribucin. Se representa
como Md .
La moda : que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se
representa Mo .

1.4 Medidas de dispersin


Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la
distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no
son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias
muestras
EL RANGO O RECORRIDO ( R ):

Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se
define como la diferencia entre el valor ms alto (Xn Xmax.) y el mas bajo (X1 Xmin) en un
conjunto de datos.

Rango para datos no agrupados: R = Xmx.-Xmn = Xn-X1

Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de clases
abiertos podemos aproximar el rango mediante el uso de los lmites de clases. Se aproxima el
rango tomando el limite superior de la ltima clase menos el limite inferior de la primera clase.

Rango para datos agrupados: R= (lim. Sup. de la clase n lim. Inf. De la clase 1)

LA VARIANZA (S2 2 ):

La varianza es una medida de dispersin relativa a algn punto de referencia. Ese punto de
referencia es la media aritmtica de la distribucin. Ms especficamente, la varianza es una
medida de que tan cerca, o que tan lejos estn los diferentes valores de su propia media
aritmtica. Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es la varianza;
cuando ms cerca estn las Xi a su media menos es la varianza. Y se define y expresa
matemticamente de la siguiente manera:

LA DESVIACIN ESTNDAR (S )

Es una medida de la cantidad tpica en la que los valores del conjunto de datos difieren de la
media. Es la medida de dispersin ms utilizada, se le llama tambin desviacin tpica. La
desviacin estndar siempre se calcula con respecto a la media y es un mnimo cuando se estima
con respecto a este valor.

1.5 Correlacin lineal simple.


El coeficiente de correlacin (r) es un nmero que indica el grado o intensidad de asociacin entre
las variables X e Y. Su valor vara entre -1 y +1; esto es: -1 r 1.
Si r=-1, la asociacin es perfecta pero inversa; es decir, a valores altos de una variable le corresponde
valores bajos a la otra variable, y viceversa.
Si r=+1, tambin la asociacin es perfecta pero directa.
Si r=0, no existe asociacin entre las dos variables.
Luego puede verse que a medida que r se aproxime a -1 +1 la asociacin es mayor, y cuando se
aproxima a cero la asociacin disminuye o desaparece.

1.6 Regresin Lineal


La regresin lineal simple se basa en estudiar los cambios en una variable, no aleatoria, afectan a una
variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser
establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Es decir,
se est en presencia de una regresin lineal simple cuando una variable independiente ejerce
influencia sobre otra variable dependiente.
1.7 Tipos de enfoque de la Probabilidad
Clsico

Los resultados de un experimento son igualmente viables, es decir, tienen tericamente las
mismas posibilidades de ocurrir.
En este caso la probabilidad de ocurrencia de un evento ser:

Nmero de resultados en los que se presenta el evento / nmero total de resultados


posibles

Por ejemplo, la probabilidad de que en una baraja francesa de 52 cartas salga el cinco de trbol
es de 1/52.

Emprico

La probabilidad de que un evento suceda se determina observando eventos similares en el


pasado. Este mtodo utiliza la frecuencia relativa de las presentaciones pasadas de un evento
como una probabilidad. Determinamos qu tan frecuente ha sucedido algo en el pasado y
usamos esa cifra para predecir la probabilidad de que suceda de nuevo en el futuro.
En este caso la probabilidad de ocurrencia de un evento ser:

Nmero de resultados esperados ocurridos en el pasado / nmero total de


experimentos adelantados

Por ejemplo, la probabilidad de que Brasil gan el mundial de Surfrica 2010 es de 5 mundiales
ganados anteriormente / 18 mundiales que se han celebrado en total.

Subjetivo

Se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada
en la evidencia que se tenga disponible. Esa evidencia puede presentarse en forma de frecuencia
relativa de presentacin de eventos pasados o puede tratarse simplemente de una creencia
meditada.

1.8 Distribucin Binomial


Un experimento sigue el modelo de la distribucin binomial o de Bernoulli si:

En cada prueba del experimento slo son posibles dos resultados: el suceso A (xito) y su
contrario .
La probabilidad del suceso A es constante, es decir, que no vara de una prueba a otra. Se
representa por p.
El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
La distribucin binomial se suele representar por B(n, p).

n es el nmero de pruebas de que consta el experimento.

p es la probabilidad de xito.

La probabilidad de es 1 p, y la representamos por q.

1.9 Distribucin de Poisson


La distribucin de Poisson se emplea para describir varios procesos, entre otros la distribucin de las
llamadas telefnicas que llagan a un conmutador, la demanda (necesidades) de servicios en una
institucin asistencial por parte de los pacientes, los arribos de los camiones y automviles a la caseta
de cobro y el nmero de accidentes en un cruce. Los ejemplos citados tienen un elemento en comn,
pueden ser descritos por una variable aleatoria discreta que asume valores enteros (0,1,2,3,4,5 y as
sucesivamente).

1.10 Distribucin Normal


La distribucin normal (en ocasiones llamada distribucin gaussiana) es la distribucin continua que
se utiliza ms comnmente en estadstica. La distribucin normal es de vital importancia en
estadstica por tres razones principales:

Muchas variables continuas comunes en el mundo de los negocios tienen distribuciones que
se asemejan estrechamente a la distribucin normal.
La distribucin normal sirve para acercarse a diversas distribuciones de probabilidad discreta,
como la distribucin binomial y la distribucin de Poisson.
La distribucin normal proporciona la base para la estadstica inferencial clsica por su
relacin con el teorema de lmite central.
Metodos de muestreo

En la referencia estadstica se conoce como muestreo a la tcnica para la seleccin de


una muestra a partir de una poblacin estadstica.1
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a
la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los
que se alcanzaran si se realizase un estudio de toda la poblacin. En las investigaciones llevadas por
empresarios y de la medicina se usa muestreo extensivamente en recoger informacin sobre
poblaciones.2
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado (que
consienta no solo hacer estimaciones de la poblacin sino estimar tambin los mrgenes de error
correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar
enteramente seguros de que el resultado sea una muestra representativa, pero s podemos actuar
de manera que esta condicin se alcance con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se
puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se pueden
obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada muestra su
probabilidad de extraccin, sigue la llamada distribucin muestral.

Tcnicas de muestreo estadstico:


Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio
y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de seleccin). Cuando
este ltimo cumple con la condicin de que todos los elementos de la poblacin tienen alguna
oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la
poblacin es conocida de antemano, recibe el nombre de muestreo probabilstico. Una muestra
seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la poblacin.
Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir cmo tomar
una muestra aleatoria ms adelante.

Muestreo aleatorio simple:


Forman parte de este tipo de muestreo todos aquellos mtodos para los que se puede calcular la
probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de
muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l.
Tipos:
Sin reposicin de los elementos : Cada elemento extrado se descarta para la subsiguiente
extraccin. Por ejemplo, si se extrae una muestra de una "poblacin" de bombillas para estimar la
vida media de las bombillas que la integran, no ser posible medir ms que una vez la bombilla
seleccionada.

Con reposicin de los elementos: Las observaciones se realizan con remplazo de los individuos, de
forma que la poblacin es idntica en todas las extracciones. En poblaciones muy grandes, la
probabilidad de repetir una extraccin es tan pequea que el muestreo puede considerarse con
reposicin aunque, realmente, no lo sea.
Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir una extraccin es
tan pequea que el muestreo puede considerarse con reposicin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin
de nmeros aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.
Muestreo sistemtico:
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego
hay que calcular una constante, denominada coeficiente de elevacin:

K= N/n

Donde N es el tamao de la poblacin y n el tamao de la muestra.

Para determinar en qu fecha se producir la primera extraccin, hay que elegir al azar un nmero
entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es
conveniente tener en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N) y
queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra (n), dividimos el
nmero de la poblacin por el nmero de la muestra que queremos tomar y el resultado de esta
operacin ser el intervalo, entonces escogemos un nmero al azar desde uno hasta el nmero del
intervalo, y a partir de este nmero escogemos los dems siguiendo el orden.
Muestreo estratificado:
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen
homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos
estratos se le asignara una cuota que determinara el nmero de miembros del mismo que
compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico,
una de las tcnicas de seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos,
existen dos tcnicas de muestreo estratificado:
Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al
tamao del estrato dentro de la poblacin.

Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms


variabilidad. Para ello es necesario un conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las
opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede
haber cierta homogeneidad. En la asignacin proporcional, si la poblacin est compuesta de un
55% de mujeres y un 45 % de hombres, se tomara una muestra que contenga tambin esos
mismos porcentajes de hombres y mujeres. En la asignacin ptima, si todos los hombres piensan
igual, pero las mujeres son impredecibles, se tomara una muestra con ms del 55% de mujeres.
Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados con
este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de
tamaos conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean homogneas respecto a
la caracterstica en cuestin. La media y la varianza desconocidas para el i-simo estrato son
denotadas por mi y si2, respectivamente.
Muestreo por etapas mltiples:
Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de referencia
o bien cuando por medio de la tcnica de muestreo simple o estratificado se obtiene una muestra
con unidades distribuidas de tal forma que resultan de difcil acceso. En el muestreo a estudios
mltiples se subdivide la poblacin en varios niveles ordenados que se extraen sucesivamente por
medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones
sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas
determinado, stos pueden subdividirse en unidades primarias representadas por circunscripciones
didcticas y unidades secundarias que seran los propios profesores. En primer lugar extraemos una
muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades)
y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una
de las primarias seleccionadas en la primera extraccin.
Muestreo por conglomerados:
Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone
que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la
caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o conglomerados para la
realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas
a encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es decir, los
miembros del grupo, o slo se le podra aplicar a algunos de ellos, seleccionados al azar. Este
mtodo tiene la ventaja de simplificar la recogida de informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la
muestra, el diseo se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer mtodo funciona
mejor cuanto ms homognea es la poblacin respecto del estrato, aunque ms diferentes son
stos entre s. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la
variabilidad, aunque deben ser muy parecidos entre s.

Homogeneidad de las poblaciones o sus subgrupos:


Homogneo significa, en el contexto de la estratificacin, que no hay mucha variabilidad. Los
estratos funcionan mejor cuanto ms homogneos son cada uno de ellos respecto a la
caracterstica a medir. Por ejemplo, si se estudia la estatura de una poblacin, es bueno distinguir
entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya menos
variabilidad, es decir, sean menos heterogneos. Dicho de otro modo, no hay tantas diferencias
entre unas estaturas y otras dentro del estrato que en la poblacin total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las mismas
diferencias dentro del estrato que en toda la poblacin, no hay por qu usar este mtodo de
muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la
poblacin, lo que se construyen son conglomerados, que ahorran algo del trabajo que supondra
analizar toda la poblacin. En resumen, los estratos y los conglomerados funcionan bajo principios
opuestos: los primeros son mejores cuanto ms homogneo es el grupo respecto a la caracterstica
a estudiar y los conglomerados, si representan fielmente a la poblacin, esto es, contienen toda su
variabilidad, o sea, son heterogneos.
El espacio muestral es: Conjunto formado por todos los resultados posibles de un experimento
aleatorio. EJ: Al lanzar un dado no cargado el espacio muestral del dado seria: 1-2-3-4-5-6.
Muestreo no probabilstico:
Es aquel para el que no se puede calcular la probabilidad de extraccin de una determinada
muestra. Por tal motivo, se busca seleccionar a individuos que tienen un conocimiento profundo del
tema bajo estudio y se considera que la informacin aportada por esas personas es vital para la
toma de decisiones.
Muestreo por cuotas:
Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En primer
lugar es necesario dividir la poblacin de referencia en varios estratos definidos por algunas
variables de distribucin conocida (como el gnero o la edad). Posteriormente se calcula el peso
proporcional de cada estrato, es decir, la parte proporcional de poblacin que representan.
Finalmente se multiplica cada peso por el tamao de n de la muestra para determinar la cuota
precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la
cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.
Muestreo de bola de nieve:
Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto
entre s. Consiste en identificar sujetos que se incluirn en la muestra a partir de los propios
entrevistados. Partiendo de una pequea cantidad de individuos que cumplen los requisitos
necesarios, servirn como localizadores de otros con caractersticas anlogas.
Muestreo subjetivo por decisin razonada:
En este caso las unidades de la muestra se eligen en funcin de algunas de sus caractersticas de
manera racional y no casual. Una variante de esta tcnica es el muestreo compensado o equilibrado,
en el que se seleccionan las unidades de tal forma que la media de la muestra para determinadas
variables se acerque a la media de la poblacin. La cual funciona sobre la base de referencias o por
recomendacin, despus se reconoce por medio de la estadstica.

También podría gustarte