Está en la página 1de 14

t

APUNTES SOBRE MUESTREO


ESTADíSTICO

v.. Parámetros Población

lnferencia

u
Estadíg rafos i
Muestra
I

i
i

( eyes Donis, José Luis


,b

INTRODUCCIÓN AL MUE§TREO ESTADÍSNCO

El método.que permile caracterizar una muestra o estudiar


la población con base en la información
que se obtiene de una parte de esa población se oenominamuestreo
esladístico.
1. Objetivos

a) Caraclerízar una muestra;


b) Estimar parámetros; y
c) Probar hipótesis.

La estimación de.parámetros pemtite..obtener estimadores-(Estadígrafos), que proporcionan L

estimaciones confiables sobre características de la pouiaáán


número de elementgg fpii¿meirirl, ítim."ndo un reducido
9" la población. L.a gJueba d" ñ¡p¿teiir pérmii;-á;#i"r o rechazar una
hipótesis de conformidad con étgraoo oe signiRiai¡én ourniiJa previamente.

(ü 2. Conceptos
a) Muestra
Es una parte representativa de la población.

b) Muestreo probabilístico

Es cuando tg9?: elementos que forman la población üenen una probabilidad


serseleccionadosloten la muestra. La seleccióñ se háce al conocida de
criterio personaf.
azar,, á!"lql"
no interviene el

c) Muestreo no probabilístico

Cuando no se. da igual oportunidad a todos los elementos


de ta población de ser incluidos en
una muestra. lnteniiene elcriterio personal.

d)

Es elestudio delconjunto total de los elementos.

e) Parámetro
i

ú I

Es una medida estbdística que identifica alguna característica


de una población.
0 Estadígrafo

Es una medida estpdística que identifica alguna característica


de una muestra.
3. Simbología principal

Media aritmética
x t.l
Varianza
Uesviación eslándar
s' o
§ q
Número de elementos
n N

-))
4. Distribución muestral de la media

Si der¡na población se extraen todas las muestras posibles y se calcula


a cada una su promedio se
tendrá una distribución muestraf de la media.
si las muestras son grandes, ñ )
30, y mientras más aumenta la distribución de la media tiende a
formar una curva normal.

xxxxxxx
f*J) . #n,r de una medía muestrat (X), se fundamenta en et
La esümación de una media poblaciona,
\& principio matemática que.dicer\el promeiío de hs meá¡ás oe todas hJ ,n'u"rir* que es posible
extraerde una pobración siempre es iguata ra verdadera mediá d;Édbraá;i;7)

Eiemplo: se tiene una población de tamaño. N


= 5, formada por tos satarios por hora
trabajadores. Extraer a) las muestras posibles de tamaño 2 que puáaen l¿tJ'{'f
extraerse de esta población
son las siguientes: r

e= N I {!D [-- faOl'Ourc'\


- J;t --\o
n! (N-n)! r [r)\

7,2 2,3 3,4 4,5


1,3, 2,4 3,5
7,4 2,5
1,5

La distribución muestralde ta medía queda de la siguiente


forma:
\i,
No, Muestra' tra
9r.l x,l ,:

1 1.2 1.5
2 1,3 2.0
3 1.4 2.5
4 1. 3.0
5 2. 2.5
6 2: 3.0
7 2. 3.5
I 3,, 3.5
I 3. 4.0
10 4. 4.5
TOTAL 30.0

El promedio de todas las rnedias, deber ser igual al promedio poblacional:


30/10 = 3
Con lo cualse comprueba elprincipio matemático.

r'-
x f
t.5 I
2.0 I
2.5 2
3.0 2
3.5 2
4.0 I
4.5 1.5 2 2.5 3.5 1 L5

Error estándar de la medi" 64


xi x XXX
Esta medida estadistica mide el grado de dispersión <te todas las medias muestrales de tamaño
n,
alrededor de la media poblacional; y se representa por ox; cuando es estimado con los datos
de una
mYgsqa s.e representa por Sx. En otras palabras el error estándar de la media es la
desviación
estándar de la distribución muestral de tas inedias.

Tomando los datos del ejercicio, el cálculo del enor estándar de la media puede calcularse
así

x X -¡r (tx 'u )'


1 -¿ 4
2 -t
a, o
1

0
E(X-u )2
4 ,t N
1

5 2 4
t5 0 l0
:

H=-EX = 15/5=3'
N

o =aJ tols = 1.41: y aplicando la fórmula64,el enor estándar de la media se tiene:

0x
-2 {vu;oV* á+ar^á--¡1
=

1* 0.866; oi = 0.866

ri. )
I-
6. Estimación de parámetros

Después de haber seleccionado una muestra, hay necesidad de estimar parámetros,


estos pueden
§er: promedio o media aritmética, totales y porcentajes. En general el¡sten dos'méroOdJ p;;;
estimar la media de la población con base a-los resultáos de uña muestra- gsi¡maciOn puntuaíi
=
¡r, y Estimación por intervalo de confianza p = Xr Z
(oi )
Z representa el número de desviaciones estándar, de acuerdo al nivel o probabilidad de confianza
que se necesite.

7. Muestreo Aleatorio simple

Es el método más sencillo en donde todos los elementos de la población tienen la misma
probabilidad de ser seleccionadas en una muestra, para la selección
sL utiliza la tabla de número
aleatorios.

8. Tamaño de muestra

El tamaño de la muástra o sea el número de etementos a seleccionar no deber ser al criterio


del
investigador pueslo que existen varias fórmulas para calcular el lamaño Ottimo
una de ellas es la siguiente: '
-'- ----'- de una muestra.,

Donde: Z= aI nümero de dewiaciones estánda¡, de


represenüa
n= 22 o2 N
acuerdo a la prúabilidad o nivel de confianza O = Desviación
ellndar de la población. N = Total de elementos en hpoblación
22 c2r N(E")2 y Ea : error absoluto de nruesfreo.

se desea seleccionar una muestra de una poblaciÓn de 30 casos, seleccionando


la variable
ingresos, según una investigación los datos obtenidos son los siguientes:
N = 30, o = 4, se desea
estimar los ingresos
_familiares con una- probabilidad de acertar Ael gS yo y un enor absoluto de
muestreo de Q 2.00. Determinar eltainañó óptimo de la muestra.

(1.s6) '
a 1+¡ 1aO¡

(1.e6)'(¿) * (30) (2

9. Muestreo

La población . se
llamados estratos, se 9n gluqos parecidos entre sí de conformidad con la variable clave,
el tamaño de la muestra y esta se reparte entre cada estrato, ra
distribución de la muestra cada estrato se conoce como afijación de la muestra.
La selección de los se hace en forma similar at muestreo simpte, utilizando la tabla de
números ala azar, como elcálculo de la X muestral, así como en erroreitañoar de la media.
Media aritmética:

X = Wr Xr + Wz X-z + ...... ...W n X r


Dónde W = es la ponderación para cada estrato

X r, = el promedio muestral en cada estrato

h = el estrato 1, 2,3,...h ó A, B, C, etc.

Enor estándar de la media

Si=

Dónde

S = desviación estándar de la muestra


W = ponderación para cada estrato (peso relativo)

La estimación por íntervalo de confianza

F= X x Z oX

La distribución o afijación de la muestra, puede hacerce de las siguientes maneras

a) Afijación uniforme
b) Afijación proporcional, y
c) Afijación óptima

10. Selección de ta muestra sistemáticamente

La selección aleatoria de los elementos, si se desea una muestra de tamaño n,


se determina un
intervalo i = N/n. se elige al azar un núrne¡o i, y se incluye en la muestra cuyo orfgen
conesponde al
1úme¡o elegido. Luego se incluye cada i - eseimo ebmlnto a partir del primero ieleccionado. para
la estimación de la media puntual y por intervalo, así como tamaño de la muestra,
se procede en
igualforma que en el muestreo simple.

EJERCICIO
Una fin¡a de Auditores hq sido contratada para fiscalizar a un grupo de 30
empresas en total, todas
contribuventes al imlye¡$,:g!l solicitando tomar una muestra de tai empresas, y que su
L1lg^ta,
selección sea al .r,1r;!{]ll"-Tl:,* de las .empresas sobre er ¡móuesto pagaoo en et período
2000-2001' ordenad-o a mayor_en-ryrilesde quetzales ur i,
27,29,29,29,29,29,30,!9 fnenor 24,26,2o,27,
30, 30, 3b, 31, 33, 33, 33, 34, 34,g4,34, "iéu¡"n["23,
Fo, 35-, ¿S, áé, 3g, 40, 40.
I

2'1 Determine el tamaño be la muestra (muestreo


-' - - simpte),
-'rirr!-'' con
Y un B0 %o de confianza y un enor de
muestreo <te e 4.0 miÉs;

2'2 seleccione la ufilizando ta tabla de número aleatorios, explicado et procedimiento


ry::d,
seguido para la seleSón;

2.3 Estime el promedio ofr imOuesto pagado por intervalo con B0 yo de probabitidad; y

2.4 conbase en t, mr.r{ra, estime er monto del impuesto pagado por ras 30 empresas.
I

I
tI
1r '
1

ii

APUNTES SOBRE
REGRESIÓN Y CORRELACION
LINEAL SI\VTPLE

t.,

o
,tE
Él
4
x

E?
¡ir
E
()
&2
v

Reyes Donisrfosé Luis


I
I

lntroducción
Contando con información sobre úariables, tales como: ingresos y gastos, ventas y
años de experiencia, ventas y utilidades. (Variables X, Y),-se sabá ó r" ,su*e que
guardan relaciÓn.9¡tre sí; se aplica regresión para calcuiar o estimar valores yi,
partir de valores X", o sea sustituir valores observados por valores
I
calculados.
Se usa la correlaciÓn para cuantificar la relación de las variables X e y, para lo
cual se calcula un indicador numérico que se denomina Coeficiente de
Correlación. El análisis de regresión y corredción. es simple cuando se estudian
dos y sÓlo dos variables; es múltiple cúando se estudian tres o más. La conelación
parcial es un caso particular de conelación mriltiple; de las tres o más
variables
pueden analizarse dos, asumiéndose que las demás no influyen.

Se dice regresión lineal cuando los valores de Y, pueden ser estimados bajo la
forma Y = a + b X, en cualquier otro caso se denominará regresión o conelación
no lineal (Curvilínea)
a 1. Regresión lineal simple

Permite estimar una variable llamada predictando (y)


.con relación a otra ltamada
Predictor (x) para lo cual es necesario ajustar una llnea recta a un conjunto de
datos-utilizando.el método de mínimos cuadrados, a través de la ecuación de la
línea recta.
Y = a + bxr dónde: '/ = predictando, variable que e desea estimar
a y b = coeficientesde regresión, a =origen y b = pendiente.
X = Predictor, con base a la que se estima y'.
Para encontrar los r:oeficientes de regresión se pueden utilizar varias fórmulas.
a) Ecuaciones nomules
Ej

IY = na + bIX
f XY= aIX + bf X2
;

b) a= (Ix2 )(fY) - (rx) (txY)


x2 - ( rx)2
[= n (f xY) - (Ix) ( ry)
n(r x,l - (Ix )2
c) a= i -o,
§= f XY -n X Y
rx'- bx2

1.1 Propiedades de los mfnimos cuadrados


a) La suma algebraica de las desviaciones de los valores originales respecto a los
calculados es cero.
(,
f (Y- Yc) =g
Yc = y calculada o estirnada

b) La suma algebraica de las desviaciones de Y respecto a Yc, al cuadrado es


mínima, comparada con cualquier otro vator que no sea yc.

f (Y-Yc)2 esmínima.

1.2 Enor estándar de estimación, símbolo Sy/x


La ecuación de regresión permite esümar los valores del predictando ( y ) en
función de los valores del predictor (X). §in embargo no se sabe el grado de enor

u de las estimaciones para lo cualse utiliza la medida estadística denominada, Enor


Estándar de Estimación. Sl Sx/y = 0, se dirá que existe estimación perfecta,
mientras menor sea el valor de §y/x, la estimación estará más cercana a la
realidad. Elenor estándar mide el grado de dispersión de los valores alrededor de
la línea de regresión.

Fónnula general: §y/x

1
Y = Predictando ó variable que se desea estimar,
Yc = valores de Y calculados con la ecuación,
n = números de parejas de la variable
Otra fórmula:

§ylx =

Dónde:
X = Valores del prerlictor, o variable dependiente
Y = Valores del predictando o estimado
t a = Origen en la ordenada
b= Pendiente de la recta
n = Número de parejas de la variable

a ) Prcpiedades de S y/x

Yc + sy/x, agrupa aproximadamente al 6g.26 yo de ros puntos


Y c + 2s!¿<, agrupa aproximadarn'ente al g5.46 ya de los puntos
Y c + 3syx, agrupa aproximadamente al gg,72 o/o delos puntos

2. Gorrelación lineal simple


v Estudla el comport¡amier¡to de una variable con relación a otra, por ejern$o:
inverción, utilidad; satarios, producción; ingresos, gastos. Las medidas estadlstícas
que permiten medir ta relación son dos coeficientes:
a) coeficiente de determinación, srmbolo I en forma primaria; y
c) Coeficiente de slmbolo r.
ionelación,

Ambos permiten establecer el grado de asociación o vinculación


cuantitativa que entre dos o más variables.

i:
h*.¡n.

M
2.1 Caracterlsticas:
r,siempre es positivo, no dice si la conelacién es negativa
Para r:

a) Sí r > 0, correlación positiva

b) r ( 0, corelación negativa

c) Si r = 0, no existe conelación
d) S¡ r = - 1, conelación perfecta negativa
e) Sí r = l,conelación perfecta positiva
0 sí -1§ r s l, la conetación es fuerte o débil, según se a@rque a cero.

3. Nube de puntos o mapa de dispersión

Esia represeñtación gráfica del predictor y el predic*ando o sea de las variables


consideradas, es decir cuando dos variables, se marcan en una gráfica.

4. Eiemplo de regrcslón y comelación

Una empresa desea saber la relación existente entre los gastos en publicidad y
sus ingresos anuales. La información es la siguiente:

Año Gastos en publicldad Ventas Q.

2002 4 32
2003 10 42
200l. 3 31
2005 4 35
2006 2 26
2007 1 21
a) El mapa de dispersión o nube de puntos
b) Determinar la ecuación de regresión para estimar ras ventas
anuares
c) Determinar ros vatores de yc, y eraborar ra gráfica
d) Estimar las ventas anuares para 2005, si se gasta en pubricidad
e s, 000.00
e) Dernostrarque f (y -yc)=g
0 lndicar el grado de enor de la estimación
g) Hallar el intervalo para el 69.26 o/o delos casos
h) lndicar cual es elgrado de conelación e interpretar el resuttado.

* SoLUCtON

a) Mapa de dispersión o nube de puntos

(v
b) Y=a +bX

b= JXY - nXY
Í.X2- nX2

a = Y - bX
Cuadro de cálculo:
i:g;*Éi*4
ffirffit#ffi
I
,.i:I¡!
f-Í-lw¡*l
i¡#;i#&r*&1&,¡&á&,ii;Hlk
fr:1i
i$¡'t
1999 4 ó¿ 12e 16 31 1 1,024
2000 10 42 424 100 44 -2 1,764
2001 3 31 93 0 29 2 961

2002 4 35 140 16 31 4 1,225


2003 2 26 52 4 27 -1 676
2004 1 21 21 1 2l -4 441
TOTAL 24 187 854 146 187.01 - 0.01 6,091

ü
a) Ecuación de regresión
§= 854 - 6(4)(31.17)
146-6(4)

§= 854-748.08 = 105.92 = 2.1184


146-96 50

a = 31.17 -2.1154 (4)

a= 31.17 -8.4736 = 22.6964

Y = 22.6964 -2.11U X
\:y'
c) Determinar los valores de Yc y elaborar la gráfica (vatores de Yc en cuadro)
d) Yc=22.6964 + 2.11U (5 ) = Q 33.2884 Mites

e) Demostrar que f (Y - Yc) = 0 (ver cuadro -0.001 aprox. Cero)

0 Sy/x = JY -aIY - bIXY

6091 * 197 -2.11U * 854


-22.6964

- 4244.23 - 1809.11
o 6091

Sy/x = 2.5

g) Hallar el intervalo para el 68.26 % ...


Yc t Sy/x

Q30.7884 miles

h) lndicar el grado de asociación de las variables.

r= 22.69il (187\+ 2.t184 (S54) -6 (31.17 )

6031 -6(31.17)

42M.23 + 1809.11 -5829.41

6.09't - 5889.41

r= 223.93 = 0.925* 100 = 92.52o/o.

También podría gustarte