Está en la página 1de 14

5.

Estadstica Inferencial

Para Alicia Nolberto es una parte de la estadstica que comprende los mtodos y
procedimientos que por medio de la induccin determina propiedades de una
poblacin estadstica, a partir de una pequea parte de la misma. Comprende
aspectos importantes como:

La toma de muestras o muestreo.


La estimacin de parmetros o variables estadsticas.
El contraste de hiptesis.
El diseo experimental.
La inferencia bayesiana.
Los mtodos no paramtricos

La inferencia siempre se realiza en trminos aproximados y declarando un cierto


nivel de confianza.
(Alicia Nolberto, 2008)
Formulas
Intervalos caractersticos
El nivel de confianza (p) se designa mediante 1 - .
El nivel de significacin se designa mediante .
El valor crtico (k) como z /2.
En una distribucin N (, ) el intervalo caracterstico correspondiente a una
probabilidad p = 1 - es:
( - z /2 , + z /2 )
Teorema central del lmite
m

flecha media de la poblacin

flecha desviacin tpica de la poblacin

n
flecha Tamao de la muestra (n>30, cualquier tamao si la poblacin es
"normal")
Las medias de las muestras siguen aproximadamente la distribucin:

Estimacin de la media de una poblacin


Intervalo de confianza para la media

Error mximo de estimacin

Tamao de la muestra

(www.dm.uba.ar/, 2007)
Ejemplos:
En una fbrica que consta de 600 trabajadores queremos tomar una muestra de
20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y
100 en la D.

En una fbrica de componentes electrnicos, la proporcin de componentes


finales defectuosos era del 20%. Tras una serie de operaciones e inversiones

destinadas a mejorar el rendimiento se analiz una muestra aleatoria de 500


componentes, encontrndose que 90 de ellos eran defectuosos. Qu nivel de
confianza debe adoptarse para aceptar que el rendimiento no ha sufrido
variaciones?
p = 0.2

q = 1 - p =0.8

p'= 90/ 500 = 0.18

E = 0.2 - 0.18 = 0.02

P (1 - z/2 <1.12) = 0.86861 - 0.8686 = 0.1314


0.8686 - 0.1314 = 0.737
Nivel de confianza: 73.72%

5.3.1

Muestreo Probabilstico

Segn la pgina en internet www.explorable.com es una tcnica de muestreo en


virtud de la cual las muestras son recogidas en un proceso que brinda a todos los
individuos de la poblacin las mismas oportunidades de ser seleccionados.
Existen diversos tipos de muestreo probabilstico como:
El muestreo aleatorio simple: es la forma ms fcil de muestreo probabilstico.
Lo nico que el investigador tiene que hacer es asegurarse de que todos los

miembros de la poblacin sean incluidos en la lista y luego seleccionar al azar el


nmero deseado de sujetos.

Puede como sacar tiras de papel de un sombrero con nombres escritos mientras
el investigador tiene los ojos vendados o puede ser tan fcil como usar un
software de computadora para hacer la seleccin aleatoria.
El muestreo aleatorio estratificado: es conocido como muestreo aleatorio
proporcional. sta es una tcnica de muestreo probabilstico en donde los sujetos
son inicialmente agrupados en diferentes categoras, tales como la edad, el nivel
socioeconmico o el gnero.
Luego, el investigador selecciona aleatoriamente la lista final de sujetos de los
distintos estratos. Es importante tener en cuenta que los estratos no se
superpongan.
Generalmente, los investigadores utilizan un muestreo aleatorio estratificado si
quieren estudiar un determinado subgrupo dentro de la poblacin.
(www.explorable.com, 2009)

Muestreo no Probabilstico
Para la pgina web explorable.com es una tcnica de muestreo donde las
muestras se recogen en un proceso que no brinda a todos los individuos de la
poblacin iguales oportunidades de ser seleccionados.
Es un producto de un proceso de seleccin aleatoria. Los sujetos en una muestra
no probabilstica generalmente son seleccionados en funcin de su accesibilidad o
a criterio personal e intencional del investigador. La desventaja del mtodo de
muestreo no probabilstico es que no se toman pruebas de una porcin
desconocida de la poblacin. Esto implica que la muestra puede representar a

toda la poblacin con precisin o no. Por lo tanto, los resultados de la


investigacin no pueden ser utilizados en generalizaciones respecto de toda la
poblacin.
Existen diversos tipos de muestreo no probabilstico como:
El muestreo por conveniencia: es probablemente la tcnica de muestreo ms
comn. En el muestreo por conveniencia, las muestras son seleccionadas porque
son accesibles para el investigador. Los sujetos son elegidos simplemente porque
son fciles de reclutar. Esta tcnica es considerada la ms fcil, la ms barata y la
que menos tiempo lleva.
El muestreo por cuotas: es una tcnica de muestreo no probabilstico en donde
el investigador asegura una representacin equitativa y proporcionada de los
sujetos, en funcin de qu rasgo es considerado base de la cuota.
Ejemplo, si la base de la cuota es de nivel de ao en la universidad y el
investigador necesita una representacin igual, con un tamao de muestra de 100,
debe seleccionar 25 estudiantes de 1 ao, 25 de 2 ao, 25 de 3 ao y 25 de 4
ao. Las bases de la cuota generalmente son la edad, el gnero, la educacin, la
etnia, la religin y el nivel socioeconmico.
El muestreo de bola de nieve: se lleva a cabo generalmente cuando hay una
poblacin muy pequea. En este tipo de muestreo, el investigador le pide al primer
sujeto que identifique a otro sujeto potencial que tambin cumpla con los criterios
de la investigacin. La desventaja de usar una muestra de bola de nieve es que
difcilmente sea representativa de la poblacin.
El muestreo discrecional: es ms comnmente conocido como muestreo
intencional. En este tipo de toma de muestras, los sujetos son elegidos para
formar parte de la muestra con un objetivo especfico. Con el muestreo
discrecional, el investigador cree que algunos sujetos son ms adecuados para la

investigacin que otros. Por esta razn, aquellos son elegidos deliberadamente
como sujetos.
(www.explorable.com, 2009)

5.4

Estadstica descriptiva

Segn Alicia Nolberto son los procedimientos empleados para organizar y resumir
conjuntos de observaciones en forma cuantitativa. El resumen de los puede
hacerse mediante tablas, grficos o valores numricos. Los conjuntos de datos
que contienen observaciones de ms de una variable permiten estudiar la relacin
o asociacin que existe entre ellas.
Examinaremos los datos en forma descriptiva con el fin de:

Organizar la informacin
Sintetizar la informacin
Ver sus caractersticas ms relevantes
Presentar la informacin

Factores necesarios para un buen anlisis estadstico:

Diseo del Experimento o Investigacin


Calidad de los Datos
(Alicia Nolberto, 2008)

Segn la pgina www.dm.uba.ar/ define a:


Poblacin: conjunto total de los sujetos o unidades de anlisis de inters en el
estudio
Muestra: cualquier subconjunto de sujetos o unidades de anlisis de la poblacin
en estudio.
Asimismo, define

- Unidad de anlisis o de observacin: al objeto bajo estudio. puede ser una


persona, una familia, un pas, una institucin o en general, cualquier objeto.
- Variable: a cualquier caracterstica de la unidad de observacin que interese
registrar y que en el momento de ser registrada puede ser transformada en un
nmero.
- Valor de una variable, dato u observacin o medicin: al nmero que describe a
la caracterstica de inters en una unidad de observacin particular.
- Caso o Registro: al conjunto de mediciones realizadas sobre una unidad de
observacin.
(www.dm.uba.ar/, 2011)
Ejemplos:
Esquema de Tallo y Hoja
Nos da una primera aproximacin rpida a la distribucin de los datos sin perder
de vista las observaciones.
Consideremos el segundo dato:
8
TALLO

9
HOJA

1. Elegimos un nmero de dgitos a la derecha de cada nmero que


correspondern a las hojas: 1 en este caso.
2. Separamos esos dgitos de los restantes, que constituirn los tallos. En este
caso obtendremos 8 tallos, de 8 a 15.

8 89

9 3445667
10 334678
11 122337789
12 00455577
13 2456899
14 238
15 556

5.4.1 Las medidas de tendencia central media aritmtica, mediana y


moda
La pgina de internet http://es.slideshare.net/ dice que al describir grupos de
observaciones, con frecuencia es conveniente resumir la informacin con un solo
nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la
distribucin de datos se denomina medida o parmetro de tendencia central o de
centralizacin. Cuando se hace referencia nicamente a la posicin de estos
parmetros dentro de la distribucin, independientemente de que sta est ms o
menos centrada, se habla de estas medidas como medidas de posicin. En este
caso se incluyen tambin los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:

Media
Media ponderada
Media geomtrica
Media armnica
Mediana

Moda

Se debe tener en cuenta que existen variables cualitativas y variables


cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan
de acuerdo al tipo de variable que se est observando, en este caso se observan
variables cuantitativas.
Media aritmtica: es el valor obtenido por la suma de todos sus valores dividida
entre el nmero de sumadores.
Ejemplo, las notas de 5 alumnos en una prueba:
Nio

nota

6,0

Primero, se suman las notas:

5,4

6,0+5,4+3,1+7,0+6,1 = 27,6

3,1

7,0

6,1

Luego el total se divide entre la cantidad de alumnos:


27,6/5=5,52

La media aritmtica en este ejemplo es 5,52


Mediana: representa el valor de la variable de posicin central en un conjunto de
datos ordenados.
Existen dos mtodos para el clculo de la mediana:
1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.
Datos sin agrupar

Si n es impar, la mediana es el valor que ocupa la posicin (n+1)/2 una vez que los
datos han sido ordenados (en orden creciente o decreciente), porque ste es el
valor central. Es decir: M_e=x_{(n+1)/2}.
Ejemplo, si tenemos 5 datos, que ordenados son :
,
,
,
,
=> El valor central es el tercero:
. Este valor,
que es la mediana de ese conjunto de datos, deja dos datos por debajo ( , ) y
otros dos por encima de l ( , ).

Datos agrupados
Al tratar con datos agrupados, si n/2 coincide con el valor de una frecuencia
acumulada, el valor de la mediana coincidir con la abscisa correspondiente. Si no
coincide con el valor de ninguna abscisa, se calcula a travs de semejanza de
tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la
siguiente equivalencia:

Donde

son

las

frecuencias

absolutas

acumuladas

tales

que

son los extremos, interior y exterior, del intervalo

donde se alcanza la mediana y


mediana. Se observa que

es la abscisa a calcular, la
es la amplitud de los intervalos

seleccionados para el diagrama.


Moda: es el valor con una mayor frecuencia en una distribucin de datos.
Hablaremos de una distribucin bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que

encontramos tres modas. Si todas las variables tienen la misma frecuencia


diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.

(http://es.slideshare.net/, 2008)

5.4.2 Las Medidas de Dispersin de Rango Desviacin, Media


Cuadricular, y Estndar y Coeficiente de Variacin
Tambin llamadas medidas de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de
una variable estn muy alejadas de la media. Para la pgina es.slideshare.net
Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms
homognea ser a la media. As se sabe si todos los casos son parecidos o varan
mucho entre ellos.
Rango: es la diferencia entre el valor mximo y el valor mnimo en un grupo de
nmeros aleatorios. Se le suele simbolizar con R.
Requisitos del rango

Ordenamos los nmeros segn su tamao.

Restamos el valor mnimo del valor mximo


Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus
valores se encuentran en un rango de:

Desviacin media: muestra el total de (xi-x)fi y para su obtencin se suman todos


los valores de dicha tendencia y el resultado de la suma se divide entre el
resultado obteniendo la media aritmtica.
Desviacin estndar: es la ms fcil de obtener puesto que para llegar a su
resultado de la varianza y elevarlo al cuadro y este sera la desviacin estndar.
Desviacin Cuarticular: las mediciones se miden en cuatro partes iguales, y cada
uno contiene 25% de los casos.
(http://es.slideshare.net/,2012)
Coeficiente de variacin: Las medidas de dispersin anteriores son todas
medidas de variacin absolutas. Una medida de dispersin relativa de los datos,
que toma en cuenta su magnitud, est dada por el coeficiente de variacin.
El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un
conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto
entre su media aritmtica y se expresa como

para una muestra y

para la poblacin.
Los coeficientes de variacin tienen las siguientes caractersticas:

Puesto que tanto la desviacin estndar como la media se miden en las


unidades originales, el CV es una medida independiente de las unidades de

medicin.
Debido a la propiedad anterior el CV es la cantidad ms adecuada para
comparar la variabilidad de dos conjuntos de datos.

En reas de investigacin donde se tienen datos de experimentos previos,


el CV es muy usado para evaluar la precisin de un experimento,
comparando en CV del experimento en cuestin con los valores del mismo
en experiencias anteriores.

Ejemplo: En seis sbados consecutivos un operador de taxis recibi 9, 7, 11, 10,


13 y 7 llamadas a su sitio para su servicio.
a) Para calcular la media.

b)

Para calcular la desviacin media

c) Para calcular el coeficiente de variacin:

(http://colposfesz.galeon.com/, 2011)

UNIVERSIDAD ICEL
CAMPUS LA VILLA

TAREA 3er PARCIAL

ORTIZ SOLANO DAVID

GRUPO: 414

18/NOV/2014

También podría gustarte