Está en la página 1de 156

REPBLICA BOLIVARIANA DE VENEZUELA.

UNIVERSIDAD DE ORIENTE
NCLEO ANZOTEGUI
ESCUELA DE CIENCIAS ADMINISTRATIVAS
COORDINACIN DE ESTUDIOS DE POSTGRADO.
MAESTRA EN CIENCIAS ADMINISTRATIVAS
MENCIN: ADMINISTRACIN DE LA PRODUCCIN

ESTADSTICA BSICA

Facilitador: Autores:
MSc. Hamlet Mata Ana Velsquez C.I.19.940.620
Daniel Rengel. C.I.12.659.167
Milagros G. Montero C.I.15.014.386
Haidee Martnez. C.I.19.142.427
Luis Condales. C.I.14.133.407

El Tigre, Agosto, 2017


INTRODUCCIN

Existen dos formas de interpretar el trmino "estadstica", entendiendo por estadstica,


cualquier coleccin de datos numricos clasicados segn un criterio; o bien, como una
ciencia que utiliza los nmeros para el estudio de las leyes que dependen del azar.
Tratando de descubrir mediante el razonamiento inductivo la causa general a la que
obedece el modelo particularmente analizado.

La palabra estadstica se origina, en las tcnicas de recoleccin, organizacin,


conservacin, y tratamiento de los datos propios de un estado, con que los antiguos
gobernantes controlaban sus sbditos y dominios econmicos. Estas tcnicas
evolucionaron a la par con el desarrollo de las matemticas, utilizando sus herramientas
en el proceso del anlisis e interpretacin de la informacin.

Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin
mayores restricciones legales. El febril jugador De Mr consult al famoso matemtico
y filsofo Blaise Pascal (1623-1662) para que le revelara las leyes que controlan el
juego de los dados, el cual, interesado en el tema, sostuvo una correspondencia epistolar
con el tmido Pierre de Fermat (1601-1665, funcionario pblico apasionado por las
matemticas; clebre porque no publicaba sus hallazgos) dando origen a la teora de la
probabilidad, la cual se ha venido desarrollando y constituyndose en la base primordial
de la estadstica.

En nuestros das, son de uso cotidiano las diferentes tcnicas estadsticas que partiendo
de observaciones muestrales o histricas, crean modelos lgico-matemticos que se
"aventuran" describir o pronosticar un determinado fenmeno con cierto grado de
certidumbre medible.

La finalidad de la presente investigacin es desarrollar los temas relacionados con el


programa SPSS y el anlisis estadstico, dndole una breve introduccin a la estadstica
y a la estadstica inferencial, explicar la teora del muestreo, la estimacin de parmetros
y prueba de hiptesis, la regresin, correlacin y ANOVA, con ejemplos prcticos que
permitan comprender mejor cada caso.
1
EL PROGRAMA INFORMTICO SPSS Y EL
ANLISIS ESTADSTICO

1. SPSS

Es un programa estadstico informtico usado en las ciencias exactas, sociales y


aplicadas, que contiene un conjunto de potentes herramientas de tratamiento de datos y
anlisis estadstico. El nombre originario corresponda al acrnimo de Statistical
Package for the Social Sciences (SPSS), reflejando la orientacin a su mercado original,
aunque este programa es tambin muy utilizado en otros campos como la
mercadotecnia.

Es uno de los programas estadsticos ms conocidos por su capacidad para trabajar con
grandes bases de datos y una sencilla interfaz para la mayora de los anlisis.

Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre
1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research
Center estuvo a cargo del desarrollo, distribucin y venta del programa. A partir de
1975 corresponde a SPSS Inc.

2. CARACTERSTICAS DEL SPSS

El SPSS para Windows proporciona:

Editor de datos. Sistema verstil, similar a una hoja de clculo, para definir, introducir,
editar y presentar datos.

Visor. El Visor permite examinar los resultados, mostrarlos y ocultarlos de forma


selectiva, modificar el orden de presentacin en la pantalla y desplazar tablas y grficos
de gran calidad entre SPSS y otras aplicaciones.
Tablas de pivote multidimensionales. Sus resultados cobrarn vida en las tablas
pivotes multidimensionales. Explora las tablas reorganizando las filas, las columnas y
las capas. Hace importantes descubrimientos que suelen quedar velados en los informes
convencionales. Compara fcilmente los grupos dividiendo la tabla de manera que
aparezca solamente un grupo cada vez.

Grficos de alta resolucin. Como funciones bsicas de SPSS se incluyen grficos de


sectores, grficos de barras, histogramas, diagramas de dispersin y grficos 3-D de alta
resolucin y a todo color, entre muchos otros.

Acceso a bases de datos. Obtiene informacin de bases de datos mediante el Asistente


para bases de datos en lugar de utilizar consultas SQL de gran complejidad.

Transformaciones de los datos. Las funciones de transformacin le ayudarn a


prepararlos datos para el anlisis. Puede crear fcilmente subconjuntos de datos,
combinar categoras y aadir, agregar, fusionar, segmentar y transponer archivos, entre
muchas otras posibilidades.

Distribucin electrnica. Se pueden enviar informes por correo electrnico pulsando


en un botn o exportar tablas y grficos en formato HTML para distribuirlos por
Internet o dentro de una Intranet.

Ayuda en pantalla. Los tutoriales ofrecen una introduccin global ampliamente


detallada, los temas de la Ayuda sensible al contexto de los cuadros de dilogo guan a
travs de la ejecucin de tareas especficas, las definiciones de las ventanas emergentes
para los resultados de las tablas pivote explican los trminos estadsticos y Estudios de
casos proporcionan ejemplos prcticos sobre cmo utilizar los procedimientos
estadsticos y cmo interpretar los resultados.

Lenguaje de comandos. Aunque la mayora de las tareas se pueden llevar a cabo


simplemente situando el puntero del ratn en el lugar deseado y pulsando en el botn,
SPSS proporciona adems un potente lenguaje de comandos que permite guardar y
automatizar muchas tareas comunes. El lenguaje de comandos tambin proporciona
algunas funcionalidades no incluidas en los mens y cuadros de dilogo. La
documentacin completa sobre la sintaxis de comandos se instala automticamente al
mismo tiempo que SPSS.

3. INSTALACIN DEL PROGRAMA SPSS

Navegar dentro del DVD hasta la carpeta SPSS20 y seleccionar el sistema operativo de
acuerdo a las caractersticas de su computadora (32bits 64bits)
Ya seleccionado su sistema operativo correspondiente, buscar el archivo setup y darle
doble click.

Aparecer la ventana inicial de la instalacin.


Seleccionar Siguiente
En esta ventana, seleccionar el tipo de instalacin. Para licencias monousuario/usuarios
individuales seleccionar la primera opcin. Seleccionar Siguiente

Aceptar los trminos de la licencia y seleccionar Siguiente.


Ingresar el nombre del usuario del SPSS y el nombre de la Organizacin en las casillas
correspondientes. Seleccionar Siguiente

Seleccionar los idiomas opcionales para la ayuda del SPSS.


Seleccionar Siguiente
Confirmar la carpeta en la que se instalar el SPSS 20.
Seleccionar Siguiente

Seleccionar Instalar para dar inicio al proceso de instalacin del SPSS 20.
Esta ventana muestra el avance de la instalacin, debe esperar hasta que finalice para
continuar con el siguiente paso de la instalacin.

Esta ventana muestra el avance de la instalacin, debe esperar hasta que finalice para
continuar con el siguiente paso de la instalacin.
Una vez finalizada la instalacin, aparecer esta ventana para iniciar con el proceso de
licenciamiento del producto. Seleccionar Aceptar

Si ya cuenta con su cdigo de autorizacin y conexin a internet, seleccione la primera


opcin.
Si desea activar el perodo de prueba, seleccione la segunda opcin y avance hasta la
diapositiva No.18
Ingrese su cdigo de autorizacin en la casilla correspondiente y luego seleccionar
Siguiente.

Aparecer una ventana mostrando el proceso de autorizacin por internet. Al finalizar


despliega un mensaje en color verde con el cdigo de licencia obtenido.
Listo, ya est instalado y activado el SPSS20 y puede empezar a
Siga los siguientes paso UNICAMENTE para activar el uso temporal de la licencia. Si
ya tiene licenciado su producto, NO debe realizar el siguiente procedimiento.

Seleccionar el cono que se indica para accesar al archivo que contiene la licencia
temporal.
Automticamente aparecer el archivo que contiene la licencia temporal. Dar doble clic
sobre el archivo temp.txt y luego Abrir.
Automticamente se agregar la ruta de acceso al archivo temp.txt
Seleccionar Siguiente

Listo, a partir de este momento, tiene 14 das para utilizar el SPSS20 . Por favor
contacte a su representante local para adquirir una licencia del producto.
4. ESTRUCTURA INTERNA DE SPSS

SPSS est formado por cinco bloques, que reciben el nombre de mdulos, cada uno
de ellos especializado en una rama de la estadstica:

Mdulo base, permite la generacin y manipulacin de datos y ficheros y la


generacin de grficos de alta resolucin. Con este mdulo se llevan a cabo
los anlisis estadsticos elementales
Mdulo Modelos de Regresin, donde se consideran una gran parte de
tcnicas estadsticas de regresin
Mdulo Modelos Avanzados, se estudian los diferentes modelos de anlisis
de la varianza y diseo de experimentos as como tablas de mortalidad y
anlisis de supervivencia
Mdulo Categoras, dedicado a los anlisis de componentes principales, de
correlacin cannica, de correspondencias, de homogeneidad y tcnicas de
Multidimensional Scaling
Mdulo Tablas, permite la generacin de tablas
Mdulo Tendencias, utilizado para el anlisis de series temporales
Mdulo Anlisis Conjunto, para el diseo de experimentos

Como programa, el SPSS est organizado en base a comandos, que constituyen los
elementos de un lenguaje. Cada procedimiento tiene asociado una serie de comandos y
con la combinacin de los mismos se puede elaborar un fichero de sintaxis para llevar a
cabo anlisis estadsticos ms complejos. Los ficheros de sintaxis se ejecutan
directamente mediante la opcin Ejecutar Proceso dentro del men Utilidades. A esta
opcin se la denomina Proceso por lotes.
Subsecciones
1.1 Ventanas
1.2 Botones
1.3 Men Principal
1.4 Iconos
1.4.1 Iconos de la Ventana Principal
1.4.2 Iconos del Visor
1.4.3 Iconos de la Ventana de Grficos
1.5 Barra de Estado
1.6 Los Comandos
El programa tiene varios tipos de ventanas (las cuales permiten, por un lado, gestionar
la introduccin de datos y decidir los anlisis a realizar y, por otro lado, acceder a
distintos aspectos de la manipulacin de los resultados generados. Todas ellas presentan
sus propias barras de herramientas que pueden ser, como en casi todas las aplicaciones
del entorno Windows, personalizadas a gusto del usuario.

5. SINTAXIS DE COMANDOS

Como ya hemos indicado, es posible acceder a la mayora de los comando desde los
mens y cuadros de dilogo. No obstante, algunas rdenes slo estn disponibles
mediante el uso del lenguaje de comandos. El lenguaje de comandos tambin permite
guardar los trabajos en un archivo de sintaxis, con lo que es posible repetir los anlisis
Introduccin al SPSS.Un archivo de sintaxis es simplemente un archivo de texto que
contiene comandos.Aunque es posible abrir una ventana de sintaxis y escribir
comandos, es ms sencillo permitir que el programa ayude a construir un archivo de
sintaxis mediante uno de los siguientes mtodos:

Pegando la sintaxis de comandos desde los cuadros de dilogo (opcin pegar)


Creando un archivo de sintaxis.En los ficheros de ayuda en pantalla de un
procedimiento determinado, siempre aparece el vnculo sintaxis de comandos en
la lista de Temas relacionados. Esta opcin permite acceder al diagrama de
sintaxis correspondiente al comando en uso. Tambin se dispone de una
completa informacin sobre el lenguaje de comandos en el manual de referencia
de sintaxis (SPSS Base Syntax Reference Guide).
6. VENTANA DEL EDITOR DE DATOS DE SPSS

Se trata de una tpica ventana de una aplicacin en Windows que, de arriba abajo,
consta de los siguientes elementos:

Barra de ttulo, con el men de control, el nombre de la ventana y los botones


de minimizar, maximizar y cerrar.
Barra de mens, con 10 mens diferentes: Archivo, Edicin, Ver, Datos,
Transformar, Estadstica, Grficos, Utilidades, Ventana y Ayuda.
Archivo. Mediante este men se pueden abrir, crear o grabar los diferentes
ficheros que SPSS emplea, ya sean de datos, instrucciones, resultados o
procesos. Igualmente, es posible controlar las tareas de impresin.
Edicin. Permite realizar las tareas habituales de edicin: modificar, borrar,
copiar, pegar, seleccionar, etc.
Ver. Permite controlar diversos parmetros de visualizacin en pantalla.
Datos. Este men permite definir variables, as como efectuar modificaciones
en los ficheros de datos: seleccionar, aadir, ponderar, etc.
Transformar. Aqu se encuentran todas las opciones relativas a la modificacin
y generacin de nuevas variables. Las funciones de este men y del anterior son
temporales, y slo estn vigentes durante la sesin, sin que afecten al fichero
original de datos. Si se quieren convertir en permanentes, deben grabarse los
cambios.
Analizar. Mediante este men se accede a los diferentes anlisis estadsticos
que se hayan instalado.
Grficos. Permite la creacin y edicin de diversos tipos de grficos de alta
resolucin, algunos de ellos son tambin accesibles a travs de determinadas
tcnicas estadsticas.
Utilidades. Entre otras, posibilita mostrar informacin sobre los ficheros de
SPSS, las variables o el tratamiento de conjuntos de variables.
Ventana. Dispone de las funciones habituales para controlar las ventanas.
?. Proporciona ayuda al usuario en el formato tpico de Windows.
Barra de herramientas, donde, mediante botones con iconos, se representan
algunas de las operaciones ms habituales. Si pasamos el puntero del ratn por
cualquiera de ellos, aparecer en la pantalla un texto en amarillo indicando la
funcin que se activa. Esta barra es personalizable.
Lnea de edicin de datos, consistente en una matriz de datos, flanqueada por
una primera fila en gris con los encabezamientos de las variables y por una
primera columna, tambin en gris, con los nmeros de los casos.
Barra de estado, en la que el sistema proporciona diversos mensajes. Est
dividida en varias zonas de avisos. La primera est reservada para informaciones
de tipo general, y en la segunda aparece lo relativo al procesador de SPSS
(nombre del comando que se est ejecutando, nmero de casos almacenados...)

7. INTRODUCCIN DE DATOS

Tras abrir el programa, se selecciona la opcin introducir datos:


La definicin de una variable para ser procesada por SPSS comporta una serie de
tareas:
Denominar

Denominar la variable
Definir el tipo de la misma
Fijar un formato de columnas
Fijar un formato para los datos

Asignar, si se desea, etiquetas significativas a variables y valores


Definir cdigos especficos para los valores ausentes o perdidos
Determinar la alineacin de los datos
Especificar el nivel de medida
El nombre se escribe en el cuadro de texto asociado al Nombre de la ventana de
definicin de variables, y al resto de las funciones se accede en las columnas
respectivas. Por defecto, las variables se consideran numricas, con formato 8.2, sin
etiqueta ni cdigo especfico para valores ausentes, con alineamiento de los valores a la
derecha de cada casilla y un nivel de medida de escala.

8. NOMBRE DE LAS VARIABLES

En lo referente al nombre de las variables, hay que cumplir una serie de requisitos:

1. La extensin mxima de los nombres es de ocho caracteres.


2. El primero de ellos ha de ser una letra forzosamente.
3. Los restantes pueden ser cualquier combinacin de letras, nmeros y los caracteres
siguientes: el punto (excepto si es el ltimo carcter), @, #, $, o el guin bajo (aunque
no es recomendable situarlo al final).
4. Otros signos o caracteres especiales no estn permitidos, y sobre todo hay que poner
especial cuidado en no introducir espacios en blanco.
5. Los nombres deben ser nicos, no estando permitida su repeticin en el mismo
fichero de datos.
6. Es indiferente que se usen maysculas o minsculas, pues internamente el sistema
opera siempre con maysculas, independientemente de la forma en que aparezcan los
nombres.
7. Hay una serie de palabras clave que tienen un significado especial para SPSS, se
emplean en diferentes procesos y subprogramas y por tanto, no se pueden usar como
nombres de variables, son las siguientes:
ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, WITH

9. DECLARACIN DEL TIPO DE LA VARIABLE


Existe una importante distincin entre las variables que constituyen una matriz de
datos:
Variables numricas. Representan las variables estadsticas conocidas como
cuantitativas. Sus valores son nicamente codificables mediante nmeros. SPSS
establece a priori todas las variables como numricas, reales con dos decimales.
A su vez, entre stas podemos distinguir entre variables numricas enteras y
variables numricas con parte decimal. Las variables numricas admiten
cualquier nmero como valor vlido, pudiendo ir precedido del signo menos o
no. Su longitud mxima es de 40 caracteres de los cuales 16 pueden ser cifras
decimales. Los signos o los puntos decimales se contabilizan a la hora de definir
la longitud de la variable.
Variables con coma. Este formato de entrada de datos aade al anterior la
coma como separador de los miles y el punto como separador de la parte entera
y de la decimal.
Variables con punto. Se emplea el punto como separador de los miles y la
coma como separador de la parte decimal
Variables numricas en notacin cientfica. Son valores aceptables todos los
numricos ms las letras D o E y los signos ms o menos. 347E3, -12D-3...
Variables tipo fecha. Desde una perspectiva estricta, estas variables son de tipo
numrico. Si se quiere adoptar un punto de vista estadstico, hay que
considerarlas como variables cuantitativas; sin embargo, su codificacin y
representacin en el editor de datos puede realizarse de distintas maneras. Si se
selecciona este tipo en el cuadro de dilogo, se abre una ventana con todos los
formatos aceptables. En la lista desplegada aparecen formatos para variables de
fecha y otros para las estrictamente temporales.
Variables tipo dlar. A un valor numrico dado, se le aade el smbolo del
dlar en los diferentes formatos que aparecen en la ventana que se despliega
caso de elegir esta opcin. El smbolo $ y las comas como separadores de los
miles aparecen automticamente.

Variables con formato de moneda personalizada. Si a travs del men de


preferencias se han creado formatos especficos para variables, mediante esta
opcin se puede elegir uno de ellos. Una vez seleccionado el formato, la entrada
de datos se realiza del modo habitual, con la salvedad de que los caracteres
empleados para simbolizar la moneda no deben teclearse, sino que son
introducidos por el sistema.
Variables tipo cadena. En su codificacin admiten cualquier carcter. Al
definirlas nicamente debe especificarse su longitud mxima. Si la sucesin de
caracteres introducida como valor de una variable de este tipo tiene una
longitud menor que el mximo declarado, se completa, mientras no se
especifique de otra manera, aadiendo espacios en blanco hacia la derecha. Con
este tipo de variables s hay diferencia entre emplear los caracteres en
minscula o mayscula. Aunque la codificacin alfanumrica es la ms
recomendable para las variables cualitativas, tambin es la ms propensa a
errores. Una alternativa viable es codificar numricamente las variables
cualitativas y asignar a los diferentes valores numricos etiquetas ilustrativas, lo
que disminuye la probabilidad de ocurrencia de errores. Adems, el editor de
datos permite visualizar la matriz con las etiquetas de los valores en vez de los
valores originales. Etiquetado de variables y valores La declaracin de las
etiquetas de las variables se lleva a cabo en la caja de texto con epgrafe
Etiqueta. La etiqueta de la variable puede ser cualquier texto con una extensin
mxima de 120 caracteres, aunque es recomendable limitar su longitud, pues en
la mayora de los listados de resultados el tamao mximo es excesivo y la
etiqueta se trunca. Un valor aconsejable puede estar entre 20 y 40 caracteres.
Las etiquetas pueden escribirse con cualquier combinacin de maysculas y
minsculas y van a aparecer siempre tal y como hayan sido declaradas. El
procedimiento es similar para las etiquetas de valores. Esta operacin slo
merece la pena para variables cualitativas en las que los cdigos asignados a los
valores no resulten claros, y muy especialmente cuando se haya realizado una
codificacin numrica de los mismos.

10. INTRODUCCIN AL SPSS

Las etiquetas de los valores pueden tener una extensin mxima de 60 caracteres,
aunque aqu es aconsejable limitar su longitud a un valor cercano a 20.

Para crear las etiquetas, el proceso es el siguiente:

1. Se teclea el cdigo del valor de la variable.


2. Se teclea el texto de la etiqueta en su cuadro correspondiente.

La correspondencia entre valor y etiqueta queda as incorporada al fichero de datos.


11. DEFINICIN DE CDIGOS PARA LOS VALORES AUSENTES O
PERDIDOS

Se entiende por valores ausentes o perdidos a aquellos casos en que no se dispone de


informacin sobre el valor de una variable determinada. SPSS distingue dos tipos de
valores ausentes:
Los definidos por el propio sistema (system-missing values). Asignados
automticamente a todas las casillas vacas que aparezcan en una variable
declarada como numrica. Se representan por una coma.
Los definidos por el usuario (user-missing values). Para las variables
alfanumricas una casilla en blanco se considera un valor vlido de la variable.

Para definir este tipo de valores faltantes, ha de abrirse el correspondiente cuadro de


dilogo, en el que se distinguen las siguientes opciones:
1. Ausencia de valores faltantes definidos por el usuario. Todos los valores, excepto los
blancos, son considerados como vlidos.
2. Valores perdidos discretos. Se pueden definir un mximo de tres valores ausentes por
cada variable.
3. Intervalo de valores perdidos. Todos los valores comprendidos entre el mximo y el
mnimo (ambos includos) son considerados como valores ausentes.
4. Un intervalo y un valor nico. Se consideran como ausentes los valores
pertenecientes al intervalo ms el valor discreto declarado.
Especificacin del nivel de medida

SPSS permite seleccionar entre tres opciones mutuamente excluyentes: escala, ordinal y
nominal, adaptndose a la propuesta clsica de Stevens en la que el nivel de intervalo se
agrupa en la categora de escala que podemos tambin identificar con las variables
cuantitativas.

12. RECODIFICAR VARIABLES


Recodificar una variable significa cambiar total o parcialmente el conjunto de cdigos
con que representamos sus valores. La recodificacin no es slo un capricho esttico
sino, en muchas ocasiones, una necesidad de transformacin adecuada para la mejora de
un anlisis tcnico.

En el men Transformar elegimos Recodificar, y dentro de este la opcin en


distintas variables para no perder la variable original. La pantalla inicial que aparece
permite llevar a cabo la siguiente secuencia de operaciones:
Elegir la variable a recodificar de la ventana de la parte izquierda
Elegir un nuevo nombre para la variable recodificada y una nueva etiqueta en la
ventana "Variable de resultado"
Establecer, si se desea, una condicin para la recodificacin en el botn
"Si

Pantalla de recodificacin de cdigos

Pantalla inicial de recodificaccin

13. CALCULAR NUEVAS VARIABLES A PARTIR DE OTRAS


EXISTENTES

Puede que nos interese generar nuevas variables a partir de datos ya almacenados en el
archivo. Para calcular nuevas variables, elegimos en el Men "Transformar" la opcin
"Calcular", accediendo a una pantalla que nos aparece permite llevar a cabo la siguiente
secuencia de operaciones:
1. Dar un nombre a la nueva variable en la ventana "Variable de destino"
2. Especificar su "Tipo y Etiqueta"
3. Generar una "expresin numrica" para la nueva variable que contendr tres
elementos: variables almacenadas - operadores simples y funciones
predeterminadas por el SPSS.
4. Establecer una condicin para el clculo (botn "SI")

Pantalla para clculo de nuevas variables


2
INTRODUCCIN A LA ESTADSTICA

1. ESTADSTICA

Es un conjunto de teoras y mtodos desarrollados para la recopilacin, representacin


y el uso de datos sobre una o varias caractersticas de inters con el objeto de tomar
decisiones, extraer conclusiones o emprender acciones.

La estadstica puede ser descriptiva o inferencial. La estadstica descriptiva tabula,


representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin
sacar conclusiones. La estadstica inferencial infiere propiedades de gran nmero de
datos recogidos de una muestra tomada de la poblacin.

2. TERMINOS BSICOS DE LA ESTADISTICA:

POBLACIN: Es una coleccin finita o infinita de elementos con caractersticas


comunes. Ejemplo: las personas, libros de una biblioteca, etc. Algunas poblaciones son
finitas y pueden conocerse; otras pueden ser infinitas y abstractas: Ej. El conjunto de
hoteles, establecimientos comerciales de una ciudad o el conjunto de todas las piezas
fabricadas por una mquina.

VARIABLE: Toda caracterstica que puede tomar diferentes valores (Ej. nmero de
hijos, precio de la habitacin) Las variables se suelen denotar por letras maysculas: X,
Y.

Tipos de variables:

1. Cualitativas o Categricas: aquellas que no son medibles, es decir, aquellas cuyas


observaciones no tienen carcter numrico. Expresan cualidades o categoras. Ej.
estado civil, sexo o profesin.(A las variables cualitativas tambin se les llama
atributos).
2. Cuantitativas: aquellas que son medibles, es decir sus observaciones tienen carcter
numrico. Estas se dividen a su vez en:
Discretas: toman valores enteros en un conjunto numerable. Ej. Nmero de
habitaciones de un hotel, nmero de hijos de una familia, nmero de obreros
de una fbrica.
Continuas: toman valores en un conjunto no numerable (los nmeros reales o
un intervalo). Ej. peso, estatura.

MUESTRA: Es un subconjunto de la poblacin. Se denota por n.

DATO: cada valor observado de la variable. Si representamos por X a la variable,


representaremos por xi cada dato diferente observado en la muestra, el subndice i
indica el lugar que ocupa si los ordenamos de menor a mayor.

MEDICIN: La asignacin o magnitud que se aplica a las categoras o clases de


acuerdo a ciertas reglas o smbolos. Una medicin se puede definir como la manera de
obtener smbolos para representar propiedades de personas, objetos, eventos o estados
cuyos smbolos tienen la misma relacin relevante entre si igual a las entidades que
representan.

3. ESCALAS DE MEDICIN DE LAS VARIABLES

Las escalas de medicin son el conjunto de los posibles valores que determinada
variable puede tomar. Por tal razn, los tipos de escala de medicin estn ntimamente
ligados con los tipos de variables a estudiar. Las magnitudes de las observaciones
cuantitativas se conocen como los valores que una variable puede asumir.
Dependiendo de la medicin y de la esencia de las variables, se obtienen diversas
clases de datos que originan diferentes escalas. Resulta imprescindible conocer el tipo
de escala que representan los datos, debido a que, de su esencia dependen las tcnicas
estadsticas que se debern aplicar para su anlisis.

Al elaborar estadsticas con datos y su caracterstica es necesario contarlas,


jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medicin como el
proceso de asignar nmeros o establecer una correspondencia uno a uno entre
objetivos y observaciones. Las escalas de medicin s clasifican de la siguiente
forma: Escala Nominal, Escala Ordinal, Escala de Intervalos y Escalas de razn o
Proporcin.

Escala de Medicin Nominal: Consiste en clasificar a los elementos, personas,


animales, etc, asignndoles smbolos o nombres. Los datos que se obtienen para una
variable cualitativa se miden en una escala nominal y simplemente se clasifican en
distintas categoras que no implican orden. La escala nominal es la forma ms dbil de
medicin porque no se puede aplicar operaciones aritmticas ni intentar el conteo de
las diferencias dentro de una categora determinada o especificar cualquier orden o
direccin a lo largo de las diversas categoras.

Propiedades de la Escala Nominal

1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos.


2. No existe un orden especfico para esta categora.
3. No presentan el cero.
4. No se basa en diferencia cuantitativa.

Ejemplos: Una muestra de personas puede clasificarse con base en la religin


profesada: (1) Cristianos; (2) Judos; (3) Musulmanes; (4) Otros; y (5) Sin Creencia
alguna. O bien podran clasificarse segn el sexo, el color de los ojos, algn
partido poltico, etctera. Otros ejemplos de escala nominal puede ser el numero de
placa de los vehculos, los nmeros de los telfonos de una ciudad, la Cedula de
Identidad de los habitantes de un pas, entre otros.

El tipo de operacin estadstica ms utilizada en la escala nominal es el conteo de las


frecuencias (distribuciones de frecuencias), con que se presentan las caractersticas en
las unidades de las respectivas subclases. Estas frecuencias pueden ser presentadas con
nmeros absolutos, porcentajes y proporciones. Adems, puede calcularse la moda,
razones, tasas de incremento, y el coeficiente de contingencia. Tipos de grficos:
Diagrama de Barras.

Escala de Medicin Ordinal: Establece una relacin de orden entre los elementos
(personas, animales, objetos, etc.), en atencin a una caracterstica, sin que reflejen
distancia entre ellos. La diferencia entre dos nmeros ordinales no tiene significado
cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no
dice cuanto es uno que el otro.

La escala ordinal sigue siendo una forma de medicin dbil porque no se pueden hacer
planteamientos numricos significativos con respecto a las diferencias entre las
categoras. Es decir, la ordenacin establece slo cul categora es mayor, mejor o
preferida; y no se habla cunto es mayor, mejor o ms preferida.Esta escala
se emplea, cuando un estudio esta basado en ciertas normas que se asignan a un
conjunto de objetos, personas o caractersticas o a un conjunto de categoras
ordenadas. Las categoras de la escala se ordenan d acuerdo con la cantidad de
rasgos o caractersticas que representan cada una de ellas ya que la escala ordinal
distingue los diferentes valores de la variable, ubicando las caractersticas en orden,
desde la ms alta hasta la ms baja.

La diferencia fundamental entre una escala nominal y una ordinal es que en la ordinal
rige no slo la relacin de igualdad, de identidad, sino tambin la relacin de mayor
que.

Propiedades de la Escala Ordinal

1. Las observaciones o elementos se les ordena en rangos o categoras diferentes.


2. Las categoras son mayores o menores que otras categoras, es decir, que existe
una clasificacin de mayor a menor (jerarqua).
3. Las categoras son mutuamente excluyentes y exhaustivas.
4. No presentan el cero.

Ejemplos:

Se pueden clasificar los habitantes de una ciudad de acuerdo a su situacin econmica,


a los estudiantes tomando en cuenta a su rendimiento acadmico, el orden jerrquico
de los militares (Subteniente, Teniente, Capitn, Mayor, Teniente Coronel, Coronel,
General) y la clasificacin acadmica de los profesores universitarios (Instructor,
Asistente, Agregado, Asociado, Titular), etctera. Aunque la escala ordinal resulta en
cierta forma ms precisa que la nominal, no alcanza el grado de precisin deseado en
una investigacin.

El tipo de operacin estadstica ms utilizada en la escala ordinal es la mediana,


percentiles, cuartiles, mnimo y mximo. Tipos de grficos: Diagrama de barras (con
un orden) y grficos de caja.
Escala de Medicin de Intervalos: Tiene todas las caractersticas de una escala ordinal,
adems permite conocer la distancia entre dos nmeros cualquiera. Esta escala se
caracteriza p o r tener una unidad de medida y un origen (cero) arbitrario. La escala
de intervalos a diferencia de la nominal y ordinal, es una escala efectivamente
cuantitativamente. Una escala de intervalo es una escala ordenada en la cual la
diferencia entre las mediciones es una cantidad significativa.

La escala de intervalos posee adems, de las caractersticas de la escala nominal y


ordinal, la propiedad de que la distancia entre dos valores es de una magnitud
conocida, lo que le permite a esta escala un mayor grado de perfeccin, ya que
proporciona nmeros que manifiestan diferencias palpables entre individuos, objetos o
cosas.

La razn entre dos intervalos es siempre independiente del punto cero y de la unidad
que se emplee en la medicin. En el caso de las escalas de intervalos las unidades de
medicin son iguales.

Propiedades de la escala de Intervalo:

1. Esta escala implica la cuantificacin de los datos


2. En estas medidas se utilizan unidades constantes de medicin (capacidad, peso,
Cntimos, grados Fahrenheit o centgrados) los cuales producen intervalos iguales
entre puntos de la escala.
3. Proporcionan nmeros que manifiestan diferencias palpables entre individuos,
objetos o cosas.
4. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario.
5. Se pueden aplicar todas las medidas estadsticas ms conocidas, con excepcin del
coeficiente de variacin.
6. Son mutuamente exclusivas y exhaustivas.

Ejemplos:
Otro ejemplo de esta escala lo constituyen las escalas utilizadas para medir
temperatura, bien sea en grados Centgrados o Fahrenheit. En estas escalas la
diferencia entre 80 y 85 es igual a la que existe entre 90 y 95 o entre dos puntos
cualesquiera de la escala.

Las estadsticas apropiadas para esta escala son: media, desviacin estndar, rango,
varianza, coeficiente de variacin, asimetra y kurtosis. Tipos de grficos: histograma,
polgono de frecuencias y grfico de tallos y hojas.

Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto de


medicin, posee todas las caractersticas de las escalas nominales, ordinales y de
intervalos; adems tiene un cero absoluto o natural que tiene significado fsico. Si en
ella la medicin es cero, significa ausencia o inexistencia total de la propiedad
considerada. Son posibles todas las operaciones aritmticas. Los nmeros indican los
valores concretos de la propiedad que s est midiendo; peso, estatura, ingresos
monetarios y gastos directos, son ejemplos de medidas con una escala de razn.

Cuando se emplea este tipo de escala, los nmeros indican razones o cocientes entre
ciertas magnitudes de los objetos, y los datos obtenidos con tales escalas pueden ser
sometidos a los tratamientos ms elaborados.

Propiedades de la escala a razn:

1. La distancia entre los nmeros es un tamao conocido y constante.


2. Los datos tienen un punto cero significativo.
3. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el coeficiente de
variacin.
4. Permite hacer comparaciones entre los nmeros verdaderos con un cero aritmtico
siendo arbitrario nicamente la unidad de medida.

Otros ejemplos de esta escala son: la medicin del peso o altura de un grupo de
personas, el ingreso familiar, la intensidad de corriente elctrica de un cable, la edad de
un grupo de personas, etc.

Generalmente, se supone que los datos que se obtienen para una variable cuantitativa
se miden en escalas de intervalo o de razn. Estas escalas constituyen los niveles ms
elevados de medicin. Son formas ms fuertes de medicin que la escala nominal y
ordinal, porque permiten comprender no slo cul de los valores de un estudio es
mayor o menor, sino por cuntas unidades de medida. Las escalas de razn son
medidas de Longitud, peso, capacidad, etc., los nmeros reflejan razones entre
particularidades y los datos obtenidos segn tales escalas pueden ser sometidas a
cualquier tratamiento estadstico.

Estadstica descriptiva. En ella debemos tener en cuenta las siguientes etapas:

a). Recoleccin de datos


b). Organizacin de datos
Tabulacin
Graficas
c). Anlisis y medicin de datos

a) Recoleccin de datos

Para esta etapa tomaremos los siguientes terminos:

Poblacin: conjunto de observaciones efectuadas

Individuo: cada elemento de la poblacin.


Atributo: caracterstica investigada en la observacin. Estos pueden ser cualitativos
(sexo, religin, nacionalidad) o cuantitativos (estatura, peso, rea estos son
continuos, se miden en nmeros reales-; nmero de hijos, nmero de goles
discretos, se miden en nmeros enteros-)

Por ejemplo: si se desea realizar un estudio estadstico de las estaturas de los alumnos
de tercer ao,

Poblacin: conjunto de estaturas


Individuo: cada estatura
Atributo: la estatura

Teniendo presente la clasificacin, clasifica los siguientes atributos

1. Afiliacin poltica de los habitantes de la Capital de Chile.

2. Cantidad de ganado vacuno en las provincias de la Ro Bueno y La Unin.

3. Religin de los padres de familia de la comunidad educativa Santa Cruz.

4. Ingresos de los obreros.

5. Cantidad de alumnos de las diferentes carreras de la Facultad de Ciencias


Exacta en la U.L.A.

6. Sexo de los alumnos de una escuela.

7. Estado civil de los habitantes de la ciudad de Ro Bueno.

8. Cantidad de pelculas nacionales estrenadas durante un ao.

9. Color de cabellos de los alumnos de un curso.

10. Puntaje obtenido por los alumnos que ingresan a la carrera de Medicina.

5. ORGANIZACIN Y DESCRIPCIN DE DATOS

Ordenacin en forma legible de los datos compilados


Clasificacin en forma sistemtica y presentacin en cuadros y/o grficos.
Clculo de medidas: parmetros o valores estadsticos para describir el
comportamiento de los datos.
DECISIN O INFERENCIA FINAL

Cuando se ha realizado un muestreo y es necesario concluir acerca de la poblacin se


debe realizar la estimacin de parmetros y la comprobacin de hiptesis.

6. DISTRIBUCIONES DE FRECUENCIAS

La distribucin de frecuencia es una disposicin tabular de datos estadsticos,


ordenados ascendente o descendentemente, de acuerdo a la frecuencia de cada dato.
Las frecuencias pueden ser:

a. FRECUENCIA ABSOLUTA (fi):

Es el nmero de veces que se repite un determinado valor d e la variable (xi). Se


designa por fi.

PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de


observaciones (n).

b. FRECUENCIA ACUMULADA (Fi):

Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que se


obtienen de las sumas sucesivas de las fi que integran cada una de las filas de una
distribucin de frecuencia, esto se logra cuando la acumulacin de las frecuencias se
realiza tomando en cuenta la primera fila hasta alcanzar la ltima. Las frecuencias
acumuladas se designan con las letras Fi. Se calcula:

PROPIEDAD: La ltima frecuencia acumulada absoluta es igual al total de


observaciones.

c. FRECUENCIA RELATIVA (hi):

Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el nmero
total de datos. Las frecuencias relativas se designan con las letras h i .

Se calcula,
PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.

d. FRECUENCIA RELATIVA ACUMULADA (Hi):

Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre nmero
total de datos. Se designa con las letras Hi. Se calcula;

PROPIEDAD: La ltima frecuencia relativa acumulada es la unida

e. DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS

Es la representacin estructurada en forma de tabla de toda la informacin que se ha


recogido sobre la variable que se estudia, es decir, es una tabla que presenta de manera
ordenada los distintos valores de una variable y sus correspondientes frecuencias. Su
forma ms comn es la siguiente:

Ejemplo 1:

El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido


respecto de la dcada anterior. Para ello ha encuestado a 50 familias respecto al
nmero de hijos, y ha obtenido los siguientes datos:

0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
Se pide:
a). Construir la tabla de frecuencias absolutas
b). Cul es el nmero de familias que tiene como mximo dos hijos?
c). Cuntas familias tienen ms de 1 hijo pero como mximo 3?
d). Qu porcentaje de familias tiene ms de 3 hijos?

Solucin:

a). Para construir la tabla de frecuencias hay que tener en cuenta que la variable en
estudio es el nmero de hijos (discreta), que toma los valores existentes entre 0
y 6 hijos y las frecuencias son el conjunto de familias, de esta forma tenemos:

b). En la columna de las fi: 2+4+21=27 en la columna de las Fi: F2= 27


c). En la columna de las fi: 21+15=36 en la columna de las Fi: 42-6=36
d). En la columna de las hj: 0.12+0.02+0.02=0.16, que supone un 16% en la
columna de las Hi: 1-0.84=0.16, 16%

7. DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se


encuentra ordenada en clases y con la frecuencia en cada clase; es decir, los datos
originales de varios valores adyacentes del conjunto se combinan para formar un
intervalo de clase. No existen normas establecidas para determinar cundo es
apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que
cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o
recorrido de la serie de datos es mayor de 20, entonces, se utilizar la distribucin de
frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando
se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o
la ojiva.
La razn fundamental para utilizar la distribucin de frecuencia de clases es
proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar
la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar,
resumir, condensar o hacer que la informacin obtenida de una investigacin sea
manejable con mayor facilidad.

Al agrupar los datos en una distribucin de frecuencia de clase se pierde parte de la


informacin. La reduccin o agrupamiento a que son sometidos los datos de una serie
de valores cuando existen muchos valores diferentes, originan los denominados
errores de agrupamiento; sin embargo, estos errores son en general muy pequeos,
razn por la cual la distribucin de frecuencia de clase tiene una validez estadstica
prctica.

Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas
generales:

El nmero de intervalos de clase se toma entre 5 y 15 dependiendo de los datos.


Cada observacin debe estar incluida en una y solo una clase o intervalo.
El valor ms pequeo y ms grande deben entrar en la clasificacin.
No deben existir brechas o vacos entre clases sucesivas.
Los intervalos no se deben sobreponer.
En la medida de lo posible, se debe utilizar la misma amplitud para todos los
intervalos.

8. COMPONENTES DE UNA DISTRIBUCIN DE FRECUENCIAS DE


CLASES

1. Clase o Intervalo de clase.

Son divisiones o categoras en las cuales se agrupan un conjunto de datos ordenados


con caractersticas comunes. Para organizar los valores de la serie de datos hay que
determinar un nmero de clases que sea conveniente. En otras palabras, que ese
nmero de intervalos no origine un nmero pequeo de clases ni muy grande. Un
nmero de clases pequeo puede ocultar la naturaleza natural de los datos y un nmero
muy alto puede provocar demasiados detalles como para observar alguna informacin
de gran utilidad en la investigacin. A las fronteras del intervalo, la llamaremos,
lmites inferior y superior de la clase y los denotaremos por Li-1, Li.
2. Punto medio o Marca de clase ()

Es la semisuma del lmite inferior y superior de una clase, tal como lo indica la
siguiente formula:

3. Amplitud, Longitud o Tamao del Intervalo.

Los intervalos de clases pueden ser de tres tipos: Clases de igual tamao, clases de
tamaos desiguales y clases abiertas. En trminos generales, las clases de igual tamao
son los ms utilizados y recomendados para los clculos estadsticos. Se designa por
las letras Ic.

Nota: Al nmero de observaciones de una clase se le llama frecuencia de clase,


si dividimos esta frecuencia por el nmero total de observaciones, se llama frecuencia
relativa de clase, y del mismo modo que lo hacamos para datos sin agrupar
definiramos Hi, y Fi.

Agrupacin de datos por intervalos de clase

1. intervalos iguales en los que se divide el nmero total de observaciones. Es


conveniente utilizar los intervalos de clase cuando se tiene un gran nmero de
datos de una variable continua.

Cmo saber cuntos intervalos considerar? Cmo determinar su amplitud?

Primero debemos determinar el rango de los datos, que es la diferencia entre el


mayor y el menor de los valores obtenidos.

Rango = xmx xmn

2. Calcular el nmero de clases a utilizar. Existen diversos criterios para determinar


el nmero de clases, ante tanta diversidad de criterios, se ha considerado que lo mas
importante es dar un ancho o longitud de clases a todos los intervalos de tal
manera que respondan a la naturaleza de los datos y al objetivo que se persigue y
esto se logra con la prctica. Existe una forma para determinar el nmero de clases
y la misma puede ilustrarse en el siguiente cuadro:

Cuando se tenga dudas en determinar el nmero de intervalos de clases, es de gran


utilidad utilizar el mtodo sugerido por Hebert A. Sturges, el cual establece que: K=
1+3,322 log(n) = nmero de intervalos.

3. Determinamos la amplitud o tamao de los intervalos travs de la siguiente


formula:

ancho o tamao de intervalos

Ejemplo 2

Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de
sus habitaciones, el gerente investiga los precios por habitacin de

40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles de
pesetas) fueron:

3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2
4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5
4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1
5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1
Procedimiento:

1. El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.
2. K= 1+3,322 log(40) = 6.3 6 nmeros de intervalos
3. Ic = 2.8 / 6 = 0.467 0.5 tamao de los intervalos

As pues la tabla sera:


Cuantos hoteles tienen un precio entre 3.3 y 3.8? 3

Cuantos hoteles tienen un precio superior a 4.8? 15

Qu porcentaje de hoteles cuestan como mucho 4.3? 27.5 %

9. MTODOS GRFICOS

La forma de la distribucin de frecuencias se percibe ms rpidamente si la


representamos grficamente. Se resume la informacin de la muestra de forma grfica
con fines clarificadores o para enfatizar y descubrir determinadas caractersticas que de
otra manera seria muy difcil de apreciar. Un grfico siempre es ms inmediato de
comprender que un conjunto de datos estadsticos. Las representaciones graficas varan
segn el tipo de variable:

a) Grficos para variables Discretas y Categricas

Grficos: la recopilacin de datos y la tabulacin pueden traducirse grficamente


mediante representaciones convenientemente elegidas: barras, sectores circulares,
mapas curvos, entre otros.

Los grficos permiten visualizar e interpretar el fenmeno que se estudia, en forma


ms clara.

Diagrama de barras: Es la representacin grfica usual para variables cuantitativas


discretas o para variables cualitativas. En el eje de ordenadas representamos los
diferentes valores de la variable (xi). Sobre cada valor levantamos una barra de
altura igual a la frecuencia (absoluta o relativa). Ejemplo:
DIAGRAMA DE SECTORES O DE PASTEL: Es el ms usual en variables
cualitativas. Se representan mediante crculos. A cada valor de la variable se le
asocia el sector circular proporcional a su frecuencia.

Ejemplo: Los siguientes datos corresponden a una encuesta referente a elecciones


locales de un partido poltico:

Para construir el diagrama de sectores partimos del hecho de que un circulo encierra
un total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360
grados en distintos sectores, de acuerdo con cada porcentaje; tenemos as que para
determinar el sector correspondiente al 50%, resolvemos la ecuacin:

Esto es, el 50% corresponde a un sector circular de medida 180 grados. A


continuacin, con ayuda de un transportador, sealaremos el sector circular de
medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10% se
tiene 36 grados. La siguiente figura muestra la representacin grafica.
b) Grficos para variables continuas

HISTOGRAMA: Es la representacin grfica de las frecuencias agrupadas de una


variable continua sobre intervalos. A diferencia de los diagramas de barras, los
histogramas dibujan rectngulos unidos entre si, lo que significa que existe
continuidad en la variable cuyos valores se representan en el eje horizontal que se
haya dividido en intervalos de igual amplitud. Las reas de los rectngulos son
proporcionales a las frecuencias que representan.

Ejemplo:

El histograma o diagrama de barras proporcionan mucha informacin respecto a la


estructura de los datos, nos permite evidenciar fundamentalmente tres
caractersticas:

1. Forma de la distribucin.
2. Acumulacin o tendencia posicional (valor central de la distribucin).
3. Dispersin o variabilidad.

Cuando nos encontramos en distribuciones donde los intervalos no tienen la misma


amplitud, las barras del histograma tienen que tener un rea proporcional a la
frecuencia que queramos representar.

El polgono de frecuencias: se construye uniendo los puntos medios de los lados


opuestos de las bases de cada rectngulo. Si se quiere cerrar el rectngulo, se
agregan dos intervalos: uno anterior y otro posterior al ltimo y se prolonga el
polgono hasta los puntos medios de estos intervalos.

Las curvas se utilizan generalmente para representar la variacin de una variable a


travs del tiempo (aos, meses, horas, etc.). Sobre el eje horizontal figuran los
perodos de tiempo.

Variacin del valor de las importaciones y exportaciones de la Argentina en


millones de dlares

Variacin del valor de las importaciones y exportaciones de la Argentina en millones


de dlares

10. MEDIDAS DE POSICIN

Despus que los datos han sido reunidos y tabulados, se inicia el anlisis con el fin de
calcular un nmero nico, que represente o resuma todos los datos. Las medidas de
posicin forman parte del conjunto de medidas descriptivas numricas, las cuales se
clasifican en parmetros cuando se calculan a partir de la poblacin total- y los
estadgrafos - cuando se calculan a partir de los datos de una muestra. Una medida de
posicin es un nmero que se toma como orientacin para referirnos a un conjunto de
datos.

Uno de los problemas fundamentales que presenta un anlisis estadstico, es el de


buscar el valor ms representativo de una serie de valores. El primer paso que hay
que realizar para que se entienda una larga serie de valores u observaciones, es el de
resumir los datos en una distribucin de frecuencia; esto no es suficiente para fines
practico, puesto que a menudo es necesario una sola medida descriptiva, y en especial
cuando se requiere comparar dos o ms serie estadsticas. Es necesario continuar el
proceso de reduccin hasta sustituir todos los valores observados por uno solo que sea
representativo, de tal forma que permita una interpretacin global del fenmeno en
estudio; para que ese valor sea representativo debe reflejar la tendencia de los datos
individuales de la serie de valores. Un valor o dato de la serie con estas caractersticas
recibe el nombre de promedio, media o medida de posicin, esto es debido a su
ubicacin en la zona central de la distribucin. Las medidas de posicin son de gran
importancia en el resumen estadstico, ya que representan un gran nmero de
valores individuales por uno solo.

El valor ms representativo de un conjunto de datos por lo general no es el valor ms


pequeo ni el ms grande, es un nmero cuyo valor se encuentra en un punto
intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia un valor
referido que representar la medida de posicin de la serie de valores. Las medidas de
posicin se emplean con frecuencia como mecanismo para resumir un gran nmero de
datos o cantidades con la finalidad de obtener un valor que sea representativo de la
serie.

Las Principales Medidas de Posicin son:

La Media Aritmtica, Mediana, Moda, los cuartiles, Deciles y Percentiles.

Todas ellas a su manera tratan de dar una idea del nmero alrededor del cual se
centra a todo el conjunto de datos.

CARACTERSTICAS DE LAS MEDIDAS DE POSICIN

Deben ser definidas rigurosamente y no ser susceptibles de diversas


interpretaciones.
Deben depender de todas las observaciones de la serie, de lo contrario no seria una
caracterstica de la distribucin.
No deben tener un carcter matemtico demasiado abstracto.
Deben ser susceptibles de clculo algebraico, rpido y fcil.

11. MEDIDAS DE TENDENCIA CENTRAL Lo importante en una tendencia


central es calcular un valor central que acte como resumen numrico para representar
al conjunto de datos. Estos valores son las medidas o ndices de tendencia central.

Las medidas de tendencia central ms utilizadas son las siguientes:

MEDIA ARITMTICA

La media aritmtica ( ) o simplemente la media es la medida de posicin de ms


importancia y utilizacin en las aplicaciones estadsticas por su fcil calculo e
interpretacin. Se trata del valor medio de todos los valores que toma la variable
estadstica de una serie de datos. La media es el valor ms representativo de la serie
de valores, es el punto de equilibrio, el centro de gravedad de la serie de datos. Por lo
general se le designa con .

La media aritmtica de una serie de n valores de una variable X1, X2, X3;
X4,.........Xn, es el cociente de dividir la sumatoria de todos los valores que toma la
variable Xi, entre el nmero total de ellos. La frmula se puede expresar as:

Desviaciones o desvos. Son diferencias algebraicas entre cada valor de la serie o cada
punto medio y la media aritmtica de dicha serie, o un valor cualquiera tomado
arbitrariamente. Los desvos o desviacin se designan con la letra di.

Dado una serie de valores X1, X2, X3,.......Xn , se llama desvo a la diferencia entre
un valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el valor
indicado k de la serie corresponde precisamente a la media aritmtica de esos valores
dados, se dice entonces que los desvos son con respecto a la media aritmtica. En
smbolo:

PROPIEDADES DE LA MEDIA ARITMTICA

1. La suma de las desviaciones con respecto a la media aritmtica es igual a cero.

2. La suma de las desviaciones al cuadrado de los diversos valores con respecto a la


media aritmtica es menor que la suma de las desviaciones al cuadrado de los diversos
valores con respecto a cualquier punto K, que no sea la media aritmtica.

3. La media aritmtica total o conjunta de dos o ms serie de datos, se puede calcularen


funcin de las medias aritmticas parciales y del nmero de datos de cada una de ellas,
mediante la siguiente formula:

Donde:

Es el nmero de datos de cada serie

Adems,

Son las medias de cada una de las series

4. La media del producto de una constante por una variable, es igual al producto de la
constante por la media de la variable.

5. La media de la suma de una constante ms una variable, es igual a la media de la


variable ms la constante.
De la misma forma se cumple esta propiedad para la resta.

CARACTERSTICAS PRINCIPALES DE LA MEDIA ARITMTICA

El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la serie
de datos.
La media se calcula con facilidad y es nica para cada caso y permite
representar mediante un solo valor la posicin de la serie de valores.
La media es una medida de posicin que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.

CLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS

Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:

En donde n es el nmero total de datos y X i son los valores de la variable.

Ejemplo:

Calcule la media aritmtica de los siguientes valores:

Por lo tanto la media es 9.

CLCULO DE LA MEDIA PARA DATOS AGRUPADOS

Cuando se trabaja con la distribucin de frecuencia agrupada, se parte del supuesto


de que todos los datos comprendidos en un intervalo de clase se distribuyen
uniformemente a lo largo de este, entonces se puede tomar la marca de clase o punto
medio () del intervalo como adecuada representacin de los valores que conforman
el mencionado intervalo. Para calcular la media en estas condiciones se pueden
utilizar tres mtodos: El mtodo directo o largo y dos mtodos abreviados. En este
curso utilizaremos el primer mtodo.

MTODO DIRECTO

Este mtodo se le conoce tambin como mtodo largo; el mismo resulta demasiado
engorroso cuando las magnitudes de los puntos medios o de las frecuencias de clase
son muy grandes, debido a que los clculos son demasiados extensos. Los pasos a
seguir para calcular la media con este mtodo son los siguientes:

1. Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos
medios de cada clase y se colocan en sus respectivas columnas, se determinan las
frecuencias de cada clase y se ubican en sus respectivas columnas.

2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto medio

3. Luego se calcula la media aritmtica aplicando la frmula:

Donde n es igual al nmero total de datos.

Limitaciones de la media aritmtica

a) Cuando los datos estn agrupados en intervalos, la media no se puede calcular si el


intervalo mximo no tiene lmite superior y/o el intervalo mnimo no lo tiene inferior.

b) Puede que a la hora de tomar los datos nos encontremos con valores muy extremos
(asimtricos), en ese caso debemos valorar si son errores, entonces deberemos
eliminarlos para realizar la media. Pero si por el contrario estos valores extremos son
importantes para nuestro estudio, deberemos escoger otros ndices de medicin, como
por ejemplo la mediana que veremos a continuacin.
LA MEDIANA

La mediana es el valor que divide en dos partes iguales, al conjunto de observaciones


ordenadas respecto de sus magnitudes, de tal manera que el nmero de datos por
encima de la mediana sea igual al nmero de datos por debajo de la misma. Se designa
por las letras Me. Tal como sucede con la media, el mtodo de determinacin depende
de si los datos son agrupados o no.

o La utilizaremos cuando la distribucin sea muy asimtrica.


o Los valores extremos no le afectan (a diferencia de la media aritmtica) ya que para
su clculo slo se toman los valores que ocupan posiciones centrales.
o Se puede calcular para todo tipo de variables, excepto cualitativas.

CLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS (Discretos)

Para encontrar la mediana en una serie de datos no agrupados, lo primero que se


hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la
posicin que esta ocupa en esa serie de datos; para ello hay que determinar si la serie
de datos es par o impar.

Si el nmero n es impar, entonces la posicin de la mediana se determina por la


frmula:

Luego el nmero que se obtiene indica el lugar o posicin que ocupa la mediana en
la serie de valores, luego la mediana ser el nmero que ocupe el lugar de lo posicin
encontrada.

Si n es par, se aplica la formula

El resultado obtenido, es la posicin que ocupara la mediana, pero en este caso se


ubica la posicin de la mediana por ambos extremos de la serie de valores y los dos
valores que se obtengan se le saca la media y esta ser la mediana buscada, por lo
tanto la mediana, en este caso, es un nmero que no se encuentra dentro de la serie de
datos dados.
Ejemplos:

Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los aos de servicios de un grupo de
trabajadores. Determine la mediana.

Lo primero que se hace es ordenar los datos en forma creciente o decreciente; Los
datos ordenados quedaran as:

5, 6, 7, 8, 9, 10, 12.

Luego, como se trata de un nmero impar de datos (n=7), se aplica la formula

Para ubicar la posicin de la mediana. Esto indica que la mediana ocupa la posicin
4, que en la serie de valores esa posicin corresponde al nmero 8, entonces, Me = 8.

Tomemos ahora los datos: 5, 5, 7, 9, 11, 12, 15, 18.

Como se trata de un nmero par de datos (n =8), la mediana est dada por:

Cuando los valores de un conjunto de datos se agrupan en una distribucin de


frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida
de una distribucin de frecuencia de datos puede no ser la misma que la mediana
obtenida de los datos sin arreglar en clases, pero el resultado ser una aproximacin.
Cuando se trata de datos agrupados, la mediana se obtiene mediante el mtodo de
interpolacin. La interpolacin parte del supuesto de que los datos de cada intervalo
de la distribucin estn igualmente distribuidos.

PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS

1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases, se


ubican las frecuencias fi y se calculan las frecuencias acumuladas Fi de esa
distribucin.

2. Se determina la ubicacin o posicin de la mediana en el intervalo de la distribucin


de frecuencia, mediante la frmula n/2. El resultado obtenido determinar la clase
donde se encuentra ubicada la mediana, lo cual se conseguir en la clase donde la
frecuencia acumulada Fi sea igual o superior a este resultado. Luego se aplica la
frmula:

Donde,

Ejemplo:

Dada la siguiente distribucin de frecuencia referida a las horas extras laboradas por
un grupo de obreros. Calcule la mediana. Realice los clculos respectivos para
completar el siguiente cuadro.

Solucin:
Luego se busca en la frecuencia acumulada Fi, un valor que sea igual o superior a 66,
este se encuentra en la clase 70 -74, la cual llamaremos clase mediana. Por lo tanto el
lmite inferior de esa clase es 70 = Li. La frecuencia absoluta de esa clase es 50 = fi ,
F(i-1) = 44 y el Ic = 5. Aplicando la formula se tiene:

Luego la mediana de esa distribucin es 72.2. Esto quiere decir que un 50 % de los
obreros trabajaron horas extras por debajo de 72.2 horas y el otro 50 % trabajaron
horas extras por encima de 72.2 horas.

CARACTERSTICAS DE LA MEDIANA

La mediana no es afectada por los valores extremos de una serie de valores, puesto
que la misma no es calculada con todos los valores de la serie.
La mediana no est definida algebraicamente, ya que para su clculo no
intervienen todos los valores de la serie.

La mediana en algunos casos no se puede calcular exactamente y esto ocurre


cuando en una serie de valores para datos no agrupados el nmero de datos es par,
en este caso la mediana se calcula aproximadamente.
La mediana se puede calcular en aquellas distribuciones de frecuencia de
clases abierta, siempre y cuando los elementos centrales puedan ser determinados.
La suma de los valores absolutos de las desviaciones de los datos individuales con
respecto a la mediana siempre es mnima. (propiedad)

LA MODA

La moda es la medida de posicin que indica la magnitud del valor que se presenta
con ms frecuencia en una serie de datos; es pues, el valor de la variable que ms se
repite en un conjunto de datos. De las medidas de posicin la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observacin
de los datos en estudio, puesto que es el dato que se observa con mayor frecuencia. Se
designa con las letras Mo.

En las representaciones grficas la moda es el punto ms alto de la grfica. La


obtencin de la moda para datos agrupados no es un valor exacto, ya que vara con las
diferentes formas de agrupar una distribucin de frecuencia.

En algunas distribuciones de frecuencias o serie de datos no agrupados o agrupados se


pueden presentar dos o ms modas, en estos casos se habla de serie de datos
bimodales o multimodales respectivamente. Estos tipos de distribuciones o series de
valores se deben a la falta de homogeneidad de los datos.

Cuando una serie de valores es simtrica, la media, la mediana y el modo coinciden, y


si el grado de asimetra de la serie es moderada, la mediana estar situada entre la
media y el modo con una separacin de un tercio entre ambas. Tomando en cuenta esta
relacin, cuando se tengan dos de esta medidas se puede determinar la tercera; sin
embargo es conveniente utilizar esta relacin para calcular solamente la moda ya que
para calcular la media y la mediana existen frmulas matemticas que dan resultados
ms exactos; la frmula matemtica para calcular la moda por medio de la relacin
antes mencionada es:

Cuando los datos se encuentran no agrupados la determinacin de la moda es sencilla y


exacta; pero para calcularla en datos agrupados existen varios mtodos; cada uno de
los cuales puede dar un valor diferente de la moda: En este curso se dar el
mtodo de la interpolacin por considerarse uno de los ms precisos en el clculo de
esta. Este mtodo puede expresarse mediante la siguiente formula:

Donde,
Ejemplo:

Dada la siguiente distribucin de frecuencia correspondiente al peso en Kg. de un


grupo de trabajadores de una empresa, calcule la moda.

La clase que presenta mayor frecuencia absoluta es 80----89, entonces esta sera la
clase modal, donde Li = 80 1 = 16 12 = 4; 2,=16 2 = 14;Ic=10

Aplicando la formula se tiene:

Este resultado de la moda se interpreta as: La mayora de los trabajadores tiene un


peso aproximadamente de 82.22 Kg .

CARACTERSTICAS DE LA MODA

El valor de la moda puede ser afectado grandemente por el mtodo de


elaboracin de los intervalos de clases.
El valor de la moda no se halla afectado por la magnitud de los valores
extremos de una serie de valores, como sucede en la media aritmtica.
La moda se puede obtener en una forma aproximada muy fcilmente, puesto
que la obtencin exacta es algo complicado.
La moda tiene poca utilidad en una distribucin de frecuencia que n o
posea suficientes datos y que no ofrezcan una marcada tendencia central.
No es susceptible de operaciones algebraicas posteriores.
La moda se utiliza cuando se trabaja con escalas nominales, aunque se puede
utilizar con las otras escalas.
La moda es til cuando se est interesado en tener una idea aproximada de la mayor
concentracin de una serie de datos.

12.MEDIDAS POSICINALES

Cuando se estudi la mediana se pudo detectar que esta divide la serie de valores en
dos partes iguales, una generalizacin de esta medida da origen a unas nuevas
medidas de posicin denominadas:

Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posicin surgen por la


necesidad de requerir de otras medidas que expresen diferentes situaciones de
orden, aparte de las sealadas por la mediana. Por lo tanto es interesante ubicar otras
medidas que fraccionen una serie de datos en diferentes partes. Es bueno destacar que
los cuartiles, los Deciles y los Percentiles son unas variantes de la mediana: De la
misma forma los percentiles abarcan tanto a los cuartiles como a los Deciles.

LOS CUARTILES.- Son medidas posicinales que dividen la distribucin de


frecuencia en cuatro partes iguales. Se designa por el smbolo Qc en la que c
corresponde a los valores 1, 2 y 3. El Q1 es el valor debajo del cual queda el 25 % de
los datos; Q3 deja el 75 % de los datos y Q2 divide la distribucin de frecuencia en
dos partes iguales, un

50 % que est por debajo de los valores de Q2 y otro 50 % que est por encima del
valor de Q2. El Q2 es igual a la mediana.

CLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna


utilidad prctica calcular los cuartiles. Para el clculo de los cuartiles en datos
agrupados en una distribucin de frecuencia existe un mtodo por anlisis grfico y
otro por determinacin numrica, por fines prcticos en esta ctedra se utilizara l
ltimo mtodo. Para calcular los cuartiles por el mtodo numrico se procede de la
siguiente manera:

1. Se localiza la posicin del cuartil solicitado aplicando la frmula de posicin:


En donde c viene a ser el nmero del cuartil solicitado, n corresponde al nmero total
de datos de la distribucin y 4 corresponde al nmero de cuartiles que presenta una
distribucin de frecuencia.

2. Se determina la posicin que ocupa el cuartil mediante la frmula:

El resultado obtenido determinara la clase donde se encuentra ubicado el cuartil, lo


cual se conseguir en la clase donde la frecuencia acumulada Fi que sea igual o
superior a este resultado. Luego se aplica la frmula:

LOS PERCENTILES: Son medidas posesinales que dividen la distribucin de


frecuencia en 100 partes iguales. Con estos se puede calcular cualquier porcentaje de
datos de la distribucin de frecuencia. Los percentiles son las medidas ms utilizadas
para propsitos de ubicacin de valor de una serie de datos ubicados en una
distribucin de frecuencia. El nmero de percentiles de una distribucin de frecuencia
es de 99. El percentil 50 es igual a la mediana y al cuartil 2, es decir:

Por encima y 50 % por debajo de los datos de la distribucin.

El clculo de los percentiles es similar al clculo de los cuartiles con una variante en la
posicin de ubicacin de estos, que viene expresada por la siguiente formula:
13. MEDIDAS DE DISPERSIN

La utilizacin de una medida de posicin escogida para representar a los datos no


indica otras caractersticas que el conjunto de observaciones que posee. No todas las
observaciones son iguales a la medida de posicin tomada o seleccionada; en general
los datos difieren unos de otros, por lo tanto se hace necesario encontrar ciertos
ndices o medidas que indiquen la variabilidad o dispersin del conjunto de
observaciones que se estudian.

Una medida de variabilidad es un numero que nos indica el grado de dispersin en un


conjunto de datos. Si el valor es pequeo (respecto de la unidad de medida) entonces
hay una gran uniformidad entre los datos (homognea). Por el contrario, un gran valor
nos indica poca uniformidad (heterognea). Cuando es cero quiere decir que todos los
datos son iguales.

Las medidas de dispersin se clasifican en dos grupos:

Medidas de Dispersin Absoluta.

Son aquellas que vienen expresadas en las mismas unidades originales que indican la
serie de datos. Entre las medidas de dispersin absoluta se encuentran: el rango, el
rango intercuartilico, la desviacin media, la varianza y la desviacin tpica.

Medidas de Dispersin Relativas.

Estas medidas vienen expresadas en valores abstractos o porcentajes; su principal


funcin es la de determinar entre varias distribuciones la de mayor o menor
dispersin. La medida de dispersin relativa de mayor importancia es el coeficiente de
variacin.

RANGO O RECORRIDO.

Es la medida de dispersin ms sencilla y se define como la diferencia entre el valor


ms alto menos el valor ms pequeo y se designa por R. Es decir, R = Xmax-Xmin
para datos no agrupados. Si los datos estn agrupados en K clases el rango ser la
diferencia entre el lmite superior de la K-esima clase menos el lmite inferior de la
primera clase.

El rango nos dar una primera idea sobre las dispersin de los datos ya que si su valor
es pequeo nos indicar una gran concentracin de los datos, y si por el contrario su
valor es grande nos puede indicar una gran variabilidad o dispersin de los datos.

RANGOS ESPECIALES

El rango nos da una idea de la dispersin total de las observaciones, por lo tanto,
puede estar afectada por valores extremos dando en consecuencia una idea de alta
dispersin. Por tal motivo, se han definido otros rangos que tratan de subsanar este
problema.

RANGO NTERCUARTILICO. Se define como la diferencia entre el cuartil


tres(Q3) y el cuartil uno(Q1) de una distribucin de frecuencia y se expresa as: RI =
Q3 Q1.

RANGO SEMI-NTERCUARTILICA. Es la diferencia entre el Q3 y el Q1


dividido entre dos:

Si los valores de la RI o RSI son pequeos indica una alta concentracin de los datos
de la distribucin en los valores centrales de la serie de datos. Estas medidas se
utilizan para comparar los grados de variacin de los valores centrales en diferentes
distribuciones de frecuencias. Los mismos no son afectados por los valores extremos,
no se adaptan a la manipulacin algebraica, por tal motivo son de poco utilidad.

DESVIACIN MEDIA. La desviacin media de un conjunto de n observaciones x1,


x2, x3,. . .xn, es el promedio de los valores absolutos de las desviaciones (di) con
respecto a la media aritmtica o la mediana. Si se denomina como DM a la desviacin
media, entonces su frmula matemtica ser la siguiente:
Esta frmula es para datos no agrupados. Se toma el valor absoluto en la ecuacin,
debido a que la primera propiedad de la media aritmtica establece que los desvos
(di) de una serie con respecto a la media aritmtica siempre son iguales a cero, es
decir: di = 0.

Cuando los datos estn en una distribucin de clases o agrupados se aplica la


siguiente formula:

En esta frmula X& es el punto medio de cada clase y fi es la frecuencia de cada clase.
La Desviacin Media a pesar de que para su clculo se toman todas las observaciones
de la serie, por el motivo de no tomar en cuenta los signos de las desviaciones (di), es
de difcil manejo algebraico. Su utilizacin en estadstica es muy reducida o casi nula,
su importancia es meramente histrica, ya que de esta frmula es la que da origen a la
desviacin tpica o estndar.

VARIANZA

Una manera de resolver el problema de los signos de las desviaciones respecto de la


media aritmtica es elevndolos al cuadrado y luego sumar todos los resultados
obtenidos. Esta suma se puede considerar como una medida de la dispersin total de
los valores. Aquellos que estn ms alejados de la media aritmtica tendrn un aporte
mayor a esta suma de cuadrados.

Su mayor utilidad se presenta en la estadstica inductiva y se puede interpretar como


una medida de variacin promedio (o el promedio de la suma de los cuadrados). Se
obtiene dividiendo la variacin total entre el nmero de unidades o medidas. Se

designa por la letra S2 su frmula de clculo es al siguiente:

2
DESVIACIN TPICA

Como la varianza es el promedio de los desvos respecto de la media elevados al


cuadrado, viene entonces expresada en unidades cuadradas. Para obtener una medida
de dispersin en las unidades originales se le extrae la raz cuadrada (positiva) a la
varianza, obteniendo as otra medida de dispersin denominada desviacin tpica o
estndar, la cual se designara por S y ser igual a :

INTERPRETACIN DE LA DESVIACIN TPICA

La desviacin tpica como medida absoluta de dispersin, es la que mejor nos


proporciona la variacin de los datos con respecto a la media aritmtica, su valor se
encuentra en relacin directa con la dispersin de los datos, a mayor dispersin de
ellos, mayor desviacin tpica, y a menor dispersin, menor desviacin tpica.

Su mayor utilidad se presenta en una distribucin normal, ya que en dicha distribucin


en el intervalo determinado por

Se encuentra el 68. 27% de los datos de la serie; en el intervalo determinado por la


Se encuentra el 95,45% de los datos y entre la

Se encuentra la casi totalidad de los datos, es decir, el 99,73% de los datos; adems,
existe una regla general de gran utilidad para la comprobacin de los clculos que
dice: una oscilacin igual a seis veces la , centrada en la media comprende
aproximadamente el 99% de los datos.

Ejemplo:

Los siguientes datos corresponden al nmero de panes consumidos por un grupo de


familias de una urbanizacin de la ciudad, durante una semana determinada.
Interpretacin.- El resultado obtenido indica que en promedio, el consumo de pan de
trigo del grupo de familias de esa urbanizacin se dispersa con respecto a su media
aritmtica en una cantidad igual a 3.59.

DISPERSIN RELATIVA

Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las
dispersiones absolutas de los trminos de la muestra. Las medidas, tomadas en esas
condiciones, sern de utilidad, solo cuando se trata de analizar una sola muestra;
pero, cuando hay que establecer comparaciones entre distintas muestras, ser
necesario expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.

Las medidas de dispersin relativas permiten comparar grupos de series distintas en


cuanto a su variacin, independientemente de las unidades en que se midan las
diferentes caractersticas en consideracin. Generalmente las medidas de dispersin
relativas se expresan en porcentajes, facilitando as el estudio con medidas
procedentes de otras series de valores La dispersin relativa viene a ser igual a la
dispersin absoluta dividida entre el promedio.
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de
variacin de Pearson, este es un ndice de variabilidad sin dimensiones, lo que permite
la comparacin entre diferentes distribuciones de frecuencias, medidas en diferentes
unidades. El coeficiente de variacin de Pearson se designa con las letras CV. La
frmula matemtica es:

Una serie de valores ser ms dispersa que otra mientras su CV sea mayor. Ejemplo:

La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro.


Determine el CV de cada uno y diga cul de ellos presenta mayor variacin y cul la
menor.

Para resolver el problema se calcula el CV de cada producto y luego s determina cul


presenta mayor o menor variacin

Se puede observar que la menor dispersin la presenta el producto 3, por lo tanto, de


los tres productos el que menos varia es ese; por otro lado el de mayor dispersin o
variabilidad es el producto 1.
14.USO DEL PROGRAMA SPSS

SPSS es un programa estadstico informtico muy usado en las ciencias exactas,


sociales y aplicadas, adems de las empresas de investigacin de mercado. El nombre
originario corresponda al acrnimo de Statistical Package for the Social Sciences
(SPSS), reflejando la orientacin a su mercado original, aunque este programa es
tambin muy utilizado en otros campos como las ciencias sociales y la mercadotecnia.
Sin embargo, en la actualidad la parte SPSS del nombre completo del software (IBM
SPSS) no es acrnimo de nada.

Es uno de los programas estadsticos ms conocidos teniendo en cuenta su capacidad


para trabajar con grandes bases de datos y una sencilla interfaz para la mayora de los
anlisis.

Por ejemplo SPSS puede ser utilizado para evaluar cuestiones educativas.

Actualmente, compite no slo con softwares licenciados como lo son SAS, MATLAB,
Statistica, Stata, sino tambin con software de cdigo abierto y libre, de los cuales el
ms destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre
llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos
sistemas operativos como Linux, adems de versiones para Windows y OS X. Este
ltimo paquete pretende ser un clon de cdigo abierto que emule todas las
posibilidades del SPSS.

Mdulos del SPSS

El sistema de mdulos de SPSS, como los de otros programas (similar al de algunos


lenguajes de programacin) provee toda una serie de capacidades adicionales a las
existentes en el sistema base. Algunos de los mdulos disponibles son:

Modelos de Regresin
Modelos Avanzados
o Reduccin de datos: Permite crear variables sintticas a partir de
variables colineales por medio del Anlisis Factorial.
o Clasificacin: Permite realizar agrupaciones de observaciones o de
variables (cluster analysis) mediante tres algoritmos distintos.
o Pruebas no paramtricas: Permite realizar distintas pruebas estadsticas
especializadas en distribuciones no normales.
Tablas: Permite al usuario dar un formato especial a las salidas de los datos para
su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los
desarrolladores del software por dejar de lado el sistema original de TABLES
para hacer uso ms extensivo de las llamadas CUSTOM TABLES.
Tendencias
Categoras: Permite realizar anlisis multivariados de variables normalmente
categoras. Tambin se pueden usar variables mtricas siempre que se realice el
proceso de recodificacin adecuado de las mismas.

Anlisis Conjunto: Permite realizar el anlisis de datos recogidos para este tipo
especfico de pruebas estadsticas.

Mapas: Permite la representacin geogrfica de la informacin contenida en un


fichero (descontinuado para SPSS 16).
Pruebas Exactas: permite realizar pruebas estadsticas en muestras pequeas.
Anlisis de Valores Perdidos: Regresin simple basada en imputaciones sobre
los valores ausentes.
Muestras Complejas: permite trabajar para la creacin de muestras
estratificadas, por conglomerados u otros tipos de muestras.
SamplePower (clculo de tamaos muestrales)
rboles de Clasificacin: Permite formular rboles de clasificacin y/o decisin
con lo cual se puede identificar la conformacin de grupos y predecir la
conducta de sus miembros.
Validacin de Datos: Permite al usuario realizar revisiones lgicas de la
informacin contenida en un fichero ".sav" y obtener reportes de los valores
considerados atpicos. Es similar al uso de sintaxis o scripts para realizar
revisiones de los ficheros. De la misma forma que estos mecanismos es posterior
a la digitalizacin de los datos.
3
INTRODUCCIN A LA ESTADSTICA
INFERENCIAL

Son muchos los factores o sucesos que no tienen respuesta, es por esto que se deben
realizar estudios pertinentes que aclaren la situacin que se desea analizar. Dicho
estudio se logra por medio de la experimentacin constante, que muestran cada uno de
los resultados que se van obteniendo con la ayuda de la estadstica. Su tarea
fundamental es el anlisis de los datos que se obtienen a partir de experiencias, con el
objetivo de representar la realidad y conocerla, permite la recoleccin de datos
importantes para el estudio de situaciones que se presentan a diario y permite dar
respuesta a los problemas de una forma til y significativa.

La estadstica inferencial o inductiva plantea y resuelve el problema de establecer


previsiones y conclusiones generales sobre una poblacin a partir de los resultados
obtenidos de una muestra. Los modelos estadsticos actan como puente entre lo
observado (muestra) y lo desconocido (poblacin). Su construccin y estudio estn
basados en el clculo de probabilidades. Utiliza resultados obtenidos mediante la
Estadstica Descriptiva y se apoya fuertemente en el clculo de probabilidades. Uno de
los aspectos principales de la inferencia es la estimacin de parmetros estadsticos. La
inferencia siempre se realiza en trminos aproximados y declarando un nivel de
confianza. Si se quiere mejorar el nivel de confianza, se deber aumentar el tamao de
la muestra, o bien disminuir la precisin de la estimacin dando un tramo ms amplio.

La estadstica sirve en administracin y economa para tomar mejores decisiones a


partir de la comprensin de las fuentes de variacin y de la deteccin de patrones y
relacione en datos econmicos y administrativos. El estadstico hoy en da no basta con
solo reunir datos y calcularlos sino debe encargarse de interpretar esta informacin
obtenida en el proceso estadstico para as poder tener un resultado ptimo e importante.
Es el conjunto de posibilidades de que un evento ocurra o no en un momento y tiempo
determinado. Dichos eventos pueden ser medibles a travs de una escala de 0 a 1, donde
el evento que no pueda ocurrir tiene una probabilidad de 0 (evento imposible) y un
evento que ocurra con certeza es de 1 (evento cierto). Cabe destacar que la estadstica
inferencial puede proporcionar una serie de mtodos importantes la cual puede estudiar
un sin nmero de datos.

Definiciones:

- La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e


interpretacin de datos de una muestra representativa, ya sea para ayudar en
la toma de decisiones o para explicar condiciones regulares o irregulares de
algn fenmeno o estudio aplicado, de ocurrencia en
forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es
decir, es el vehculo que permite llevar a cabo el proceso relacionado con
la investigacin cientfica.
- La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta
la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas si/no (prueba de hiptesis),
estimaciones de unas caractersticas numricas (estimacin), pronsticos de
futuras observaciones, descripciones de asociacin.
- Estimacin: Se encarga de establecer los valores de los parmetros de la
poblacin.
- Pruebas de Hiptesis: constituyen un proceso relacionado con aceptar o rechazar
afirmaciones acerca de los parmetros de la poblacin.
- Probabilidad:

El propsito principal de los mtodos estadsticos es legitimar generalizaciones sobre


poblaciones usando datos de muestra.

Funcin:

El uso principal de la inferencia en la investigacin del comportamiento hacer


inferencia acerca de un numero grande de personas, o de otras unidades
observacionales, a partir de datos concernientes a un grupo relativamente
pequeo de personas.
Los mtodos estadsticos inferenciales emplean el razonamiento inductivo, es
decir, razonan de lo particular a lo general, razonamiento de los estadgrafos de
una muestra observada a los parmetros de la poblacin observada.

1.PROBABILIDAD

Se usa extensamente en reas como la estadstica, la fsica, la matemtica, las ciencias y


la filosofa para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales
y la mecnica subyacente discreta de sistemas complejos, por lo tanto, es la rama de las
matemticas que estudia mide o determina a los experimentos o fenmenos aleatorios es
que no se sabe que resultado particular se obtendr al realizarlo. Es decir, si es un
suceso asociado con un experimento aleatorio, no podemos indicar con certeza si
ocurrir o no en una prueba particular.

TIPO DE PROBABILIDAD.

PROBABILIDAD CLSICA

A menudo recibe el nombre d probabilidad Priori, porque si estamos usando ejemplos


ordenados, como monedas y dados legales o una baraja ordinaria, damos la respuesta
por anticipado (a priori) sin lanzar la moneda o el dado ni extraer un naipe. La
probabilidad clsica define la probabilidad de que un evento ocurra como:

PROBABILIDAD EMPRICA

Una teora de mayor aplicacin y muy sostenida es la basada en la frecuencia relativa.


Puede atribuirse a este punto de vista el adelanto registrado en la aplicacin de la
probabilidad en la fsica, la astronoma, la biologa las ciencias sociales y los negocios.
Esta teora est estrechamente relacionada con el punto de vista expresado por
Aristteles: lo probable es aquello que ocurre diariamente. Notamos a travs de gran
cantidad observaciones acumulados con los diversos juegos de azar una forma general
de regularidad que permiti establecer una teora.
PROBABILIDAD SUBJETIVAS

Se refiere a la probabilidad de ocurrencia en un suceso basado en la experiencia previa,


la opinin personal o la intuicin del individuo. En este caso despus de estudiar la
informacin disponible, se asigna un valor de probabilidad a los sucesos basados en el
grado de creencia de que el suceso pueda ocurrir.

TEOREMA DE BAYES

El teorema de Bayes, en la teora de la probabilidad, es una proposicin planteada por el


filsofo ingls Thomas Bayes (1702-1761) en 1763 que expresa la probabilidad
condicional de un evento aleatorio A dado B en trminos de la distribucin de
probabilidad condicional del evento B dado A y la distribucin de probabilidad
marginal de slo A.

En trminos ms generales y menos matemticos, el teorema de Bayes es de enorme


relevancia puesto que vincula la probabilidad de A dado B con la probabilidad de B
dado A. Es decir, por ejemplo, que sabiendo la probabilidad de tener un dolor de cabeza
dado que se tiene gripe, se podra saber (si se tiene algn dato ms), la probabilidad de
tener gripe si se tiene un dolor de cabeza. Muestra este sencillo ejemplo la alta
relevancia del teorema en cuestin para la ciencia en todas sus ramas, puesto que tiene
vinculacin ntima con la comprensin de la probabilidad de aspectos causales dados
los efectos observados.

Sea (A1, A2, A i, . . . , An) un conjunto de sucesos mutuamente excluyentes y


exhaustivos, y tales que la probabilidad de cada uno de ellos es distinta de cero (0). Sea
B un suceso cualquiera del que se conocen las probabilidades condicionales P (B | A i).
Entonces, la probabilidad P (A i | B) viene dada por la expresin:

- P (A i | B) = P(B/A1) P(A1)
P(B)
Donde:
P(A1): Son las probabilidades a priori,
P (B/A1): es la probabilidad de B en la hiptesis A1.
P(A1/B): son las probabilidades a posteriori.
Ejercicio 1: El parte meteorolgico ha anunciado tres posibilidades para el fin de
semana:

a) Que llueva: probabilidad del 50%.

b) Que nieve: probabilidad del 30%

c) Que haya niebla: probabilidad del 20%.

Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente


es la siguiente:

a) Si llueve: probabilidad de accidente del 10%.

b) Si nieva: probabilidad de accidente del 20%

c) Si hay niebla: probabilidad de accidente del 5%.

Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad no


sabemos que tiempo hizo (nev, llovo o hubo niebla). El teorema de Bayes nos permite
calcular estas probabilidades:

Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se


denominan "probabilidades a priori" (lluvia con el 60%, nieve con el 30% y niebla con
el 10%).

Una vez que incorporamos la informacin de que ha ocurrido un accidente, las


probabilidades del suceso A cambian: son probabilidades condicionadas P(A/B), que se
denominan "probabilidades a posteriori".

Vamos a aplicar la frmula:

a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el da del accidente


(probabilidad a posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:

La probabilidad de que estuviera nevando es del 21,4%.

c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%.

2.DISTRIBUCIN DE PROBABILIDAD

Una distribucin de probabilidad la podemos concebir como una distribucin terica de


frecuencia, es decir, es una distribucin que describe como se espera que varen los
resultados. Dado que esta clase de distribuciones se ocupan de las expectativas son
modelos de gran utilidad para hacer inferencias y tomar decisiones en condiciones de
incertidumbre.

VARIABLES ALEATORIAS DISCRETAS

Es el espacio muestral, o conjunto de todos los posibles sucesos aleatorios, sobre el que
se define el espacio de probabilidad en cuestin. es la variable aleatoria en cuestin, es
decir, una funcin definida sobre el espacio muestral a los nmeros reales.

El objetivo de este apartado es abordar el estudio de algunas distribuciones de


probabilidad de variables aleatorias discretas, concretamente las siguientes
distribuciones:

- Distribucin Uniforme

-Distribucin Binomial

- Distribucin de Poisson
Cuando nos planteamos estudiar estas distribuciones de probabilidad, lo hacemos
partiendo de la base que su estudio nos permitir simplificar el tratamiento estadstico
de muchos fenmenos reales. De esta manera, si nosotros nos encontramos con un
fenmeno real tal y como puede ser realizar una inversin o no. Este es un fenmeno
que tiene dos posibles valores, invertir, no invertir

Si nosotros hemos estudiado esta variable tendremos perfectamente identificados tanto


la media como la varianza como su funcin de cuanta, etc... Es decir, conocemos el
comportamiento probabilstico de este fenmeno. Si nos ponemos a pensar en
fenmenos econmicos reales, veremos que existen muchos que se pueden ajustar a un
comportamiento de este tipo. Todos ellos estn estudiados simultneamente mediante la
distribucin de Bernuilli o la generalizacin binomial. Por tanto, cuando estudiamos la
distribucin binomial, estamos estudiando miles de posibles distribuciones. Lo mismo
pasar con el resto de distribuciones que analizaremos.

DISTRIBUCIN UNIFORME DISCRETA

Decimos que una variable aleatoria discreta (X) tiene distribucin uniforme cuando la
probabilidad en todos los puntos de masa probabilstica es la misma; es decir, cuando
todos los posibles valores que puede adoptar la variable (x1, x2,xk) tienen la misma
probabilidad.

Pongamos el socorrido pero til caso del lanzamiento de un dado. Si definimos una
variable aleatoria (X) como el nmero resultante tras su lanzamiento, los valores que
puede tomar esa variable aleatoria son {1, 2, 3, 4, 5, 6}. Pues bien, esa variable aleatoria
tiene distribucin uniforme si, como es el caso, la probabilidad es la misma para cada
uno de los resultados posibles.

Funcin de cuanta. Representacin grfica. En vista de lo dicho, la funcin de cuanta


de una variable aleatoria discreta con distribucin uniforme ser:
DISTRIBUCIN BINOMIAL

Una buena parte de los fenmenos que ocurren en la vida real pueden ser estudiados
como una variable aleatoria discreta con distribucin binomial, por lo que su estudio
puede ser de gran utilidad prctica.

La expresin formal de la funcin de cuanta de una distribucin binomial es:

DISTRIBUCIN DE POISSON

La distribucin de Poisson se puede entender como un caso particular de la


Binomial que utilizamos para determinadas distribuciones en las que el clculo de
la probabilidad es engorroso debido bien a que el nmero de pruebas es
excesivamente elevado o bien a que la probabilidad de xito es excesivamente baja; en
ambos casos la media (n*p) es muy pequea en relacin al nmero de pruebas (n).
En estos casos se puede demostrar que la distribucin binomial converge, tiende a
comportarse, como una distribucin de Poisson. Como regla prctica entenderemos que
es aplicable la distribucin de Poisson en aquellas binomiales cuya media tenga
un valor inferior a 5 y el nmero de pruebas sea superior a 30.

Algunos ejemplos de fenmenos que se ajustan a una distribucin de Poisson son los
siguientes:

- el nmero de accidentes de trfico en una ciudad durante una semana.


- el nmero de emergencias que llegan a un servicio de urgencia hospitalaria.
- el nmero de robos denunciados en un mes en la ciudad de Madrid.
- el nmero de llamadas telefnicas que llegan a la centralita de una gran empresa
en hora punta.
3.TABLA DE DISTRIBUCIN NORMAL ESTNDAR.

Esta curva "de campana" es la distribucin normal estndar.

Puedes usar la tabla de abajo para saber el rea bajo la curva desde la lnea central hasta
cualquier lnea vertical "a valor Z" hasta 3, en incrementos de 0.1

Esto te dice qu parte de la poblacin est dentro de "Z" desviaciones estndar de la


media.

En lugar de una tabla larga, hemos puesto los incrementos de 0.1 hacia abajo, y los de
0.01 de lado.

Por ejemplo, para saber el rea debajo de la curva entre 0 y 0.45, ve a la fila de 0.4, y
sigue de lado hasta 0.45, all pone 0.1736

Como la curva es simtrica, la tabla vale para ir en las dos direcciones, as que 0.45
negativo tambin tiene un rea de 0.1736.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
4.MANEJO DE TABLAS ESTADSTICAS - DISTRIBUCIN NORMAL.

Para calcular la probabilidad de una variable aleatoria z, que sigue una distribucin
tpica (media=0; desviacin tpica=1) se dispone de una tabla, en la que para cada valor
de z se da la probabilidad del intervalo z - +. Para ahorrar espacio, solamente se
presentan los valores de z desde 0 hasta 3 (por encima de ese valor, la probabilidad es
prcticamente nula). Para calcular otras probabilidades se recurre a la simetra de la
curva normal, y que el rea bajo la curva entre - y + es igual a 1. a) P(z 0,86) El
rea que corresponde a esta probabilidad se obtiene directamente en la tabla. En la
primera columna a la izquierda se localiza el valor 0,8 y en la primera fila el valor 0,06.
En la interseccin de la fila y de la columna se encuentra el valor buscado. En este caso:
P(z 0,86) = 0.1977.

En la figura, el rea sombreada representa la probabilidad asociada a z 0,86

b) P(z < 1,04) Para calcular esta probabilidad, tendremos en cuenta que esta es la
complementaria a la que aparece en la tabla, P(z 1.04). En consecuencia: P(z < 1,04) =
1 - P(z 1.04) = 1 - 0,1515= 0.8485.
4
TEORA DE MUESTREO

1. MUESTREO

Actualmente el muestreo puede ser considerado como un instrumento organizado para


obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de
importancia de los problemas que se desean resolver, adems de ocuparse de la
adecuada presentacin de los hechos individuales registrados y de la manera en que
stos se recopilan y resumen.

2. EL MUESTREO PROBABILSTICA

Es una tcnica de muestreo en virtud de la cual las muestras son recogidas en un


proceso que brinda a todos los individuos de la poblacin las mismas oportunidades de
ser seleccionados.
En esta tcnica de muestreo, el investigador debe garantizar que cada individuo tenga
las mismas oportunidades de ser seleccionado y esto se puede lograr si el investigador
utiliza la aleatorizacin.
La ventaja de utilizar una muestra aleatoria es la ausencia de sesgos de muestreo y
sistemticos. Si la seleccin aleatoria se hace correctamente, la muestra ser
representativa de toda la poblacin.
El efecto de esto es un sesgo sistemtico ausente o mnimo que es la diferencia entre los
resultados de la muestra y los resultados de la poblacin. El sesgo de muestreo tambin
se elimina ya que los sujetos son elegidos al azar.

3. EL MUESTREO NO PROBABILSTICA

Es una tcnica de muestreo donde las muestras se recogen en un proceso que no brinda
a todos los individuos de la poblacin iguales oportunidades de ser seleccionados. En
cualquier tipo de investigacin es difcil lograr un muestreo aleatorio autntico.
La mayora de los investigadores tienen limitaciones temporales, monetarias y de mano
de obra y, gracias a ellas, es casi imposible tomar una muestra aleatoria de toda la
poblacin. Generalmente, es necesario emplear otra tcnica de muestreo, la tcnica de
muestreo no probabilstico.

A diferencia del muestreo probabilstico, la muestra no probabilstica no es un producto


de un proceso de seleccin aleatoria. Los sujetos en una muestra no probabilstica
generalmente son seleccionados en funcin de su accesibilidad o a criterio personal e
intencional del investigador.

La desventaja del mtodo de muestreo no probabilstico es que no se toman pruebas de


una porcin desconocida de la poblacin. Esto implica que la muestra puede representar
a toda la poblacin con precisin o no. Por lo tanto, los resultados de la investigacin no
pueden ser utilizados en generalizaciones respecto de toda la poblacin.

4. CUNDO UTILIZAR EL MUESTREO NO PROBABILSTICO

Este tipo de muestreo puede ser utilizado cuando se quiere mostrar que existe un rasgo
determinado en la poblacin. Tambin se puede utilizar cuando el investigador tiene
como objetivo hacer un estudio cualitativo, piloto o exploratorio. Se puede utilizar
cuando es imposible la aleatorizacin, como cuando la poblacin es casi ilimitada. Se
puede utilizar cuando la investigacin no tiene como objetivo generar resultados que se
utilicen para hacer generalizaciones respecto de toda la poblacin.

Tambin es til cuando el investigador tiene un presupuesto, tiempo y mano de obra


limitados.

Esta tcnica tambin se puede utilizar en un estudio inicial que ser llevado a cabo
nuevamente utilizando un muestreo probabilstico aleatorio.
MUESTREO PROBABILSTICA

Cuantitativo
Todos los casos tienen la misma probabilidad de ser
seleccionados
Es ciego a la hora de seleccionar los casos
No requiere un conocimiento de la poblacin a estudiar
Persigue la inferencia estadstica
Requiere una muestra con mayor nmero de casos

MUESTREO NO PROBABILSTICA

Cualitativo
Todos los casos no tienen la misma probabilidad de ser
seleccionados
El investigador elige los casos que ms le interesan (ms ricos
en informacin)
Requiere un conocimiento ms levado de la poblacin
Persigue la inferencia lgica
Requiere una muestra con menos casos

5. MUESTREO ESTADSTICO

En estadstica un muestreo es la tcnica para la seleccin de una muestra a partir de una


poblacin. En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de
la poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al conjunto
de muestras que se pueden obtener de la poblacin se denomina espacio muestral. La
variable que asocia a cada muestra su probabilidad de extraccin

Muestreo Estadstico: son aquellos que se basan en el principio de equiprobabilidad. Es


decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamao n tienen la misma probabilidad de ser elegidas
El muestreo: es una herramienta de la investigacin cientfica. Su funcin bsica es
determinar que parte de una realidad en estudio (poblacin o universo) debe examinarse
con la finalidad de hacer inferencias sobre dicha poblacin.

El Muestreo es ms que el procedimiento empleado para obtener una o ms muestras de


una poblacin; el muestreo es una tcnica que sirve para obtener una o ms muestras de
poblacin.
Este se realiza una vez que se ha establecido un marco muestral representativo de la
poblacin, se procede a la seleccin de los elementos de la muestra aunque hay muchos
diseos de la muestra.
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada
muestra no necesariamente seran iguales, y lo ms probable es que variaran de una
muestra a otra.

6. VENTAJAS DEL METODO DE MUESTREO

Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son
mencionadas a continuacin:

COSTO REDUCIDO

Si los datos obtenidos provienen de una pequea fraccin de la poblacin, los gastos
asociados a su recopilacin sern mucho menores que si se intenta realizar un censo.
Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de
muestras que solamente representan una pequea fraccin de la poblacin.

MAYOR RAPIDEZ

.Como consecuencia de lo anterior los datos pueden recolectarse y resumirse


rpidamente con una muestra, siendo esto de vital importancia cuando se requiere la
informacin con urgencia mayor alcance

Para la realizacin de algunos tipos de encuestas se cuenta con personal y recursos


limitados. Lo anterior conlleva a que la realizacin de un censo sea algo imprctico, y
por tanto se tiene mayor flexibilidad respecto a la informacin que se puede llegar a
obtener.
MAYOR EXACTITUD

Dado que se reduce el volumen de trabajo en gran medida, se puede utilizar personal
ms capacitado y someterlo a entrenamiento intensivo, con el fin de tener una
supervisin cuidadosa del trabajo decampo y procesamiento de los resultados.

En el diseo de una muestra hay que considerar dos aspectos; inicialmente un proceso
de seleccin, en la que se incluyen en la muestra algunos elementos de la poblacin; y
posteriormente un proceso de estimacin, en el que se llevan a cabos los clculos de las
estadsticas de la muestra, que son estimadores mustrales de valores de la poblacin.

Una de las desventajas al utilizar el muestreo, es que dentro de los valores mustrales
que se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de
una designacin de solo una fraccin de la poblacin total a ser observada en la muestra,
sin embargo, al realizar un buen diseo de muestra, se tiene como consecuencia que
estos errores tengan la menor presencia posible.

Dentro del muestreo se pueden distinguir varias formas:

Muestras casuales o fortuitas, en las cuales se sacan conclusiones solamente de


elementos que llegan por casualidad.

Seleccin experta, que se considera como un tipo de muestro no aleatorio, ya


que personas consideradas como expertas se encargan de escoger unidades que
consideran tpicas o representativas.

Muestreo de cuota que es aquel en el que de acuerdo a algunas variables


demogrficas, se construye una muestra relativamente proporcional a la
poblacin.

Muestreo de poblaciones mviles. En el que la poblacin total es estimada de la


proporcin de individuos en la recaptura, que han sido capturados de manera
previa y fueron marcados.
7. EL MUESTREO EN LA INVESTIGACION DE LA ADMINISTRACION

El muestreo estadstico es la herramienta que la Matemtica utiliza para el estudio de las


caractersticas de una poblacin a travs de una determinada parte de la misma. La muestra de
estudio debe ser lo ms pequea posible ya que del hecho de que una muestra sea ms grande,
no se desprende necesariamente que la informacin sea ms fiable. Adems, la muestra elegida
debe serlo por un proceso aleatorio para que sea lo ms representativa posible. Es un proceso de
seleccin o escogencia de una parte de la poblacin para propsitos investigativos y/o
recoleccin de informacin. El muestro se hace necesario por motivos de economa de recursos
y tiempo, as como factibilidad. Por ello, el objetivo del investigador es hacer inferencia en
relacin con la poblacin total, con base en los resultados obtenidos de la muestra

Es un procedimiento por el que se infieren los valores verdaderos de una poblacin, a travs de
la experiencia obtenida con una muestra de esta. El uso de muestras para estimar valores de una
poblacin ofrece diversas ventajas. En trminos generales se puede afirmar que el muestreo
permite una reduccin considerable de los costos materiales del estudio, una mayor rapidez en
la obtencin de la informacin y el logro de resultados con mxima calidad.

La estadstica matemtica y en particular los mtodos de muestreo, han jugado un papel


de gran importancia y utilidad en el desarrollo de las empresas, precisamente por su
carcter de rapidez y economa. Cmo se seleccion la muestra, cmo se realiz la
inferencia (extrapolacin de las conclusiones obtenidas sobre la muestra, al resto de la
poblacin), y qu grado de confianza se tuvo en ello, fueron los principales problemas
que se enfrentaron.

Hoy las tcnicas de muestreo asistidas por computadoras, son herramientas bsicas,
pues la rpida toma de decisiones que hay que ejecutar en la dinmica de los procesos
econmicos, demanda el uso de nuevas tecnologas que le impriman una rapidez,
confiabilidad, disponibilidad y capacidad, entre otras facilidades, que se han ido
buscando a travs de los recursos informticos. El muestreo es por lo tanto una
herramienta de la investigacin cientfica, cuya funcin bsica es determinar que parte
de una poblacin debe examinarse, con el fin de hacer deducciones sobre dicha
poblacin.
8. RAZON DE LA UTILIZACION DE LOS METODOS DE MUESTREO

La teora del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la
distribucin de una representacin en dicha poblacin y las distribuciones de dicho
representacin en todas sus muestras.

Hay veces en que no es posible o favorable efectuar un censo (analizar a todos los
elementos de una poblacin), se toma una muestra, deduciendo que dicha muestra es
una parte representativa de la poblacin.

La muestra debe obtener una representacin apropiada de la poblacin, en la que se


represente de la mejor manera los rasgos principales de dicha poblacin que son
importantes para la investigacin. Para que una muestra sea representativa, y por lo
tanto til, debe de reflejar las semejanzas y diferencias encontradas en la poblacin, es
decir ilustrar las caractersticas de sta.

Existen: el muestreo emprico y el probabilista. El primero, suele usarse cuando se


tiene un amplio conocimiento del fenmeno que se investigar y cuando existen
estudios previos al respecto; tal que el estadstico tiene antecedentes y el costo para la
investigacin es reducido. Este tipo de muestreo se recomienda cuando no se desea un
anlisis profundo y preciso sobre las caractersticas del universo que se estudia. Este
mtodo resulta en ocasiones bueno, ya que capta con relativa facilidad las caractersticas
de la poblacin en estudio. Como podr notarse, no es del todo cientfico y no permite
por s mismo llegar a estimaciones precisas, resultando difcil realizar inferencias en la
estimacin. El mtodo cientfico -por lo contrario- proporciona una medida de la
magnitud del error y de la confianza con que se puede tomar los resultados.
Generalmente suele ser ms costoso y quizs tome un poco ms de tiempo el realizarlo,
en especial cuando hay problema de informacin sobre el nmero de unidades que
integran el universo y algunas otras caractersticas que permiten el clculo rpido del
tamao de la muestra, teniendo adems que gastarse cierto nmero de horas-hombre
en la recavacin de la informacin requerida. Es recomendable, sin embargo, usar
siempre el mtodo cientfico para dotar a los estudios de seguridad matemtica, aun
cuando se tengan que hacer esfuerzos extraordinarios para conseguir los recursos
monetarios necesarios. En otras palabras, estos trminos no son otra cosa ms que
sinnimos de una seleccin aleatoria y una seleccin arbitraria respectivamente.
9. TIPOS DE MUESTRAS

Existen 2 clases bsicas de muestras: la muestra probabilstica y la muestra no


probabilstica, la eleccin entre una y otra se determina con base en los objetivos del
estudio, el esquema de la investigacin y el alcance de sus contribuciones

TIPOS DE MUESTREO

9.1 MUESTREO PROBABILSTICO.

Cada elemento del universo tiene una probabilidad conocida y no nula de figurar en la
muestra, es decir, todos los elementos del universo pueden formar parte de la muestra.
Los mtodos de muestreo probabilstico son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los elementos del universo tienen
la misma probabilidad de ser elegidos para formar parte de la muestra.

Tipos de mtodos de muestreo probabilstico:


Muestreo aleatorio simple.
Muestreo aleatorio sistemtico
Tabla de nmeros aleatorios
Muestreo aleatorio estratificado
Muestreo aleatorio por conglomerados
9.1.1. MUESTREO ALEATORIO SIMPLE.

La seleccin de la muestra se realiza en una sola etapa, directamente y sin


reemplazamientos.

Se aplica fundamentalmente en investigaciones sobre poblaciones pequeas y


plenamente identificables, por ejemplo cuando disponemos de la lista completa de todos
los elementos del universo.

Para explicarlo en un lenguaje sencillo, consiste en rifar sortear entre todos los
elementos del universo los que pertenecern a la muestra.

Los pasos para obtener una muestra aleatoria simple son:

Definir la poblacin de estudio.


Enumerar a todas las unidades de anlisis que integran la poblacin,
asignndoles un nmero de identidad o identificacin.
Determinar el tamao de muestra ptimo para el estudio.
Seleccionar la muestra de manera sistemtica utilizando una tabla de nmeros
aleatorios generada por medios computacionales para garantizar que se tiene un
orden aleatorio.

Por ejemplo, para obtener una muestra de alumnos del Instituto Tecnolgico de Nuevo
Casas Grandes a los que se les aplicar una encuesta. Lo primero que se hace es
enumerar a todo el alumnado de la institucin. Se obtiene una lista de los alumnos
matriculados y se le asigna un nmero a cada uno de ellos en orden alfabtico y
ascendente. Suponiendo que el total de alumnos es de 700 se utilizan los nmeros 000,
001, 002, 003,...,699. Se determina el tamao de muestra, suponiendo que en este caso
es de tamao 75. Enseguida se utiliza la tabla de nmeros aleatorios formando nmeros
de tres dgitos aceptando como unidad de anlisis muestral a todos aquellos que estn
comprendidos entre el 000 y el 699.
9.1.2 MUESTREO ALEATORIO SISTEMTICO.

Es una variante del Aleatorio Simple, se diferencia en la forma de seleccionar los


elementos de la muestra.
Una vez determinado el tamao de la muestra se calcula el coeficiente de elevacin, que
es el cociente, la divisin, entre el tamao del universo y el tamao de la muestra.

Se elige un nmero al azar que sea como mximo el coeficiente de elevacin, es decir
un nmero entre 1 y K. A este nmero lo llamaremos a.

En el listado de todos los elementos del universo se selecciona el elemento a, el


elemento a + K, el a + 2K, el a + 3K, as hasta completar la muestra.

Obviamente para utilizar este mtodo necesitamos disponer de la lista de todos los
elementos del universo y por supuesto debe ser un universo no muy grande.

Este proceso permite simplificar considerablemente el proceso de seleccin, pero existe


el riesgo de introducir sesgos en la muestra al elegir los elementos de forma peridica.
Estos riesgos se producen cuando el listado del universo est ordenado en funcin de
determinados criterios que pueden inducir a que la seleccin sistemtica recaiga en
elementos que no sean representativos del universo.

Ejemplo:
Vamos a realizar un estudio sobre el nivel de satisfaccin de las y los clientes de una
empresa.

Si el personal de la empresa, por ejemplo de una tienda, atiende en orden a las y los
clientes, es decir, que el personal se turna para atender a cada cliente, nos puede
provocar conflictos si utilizamos el muestreo aleatorio sistemtico.
Imaginen que el coeficiente de elevacin es siete, y en la tienda hay siete vendedores y
vendedoras, la muestra correspondera solamente a los y las clientes atendidos por el
vendedor nmero siete. Esto producira que el estudio sera sobre la calidad de atencin
de un determinado vendedor o vendedora y no sobre la totalidad.

Para utilizar este tipo de muestreo y evitar estos riesgos se puede desordenar el listado
de los elementos del universo antes de realizar la seleccin.

Ventajas y Desventajas
El muestreo sistematizado se utiliza con frecuencia porque, si se sigue de modo
correcto, es una forma relativamente fcil de tomar una muestra, a la vez que sea segura
la aleatoriedad. La disponibilidad de listas y el corto tiempo hacen de este un mtodo
atractivo y econmico. La mayor debilidad del muestreo aleatorio sistematizado es el
potencial de que haya patrones ocultos en los datos que no sean detectados por el
investigador. No obstante la pequea perdida potencial en la representatividad
contrarresta con los ahorros econmicos significativamente mayores en tiempo,
esfuerzo y costo. Otra dificultad es que el investigador tiene que conocer exactamente
cuntas unidades es mustrales integran la poblacin meta definida.

9.1.3 TABLA DE NMEROS ALEATORIOS.

Las Tablas de Nmeros Aleatorios contienen los dgitos 0, 1, 2,..., 7, 8, 9. Tales dgitos
se pueden leer individualmente o en grupos y en cualquier orden, en columnas hacia
abajo, columnas hacia arriba, en fila, diagonalmente, etc., y es posible considerarlos
como aleatorios. Las tablas se caracterizan por dos cosas que las hacen particularmente
tiles para el muestreo al azar. Una caracterstica es que los dgitos estn ordenados de
tal manera que la probabilidad de que aparezca cualquiera en un punto dado de una
secuencia es igual a la probabilidad de que ocurra cualquier otro. La otra es que las
combinaciones de dgitos tienen la misma probabilidad de ocurrir que las otras
combinaciones de un nmero igual de dgitos. Estas dos condiciones satisfacen los
requisitos necesarios para el muestreo aleatorio, establecidos anteriormente. La primera
condicin significa que en una secuencia de nmeros, la probabilidad de que aparezca
cualquier dgito en cualquier punto de la secuencia es 1/10. La segunda condicin
significa que todas las combinaciones de dos dgitos son igualmente probables, del
mismo modo que todas las combinaciones de tres dgitos, y as sucesivamente.

Existen mtodos ms eficaces para generar nmeros aleatorios, en muchos de los cuales
se utilizan calculadoras u otra clase de aparatos electrnicos. Las tablas elaboradas
mediante estos mtodos son verificadas completamente para asegurarse de que en
realidad sean aleatorias. Sin embargo, el inters no radica en elaborar estas tablas, sino
utilizarlas. Para utilizar una Tabla de Nmeros Aleatorios:1- Hacer una lista de los
elementos de la poblacin.2- Numerar consecutivamente los elementos de la lista,
empezando con el cero (0,00, 000, etc.).3- Tomar los nmeros de una Tabla de Nmeros
Aleatorios, de manera que la cantidad de dgitos de cada uno sea igual a la del ltimo
elemento numerado de su lista. De ese modo, si el ltimo nmero fue 18, 56 72, se
deber tomar un dgito de dos nmeros.

Omitir cualquier dgito que no corresponda con los nmeros de la lista o que repita
cifras seleccionadas anteriormente de la tabla. Continuar hasta obtener el nmero de
observaciones deseado. Utilizar dichos nmeros aleatorios para identificar los elementos
de la lista que se habrn de incluir en la muestra.

Un ejemplo de una tabla de nmeros aleatorios consiste en la lista de los nmeros de


Lotera Nacional premiados a lo largo de su historia, pues se caracterizan por que cada
dgito tiene la misma probabilidad de ser elegido, y su eleccin es independiente de las
dems extracciones. Un modo de hacerlo es el siguiente: Supongamos que tenemos una
lista de nmeros aleatorios de k= 5 cifras (00000-99.999), una poblacin de N= 600
individuos, y deseamos extraer una muestra den= 6 de ellos. En este caso ordenamos a
toda la poblacin (usando cualquier criterio) de modo que a cada uno de sus elementos
le corresponda un nmero del1 al 600. En segundo lugar nos dirigimos a la tabla de
nmeros aleatorios, y comenzando en cualquier punto extraemos un nmero t, y
tomamos como primer elemento de la muestra al elemento de la poblacin:

1+ { t . N } = 1+ { t . 600}
10K 100.000
El proceso se repite tomando los siguientes nmeros de la tabla de nmeros aleatorios,
hasta obtener la muestra de 10 individuos
.U = t
10k
Las cantidades pueden ser consideradas como observaciones de una v. a. U, que sigue
una distribucin uniforme en el intervalo [0,1]
UU (0,1)

9.1.4 MUESTREO ALEATORIO ESTRATIFICADO

Se basa en dividir los elementos del universo en grupos, donde cada elemento del
universo pertenece a un solo grupo, y el conjunto de los grupos forman la totalidad del
universo. A cada grupo lo llamamos estrato.
Ventajas:
permite tratar de forma independiente los elementos de cada uno de los estratos.
puede realizar diferentes mtodos de muestreo y/o estimacin en determinados
estratos, lo que permite reducir la varianza (desviacin estndar) y por tanto
disminuir el tamao de la muestra.
permite aumentar la precisin de los resultados.
facilita la coordinacin y realizacin de los trabajos de campo.

Objetivo: conseguir en cada estrato elementos homogneos entre si y heterogneos en


relacin con los elementos de los otros estratos.
Homogneos entre s, que todos los elementos de un estrato tienen caractersticas y
comportamientos similares en relacin a la variable que estudiamos.
Heterogneos con los otros, que tienen caractersticas y comportamientos diferentes en
relacin a la variable que estudiamos.

Proceso de estratificacin:
1. Definir las caractersticas (variables) que utilizaremos para definir los estratos.
Las caractersticas han de estar relacionadas con la variable a estudiar.
2. Determinar el nmero de estratos.
El nmero de estratos no puede ser muy grande porque estratos con pocos elementos
dificultan y encarecen el proceso, pero tampoco puede ser muy pequeo porque nos
aportara muy pocas ventajas.
3. Determinar el tamao de la muestra.
4. Seleccionar la muestra en cada estrato.
Se puede utilizar el muestreo aleatorio simple o el sistemtico en cada estrato.

Resulta difcil estratificar variables muy correlacionadas, es decir, cuando no existen


diferencias entre las caractersticas y comportamiento de los elementos.
En general y como criterio ms viable se suele recurrir a variables especiales como
pases, regiones, departamentos, sucursales.

EJEMPLO
Supongamos que estamos interesados en estudiar el grado de aceptacin que la
implantacin de la reforma educativa ha tenido entre los padres de una determinada
provincia. A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los
datos del ministerio que de los 10000 nios escolarizados en las edades que nos
interesan, 6000 acuden a colegios pblicos, 3000 a colegios privados concertados y
1000 a colegios privados no concertados. Como estamos interesados en que en nuestra
muestra estn representados todos los tipos de colegio, realizamos un muestreo
estratificado empleando como variable de estratificacin el tipo de centro.

Si empleamos una afijacin simple elegiramos 200 nios de cada tipo de centro, pero
en este caso parece ms razonable utilizar una afijacin proporcional pues hay bastante
diferencia en el tamao delos estratos. Por consiguiente, calculamos que proporcin
supone cada uno de los estratos respecto de la poblacin para poder reflejarlo en la
muestra.

Colegios pblicos: 6000/10000=0.60


Colegios privados concertados: 3000/10000=0.30
Colegios privados no concertados: 1000/10000=0.10
Para conocer el tamao de cada estrato en la muestra no tenemos ms que multiplicar
esa proporcin por el tamao muestral.
Colegios pblicos: 0.60x600=360 sujetos
Colegios privados concertados: 0.30x600=180 sujetos
Colegios privados no concertados: 0.10x600= 60 sujetos
9.1.5 MUESTREO ALEATORIO POR CONGLOMERADOS O CLUSTERS

En este tipo de muestreos la unidad muestral no son los elementos del universo, sino un
conjunto de elementos que bajo determinados aspectos se puede considerar que forman
una unidad. Por ejemplo las diferentes carreras en la universidad o las juntas receptoras
de votos en un proceso electoral forman conglomerados naturales.
Definidas las unidades mustrales, los conglomerados, se realiza la seleccin de la
muestra. La muestra ser un nmero determinado de conglomerados. Se entrevista a
todos y cada uno de los elementos del conglomerado si son pocos. Si el nmero de
elementos de cada conglomerado es muy grande se realiza un sub-muestreo en cada uno
de los conglomerados, pudiendo utilizar cualquiera de los mtodos de muestreo
anteriormente mencionados.
Las diferencias entre los conglomerados y los estratos son:
Los elementos de los estratos son homogneos (similares) entre si, mientras
que los elementos de los conglomerados son heterogneos (diferentes) entre
s.
Los estratos son heterogneos (diferentes) entre s, mientras que los
conglomerados son homogneos (similares) entre s.

9.2 MUESTREO NO PROBABILSTICO

No todos los elementos de la muestra NO tienen la misma probabilidad, y por tanto no


se tiene la certeza que la muestra extrada sea representativa. En general se seleccionan
los elementos siguiendo determinados criterios procurando que la muestra sea
representativa al mximo.

Teniendo claro que no sirven para realizar generalizaciones, en ocasiones son tiles para
estudios exploratorios o cuando los estudios probabilsticos resultan excesivamente
costosos.
Tipos de muestreo NO probabilstico:
Muestreo causal o accidental
Muestreo opintico o intencional
Muestreo por cuotas
Muestreo por bola de nieve.
9.2.1 MUESTREO CAUSAL O ACCIDENTAL

Se trata de un proceso en el que el investigador o investigadora selecciona directa o


intencionalmente los elementos del universo que formaran parte de la muestra. El caso
ms frecuente de este procedimiento es el utilizar como muestra los elementos a los que
se tiene fcil acceso, un caso particular es el de las y los voluntarios a participar en una
investigacin.

Ejemplos cercanos:
Cuando un profesor o profesora pregunta a un par de estudiantes, los que tiene
ms cerca por ejemplo.
Cuando un programa de televisin o radio realiza un sondeo mediante las
llamadas telefnicas al programa.
Cuando un programa de televisin saca un equipo a la calle y le pregunta a unas
cuantas personas.

9.2.2 MUESTREO INTENCIONAL O DE JUICIO.

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras


representativas mediante la inclusin en la muestra de grupos supuestamente tpicos.
Es muy frecuente su uso en sondeo preelectorales de zonas que en anteriores votaciones
han marcado tendencias de voto, es decir, el resultado de las elecciones en esa zona fue
el mismo que el resultado global.

9.2.3 MUESTREO POR CUOTAS.

Se basa en un buen conocimiento de los estratos de la poblacin y/o de los elementos


ms representativos o adecuados para los fines de la investigacin. Mantiene
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de
aleatoriedad del mtodo probabilstico.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de


individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25
a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se
eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo se
utiliza mucho en las encuestas de opinin.

Por ejemplo, la Consejera de Sanidad desea estudiar la incidencia de las drogas en la


adolescencia. Lo que deberamos hacer sera: conocer por los informes de la Consejera
de Educacin cuales son los centros ms afectados por el problema, fijar un nmero de
sujetos a entrevistar proporcional a cada uno de los estratos (cuotas) y finalmente dejar
en manos de los responsables del trabajo de campo a que sujetos concretos se deber
entrevistar.

9.2.4 MUESTREO POR BOLA DE NIEVE

Se localiza a algunos elementos del universo, los cuales conducen a otros, y estos a
otros, y as hasta conseguir una muestra suficiente, llegando incluso a completar el
censo del universo.
Aunque pueda parecer que no tiene utilidad, se utiliza frecuentemente cuando con
conocemos la poblacin, por ejemplo con poblaciones como delincuentes, sectas,
determinados tipos de enfermedades,

10. AFIJACIN DE LA MUESTRA

La distribucin de la muestra en funcin de los diferentes estratos se denomina


afijacin, y puede ser de diferentes tipos.

Afijacin Simple. A cada estrato le corresponde igual nmero de elementos de la


muestra.
Afijacin Proporcional. La distribucin se hace de acuerdo con el peso de la poblacin
en cada estrato, la cantidad de elementos del universo que tiene cada estrato.
Afijacin ptima. Se tiene en cuenta la previsible dispersin de los resultados, de
modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya
que no se suele conocer la desviacin estndar previamente en cada estrato. Aunque
cuando se puede utilizar reduce costos y mejora la precisin de los resultados.
11. NIVEL DE DESAGREGACIN

En ocasiones, adems de obtener resultados, estimaciones, para todo el universo


pretendemos obtener estimaciones para diferentes subgrupos en los que se puede
subdividir el universo objeto del estudio.

Ejemplo:
Al realizar un estudio sobre el nivel de satisfaccin de las y los clientes de una empresa,
podemos pretender determinar el nivel de satisfaccin de cada uno de los
departamentos, por ejemplo a nivel general y tambin la satisfaccin con vendedores,
con caja, con servicio tcnico,

Para resolver estas situaciones se suele recurrir a dos tcnicas:


Aumentamos el tamao de la muestra total hasta conseguir que el nmero de
elementos de la poblacin de cada subgrupo sea suficiente.

Realizar una afijacin no proporcional, tratando cada subgrupo como si fuera


una divisin diferente.

Ejemplo:
Realizar un estudio a nivel nacional pero en el que pretendemos dar resultados de cada
una de las regiones del pas, requiere que cada regin se trabaje como un universo
diferente.

Como la precisin del estimador, de la variable que queremos estimar, est ntimamente
relacionada con el tamao de la muestra y no con la fraccin del muestreo, esto hace
que en ciertos casos pueda necesitarse una muestra prcticamente del mismo tamao
para obtener datos de una regin o departamento y la totalidad del pas.

Hemos de tener en cuenta estas tcnicas en el ejemplo del estudio del nivel de
satisfaccin en el caso que las y los clientes no reciban los servicios de todas y cada una
de las reas que queremos analizar. Por ejemplo si el servicio tcnico atiende a una
minora de las y los clientes, ser necesario realizar una afijacin no proporcional entre
las y los clientes de esta rea o incrementar la muestra hasta que tengamos suficientes
clientes de esta rea.
12. ERRORES EN EL MUESTREO

Cuando se utilizan valores muestrales, o estadsticos para estimar valores poblacionales,


o parmetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error
no muestral.

El error muestral se refiere a la variacin natural existente entre muestras tomadas de la


misma poblacin.

Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran


cuidado para asegurar que dos muestras del mismo tamao sean representativas de una
cierta poblacin, no esperaramos que las dos sean idnticas en todos sus detalles. El
error muestral es un concepto importante que ayudar a entender mejor la naturaleza de
la estadstica inferencial.

12.1 ERRORES MUESTRALES

En estadstica, error muestral o error de estimacin es el error que surge a causa de


observar una muestra de la poblacin completa.

La estimacin de un valor de inters, como la media o el porcentaje, estar


generalmente sujeta a una variacin entre una muestra y otra. Estas variaciones en las
posibles muestras de una estadstica pueden, tericamente, ser expresadas como errores
muestrales, sin embargo, normalmente, en la prctica el error exacto es desconocido. El
error muestral se refiere en trminos ms generales al fenmeno de la variacin entre
muestras. Cuando este no es mencionado se considera que el margen de error base es el
0.02% (0.2 para muestreo paralelo y 2 para muestreo directo).

El error muestral deseado, generalmente puede ser controlado tomando una muestra
aleatoria de la poblacin, suficientemente grande, sin embargo, el costo de esto puede
ser limitante. Si las observaciones son tomadas de una muestra aleatoria, la teora
estadstica brinda clculos probabilsticos del tamao deseado del error muestral para
una estadstica en particular o estimacin. Estos usualmente son expresados en trminos
del error estndar.

El error muestral puede ser contrastado con el error no muestral, el cual se refiere al
conjunto de las desviaciones del valor real que no van en funcin de la muestra
escogida, entre los cuales se encuentran varios errores sistemticos y algunos errores
aleatorios. Resultan mucho ms difciles de cuantificar que el error muestral.

Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por
ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una
poblacin con media = 15: si la media de la muestra es x=12, entonces a la
diferencia observada x- = -3 se le denomina el error muestral. Una media muestral x
puede pensarse como la suma de dos cantidades, la media poblacional y el error
muestral; si denota el error muestral, entonces:

12.2 ERRORES NO MUESTRALES

Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.

El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a


una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones de un
parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo)
que el parmetro real.

El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin.

La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la


poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida con
procedimientos aleatorios se llama muestra aleatoria.

Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio


simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemtico.

Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
Ejemplo:

Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadstica de 20 alumnos. 20C5 da el nmero total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos
las 15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y despus los revolvemos, entonces podremos tener una muestra aleatoria de
5 si seleccionamos un trozo de papel con cinco nombres. Un procedimiento ms simple
para elegir una muestra aleatoria sera escribir cada uno de los 20 nombres en pedazos
separados de papel, colocarlos en un recipiente, revolverlos y despus extraer cinco
papeles al mismo tiempo.

Otro mtodo para obtener una muestra aleatoria de 5 estudiantes en un grupo de 20


utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una
calculadora o una computadora. Tambin se puede prescindir de estas y hacer la tabla
escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y los
revolvemos, de ah, la primera tira seleccionada determina el primer nmero de la tabla,
se regresa al recipiente y despus de revolver otra vez se selecciona la seguida tira que
determina el segundo nmero de la tabla; el proceso contina hasta obtener una tabla de
dgitos aleatorios con tantos nmeros como se desee.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para las
encuestas nacionales de opinin sobre productos o sobre elecciones presidenciales, sera
muy costoso o tardado.

13. TAMAO DE LA MUESTRA

El tamao de la muestra de una muestra estadstica es el nmero de observaciones que


la componen.

El tamao de la muestra normalmente es representado por "n" y siempre es un nmero


entero positivo. No se puede hablar de ningn tamao exacto de la muestra, ya que
puede variar dependiendo de los diferentes marcos de investigacin. Sin embargo, si
todo lo dems es igual, una muestra de tamao grande brinda mayor precisin en las
estimaciones de las diversas propiedades de la poblacin.

Determinar el tamao de la muestra que se va a seleccionar es un paso importante en


cualquier estudio de investigacin, por lo tanto, se debe justificar convenientemente de
acuerdo al planteamiento del problema, la poblacin, los objetivos y el propsito de la
investigacin.

Dados dos estudios exactamente iguales, dos mtodos de muestreo iguales y la misma
poblacin, el estudio con un tamao de muestra ms grande tendr menos error del
proceso de muestreo que el estudio con un tamao menor de la muestra. Debes recordar
que a medida que aumenta el tamao de la muestra, se acerca al tamao de toda la
poblacin y, por lo tanto, se aproxima a todas las caractersticas de la poblacin,
disminuyendo el error del proceso de muestreo.

En estadstica el tamao de la muestra es el nmero de sujetos que componen la muestra


extrada de una poblacin, necesarios para que los datos obtenidos sean representativos
de la poblacin.

Objetivos de la determinacin del tamao adecuado de una muestra.

1. Estimar un parmetro determinado con el nivel de confianza deseado.


2. Detectar una determinada diferencia, si realmente existe, entre los grupos de
estudio con un mnimo de garanta.
3. Reducir costes o aumentar la rapidez del estudio.

FACTORES DE LOS QUE DEPENDE EL TAMAO MUESTRAL


El tamao muestral depender de decisiones estadsticas y no estadsticas, pueden
incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que
estar en campo.

Antes de calcular el tamao de la muestra necesitamos determinar varias cosas:

1. Tamao de la poblacin. Una poblacin es una coleccin bien definida de


objetos o individuos que tienen caractersticas similares. Hablamos de dos tipos:
poblacin objetivo, que suele tiene diversas caractersticas y tambin es conocida como
la poblacin terica. La poblacin accesible es la poblacin sobre la que los
investigadores aplicaran sus conclusiones.
2. Margen de error (intervalo de confianza). El margen de error es una estadstica
que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta,
es decir, es la medida estadstica del nmero de veces de cada 100 que se espera que los
resultados se encuentren dentro de un rango especfico.
3. Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor
con una determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95%
significa que los resultados de una accin probablemente cubrirn las expectativas el
95% de las veces.
4. La desviacin estndar. Es un ndice numrico de la dispersin de un conjunto
de datos (o poblacin). Mientras mayor es la desviacin estndar, mayor es la dispersin
de la poblacin.

Cul debe ser el tamao de la muestra?


Determinar el tamao de la muestra que se va a seleccionar es un paso importante en
cualquier estudio de investigacin. Por ejemplo, un investigador desea determinar la
prevalencia de problemas oculares en nios en edad escolar y quiere realizar una
encuesta.

La pregunta importante que debe ser contestada en todas las encuestas de muestra es:
"Cuntos participantes deben ser elegidos para una encuesta?" Sin embargo, la
respuesta no puede ser dada sin tener en cuenta los objetivos y circunstancias de las
investigaciones.
La eleccin del tamao de la muestra depende de consideraciones no estadsticas y
estadsticas. Las consideraciones no estadsticas pueden incluir la disponibilidad de los
recursos, la mano de obra, el presupuesto, la tica y el marco de muestreo. Las
consideraciones estadsticas incluirn la precisin deseada de la estimacin de la
prevalencia y la prevalencia esperada de los problemas oculares en nios en edad
escolar.

Para determinar el tamao adecuado de las muestras es necesario seguir los tres
criterios:

1. Nivel de precisin
El nivel de precisin, tambin llamado error de muestreo, es el rango en donde se estima
que est el valor real de la poblacin. Este rango se expresa en puntos porcentuales. Por
lo tanto, si un investigador descubre que el 70% de los agricultores de la muestra han
adoptado una tecnologa recomendada con una tasa de precisin de ~+mn~ 5%, el
investigador puede concluir que entre el 65% y el 75% de los agricultores de la
poblacin han adoptado la nueva tecnologa.

2. Nivel de confianza
El intervalo de confianza es la medida estadstica del nmero de veces de cada 100 que
se espera que los resultados se encuentren dentro de un rango especfico.
Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una
accin probablemente cubrirn las expectativas el 90% de las veces.
La idea bsica descripta en el Teorema del lmite central es que cuando una poblacin
se muestrea muchas veces, el valor promedio de un atributo obtenido es igual al valor
real de la poblacin. En otras palabras, si un intervalo de confianza es del 95%, significa
que 95 de 100 muestras tendrn el valor real de la poblacin dentro del rango de
precisin.

3. Grado de variabilidad
Dependiendo de la poblacin objetivo y los atributos a considerar, el grado de
variabilidad vara considerablemente. Cuanto ms heterognea sea una poblacin,
mayor deber ser el tamao de la muestra para obtener un nivel ptimo de precisin.
Ten en cuenta que una proporcin de 55% indica un nivel ms alto de variabilidad que
un 10% o un 80%. Esto se debe a que 10% y 80% significa que una gran mayora no
posee o posee el atributo en cuestin.

Existen muchos enfoques para determinar el tamao de la muestra, incluyendo el uso de


un censo en el caso de poblaciones ms pequeas, el uso de tablas publicadas, imitar un
tamao de muestra de estudios similares y aplicar frmulas para calcular un tamao de
la muestra.

FRMULA PARA CALCULAR EL TAMAO DE LA MUESTRA


CONOCIENDO EL TAMAO DE LA POBLACIN:

Para calcular el tamao de la muestra suele utilizarse la siguiente frmula:

Donde:
n = tamao de la muestra.
N = tamao de la poblacin.
Desviacin estndar de la poblacin que, generalmente cuando no se tiene su valor,
suele utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se
tiene su valor, se lo toma en relacin al 95% de confianza equivale a 1,96 (como ms
usual) o en relacin al 99% de confianza equivale 2,58, valor que queda a criterio del
investigador.
e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor,
suele utilizarse un valor que vara entre el 1% (0,01) y 9% (0,09), valor que queda a
criterio del encuestador.
La frmula del tamao de la muestra se obtiene de la frmula para calcular la
estimacin del intervalo de confianza para la media, la cual es:
De donde el error es:

De esta frmula del error de la estimacin del intervalo de confianza para la media se
despeja la n, para lo cual se sigue el siguiente proceso:
Elevando al cuadrado a ambos miembros de la frmula se obtiene:

Multiplicando fracciones:

Eliminando denominadores:

Eliminando parntesis:

Transponiendo n a la izquierda:

Factor comn de n:
Despejando n:

Ordenando se obtiene la frmula para calcular el tamao de la muestra:

EJEMPLOS ILUSTRATIVOS

1) Calcular el tamao de la muestra de una poblacin de 500 elementos con un nivel de


confianza del 95%

Solucin:

Realizando el grfico que representa el 95% de confianza se obtiene:

Se tiene N=500, para el 95% de confianza Z = 1,96, y como no se tiene los dems
valores se tomar y e = 0,05.

Reemplazando valores de la frmula se tiene:


Los clculos en Excel se muestran en la siguiente figura:

2) Calcular el tamao de la muestra de una poblacin de 500 elementos con un nivel de


confianza del 99%

Solucin:

Realizando el grfico que representa el 99% de confianza se obtiene:

Se tiene N=500, para el 99% de confianza Z = 2,58, y como no se tiene los dems
valores se tomar y e = 0,05.
Reemplazando valores en la frmula se obtiene:

Los clculos en Excel se muestran en la siguiente figura:

CLCULO DEL TAMAO DE LA MUESTRA


DESCONOCIENDO EL TAMAO DE LA POBLACIN

La frmula para calcular el tamao de muestra cuando se desconoce el tamao de la


poblacin es la siguiente:

En donde
Z = nivel de confianza,
P = probabilidad de xito, o proporcin esperada
Q = probabilidad de fracaso
D = precisin (error mximo admisible en trminos de proporcin)

TABLAS PARA EL CLCULO DEL TAMAO DE MUESTRA

1. Se debe determinar el nivel de confianza con que se desea trabajar. (Z ), donde

z = 1.96 para un 95% de confianza o z= 1.65 para el 90% de confianza

TABLA DE APOYO AL CALCULO DEL TAMAO DE UNA MUESTRA

POR NIVELES DE CONFIANZA

Certeza 95% 94% 93% 92% 91% 90% 80% 62.27% 50%

Z 1.96 1.88 1.81 1.75 1.69 1.65 1.28 1 0.6745

3.84 3.53 3.28 3.06 2.86 2.72 1.64 1.00 0.45

e 0.05 0.06 0.07 0.08 0.09 0.10 0.20 0.37 0.50

0.0025 0.0036 0.0049 0.0064 0.0081 0.01 0.04 0.1369 0.25

Para ver como se distribuye algunas de las caractersticas de la muestra con respecto a la
variable que se est midiendo, podemos recurrir a la famosa campana de Gauss o
Student que refleja la curva normal de distribucin cuya caracterstica principal es la de
ser unimodal donde la media, mediana y la moda siempre coinciden.

Esta distribucin normal, nos permite representar en la estadstica muchos fenmenos


fsicos, biolgicos, psicolgicos o sociolgicos
Ahora bien, se hace necesario el definir los trminos Media, Moda y Mediana

Media: Es el conjunto de n observaciones sumadas y divididas entre n.

Moda: Se define como el valor que ms ocurre en un conjunto de observaciones.

Mediana: es el centro de un conjunto de observaciones ordenadas en forma creciente

Esta curva esta detallada en todos los libros de estadstica y recurriremos a ella cuando
deseemos obtener otros valores de certeza como por ejemplo el 99% de estimacin y
que da por resultado z=3.00 o z=1.65 para el 90%.

2. Tambin se debe estimar las caractersticas del fenmeno investigado. Donde


deberemos considerar la probabilidad de que ocurra el evento (p) y la de que no se
realice (q); siempre tomando en consideracin que la suma de ambos valores p + q ser
invariablemente siempre igual a 1, cuando no contemos con suficiente informacin, le
asignaremos p = .50 q = .50
3. Igualmente de determina el grado de error mximo aceptable en los resultados de la
investigacin. ste puede ser hasta del 10%; ya que variaciones superiores al 10%
reducen la validez de la informacin.

4. Se aplica la frmula del tamao de la muestra de acuerdo con el tipo de poblacin.

Poblacin infinita Poblacin Finita

Cuando no se sabe el nmero exacto de Cuando se conoce cuntos elementos tiene


unidades del que est compuesta la la poblacin
poblacin.

En donde: N = Universo

Z = nivel de confianza. e = error de estimacin.

p = Probabilidad a favor. n = tamao de la muestra

q = Probabilidad en contra.

Ejemplo aplicado a un Archivo

Supngase que se desea determinar la calidad y el nivel de servicio que ofrece una
Unidad de informacin Archivstica; por lo que resulta necesario entrevistar a los
distintos usuarios que acuden a los archivo para as conocer su opinin. Cmo
calcularamos el tamao de la muestra?

1. Establecer el nivel de confianza (95% y un error del 5%) o el (90% - y un error


del 10%).
2. Se obtiene el marco muestral, en este caso la referencia con que contamos ser el
registro de visitantes la cual fue en la Unidad de Informacin del ao pasado y
que arroja la cifra de 43,700.

Valores a estimar

n=?
e = 5% =0.05 o 10% = 0.1

Z = 1.96 (tabla de distribucin normal para el 95% de confiabilidad y 5% error)

Z = 1.65 para el 90% de confiabilidad y 10% error.

N= 43,700 (universo)

p = 0.50

q = 0.50

4. Enseguida especificaremos las operaciones para evaluar a n (tamao de la


muestra) , Para sta estimacin supondremos que contamos con un 95% de
confiabilidad y por tanto un porcentaje de error del 5% (0.05)
4. Ahora bien, si nuestro criterio fuera otro como por ejemplo el considerar un
margen del 90% de confiabilidad con su correspondiente porcentaje de error, en
este caso sera del 10% 0.10)

6. Se comparan ambos resultados, y elegimos 381 entrevistas (por aproximacin a la


siguiente cantidad entera) ya que es el que tiene menor margen de error presenta y por
consecuencia una mayor confiabilidad.

7. Mediante una tabla de nmeros aleatorios se elegirn a los usuarios a los que se les
aplicara la encuesta.

Resultados: P = 0.5
Valor para P (-1.9550000000000414< Z < 1.9550000000000414) = 0.95

Tabla para la determinacin de una muestra sacada de una poblacin finita para
mrgenes de error del 1%, 3%, 4%, 5% y 10% en la hiptesis de P=0.5 y nivel de
confianza 0.95

N 1% 2% 3% 4% 5% 10%
100 98.9745249 96.02052544 91.47047033 85.77977275 79.4265408 49.1135019
7329496 640351 27214 915327 0143045 4840137
150 147.696840 141.1930401 131.5392028 120.0478994 107.925649 58.6078802
88493875 374244 0835462 8959662 82280896 7019096
200 195.919648 184.6199363 168.4295763 150.0120201 131.521285 64.8789151
86425546 5919077 3981064 1529656 6104389 2707041
250 243.650591 226.4004809 202.5053381 176.4350836 151.378717 69.3298880
2727507 9421358 160043 699387 60647587 2443973
300 290.897155 266.6265543 234.0767695 199.9097744 168.321093 72.6527489
3610507 521874 7389586 3609302 94783802 3431207
350 337.666677 305.3833246 263.4101616 220.9034988 182.946413 75.2281447
1842368 774017 150704 1309047 61319566 1355451
400 383.966345 342.7498500 290.7353437 239.7898245 195.699578 77.2827857
3991781 703429 578777 270112 53437913 6131878
450 429.803204 378.7996167 316.2517180 256.8709045 206.918440 78.9601173
9479907 7596515 985343 0854566 45224107 444645
500 475.184160 413.6010215 340.1331333 272.3937639 216.864171 80.3553313
63158645 510508 959296 1982705 40215167 8999169
550 520.115980 447.2178047 362.5318513 286.5623242 225.741849 81.5340823
5771206 7297625 217004 736703 91986732 6940564
600 564.605299 479.7094400 383.5817962 299.5464119 233.714753 82.5431191
6029928 6024973 088736 520024 07085532 5708388
650 608.658622 511.1314854 403.4012348 311.4885980 240.914490 83.4166330
4849187 1537464 936684 7225824 60684647 1941661
700 652.282327 541.5359002 422.0949999 322.5094552 247.448327 84.1802087
1264457 515017 4084416 8517275 20975703 8153922
750 695.482667 570.9713321 439.7563445 332.7116430 253.404562 84.8533724
6371598 083432 157457 903234 8435298 6657377
800 738.265777 599.4833763 456.4684981 342.1831153 258.856546 85.4512845
3217059 853077 917474 3889056 6124638 485999
850 780.637671 627.1148120 472.3059784 350.9996623 263.865712 85.9858954
5826177 086742 7618617 6748793 5858739 0926203
900 822.604250 653.9058155 487.3357016 359.2269434 268.483904 86.4667522
7398469 947552 6149906 1101356 76916035 580897
950 864.171302 679.8941563 501.6179279 366.9221246 272.755178 86.9015743
769765 63968 332276 763185 11903967 013925
1000 905.344505 705.1153737 515.2070688 374.1352095 276.717208 87.2966702
9663079 944991 859263 4421296 37459503 6594012
1500 1296.59061 921.6472347 621.9107385 427.3403214 304.753874 89.8848460
9964387 146847 480862 535419 1842089 8320645
2000 1653.97452 1088.830092 693.7516024 460.0519089 321.016377 91.2373507
1948461 195294 29586 7123924 2295833 3245491
2500 1981.71000 1221.808597 745.4162660 482.1983914 331.634534 92.0685687
44072452 3588657 389466 20928 53897625 1409462
3000 2283.33955 1330.105534 784.3577539 498.1865580 339.112342 92.6311796
6418513 2399325 988307 4482404 428483 8865404
3500 2561.86292 1420.008916 814.7607032 510.2715460 344.663477 93.0372729
58133533 7951908 952571 722558 36302106 1363818
4000 2819.83722 1495.837991 839.1559643 519.7271858 348.947577 93.3441871
5923997 0816236 602843 06882 7483599 9026479
4500 3059.45567 1560.657823 859.1641200 527.3273929 352.354004 93.5843018
3404084 995034 544292 290222 9813682 3801005
5000 3282.61009 1616.703714 875.8709668 533.5694965 355.127408 93.7772848
5978404 1220003 548792 535495 79014956 2186193
5500 3490.94098 1665.644183 890.0312997 538.7876651 357.429241 93.9357729
35385504 932048 16249 982584 72396425 916014
6000 3685.87788 1708.749909 902.1861110 543.2147457 359.370353 94.0682562
5600687 1869813 592345 25093 7852138 6295027
6500 3868.67225 1747.005627 912.7332863 547.0179591 361.029376 94.1806497
9747404 468994 676316 275241 76955423 2395686
7000 4040.42436 1781.186284 921.9719884 550.3204988 362.463636 94.2772009
7130497 6757558 86659 108461 5145255 6084701
7500 4202.10543 1811.910078 930.1314879 553.2151257 363.715911 94.3610389
6754517 2691312 005355 463578 37267626 7194441
8000 4354.57604 1839.676181 937.3904472 555.7730190 364.818771 94.4345196
1870733 5658142 702512 287069 5307109 4327319
8500 4498.60142 1864.892073 943.8901547 558.0497074 365.797452 94.4994506
2810053 5286924 645256 454029 54092904 3300314
9000 4634.86433 1887.893668 949.7438113 560.0891466 366.671809 94.5572420
2272339 781115 33632 951832 9305647 73743
9500 4763.97585 1908.960367 955.0431797 561.9265850 367.457680 94.6090101
816683 6048894 214479 945719 37849103 5361914
10000 4886.48458 1928.326461 959.8634300 563.5906179 368.167849 94.6556499
6003653 2136875 578553 43896 5338237 1408816
10500 5002.88439 1946.189882 964.2667280 565.1046864 368.812753 94.6978874
0631685 1193738 177361 686695 00226815 3399788
11000 5113.62109 1962.718993 968.3049304 566.4881889 369.400992 94.7363179
0721232 6708282 5295 764006 55769945 0292036
11500 5219.09815 1978.057912 972.0216371 567.7573164 369.939722 94.7714338
5047394 9337777 977066 332364 01047654 4330567
12000 5319.68161 1992.330723 975.4537715 568.9256890 370.434939 94.8036463
45449475 694355 800091 336314 57878377 3225452
12500 5415.70430 2005.644840 978.6328112 570.0048469 370.891712 94.8333011
61795475 5098438 797958 483098 16741573 683019
13000 5507.46955 2018.093716 981.5857565 571.0046327 371.314349 94.8606913
2325796 9038218 69904 886745 36435664 3434289
13500 5595.25436 2029.759042 984.3358990 571.9334926 371.706539 94.8860667
1351852 187605 660637 738254 8332897 1028185
14000 5679.31222 2040.712536 986.9034373 572.7987154 372.071459 94.9096417
0556575 1241067 462915 183485 25385714 1836133
14500 5759.87554 2051.017424 989.3059738 573.6066241 372.411856 94.9316013
0774185 781513 827393 873636 5015312 969466
15000 5837.15780 2060.729661 991.5589191 574.3627312 372.730123 94.9521062
22986505 75039 508116 858315 0186804 6716221
15500 5911.35544 2069.898944 993.6758225 575.0718640 373.028349 94.9712962
3852824 547545 330902 983094 081264 6331005
16000 5982.64952 2078.569565 995.6686450 575.7382682 373.308369 94.9892939
97960555 1916058 361179 63285 7610264 3066318
16500 6051.20722 2086.781125 997.5479854 576.3656927 373.571802 95.0062070
536089 67915 172657 42719 71963796 4515558
17000 6117.18310 2094.569142 999.3232687 576.9574603 373.820079 95.0221307
5221824 750378 503978 879581 47955657 7333046
17500 6180.72031 2101.965561 1001.002904 577.5165268 374.054471 95.0371494
6958112 4279973 5132785 071793 448454 6400171
18000 6241.95161 2108.999192 1002.594419 578.0455297 374.276111 95.0513381
7842369 99036 7932662 361402 6961898 4286543
18500 6301.00030 2115.696090 1004.104572 578.5468306 374.486013 95.0647637
0758755 0408253 0633886 528146 27168075 6597426
19000 6357.98102 2122.079868 1005.539445 579.0225500 374.685084 95.0774862
2840624 9672247 0931726 212033 6845184 7627502
19500 6413.00054 2128.171988 1006.904530 579.4745972 374.874143 95.0895594
85465335 2041066 8651594 738775 05046724 983862
20000 6466.15841 2133.991989 1008.204799 579.9046964 375.053925 95.1010318
7307451 2073553 8227748 273252 3020186 997905
20500 6517.54754 2139.557705 1009.444761 580.3144080 375.225097 95.1119472
4529318 8432 3437551 546472 78832534 4114463
21000 6567.25476 2144.885446 1010.628515 580.7051482 375.388264 95.1223451
358523 918442 9898755 05952 52816824 3410424
21500 6615.36131 2149.990155 1011.759800 581.0782047 375.543974 95.1322615
5448051 787203 8087857 599292 3314079 216535
22000 6661.94329 2154.885550 1012.842028 581.4347516 375.692726 95.1417290
1771264 324047 7424556 044927 96587 9321563
22500 6707.07203 2159.584246 1013.878323 581.7758609 375.834978 95.1507776
6501032 0245785 0177107 75479 51567705 446468
23000 6750.81451 2164.097864 1014.871547 582.1025142 375.971146 95.1594343
0477965 5595997 2487934 266147 05206315 9146663
23500 6793.23362 2168.437129 1015.824331 582.4156112 376.101611 95.1677242
2947458 749476 8629983 586107 7174322 4226215
24000 6834.38853 2172.611952 1016.739097 582.7159787 376.226726 95.1756700
3430398 6272773 3629135 981897 3068907 380502
24500 6874.33492 2176.631507 1017.618074 583.0043776 376.346812 95.1832927
7000476 010998 8584188 874377 41794436 6244292
25000 6913.12526 2180.504296 1018.463324 583.2815093 376.462167 95.1906117
5661811 7977533 2351264 188085 227908 2668839
5
ESTIMACIN DE PARMETROS Y PRUEBA DE
HIPTESIS

1.- INTRODUCCIN
La Estadstica descriptiva y la teora de la Probabilidad van a ser los pilares de
un nuevo procedimiento (Estadstica Inferencial) con los que se va a estudiar el
comportamiento global de un fenmeno. La probabilidad y los modelos de distribucin
junto con las tcnicas descriptivas, constituyen la base de una nueva forma de
interpretar la informacin suministrada por una parcela de la realidad que interesa
investigar.

En el siguiente esquema representa el tema a tratar y que ser desarrollado a


continuacin.

Estimacin Puntual
Estadstica
Descriptiva Intervalos
INFERENCIA

Contraste
Probabilidad y
modelos

Los mtodos bsicos de la estadstica inferencial son la estimacin y el contraste


de hiptesis, que juegan un papel fundamental en la investigacin.

Por tanto, algunos de los objetivos que se persiguen en este tema son:
Calcular los parmetros de la distribucin de medias o proporciones
muestrales
de tamao n, extradas de una poblacin de media y varianza conocidas.
Estimar la media o la proporcin de una poblacin a partir de la media o
proporcin muestral.
Utilizar distintos tamaos muestrales para controlar la confianza y el error
admitido.
Contrastar los resultados obtenidos a partir de muestras.
Visualizar grficamente, mediante las respectivas curvas normales, las
estimaciones realizadas.

En la mayora de las investigaciones resulta imposible estudiar a todos y cada


uno de los individuos de la poblacin ya sea por el coste que supondra, o por la
imposibilidad de acceder a ello. Mediante la tcnica inferencial obtendremos
conclusiones para una poblacin no observada en su totalidad, a partir de estimaciones o
resmenes numricos efectuados sobre la base informativa extrada de una muestra de
dicha poblacin. Por tanto, el esquema que se sigue es,

En definitiva, la idea es, a partir de una poblacin se extrae una muestra por
algunos de los mtodos existentes, con la que se generan datos numricos que se van a
utilizar para generar estadsticos con los que realizar estimaciones o contrastes
poblacionales.

Existen dos formas de estimar parmetros: la estimacin puntual y la


estimacin por intervalo de confianza. En la primera se busca, con base en los datos
muestrales, un nico valor estimado para el parmetro. Para la segunda, se determina un
intervalo dentro del cual se encuentra el valor del parmetro, con una probabilidad
determinada.

Si el objetivo del tratamiento estadstico inferencial, es efectuar generalizaciones


acerca de la estructura, composicin o comportamiento de las poblaciones no
observadas, a partir de una parte de la poblacin, ser necesario que la parcela de
poblacin examinada sea representativa del total. Por ello, la seleccin de la muestra
requiere unos requisitos que lo garanticen, debe ser representativa y aleatoria.
Adems, la cantidad de elementos que integran la muestra (el tamao de la
muestra) depende de mltiples factores, como el dinero y el tiempo disponibles para el
estudio, la importancia del tema analizado, la confiabilidad que se espera de los
resultados, las caractersticas propias del fenmeno analizado, etctera. As, a partir de
la muestra seleccionada se realizan algunos clculos y se estima el valor de los
parmetros de la poblacin tales como la media, la varianza, la desviacin estndar, o la
forma de la distribucin, etc.

El estudio muestral no es un tema que entre a formar parte de este tema, pero si
necesitaremos una serie de conceptos necesarios para el desarrollo del tema, y que se
detallan a continuacin.

1.1.- Conceptos bsicos


POBLACIN: Conjunto de elementos sobre los que se observa un carcter comn. Se
representa con la letra N.

MUESTRA: Conjunto de unidades de una poblacin. Cuanto ms significativa sea,


mejor ser la muestra. Se representa con la letra n.

UNIDAD DE MUESTREO: Est formada por uno o ms elementos de la poblacin.


El total de unidades de muestreo constituyen la poblacin. Estas unidades son disjuntas
entre s y cada elemento de la poblacin pertenece a una unidad de muestreo.

PARMETRO: Es un resumen numrico de alguna variable observada de la


poblacin. Los parmetros normales que se estudian son:

- La media poblacional: X
- Total poblacional: X
- Proporcin: P

ESTIMADOR: Un estimador * de un parmetro , es un estadstico que se emplea


para conocer el parmetro desconocido.

ESTADSTICO: Es una funcin de los valores de la muestra. Es una variable aleatoria,


cuyos valores dependen de la muestra seleccionada. Su distribucin de probabilidad, se
conoce como Distribucin muestral del estadstico.

ESTIMACIN: Este trmino indica que a partir de lo observado en una muestra (un
resumen estadstico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la poblacin total, de modo que lo estimado es el
valor generalizado a la poblacin. Consiste en la bsqueda del valor de los parmetros
poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:

- Puntual: cuando buscamos un valor concreto.


- Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se
supone que va a estar el valor del parmetro que se busca con una cierta
probabilidad.

CONTRATE DE HIPTESIS: Consiste en determinar si es aceptable, partiendo de


datos muestrales, que la caracterstica o el parmetro poblacional estudiado tome un
determinado valor o est dentro de unos determinados valores.

NIVEL DE CONFIANZA: Indica la proporcin de veces que acertaramos al afirmar


que el parmetro est dentro del intervalo al seleccionar muchas muestras.

2.- EL CONCEPTO DE ESTADSTICO Y DISTRIBUCIN


MUESTRAL
El objetivo de la inferencia es efectuar una generalizacin de los resultados de la
muestra de la poblacin. La tarea que nos ocupa ahora es conocer las distribuciones de
la probabilidad de ciertas funciones de la muestra, es decir, variables aleatorias
asociadas al muestreo o estadsticos muestrales. stos sern tiles para hacer
inferencia respecto a los parmetros desconocidos de una poblacin. Por ello se habla de
distribuciones muestrales, ya que estn basados en el comportamiento de las
muestras.

El primer objetivo es conocer el concepto de distribucin muestral de un


estadstico; su comportamiento probabilstico depender del que tenga la variable X y
del tamao de las muestras.

Sea x1.......xn, una muestra 1 aleatoria simple (m.a.s) de la variable aleatoria X,


con funcin de distribucin F0 , se define el estadstico T como cualquier funcin de la
muestra que no contiene ninguna cantidad desconocida.

Sea una poblacin donde se observa la variable aleatoria X. Esta variable X,


tendr una distribucin de probabilidad, que puede ser conocida o desconocida, y ciertas
caractersticas o parmetros poblacionales. El problema ser encontrar una funcin que
proporcione el mejor estimador de . El estimador, T, del parmetro debe tener una
distribucin concentrada alrededor de y la varianza debe ser lo menor posible.

Los estadsticos ms usuales en inferencia y su distribucin asociada


considerando una poblacin P sobre la que se estudia un carcter cuantitativo son:

1
Todas las variables aleatorias que forman la muestra verifican que son independientes
entre s, que
E[ X i ] = 2
y que su V [
Xi ] = .
n
o Total: t = i = 1 xi .

2.1.- Distribuciones muestrales

Consideremos todas las posibles muestras de tamao n en una poblacin,


entonces, como se deca anteriormente, para cada muestra podemos calcular un
estadstico (media, desviacin tpica, proporcin,...) que variar de una a otra. As
obtenemos una distribucin de ese estadstico que se llamar distribucin muestral.

Las medidas fundamentales de esta distribucin son la media, la desviacin


tpica, tambin denominada error tpico, y el total poblacional, y sus distribuciones
muestrales son las siguientes.

MEDIA MUESTRAL: Sea X1.....Xn, una m.a.s. con media o con E(x)= y
con
2
varianza muestral V [ X ] = , entonces la media muestra se distribuye como una
n
normal de parmetros:

X N (, ).
n

VARIANZA MUESTRAL: Sea X1.....Xn, una m.a.s. independientes e idnticamente


distribuidas, definimos el estadstico muestral para la varianza como la cuasivarianza
muestral

muestral
TOTAL MUESTRAL: Sea X1......Xn, una m.a.s. con E(t)= n y con V(t)= n 2

,
entonces se distribuye como una normal:

(
t N n ; n 2
).

3.- ESTIMACIN PUNTUAL


Un estimador de un parmetro poblacional es una funcin de los datos
muestrales. En pocas palabras, es una frmula que depende de los valores obtenidos de
una muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto
de un parmetro. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la
talla media de los individuos de la muestra.

La media de la muestra puede ser un estimador de la media de la poblacin, la


cuasivarianza muestral es un buen estimador de la varianza poblacional y el total
muestral es un buen estimador del total poblacional.
Por tanto, una definicin ms matemtica de un estimador y las propiedades que
debe de cumplir un estimador para ser bueno.
Sea X1......Xn, una m.a.s. de tamao n, decimos que es un estimador * de un
parmetro si el estadstico que se emplea para conocer dicho parmetro desconocido
es este.

3.1.- Propiedades deseables de un estimador

Las propiedades o criterios para seleccionar un buen estimador son los


siguientes:
A) Insesgadez: Diremos que un estimador * de un parmetro es insesgado si su
esperanza coincide con el verdadero valor del parmetro.
E[*] = .
En el caso de que no coincidan, diremos que el estimador es sesgado.
B) Eficiencia: Dados dos estimadores 1* y 2* para un mismo parmetro , se dice que
1* es ms eficiente que 2* si:
V[1*] < V[2*].

C) Suficiencia: Se dice que un estimador de un parmetro es suficiente cuando para su


clculo utiliza toda la informacin de la muestra.
D) Consistencia: Decimos que un estimador * de un parmetro es consistente si la
distribucin del estimador tiende a concentrarse en un cierto punto cuando el tamao de
la muestra tiende a infinito.

Lim n = {P[ +
]}.

3.2.- Mtodos para obtener estimadores

El demostrar que un cierto estimador cumple estas propiedades puede ser


complicado en determinadas ocasiones. Existen varios mtodos que nos van a permitir
obtener los estimadores puntuales. Los ms importantes son:
MTODO DE LOS MOMENTOS: se basa en que los momentos poblacionales y se
estiman mediante los momentos muestrales. Suelen dar estimadores consistentes.
MTODO DE MNIMOS CUADRADOS: consiste en obtener un estimador que
hace mnima una determinada funcin.
MTODO DE MXIMA VEROSIMILITUD: consiste en tomar como parmetro
poblacional el valor de la muestra que sea ms probable, es decir, que tenga mayor
probabilidad. Se suelen obtener estimadores consistentes y eficientes. Es el ms
utilizado.
La probabilidad de que la media muestral sea igual a la media poblacional es
cero, P[x = ] = 0 , es decir, que ser bastante complicado obtener un
estimador
puntual, por ello se utiliza ms el Intervalo de Confianza y el Contraste de Hiptesis.

4.- ESTIMACIN POR INTERVALOS DE CONFIANZA


El intervalo de confianza est determinado por dos valores dentro de los cuales
afirmamos que est el verdadero parmetro con cierta probabilidad. Son unos lmites o
margen de variabilidad que damos al valor estimado, para poder afirmar, bajo un
criterio de probabilidad, que el verdadero valor no los rebasar. Es una expresin del
tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al
parmetro estimado con una determinada certeza o nivel de confianza.

En la estimacin por intervalos se usan los siguientes conceptos:


Variabilidad del parmetro: Si no se conoce, puede obtenerse una
aproximacin en los datos o en un estudio piloto. Tambin hay mtodos para
calcular el tamao de la muestra que prescinden de este aspecto. Habitualmente
se usa como medida de esta variabilidad la desviacin tpica poblacional y se
denota .
Error de la estimacin: Es una medida de su precisin que se corresponde con
la amplitud del intervalo de confianza. Cuanta ms precisin se desee en la
estimacin de un parmetro, ms estrecho deber ser el intervalo de confianza y,
por tanto, menor el error, y ms sujetos debern incluirse en la muestra
estudiada. Llamaremos a esta precisin E, segn la frmula E = 2 - 1.
Nivel de confianza: Es la probabilidad de que el verdadero valor del parmetro
estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel
de confianza se denota por (1-), aunque habitualmente suele expresarse con un
porcentaje ((1-)100%). Es habitual tomar como nivel de confianza un 95% o
un 99%, que se corresponden con valores de 0,05 y 0,01, respectivamente.
Valor : Tambin llamado nivel de significacin. Es la probabilidad (en tanto
por uno) de fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1)
y el nivel de confianza (1-). Por ejemplo, en una estimacin con un nivel de
confianza del 95%, el valor es (100-95)/100 = 0,05.
Valor crtico: S e representa por Z/2. Es el valor de la abscisa en una
determinada distribucin que deja a su derecha un rea igual a /2, siendo 1- el
nivel de confianza. Normalmente los valores crticos estn tabulados o pueden
calcularse en funcin de la distribucin de la poblacin. Por ejemplo, para una
distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para =
0,05 se calculara del siguiente modo: se busca en la tabla de la distribucin ese
valor (o el ms aproximado), bajo la columna "rea"; se observa que se
corresponde con -0,64. Entonces Z/2 = 0,64. Si la media o desviacin tpica de
la distribucin normal no coinciden con las de la tabla, se puede realizar el
cambio de variable t=(X-)/ para su clculo.
Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una
estimacin de la media con un margen de error de 0,6 y un nivel de confianza del 99%",
podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con
una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando,
respectivamente, la mitad del error, para obtener el intervalo de confianza segn las
definiciones dadas.

Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza


van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del
intervalo de confianza, tenemos tambin una mayor probabilidad de xito en nuestra
estimacin, es decir, un mayor nivel de confianza.

Por tanto, un aspecto que debe de tenerse en cuenta es el tamao muestral, ya


que para disminuir el error que se comente habr que aumentar el tamao muestral. Esto
se resolver, para un intervalo de confianza cualquiera, despejando el tamao de la
muestra en cualquiera de las frmulas de los intervalos de confianza que veremos a
continuacin, a partir del error mximo permitido.

Los intervalos de confianza pueden ser unilaterales o bilaterales:

P[ X < z ] = 1 P[ X > z ] = 1 .
UNILATERAL:

P z < X < z .
BILATERAL:
2 2

4.1.- Intervalo de confianza para la media con varianza conocida

Sea X una variable aleatoria que se distribuye como X N( , ), si utilizamos



la media muestral ( X ) como estimador, entonces X N ( , ).
n

Tipificando, centramos el estimador, cambiando de origen y de escala


obteniendo:
x
Z= N (0;1).
/
n
Entonces, el intervalo de confianza o la probabilidad para el estimador media
con la varianza conocida viene dado por los siguientes parmetros:

x
P z < < z = P z . < x < z =
2
/ n 2 2
n 2
n

P x z . < < x + z .
2 2 n

n

Cambiamos todos los signos, para conseguir la media () positiva:



P [ x + z /2 > > x - z /2 ] = (1- ).
n n

Ordenando la informacin:

P [ x - z /2 < < x + z /2 ] = (1- ).
n n

Por tanto, el intervalo es,



x z x; + z .
2 n 2 n

4.2.- Intervalo de confianza para la media con varianza desconocida


y n>30

Sabemos que para cualquier distribucin, por el Teorema Central del Lmite, si
tiene un tamao de muestra grande, se puede aproximar o se distribuye como una
Normal de parmetros:
s
X N (, )
,
n
siendo s la cuasidesviacin tpica muestral. En consecuencia,
x
Z= N (0;1) ,
s/ n
y procediendo de forma anloga a la anterior llegamos a que el intervalo de confianza
que buscamos es
s s
x z ;x + z .
2 n 2 n

4.3.- Intervalo de confianza para la media con varianza


desconocida y n<30

Partiendo de una poblacin Normal, en estas condiciones la variable aleatoria se


distribuye como una t-Student con n-1 grados de libertad de la forma,
x
t n 1 .
s/ n

Construimos entonces el intervalo de confianza a un nivel (1- )% de la forma:


x s s
P t < < t = P t . < x < t = 1 .,
s/ n
n1; n 1; 2 n n 1; n
2
n 1;
2
2

de manera que si continuamos despejando de forma anloga a los caso anteriores se


obtiene un intervalo de confianza:

s
I .C . x t s ; x + t .
n1;
2 n n1;
2 n

4.4.- Intervalo de confianza para la proporcin

Basndonos en una variable aleatoria que se distribuye como una Binomial,


X B(n; p); y la aproximacin de una distribucin Binomial por una Normal cuando
el tamao de la muestra es muy grande, se ha visto que se puede expresar como
( )
X N n p; npq . Segn esto, la variable aleatoria definida como Y=X/n se
(
distribuye como Y N p; pq / n . )
Al tipificar, nos queda
p P
Z= N (0;1) .
pq
n

Entonces, el intervalo de confianza o la probabilidad para el estimador


proporcin viene dado por los siguientes parmetros:
pq pq
p z ; p + z ; .
2
n 2
n
4.5.- Intervalo de confianza para la varianza

En poblaciones Normales ya hemos visto que la variables aleatoria


(n 1)s 2
2

n
2

1 . Para un nivel de confianza de (1- )% viene dado por,

(n <1)s 2
P 2 2
= 1 .
n 1;1 2 < n1;


2
2

Si invertimos y despejamos, nos queda,


2 1 11)s 2 (n (n 1)s 2
2
P > > = P > > = 1 .
(n 1)s 2 2

2 2 2
n n 1;
n n 1;

1;1
1;1
2
2
2 2

Y por tanto, el intervalo de confianza para la varianza es:


(n 1)s 2 (n 1)s 2
; .
2 2




n 1;

2
n1;1
2

5.- CONTRASTE DE HIPTESIS


El problema central de la inferencia estadstica es un problema de toma de
decisiones, del cual la estimacin y el contraste de hiptesis son aspectos importantes,
diferenciados entre s, pero complementarios.

Un contraste de hiptesis o Test de hiptesis estadstico es una prueba de


significacin o una prueba estadstica, que indican el proceso mediante el cual
decidimos si una proposicin respecto de la poblacin, debe ser aceptada o no. Esta
proposicin es lo que se denomina hiptesis estadstica.

Es una regla de decisin que nos dice cuando aceptar y rechazar las hiptesis,
con esto vemos si los datos de una muestra son compatibles o no con los de la
poblacin.
Una hiptesis estadstica, por tanto, es una proposicin acerca de la funcin de
probabilidad o de la funcin de densidad de probabilidad de una variable aleatoria o de
varias variables aleatorias. Tal proposicin debe referirse bien a la forma de la
distribucin de probabilidad, bien al valor o valores de los parmetros que lo definan o
bien a ambos. Hiptesis estadstica es, una afirmacin acerca de la distribucin de la
poblacin. Puede haber hiptesis estadsticas en contextos paramtricos y no
paramtricos.

El contraste de hiptesis estadstico se basar en la informacin proporcionada


por la muestra. De modo, que si rechazamos la hiptesis, queremos indicar que los datos
de la muestra ofrecen cierta evidencia sobre su falsedad. Si la aceptamos simplemente
queremos significar que no se rechaza.

Un contraste de hiptesis consiste, por tanto, en estudiar dos hiptesis: H0


(hiptesis nula), H1 (hiptesis alternativa), de manera que el investigador divide los
resultados muestrales en dos zonas; una zona de rechazo y otra de aceptacin, de
manera que segn como obtengamos el resultado, aceptaremos o rechazaremos la
hiptesis.

Al aplicar un contraste de hiptesis, clasificamos los puntos del espacio muestral


en dos regiones excluyentes y complementarias:
Regin de Rechazo o Regin Crtica: La formada por el conjunto de los
valores del estadstico de contraste que nos llevan a rechazar la hiptesis nula H0,
se llama regin crtica (los puntos que delimitan la regin crtica se llaman
puntos crticos).
Regin de Aceptacin o Regin de No Rechazo: Es la formada por el conjunto
de los valores del estadstico de contraste que nos lleva a aceptar la hiptesis
nula H0.

5.1.- Planteamiento de la hiptesis estadstica

Aquella hiptesis que se desea contrastar se llama hiptesis nula (Ho), por tanto,
la que se acepta o rechaza como conclusin del contraste. La hiptesis nula suele ser
una estrategia o medio del que se sirve el investigador para probar la alternativa. Suele
ir acompaada por la hiptesis alternativa o hiptesis experimental, simbolizada por H1.
La hiptesis alternativa es la que se verifica cuando no se verifica la hiptesis
nula. El planteamiento de Ho permite elaborar un modelo Probabilstico a partir del cual
podemos llegar a la decisin final.

A su vez, al plantear una hiptesis, esta puede ser simple o compuesta. Una
hiptesis es simple si se especifica exactamente el valor del parmetro. Una hiptesis es
compuesta, si contiene dos ms valores del parmetro. La hiptesis nula (Ho) por ser
ms concreta suele ser simple y la alternativa, compuesta. Es frecuente plantearlas como
complementarias.

5.2.- Supuestos
Las suposiciones que podemos hacer dependiendo del tipo de contraste que
necesitemos son:
a) Supuestos acerca de las caractersticas de los datos que se van a manipular,
como puede ser la independencia de la observaciones, nivel de medida
utilizada, etc.
b) Supuestos acerca de la forma de distribucin de partida: Normal, Binomial,
etc.

La violacin de los supuestos podr invalidar ms o menos el modelo


probabilstico y llevarnos a decisiones errneas. Concierne al investigador conocer las
consecuencias que se derivan de la violacin de tales supuestos sobre el modelo. Por
este motivo, si se plantean los supuestos deben ser mnimos y no demasiado exigentes.

Por ejemplo, se puede plantear de partida:


Poblaciones de partida: normales.
Muestras independientes.
Observaciones de las muestras: independiente.

5.3.- Estadstico de Contraste


Estadstico de Contraste es, aquel estadstico (T) que utilizamos para tomar una
decisin en un contraste de hiptesis. Este estadstico es una variable aleatoria, con una
distribucin muestral determinada, que nos dar las probabilidades asociadas a un valor
o un determinado intervalo de valores del estadstico de contraste. Este deber cumplir
todas las caractersticas que se mencionaron anteriormente cuando se habl de los
estadsticos.

5.4.- Reglas de decisin


Una regla de decisin es el criterio utilizado para decidir si aceptamos o
rechazamos la hiptesis nula, a partir del espacio muestral de valores del estadstico de
contraste y probabilidades asociadas.
Este criterio consiste en dividir tal espacio en dos zonas mutuamente excluyentes
y exhaustivas: la zona de rechazo o regin crtica y la zona de aceptacin. La zona de
rechazo est constituida por aquellos valores del estadstico de contraste que se alejan
mucho de Ho, por lo tanto es muy poco probable que ocurran si Ho es verdadera. Por
ejemplo, a continuacin se pueden ver dos ejemplos de contrastes, uno unilateral y otro
bilateral, aunque se pueden crear muchos ms.

Un contraste de hiptesis unilateral es de la forma (hay ms formas):


Ho: = o
H1: >o
Un contraste de hiptesis bilateral es de la forma:
Ho: = o
H1: o

Decidimos que un contraste es unilateral o direccional, si para tomar la decisin


de rechazar Ho nos servimos exclusivamente de los valores muy grandes o
exclusivamente de los valores muy pequeos del estadstico de contraste.

Decidimos que un contraste es bilateral o no direccional, si utilizamos los


valores muy grandes y muy pequeos de los posibles valores del estadstico de
contraste.

Si la distribucin, bajo la H1, slo puede estar a la derecha ser ms potente si


colocamos a la derecha toda la regin crtica.
Si la distribucin, bajo la H1, puede estar a la derecha o la izquierda sera un test
ms potente el que pone parte de la regin crtica a la derecha y parte a la izquierda.
El valor se llama nivel de significacin o nivel de riesgo y representa a la
probabilidad de que un nivel concreto del estadstico de contraste, caiga en la zona de
rechazo o crtica, es decir, es el conjunto de valores del estadstico de contraste que nos
lleva a la decisin de rechazar la hiptesis nula.

El valor (1-) se llama nivel de confianza, es el conjunto de valores del


estadstico de contraste que nos lleva a la decisin de aceptar la hiptesis nula.

En los contrates unilaterales est concentrada en uno de los dos extremos


de la distribucin, en una nica cola. En los contrastes bilaterales se reparte entre los
dos
extremos de la distribucin, en las dos colas.

Los contrastes unilaterales suelen ser mejores que los contrates bilaterales. La
eleccin de uno u otro, est condicionada al planteamiento de la hiptesis alternativa.
Ejemplo:
Si Ho 0.50 H1 > 0.50 Es unilateral.

Si Ho = 0.50 H1 0.50 Es bilateral.

5.5.- Clculo del estadstico y toma de decisin


Antes de poder tomar una decisin se debe recopilar los datos con los que se van
a trabajar, es decir, se obtienen los datos de una varias muestras y los estimadores del
parmetro (proporcin, media, etc.) correspondiente, calculamos el valor concreto del
estadstico de contraste y fijado el nivel de significacin con la zona crtica, si el valor
de tal estadstico cae en la zona crtica, rechazamos las hiptesis nula y por tanto,
aceptamos la hiptesis alternativa. En este caso debemos interpretar que no hay
evidencia suficiente para decidir que es falsa. En caso contrario se aceptar la hiptesis
nula.

5.6.- Errores en los contrates de hiptesis


Cuando se realiza un contraste de hiptesis, siempre debemos tener en cuenta
que cuando aceptamos o rechazamos una hiptesis puede que estemos cometiendo un
cierto error. Cuando Rechazamos Ho, significa que Ho es falsa y cuando aceptamos Ho,
significa que Ho es verdadera. Por tanto, se pueden considerar, dos tipos de errores que
se pueden cometer cuando se realiza un contraste:
- Error tipo I ( ): Es el error que se comete en la decisin del contraste
cuando se rechaza la hiptesis nula (Ho), siendo correcta (cierta).
- Error tipo II (): Es el error que se comete en la decisin del contraste
cuando se acepta la hiptesis nula (Ho), siendo falsa.
En la siguiente tabla se puede ver de forma ms concreta:

Verdadera Falsa
(1-
Acertar )
Error tipo II
correcta
Decisin (1-
Rechazar )
Error tipo I
Decisin Correcta
De aqu se pueden obtener las siguientes conclusiones que deben de tenerse en
cuenta:

El ERROR II es el ms grave, al que tambin se le conoce como potencia del


contraste, y se representa con la letra .
es el valor de significacin, nos dice a partir de qu valor
estamos cometiendo un error tipo I.

As, las probabilidades asociadas a los tipos dos tipos de Error vienen dadas por
las siguientes expresiones:

1.- Nivel de significacin o tamao del contraste ( ):

=P(error tipo I}=P{rechazar Ho / Ho cierta}

2.- Potencia del contraste ( ):

= P{rechazar Ho / Ho falsa}=1-P{ Aceptar Ho / Ho falsa}= 1-P{error tipo II}

5.7.- Potencia de un contrate


Se llama potencia de un contraste a la probabilidad de rechazar Ho, cuando es
falsa. Su probabilidad es 1-. Ms estrictamente debera llamarse potencia de
regin
crtica. No es ms que la probabilidad de que sta detecte una Ho falsa dado un valor para
H1.
Los valores de y no tienen la misma importancia psicolgica. Es
el
investigador el que en cada caso deber saber que error tiene ms importancia para tratar
de disminuirlo. Para disminuir el valor de es necesario aumentar el tamao de
la
muestra.

5.8.- Curvas de potencia de un contrate


Fijado un nivel de significacin ( ), una hiptesis nula y una hiptesis
alternativa, tendremos una potencia para cada valor que tome la hiptesis alternativa
(H1). La curva
que se obtiene al relacionar los posibles valores de H1 con los correspondientes (1-), se
llama curva de potencia o funcin de potencia.

Cuanto mayor es el nivel de significacin (probabilidad Error Tipo I) mayor es la


potencia.

5.9.- Efecto del tamao de la muestra en la potencia


Se trata de poner de manifiesto cmo, manteniendo constante , al aumentar el
tamao de la muestra decrece el valor de , y por tanto, se incrementa la potencia,
la
capacidad del contraste para distinguir H0 y H1.

Al igual que ocurra en los intervalos de confianza, el tamao de la muestra ser


importante para determinar el error que se comete o cual es el tamao de la muestra
necesario para mantener un determinado error mnimo.

5.10.- Nivel de significacin y nivel critico


Se puede definir el nivel de significacin () como la mxima probabilidad de
rechazar la Ho cuando es cierta. El nivel de significacin lo elige el investigador antes de
realizar el contrate, para que no influya en su decisin. Por lo tanto el nivel de significacin
representa el riesgo mximo admisible al rechazar Ho.

El nivel crtico se calcula despus de obtener el valor del estadstico de contraste y


representa el riesgo mnimo con el que se rechaza Ho.

5.11.- Violacin de los supuestos en los contrastes de hiptesis


A continuacin, se detalla de forma esquemtica en que situaciones se deben
utilizar otras distribuciones asociadas a la normal.
5.11.1.- Utilizacin de la distribucin T-Student, en el contraste de

a) Independencia: m.a.s. y poblacin pequea


b) Normalidad: Si la muestra es grande no presenta serios problemas. Si la
muestra es pequea los contrastes unilaterales aumentan el error. Por lo
tanto, si la muestra es grande haremos un contraste unilateral, si
utilizamos la distribucin t-student y no se puede asumir que la
poblacin es normal.
5.11.2.- Utilizacin de la distribucin T-Student, en el contraste de 1 - 2

a) Independencia: Muy importante.


b) Normalidad.
c) Igualdad de varianzas.

5.11.3.- Utilizacin de la distribucin Chi-Cuadrado ( 2 ), en el contraste 2

El supuesto de normalidad lleva consigo un error, que no podemos


corregir aumentando el tamao muestral.

5.11.4.- Utilizacin de la distribucin F-Snedecor en el contraste de 2 1/ 2 2

No se puede usar si las poblaciones no son normales o los tamaos de las


muestras no son grandes. Tampoco debe utilizarse si la independencia no es
segura.

5.12.- Propiedades deseables en los contrastes de hiptesis


El investigador debe seleccionar aquella prueba que le sirve para contrastar su
hiptesis y procurar que se cumplan los supuestos que la sustentan, adems deben de
reunir estas propiedades:

Carencia de Sesgo:

Un Contraste de Hiptesis es una prueba insesgada de Ho, si la probabilidad de


rechazar Ho cuando es falsa, es igual o mayor que la probabilidad de rechazar Ho
cuando es cierta. Es decir, si su potencia es mayor o igual que su nivel de significacin.

Consistencia:

Una secuencia de contrastes es consistente frente a todas las alternativas Hi, si su


funcin de potencia se aproxima a 1, a medida que n tiende al infinito. Se supone >0
y
constante.

5.13.- El concepto de p-valor


Cuando se realiza un contraste de hiptesis sabemos que a partir del nivel de
significacin delimitamos la zona de aceptacin y de rechazo. En ocasiones es muy
interesante calcular el nivel de significacin a partir del cual la hiptesis nula, H0, se va
a rechazar. Esta es la idea o concepto del p-valor, es decir,

[ ]
p = P Z > z exp .

El p-valor puede considerarse como el valor lmite para que un contraste sea
significativo, es decir, elegido un nivel de significacin , se rechazar H0 si p .
5.14.- Contraste de hiptesis para la media con varianza conocida

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


mejor conocido es la media muestral,

X N (, )

.
n
Como ya se conoce su distribucin, el estadstico de contraste ser:
x
N (0;1) .
/
n

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es


cierta, y se rechaza cuando:
H0 : = x 0
RECHAZO H0 si > z
0
A)
H1 : 0
/ n 2
H0 : x 0
RECHAZO H0 si > z
0
B)
H1 : > / n
0
H0 : x 0
RECHAZO H0 si < z
0
C)
H1 : < / n
0

En caso contrario se acepta la hiptesis nula.

5.15.- Contraste de hiptesis para la media con varianza


desconocida y n>30

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


s
mejor conocido es la media muestral, X N ( , ) .
n
Como ya se conoce su distribucin, el estadstico de contraste ser:
x
N (0;1) .
s/ n
Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es
cierta, y se rechaza cuando:
H0 : = x 0
RECHAZO H0 si > z
0
A)
H1 : s/ n 2
0

H0 : x 0
RECHAZO H0 si > z
0
B)
H1 : > s/ n
0

H0 : x 0
RECHAZO H0 si < z
0
C)
H1 : < 0 s/ n
En caso contrario se acepta la hiptesis nula.
5.16.- Contraste de hiptesis para la media con varianza
desconocida y n<30

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


mejor conocido es la media muestral, X t .
n1
Como ya se conoce su distribucin, el estadstico de contraste ser:
x
tn 1
s/ n
Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es
cierta, y se rechaza cuando:

H0 : = x 0
RECHAZO H0 si >t
0
A)
H1 : s/ n n1;
2
0

H0 : x 0
RECHAZO H0 si > t n 1;
0
B)
H1 : > s/ n
0

H0 : x 0
RECHAZO H0 si < t n1;
0
C)
H1 : < s/ n
0

En caso contrario se acepta la hiptesis nula.

5.17.- Contraste de hiptesis para la proporcin

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


pq
mejor conocido es la proporcin muestral, P N p; .
n

Como ya se conoce su distribucin, el estadstico de contraste ser:

p P0
N (0;1) .
p0 q0
n

Podemos hacer tres tipos de contraste. Se presupone que la hiptesis nula es


cierta, y se rechaza cuando:

H 0 : P = P0 p P0
A) RECHAZO H0 si > z
H 1 : P P0 p 0 q0 2
n
H 0 : P P0 p P0 > z
B) RECHAZO H0 si
H 1 : P > P0 p 0 q0
n

H 0 : P P0 p P0 < z
C) RECHAZO H0 si
H 1 : P < P0 p0 q0
n
En caso contrario se acepta la hiptesis nula.

5.18.- Contraste de hiptesis para la varianza

Supongamos una poblacin Normal. Para realizar este contraste el estadstico


mejor conocido es la varianza muestral. Como ya se conoce su distribucin, el
estadstico de contraste ser:
(n 1)s 2 2
n 1
2
.

Como en este caso, la distribucin del estadstico no es simtrica, podremos


hacer tres mismos tipos de contraste, pero en este caso habr que tener en cuenta esa
no simetra. Se presupone que la hiptesis nula es cierta, y se rechaza cuando:

0 2: =
2
H 2
0
si
(n 1)s 2 ; 2
A) RECHAZO H0 2
H1 : 2 0
1
2
0
2 2

H 0 : 2 0 (n=
RECHAZO H0
2 1)s= 2
B) si > 2

H1 : >2
0
02
2

H0 : 2 0 (n= 1)s= 2
RECHAZO H
2 si < 2
C) 0 1
H1 : 2 < 02
0

Nota: En caso
contrario se
acepta la
hiptesis nula.
6
REGRESIN, CORRELACIN Y ANOVA

1. REGRESIN LINEAL SIMPLE

En el caso de la regresin simple se puede predecir una variable Y (dependiente o


criterio) a partir de una X (independiente o predictora). Ambas cuantitativas.

Para un caso i la ecuacin en la poblacin es:

Yi = + Xi + Ei
Siendo:
Parmetros:
: Origen de la recta
: Pendiente de la recta
Ei: Error aleatorio

En la muestra se estima y con A y B:

Con estos estimadores, la ecuacin es: Yi = A + BXi + Ei

Por lo que el valor predicho para cada Xi es: Y'i= A + BXi

El error en el pronstico es: Ei= Yi - Y'i

Ejemplo: Se intenta predecir el absentismo laboral Y (en horas al ao) a partir del
salario X (en euros semanales).
Contraste sobre
Objetivo: Comprobar si hay relacin lineal, y de que tipo es esta, entre X e Y.

Hiptesis Bilateral:

H0: = 0 (no hay relacin lineal, son linealmente independientes)

H1: 0 (hay relacin lineal)

Unilateral derecho:

H0: 0 (no hay relacin lineal)

H1: > 0 (hay relacin lineal positiva)

Unilateral izquierdo:

H0: 0 (no hay relacin lineal)

H1: < 0 (hay relacin lineal negativa)

Supuestos

Independencia
Normalidad
Homocedasticidad
Estadstico de contraste

Zona crtica Bilateral:

T / 2 tn-2yT1-/2tn-2

Unilateral derecho: T1-tn-2

Unilateral izquierdo: T tn-2

Ejemplo: Contrastar si al aumentar el salario (X) aumenta el absentismo (Y) con =


0,01.

1. Hiptesis
H0: 0
H1: > 0

2. Supuestos: normalidad, independencia, homocedasticidad.

3. Estadstico de contraste

4. Zona crtica

Unilateral derecho: 0,99t3= 4,541

5. Decisin

Mantener H0
2. REGRESIN EN FORMATO ANOVA

Combinacin lineal de variables

Ejemplo: Un examen tiene dos partes: terica y prctica. La parte terica (Y) cuenta un
40% y la parte prctica (Z) un 60% de la nota final (X).

Si una persona obtiene en el terico un 4,5 y en el prctico un 6,1 su puntuacin final


es:

La media y la varianza de X son:

Ejemplo: Si en el terico y el prctico se obtiene los siguientes resultados:

Entonces los resultados para la nota final son:


Es decir: SCT = SCR + SCE

Ejemplo: Vimos que 179 = X y 380 = Y.

Se comprueba que: E(Yi)= 47,06 + (1,86)179 = 380


Correlacin de Pearson

Para cuantificar la intensidad y sentido de la relacin entre dos variables X e Y


cuantitativas se tiene:
Clculo de rxy en la muestra:

r2 es el equivalente en regresin a las medidas de tamao del efecto del ANOVA:

2,2 y 2.

Contraste sobre xy

1. Hiptesis Bilateral: H0: XY= 0; H1: XY 0

U. derecho: H0: XY 0 ; H1: XY > 0

U. izquierdo: H0: XY 0 ; H1: XY < 0

2. Supuestos Independencia Normalidad

3. Estadstico de contraste

Cuya distribucin es tn-2

4. Zona crtica Bilateral: T / 2 t n-2 y T 1- / 2t n-2

Unilateral derecho:
T 1- t n-2
Unilateral izquierdo:
T t n-2
CONCLUSIN

El avance tecnolgico en la informtica ha contribuido enormemente al desarrollo de la


estadstica, sobre todo en la manipulacin de la informacin, pues en el mercado existen
paquetes estadsticos de excelente calidad, como el SAS, SPSS, SCA,
STATGRAPHICS, amn de otros, que "corren" en un ordenador sin mayores exigencias
tcnicas, permitiendo el manejo de grandes volmenes de informacin y de variables.

La estadstica, entonces, dej de ser una tcnica exclusiva de los estados, para
convertirse en una herramienta imprescindible de todas las ciencias, de donde proviene
la desconcertante desuniformidad en las definiciones de los diferentes autores, ya que
cada estudioso la define de acuerdo con lo que utiliza de ella y tenemos definiciones
como que la estadstica es la tecnologa del mtodo cientfico, o que es el conocimiento
relacionado con la toma de decisiones en condiciones de incertidumbre, o que la
estadstica son mtodos para obtener conclusiones a partir de los resultados de los
experimentos o procesos, o que es un mtodo para describir o medir las propiedades de
una poblacin. En fin, no se trata de discutir si la estadstica es una ciencia, una tcnica
o una herramienta, sino de la utilizacin de sus mtodos en provecho de la evolucin del
conocimiento.

La estadstica hace inferencias sobre una poblacin, partiendo de una muestra


representativa de ella. Es a partir del proceso del diseo y toma de la muestra desde
donde comienzan a definirse las bondades y confiabilidad de nuestras aseveraciones,
hechas, preferentemente, con un mnimo costo y mnimo error posible.

En las ltimas dcadas la estadstica ha alcanzado un alto grado de desarrollo, hasta el


punto de incursionar en la totalidad de las ciencias; inclusive, en la lingstica se aplican
tcnicas estadsticas para esclarecer la paternidad de un escrito o los caracteres ms
relevantes de un idioma.

La estadstica es una ciencia auxiliar para todas las ramas del saber; su utilidad se
entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan
cierto grado de incertidumbre... y la Estadstica ayuda en la incertidumbre, trabaja con
ella y nos orienta para tomar las decisiones con un determinado grado de confianza.
BIBLIOGRAFA

Canavos, George C. (1988). "Probabilidad y Estadstica. Aplicaciones y


Mtodos". Ed.: Mc Graw Hill.F
Lara Porras A.M. (2002). "Estadstica para Ciencias Biolgicas y Ciencias
Ambien- tales. Problemas y Exmenes Resueltos". Ed.: Proyecto Sur. F
https://es.scribd.com/doc/39282769/TRABAJO-DE-MUESTREO
https://personal.ua.es/es/francisco-
frances/materiales/tema3/muestreo_probabilstico_y_no_probabilstico.html
https://explorable.com/es/muestreo-probabilistico
https://es.wikipedia.org/wiki/SPSS
http://spssca.com/yahoo_site_admin/assets/docs/Procedimiento_de_instalacion_S
PSS20.148152121.pdf
https://www.uam.es/personal_pdi/economicas/eva/pdf/introspss.pdf
https://www.uam.es/personal_pdi/psicologia/carmenx/Tema8.pdf
https://es.wikipedia.org/wiki/Error_muestral
https://explorable.com/es/error-de-muestreo

https://es.wikipedia.org/wiki/Tama%C3%B1o_de_la_muestra

https://explorable.com/es/tamano-de-la-muestra

http://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadisticaII/tema4.
pdf
http://inferencial1.blogspot.com/p/unidad-1.html
https://www.clubensayos.com/Temas-Variados/IMPORTANCIA-DE-LA-
ESTADISTICA-INFERENCIAL-EN-LAINVESTIGACI%C3%93N/996702.html
https://es.slideshare.net/maguieb/estadsticainferencial16313544?next_slideshow=
1
https://www2.ulpgc.es/hege/almacen/download/5/5509/Tema_1.pdf
https://www.u-cursos.cl/ingenieria/2009/2/MA3403/3/material_docente/bajar?id