Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CENSO.
Es la actividad que comprende el estudio de la totalidad de los elementos
(poblacin) que componen el suceso analizado para la obtencin de datos. Se
incluyen investigaciones en las que se obtienen datos mediante un listado o
enumeracin completa de diversas caractersticas de la poblacin en estudio.
Los Censos son el estudio en un momento determinado de todos los elementos
de un sector, comunidad o del total de la poblacin con fines estadsticos.
MUESTRA
Cuando se habla de muestra no se estudia toda la poblacin sino un fragmento
de ella, que contiene las caractersticas que se desean estudiar, su seleccin se
hace en forma aleatoria o probabilstica (aplicando tcnicas de muestreo) y
debe ser estadsticamente representativa de la poblacin.
Este tipo de investigacin tambin abarca a los casos de obtencin de datos a
travs de enumeracin por muestreo en datos administrativos.
REGISTRO ADMINISTRATIVO
A travs de los registros administrativos se obtienen datos de manera continua
de un suceso o actividad a medida que se va generando el mismo. Representa
la obtencin de datos de una fuente primaria. Aqu el formato administrativo
utilizado (registro / formulario) puede ser elaborado por el mismo Organismo
Responsable o por otras Instituciones.
ESTADSTICAS SECUNDARIAS
Por estadsticas secundarias se consideran todas las operaciones estadsticas
que generen resultados en funcin de indicadores / ndices, los datos son
provenientes de fuentes internas y/o externas del Organismo responsable.
Generalmente, tambin se les conoce como Estadsticas Derivadas (o de
sntesis): que parten de valores de varias estadsticas y mediante un
procedimiento tcnico de reelaboracin se obtienen otros resultados
(informacin) estadsticos diferentes.
RECOPILACIONES DE OTRAS FUENTES
Se refiere a la publicacin de resultados producidos a partir de otras
estadsticas, que no hayan sido objeto de reelaboracin o transformacin. Por
lo general no tienen formatos propios y no lo llena el personal del organismo,
en este caso es llenado por otra persona y solo se realizan presentaciones de
cuadros.
EL CONOCIMIENTO CIENTFICO: CARACTERSTICAS
A) OBJETIVO: independiente de opiniones o preferencias individuales,
imparciales y comprobables mediante rplica. Contraste intersubjetivo como
garante de la objetividad.
B) FCTICO: la experiencia como fuente de informacin y de respuesta a los
problemas.
Base emprica y experiencia.
C) RACIONAL: sistematizacin coherente de enunciados fundados y/o
contrastables, y logro de una teora o conjunto sistemtico y racional de ideas
sobre la realidad de que se trate.
D) CONTRASTABLE: fiabilidad por el conocimiento intersubjetivo.
E) SISTEMTICO: conocimiento ordenado, consistente y coherente en sus
elementos, totalidad interrelacionada e integrada en un sistema.
F) METDICO: fruto de una metodologa rigurosa.
G) COMUNICABLE: expresado en un lenguaje apropiado y preciso, en trminos
inequ-vocos y aceptados por la comunidad cientfica.
H) ANALTICO: seleccin de variables o cuestiones que "rompen" la unidad, la
complejidad y globalidad de los fenmenos humanos, actuando a distintos
niveles y con diversos grados de globalizacin. Seccionar la realidad.
CARACTERSTICAS DE LAS TEORAS
1) SISTEMA RELACIONAL de leyes que en mayor o menor grado tienden a ser
generales, necesarias y constantes, estando orientadas a describir, explicar y
predecir los fenmenos objeto de estudio.
2) DEDUCIBILIDAD: es posible deducir o derivar una serie de precisiones o
consecuencias de la teora.
3) CONTRASTABILIDAD: las consecuencias derivadas de la teora pueden
contrastarse con la realidad para ver si contradicen los hechos observados.
4) CONSISTENCIA: INTERNA: no pueden existir contradicciones entre las
explicaciones y predicciones que contiene una teora.
EXTERNA: no pueden entrar en contradiccin con otras teoras afines.
EL MTODO CIENTFICO
Consiste en formular cuestiones y/o problemas sobre la realidad de mundo y
de los hombres, con base en la observacin de la realidad y las teoras ya
existentes, en anticipar soluciones a estos problemas y en contrastarlos o
verificar con la misma realidad estas soluciones a los problemas, mediante la
observacin de los hechos que ofrezca, la clasificacin y el anlisis de los
mismos.
La investigacin es un proceso cclico con componentes deductivos e
inductivos.
Para ASIMOV el mtodo cientfico ideal consiste en:
1) Detectar la existencia de un problema
2) Separar y desechar los aspectos no esenciales
3) Reunir todos los datos posibles que incidan sobre el problema mediante la
observacin simple y experimental
4) Elaborar una generalizacin provisional que los describa de la manera ms
simple posible: un enunciado breve o una formulacin matemtica. Esto es una
hiptesis.
5) Con la hiptesis no se pueden predecir los resultados de experimentos no
realizados an. Ver con ellos si la hiptesis es vlida.
6) Si los experimentos funcionan, la hiptesis sale reforzada y puede
convertirse en una teora o en una ley natural.
Los Datos, Variables, Cualitativa, Cuantitativa, Discreto y Continuo.
En esta entrada se procura mostrar conceptos y diferencias entre una serie de
trminos bsicos para el anlisis estadstico.
Iniciando por los datos y sus tipos puede decirse que los datos son los valores
que adoptan las variables en cada caso particular, las variables no son ms
que aquello que estudiamos en cada individuo de la muestra, como por
ejemplo: estatura, edad, sexo, peso, antigedad en el puesto, etc. Ya habiendo
definido dato y variable, se pueden clasificar en dos grandes tipos segn lo que
se observe en ellos:
Cuantitativos: que se pueden expresar de forma numrica, los cuales a su
vez pueden ser de dos tipos: discretos: los cuales producen respuestas
numricas, pero en nmeros enteros, generalmente producto de un conteo, no
pueden tener valores intermedios en un rango, por ejemplo: nmero de
empleados o nmero de puestos que ha ocupado una persona en una
compaa, los cuales no pueden ser 450.3 empleados o 3 puestos y medio. El
otro tipo cuantitativo es el continuo: que si puede adoptar cualquier valor
numrico intermedio en un rango, generalmente producto de una medicin,
por ejemplo: edad de los empleados o sueldo de los ejecutivos, que puede ser
medido de manera precisa, como una edad de 38 aos, 6 meses y 18 das o un
sueldo de Q. 4,529.33.
Cualitativos: Tambin denominados como categricos por algunos autores, ya
que clasifican cada caso en una o varias categoras, como por ejemplo: Como
le parece la comida de la cafetera de la empresa? Que puede tener varias
categoras tales como: buena, regular y mala. En este grupo se encuentran
aquellos que producen respuestas con solo dos opciones probables como por
ejemplo: Tiene usted empleo actualmente? que solo admite s o no.
Distribucin de frecuencia
Grficos estadsticos.
Los grficos son medios popularizados y a menudo los ms convenientes para
presentar datos, se emplean para tener una representacin visual de la
totalidad de la informacin. Los grficos estadsticos presentan los datos en
forma de dibujo de tal modo que se pueda percibir fcilmente los hechos
esenciales y compararlos con otros.
UNIDAD II Y III.
Medidas descriptivas.
Las medidas descriptivas son valores numricos calculados a partir de la
muestra y que nos resumen la informacin contenida en ella.
Medidas de Posicin: Cuantiles.
Los cuantiles son valores de la distribucin que la dividen en partes iguales, es
decir, en intervalos, que comprenden el mismo nmero de valores. Los ms
usados son los cuartiles, los deciles y los percentiles.
PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto
de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15%
de las observaciones, y por encima queda el 85%
CUARTILES: son los tres valores que dividen al conjunto de datos ordenados
en cuatro partes iguales, son un caso particular de los percentiles:
- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de
los datos
- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la
mitad de los datos
- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes
de los datos
DECILES: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son tambin un caso particular de los percentiles.
Medidas de Dispersin
Las medidas de tendencia central tienen como objetivo el sintetizar los datos
en un valor representativo, las medidas de dispersin nos dicen hasta qu
punto estas medidas de tendencia central son representativas como sntesis de
la informacin. Las medidas de dispersin cuantifican la separacin, la
dispersin, la variabilidad de los valores de la distribucin respecto al valor
central. Distinguimos entre medidas de dispersin absolutas, que no son
comparables entre diferentes muestras y las relativas que nos permitirn
comparar varias muestras.
DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades
que la variable pero al cuadrado, para evitar este problema podemos usar
como medida de dispersin la desviacin tpica que se define como la raz
cuadrada positiva de la varianza
Para estimar la desviacin tpica de una poblacin a partir de los datos de una
muestra se utiliza la frmula (cuasi desviacin tpica):
Cinco personas entran a una sala en la que hay 8 sillas. De cuntas maneras
diferentes pueden ocupar las sillas?
Existen 6 resultados posibles para el primer tiro, y para cada uno de ellos, hay
6 resultados posibles para el segundo tiro. Hay 6 6, o 36, resultados posibles:
Espacio muestral: {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4),
(2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5),
(4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
El espacio muestral consiste en todos los resultados para los cuales el primero
tiro no fue 6, y el segundo tiro fue 6. Para el primer lanzamiento existan 5
resultados posibles que no son 6. Para cada uno de ellos, exista slo un posible
resultado que era 6. Entonces hay 5 1 o 5 resultados en el espacio de
eventos:
Espacio de eventos: {(1,6), (2,6), (3,6), (4,6), (5,6)}
Nota que el tamao del espacio muestral para ambos lanzamientos es el
producto del tamao del espacio muestral para cada lanzamiento. De manera
similar, el tamao del espacio de eventos par dos lanzamientos es el producto
del tamao de los espacios de eventos de cada lanzamiento.
Veamos el escenario 2:
Sacas una canica de una bolsa que contiene 2 canicas rojas, 2 blancas, y una
verde. Anotas el color, regresas la canica a la bolsa, y sacas otra canica. Cul
es la probabilidad de sacar canica roja ambas veces?
Para ayudarnos a recordar que hay dos canicas rojas, las nombraremos R1 y
R2. Haremos lo mismo con las canicas blancas, W1 y W2.
Esto es vlido para todas las situaciones con eventos independientes. Tambin
puede extenderse a ms de dos eventos.
Teorema de Bayes.
El teorema de Bayes, en la teora de la probabilidad, es una proposicin
planteada por el filsofo ingls Thomas Bayes (1702-1761)1 en 1763,2 que
expresa la probabilidad condicional de un evento aleatorio A dado B en
trminos de la distribucin de probabilidad condicional del evento B dado A y la
distribucin de probabilidad marginal de slo A.
En trminos ms generales y menos matemticos, el teorema de Bayes es de
enorme relevancia puesto que vincula la probabilidad de A dado B con la
probabilidad de B dado A. Es decir, por ejemplo, que sabiendo la probabilidad
de tener un dolor de cabeza dado que se tiene gripe, se podra saber (si se
tiene algn dato ms), la probabilidad de tener gripe si se tiene un dolor de
cabeza. Muestra este sencillo ejemplo la alta relevancia del teorema en
cuestin para la ciencia en todas sus ramas, puesto que tiene vinculacin
ntima con la comprensin de la probabilidad de aspectos causales dados los
efectos observados.
Frmula de Bayes.
Con base en la definicin de Probabilidad condicionada se obtiene la Frmula
de Bayes, tambin conocida como la Regla de Bayes:
VARIANZA
Es un promedio ponderado de las de las desviaciones al cuadrado.
Varianza = E (x - ) f (x).
DISTRIBUCIN BINOMIAL
La distribucin Binomial es un caso particular de probabilidad de variable
aleatoria discreta, y por sus aplicaciones, es posiblemente la ms importante.
Esta distribucin corresponde a la realizacin de un experimento aleatorio que
cumple con las siguientes condiciones:
* Al realizar el experimento slo son posible dos resultados: el suceso A,
llamado xito, y el suceso B, llamado fracaso.
* Al repetir el experimento, el resultado obtenido es independiente de los
resultados obtenidos anteriormente.
* La probabilidad del suceso A es constante, es decir, no vara de una prueba
del experimento a otra.
* En cada experimento se realizan n pruebas idnticas.
Todo experimento que tenga estas caractersticas se dice que sigue el modelo
de la distribucin Binomial o distribucin de Bernoulli.
En general, si se tienen n ensayos Bernoulli con probabilidad de xito p y de
fracaso q, entonces la distribucin de probabilidad que la modela es la
distribucin de probabilidad binomial y su regla de correspondencia es:
Donde:
P(X)= es la probabilidad de ocurrencia del evento
p = es la probabilidad de xito del evento (en un intento)
q = es la probabilidad de fracaso del evento (en un intento) (se define como q
= 1 p)
X = ocurrencia del evento o xitos deseados
n = nmero de intentos
EJEMPLO:
Cul es la probabilidad de obtener exactamente 2 caras al lanzar una misma
moneda 6 veces?
Dnde:
P(X)= Probabilidad de que ocurra el evento
p = (0.5)
q = (se define como q = 1 p) (0.5)
X=2
n=6
Al sustituir los valores en la frmula obtenemos:
DISTRIBUCIN DE POISSON
La distribucin de POISSON es tambin un caso particular de probabilidad de
variable aleatoria discreta, el cual debe su nombre a Simon Denis Poisson
(1781-1840), un francs que la desarroll a partir de los estudios que realiz
durante la ltima etapa de su vida.
Es til cuando tratamos con cantidades de ocurrencia de un evento a lo largo
de un intervalo de tiempo o espacio especificado.
Esta distribucin se utiliza para describir ciertos procesos.
Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad
de rea, tiempo, pieza, etc:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo,
rea, o producto, la frmula a utilizar sera:
Donde:
p(X)= probabilidad de que ocurran x xitos, cuando el nmero promedio de
ocurrencia de ellos es /.
/= media o promedio de xitos por unidad de tiempo, rea o producto
e = 2.718 (base de logaritmo neperiano o natural)
X = variable que nos denota el nmero de xitos que se desea que ocurra
Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren
por unidad de tiempo, rea o producto es totalmente al azar y que cada
intervalo de tiempo es independiente de otro intervalo dado, as como cada
rea es independiente de otra rea dada y cada producto es independiente de
otro producto dado.
EJEMPLO:
Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b)
10 cheques sin fondos en cualquiera de dos das consecutivos? (e=
2.718281828)
Resolviendo para:
a) x = 4; / = 6 cheques sin fondo por da
Comprobando (sustituyendo en la frmula):
Por lo tanto la probabilidad de que el banco reciba cuatro cheques sin fondo en
un da dado es de 0.133853 (13.39%)
Valores directos para determinar probabilidades de Poisson.
Para un valor dado de /, la entrada indica la probabilidad de obtener un valor
especfico de X
Para el
Existen dos razones bsicas por las cuales la distribucin normal ocupa un
lugar tan prominente en la estadstica:
Tiene algunas propiedades que la hacen aplicable a un gran nmero de
situaciones en la que es necesario hacer inferencias mediante la toma de
muestras.
La distribucin normal casi se ajusta a las distribuciones de frecuencias reales
observadas en muchos fenmenos, incluyendo caractersticas humanas,
resultados de procesos fsicos y muchas otras medidas de inters para los
administradores, tanto en el sector pblico como en el privado.
Propiedad:
No importa cules sean los valores de y σ para un distribucin de
probabilidad normal, el rea total bajo la curva siempre es 1, de manera que
podemos pensar en reas bajo la curva como si fueran probabilidades.
Matemticamente es verdad que:
Aproximadamente el 68% de todos los valores de una poblacin normalmente
distribuida se encuentra dentro de 1 desviacin estndar de la media.
Aproximadamente el 95.5% de todos los valores de una poblacin
normalmente distribuida se encuentra dentro de 2 desviaciones estndar de
la media.
Aproximadamente el 99.7% de todos los valores de una poblacin
normalmente distribuida se encuentra dentro de 3 desviaciones estndar de
la media.
En la que:
x = valor de la variable aleatoria que nos preocupa.
= media de la distribucin de la variable aleatoria.
σ = desviacin estndar de la distribucin.
z = nmero de desviaciones estndar que hay desde x a la media de la
distribucin. (El uso de z es solamente un cambio de escala de medicin del eje
horizontal).
Distribucin normal que ilustra la comparacin de los valores de z y las
desviaciones estndar
EJEMPLO.
Partiendo de la misma premisa, = 500 y σ = 100. Cul es la
probabilidad de que un candidato elegido al azar se tome entre 500 y 650
horas en completar el programa de entrenamiento?
Prueba F.
El anlisis de Varianza contrasta la hiptesis de igualdad de las Medias de ms
de dos grupos, y tiene su fundamento en la relacin entre la variacin
explicada por las diferencias entre grupos y la variacin individual.
Consideremos la siguiente situacin: Queremos comparar la efectividad de
cuatro tratamientos de la depresin, para lo que aplicamos los tratamientos a
cuatro grupos de pacientes seleccionados aleatoriamente. A finales del
tratamiento recogemos los datos, que son:
Donde:
Donde
glI: grados de libertad "intra"= J(n-1).
La Media Cuadrtica "intra" mide la variacin explicada por diferencias
individuales porque solo depende de las diferencias dentro de cada grupo. En
cambio, las diferencias entre grupos no explican la variacin "intra".
e) El estadstico F pone en relacin la variacin "entre" respeto de la variacin
"intra":
Tomara el valor 0 (porque las diferencias dentro del parntesis siempre seran
0).
En consecuencia, el estadstico F sera una razn de dos estimadores de la
misma Varianza y seguira la distribucin F con J-1 y J(n-1) grados de libertad.
h) Si la Hiptesis Nula fuera falsa, es a decir, si hubiera diferencias entre las
Medias poblacionales, la expresin.
Tomara un valor superior a 0. En consecuencia, el estadstico F NO sera una
razn de dos estimadores de la misma Varianza y el cociente F NO seguira la
distribucin FJ-1,J(n-1).
En conclusin, si el estadstico F sigue la distribucin FJ-1,J(n-1) pensaremos
que no hay evidencia suficiente por rechazar la Hiptesis Nula. En cambio, si el
estadstico F NO sigue la distribucin FJ-1,J(n-1), pensaremos que es ms
razonable rechazar la Hiptesis Nula.
Prueba de chi-cuadrado.
Una prueba de chi-cuadrado es una prueba de hiptesis que compara la
distribucin observada de los datos con una distribucin esperada de los datos.
Existen varios tipos de pruebas de chi-cuadrado:
Prueba de chi-cuadrado de bondad de ajuste
Utilice este anlisis para probar qu tan bien una muestra de datos categricos
se ajusta a una distribucin terica.
Por ejemplo, usted puede comprobar si un dado es justo, lanzando el dado
muchas veces y utilizando una prueba de chi-cuadrado de bondad de ajuste
para determinar si los resultados siguen una distribucin uniforme. En este
caso, el estadstico chi-cuadrado cuantifica qu tanto vara la distribucin
observada de conteos con respecto a la distribucin hipottica.
Pruebas de chi-cuadrado de asociacin e independencia
Los clculos para estas pruebas son iguales, pero la pregunta que se est
tratando de contestar puede ser diferente.
Prueba de asociacin: utilice una prueba de asociacin para determinar si una
variable est asociada a otra variable. Por ejemplo, determine si las ventas de
diferentes colores de automviles dependen de la ciudad donde se venden.
Prueba de independencia: utilice una prueba de independencia para
determinar si el valor observado de una variable depende del valor observado
de otra variable. Por ejemplo, determine si el hecho de que una persona vote
por un candidato no depende del sexo del elector.