Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de Estadı́stica
Fundamentos Conceptuales
de Estadı́stica
1 Introducción 1
1.1 Formas del saber . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Saber Cotidiano . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Saber Cientı́fico . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Método cientı́fico e investigación . . . . . . . . . . . . . . . . . 2
1.2.1 Caracterı́sticas de un Método Cientı́fico . . . . . . . . . 3
1.2.2 Investigación y su Procedimiento . . . . . . . . . . . . . 3
1.3 La Estadı́stica y la Investigación . . . . . . . . . . . . . . . . . 4
1.4 Reseña histórica de la Estadı́stica . . . . . . . . . . . . . . . . . 5
iv
ÍNDICE GENERAL v
2.4.5 El Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.6 Los Parámetros y las Estadı́sticas . . . . . . . . . . . . . 21
3 Metodologı́a de la Estadı́stica 22
3.1 Definición de Objetivos . . . . . . . . . . . . . . . . . . . . . . 22
3.2 Definición del colectivo o población . . . . . . . . . . . . . . . . 23
3.3 Determinación de la cobertura . . . . . . . . . . . . . . . . . . 23
3.4 Determinación del marco de muestreo . . . . . . . . . . . . . . 23
3.4.1 Definición . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4.2 Problemas del Marco . . . . . . . . . . . . . . . . . . . . 24
3.4.3 Soluciones Generales . . . . . . . . . . . . . . . . . . . . 24
3.5 Definición de unidades . . . . . . . . . . . . . . . . . . . . . . . 25
3.5.1 Unidad Poblacional . . . . . . . . . . . . . . . . . . . . 25
3.5.2 Unidad Muestral . . . . . . . . . . . . . . . . . . . . . . 25
3.5.3 Unidades de Observación . . . . . . . . . . . . . . . . . 25
3.6 Determinación del diseño muestral . . . . . . . . . . . . . . . . 26
3.6.1 Muestreo No Probabilı́stico . . . . . . . . . . . . . . . . 26
3.6.2 Muestreo Probabilı́stico . . . . . . . . . . . . . . . . . . 27
3.7 Recolección de información . . . . . . . . . . . . . . . . . . . . 27
3.8 Tratamiento de la información . . . . . . . . . . . . . . . . . . 28
3.8.1 Distribuciones de Frecuencias . . . . . . . . . . . . . . . 28
3.8.2 Clasificación Unidimensional . . . . . . . . . . . . . . . 29
3.8.3 Clasificación Bi y Pluridimensional . . . . . . . . . . . . 31
3.9 Análisis e Interpretación . . . . . . . . . . . . . . . . . . . . . . 33
9 La estimación estadı́stica 72
9.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
9.2 Algunas propiedades de un buen estimador . . . . . . . . . . . 73
9.2.1 Insesgamiento . . . . . . . . . . . . . . . . . . . . . . . . 73
9.2.2 Consistencia . . . . . . . . . . . . . . . . . . . . . . . . 74
9.2.3 Eficiencia relativa . . . . . . . . . . . . . . . . . . . . . . 74
9.2.4 Suficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . 75
9.3 Formas de hacer estimaciones . . . . . . . . . . . . . . . . . . . 75
Introducción
1
2 CAPÍTULO 1. INTRODUCCIÓN
Finalmente y solo a principios del siglo XX, una segunda escuela inglesa,
principalmente preocupada con problemas de estudio e investigación en
agronomı́a y biometrı́a, inicia y pone los cimientos de la ciencia a la que
nos referimos actualmente con la palabra Estadı́stica. Son sus principales
componentes: Galton, Karl Pearson, W. Gosset (Student), R. A. Fisher.
CAPÍTULO 2
9
10 CAPÍTULO 2. CONCEPTOS FUNDAMENTALES DE ESTADÍSTICA
hechos.
2.4.3.1. La Medición
Lundberg
“Cuando uno puede medir y expresar numéricamente lo que dice, conoce
algo de ello; pero mientras no pueda uno medir ni expresarse en números, su
conocimiento es escaso y poco satisfactorio”: Lord Kelvin
“Contar hechos observables es la operación básica de la medición. Contar
o computar es establecer una correspondencia biunı́voca entre el conjunto de
objetos que hay que contar y un subconjunto de los enteros positivos... Para
que una colección de hechos sea empı́ricamente contable, tiene que consistir en
miembros empı́ricamente distinguibles”: (Bunge 1972)
Las citas anteriores, algunas de ellas demasiado extremas, son evidencia de
la importancia que para los tratadistas de la ciencia, la metodologı́a cientı́fica y
la investigación, tienen la medición y la cuantificación. Pero es conveniente
tratar de responder a la inquietud relativa a si estos conceptos significan lo
mismo, si tienen la misma acepción y aplicación.
En el sentido más corriente y elemental, el concepto de medir es utilizado
para significar la asignación de valores numéricos o dimensiones a un objeto
u objetos mediante la utilización de determinados procedimientos. En términos
más estrictamente metodológicos, la medición consiste sustancialmente
en una observación cuantitativa, atribuyendo un número a determinadas
caracterı́sticas o rasgos del hecho o fenómeno observado. Esto no presenta
mayores inconvenientes si se trata de medir aspectos materiales y morfológicos
de los objetos de estudio; la dificultad aparece cuando se desean expresar
numéricamente aspectos más evanescentes e intangibles.
Cuando un fı́sico habla acerca de la medición, se refiere generalmente a
la asignación de números a observaciones, de modo que los números sean
susceptibles de análisis por medio de manipulaciones u operaciones de acuerdo
con ciertas reglas. Este análisis por manipulación, en el mejor sentido de la
palabra, dará nuevas informaciones de los objetos que se están midiendo. En
otras palabras, la relación entre los objetos que se están observando y los
números, es tan directa que mediante la manipulación de los números el fı́sico
obtiene nueva información acerca de los objetos. Por ejemplo, puede determinar
el peso de una masa de material homogéneo que haya sido partida por la mitad,
dividiendo su peso por dos.
En las ciencias sociales, el cientı́fico social, que toma al fı́sico como modelo,
suele intentar algo parecido a la calificación o medición de las variables sociales;
pero, en sus escalas, el investigador social muy a menudo menosprecia un
fundamento de la teorı́a de la medición.
Pasa por alto que, para hacer ciertas operaciones con los números que ha
asignado a las observaciones, la estructura del método de correspondencia de
los números (puntajes) a las observaciones debe ser isomórfica con respecto a
alguna estructura numérica que incluya estas operaciones. Si los dos sistemas
son isomórficos, sus estructuras son las mismas en las relaciones y operaciones
14 CAPÍTULO 2. CONCEPTOS FUNDAMENTALES DE ESTADÍSTICA
Una escala conceptual y una escala material sobre las cuales puede
registrarse o medirse la magnitud,
Aunque se acepta que los elementos presentados por (Bunge 1972) son
necesarios, sin embargo no son suficientes para emprender una operación de
medición y consecuentemente tratar de establecer las diferentes escalas o niveles
de medición, concepto este que se adoptará, más como proceso de observación,
que como proceso de análisis.
El proceso de medición tiene como propósito inicial distinguir y por ende
clasificar objetos, casos, fenómenos y debe responder a una serie de principios
o requisitos que se enuncian a continuación.
En primer lugar el proceso de medición debe ser válido, entendiéndose
que cumple este requisito cuando mide de alguna manera demostrable aquello
que trata de medir, libre de distorsiones sistemáticas. Cabe anotar que existen
diferentes métodos de validación, a saber: La validez pragmática, consistente
en encontrar un criterio exterior al instrumento de medida, para relacionarlo
con las puntuaciones obtenidas. La validez predictiva, que se comprueba por
los resultados obtenidos en el futuro, y la validez concurrente, que contrasta
resultados de otros elementos de juicio, con tipos de validez pragmática. Otro
procedimiento de validación es el análisis factorial, aunque su aplicación se
limita principalmente a los aspectos psicosociales.
El segundo principio deseable en la medición es la fiabilidad. Una medición
es confiable o segura cuando aplicada repetidamente a un mismo individuo o
grupo, o al mismo tiempo por investigadores diferentes, proporciona resultados
iguales o por lo menos parecidos. La determinación de la confiabilidad consiste
pues, en establecer si las diferencias de resultados se deben a inconsistencias en
la medida.
El problema de la fiabilidad se presenta en el instrumental que se utiliza,
cuando la validez de las mediciones ofrece dudas en relación con lo que se
quiere medir. Los procedimientos más usuales para la determinación de la
fiabilidad son el análisis de la estabilidad de los resultados, mediante la
aplicación de mediciones repetidas y la equivalencia de los resultados cuando
los instrumentos son administrados por diferentes personas.
Finalmente se tiene el principio de la precisión. Se puede decir que una
medición es precisa cuando localiza con exactitud satisfactoria, en relación con
el propósito que se busca, la posición del fenómeno que se estudia.
El nivel de medida o escala de medida, expresiones aceptadas casi
universalmente, está formado por un conjunto de numerales distintos y un
conjunto de modalidades distintas relacionadas biunı́vocamente. Se suelen
distinguir cuatro niveles de medición que dan lugar a cuatro niveles de escalas:
nominal ordinal o de orden jerárquico, de intervalos y de razón o cociente.
Ahora bien, el tipo de escala estará dado, según sea verificable uno u otro tipo
de relación.
2.4. SISTEMA CONCEPTUAL BÁSICO 17
sı́. Los numerales empleados en las escalas ordinales no son cuantitativos, sino
que indican exclusivamente la posición en la serie ordenada y no “cual es” la
diferencia entre posiciones sucesivas de la escala.
Las relaciones entre los elementos en clasificación, pueden formularse con el
signo >, mayor que, o sea que axiomáticamente la diferencia fundamental entre
una escala nominal y una ordinal es que esta última incorpora no solamente
la relación de equivalencia (=) sino también la relación “más grande que”
(>). Esta relación es irreflexiva (no es verdad para ninguna x tal que x > x),
asimétrica (x > y luego x < y) y transitiva (x > y y y > z luego x > z).
Puesto que cualquier transformación tendiente a conservar el orden no altera
la información contenida en una escala ordinal, se dice que la escala es “única
hasta una transformación monotónica”. Esto es, no importa que números se
den a una pareja de clases o a los miembros de esas clases, siempre que el
número mayor sea dado a los miembros de la clase mayor o más preferida. Por
supuesto, pueden usarse números menores para grados más preferidos (...de
primera clase, de segunda clase, etc.); en tanto se sea consecuente, es indiferente
el uso del número mayor o menor para denotar “mayor” o “más preferido”.
Fundamentalmente, las escalas ordinales se estudian en Estadı́stica, con base
en las llamadas “estadı́sticas de orden” o “estadı́sticas de rango”.
Cuando una escala tiene todas las caracterı́sticas de una escala de intervalo
y además un punto cero real en su origen, se llama escala de razón. Además
de distinción, orden y distancia, ésta es una escala que permite establecer en
qué proporción es mayor una categorı́a de una escala que otra. El cero absoluto
o natural representa la nulidad de lo que se estudia.
Las operaciones y relaciones hechas con los valores numéricos en una escala
de razón son correspondientes a una escala isomórfica de la estructura de la
aritmética. Por consiguiente las operaciones de la aritmética son permisibles en
los valores numéricos asignados a los objetos mismos, ası́ como también en los
intervalos entre los números como sucede en las escalas de intervalo. Implican
que las relaciones de equivalencia, relación de mayor a menor, proporción
conocida de dos intervalos y proporción conocida de dos valores de la escala,
sean posibles de obtener operacionalmente.
Los números asociados con los valores de la escala de razón son “verdaderos”
números con un verdadero cero; solo la unidad de medida es arbitraria. Ası́ la
escala de razón es “única hasta la multiplicación por una constante positiva”.
Además de los procesos paramétricos básicos de las escalas de intervalo, en las
de razón pueden utilizarse estadı́sticas como la media geométrica, el coeficiente
de variación, las que requieren el conocimiento del verdadero valor cero.
2.4.5. El Muestreo
Para resolver los problemas que en general se presentan para realizar
censos, se ha desarrollado el método de muestreo, el cual de manera sencilla
puede definirse como un método cientı́fico que pone en práctica principios
estadı́stico – matemáticos, que permiten obtener información de una PARTE
de los elementos del agregado y hacer inferencias acerca de las caracterı́sticas
estudiadas, para todo el colectivo de origen.
Las principales caracterı́sticas del método son:
Metodologı́a de la Estadı́stica
22
3.2. DEFINICIÓN DEL COLECTIVO O POBLACIÓN 23
3.4.1. Definición
Se entiende por Marco de Muestreo o Marco Muestral, todo artificio
o conjunto de artificios, que permita la identificación y ubicación de todos y
cada uno de los elementos de la población o en su defecto, de todas y cada
una de las unidades muestrales, ya que es la base del proceso de selección de
la muestra.
Los factores relevantes de la naturaleza del marco disponible o factible,
24 CAPÍTULO 3. METODOLOGÍA DE LA ESTADÍSTICA
a. nj ≥ 0
b. nj ≤ n
m
P
c. nj = n
j=1
a. fj ≥ 0
b. fj ≤ 1
m
P
c. fj = 1
j=1
FRECUENCIAS FRECUENCIAS
CLASES
ABSOLUTAS RELATIVAS
C1 n1 f1
C2 n2 f2
.. .. ..
. . .
Cj nj fj
.. .. ..
. . .
Cm nm fm
TOTAL N 1
a. njk ≥ 0
b. njk ≤ n
c. njk ≥ nj·
d. njk ≥ n·k
m P
P w
e. njk = n
j=1 k=1
32 CAPÍTULO 3. METODOLOGÍA DE LA ESTADÍSTICA
w
P
f. njk = nj·
k=1
m
P
g. njk = n·k
j=1
w
P
d. fjk = nj·
k=1
m
P
e. fjk = n·k
j=1
4.1. Introducción
En general cuando se observan variables no – cuantitativas en los elementos
de una población o de una muestra, el interés posterior a este proceso se centra
no solo en analizar comportamientos generalizados de las mismas, sino, más
comúnmente, en establecer si existen relaciones de correspondencia, coligación
o asociación entre dos o más de tales variables. Las variables no cuantitativas se
generan por escalas de medición nominal u ordinal, a diferencia de las variables
cuantitativas generadas por escalas de intervalo o de razón.
Los métodos para analizar las variables no cuantitativas son de
diversa ı́ndole, siendo los más preponderantes hoy en dı́a el Análisis de
Correspondencias, la Clasificación Automática, la Estadı́stica Textual, métodos
que superan los alcances de estas notas, en las cuales solo se presentan
fundamentos de tipo esencialmente descriptivo, para el tratamiento de tales
variables.
35
36 CAPÍTULO 4. ANÁLISIS DE VARIABLES NO CUANTITATIVAS
CLASES B1 B2 TOTAL
A1 n11 n11 n1·
A2 n21 n21 n2·
TOTAL n·1 n·2 n
a. n12 ≥ 0
b. n12 ≤ n·2
c. n12 ≤ n1·
d. n11 + n12 + n21 + n22 = n
e. n12 ≥ n1· + n·2 − n
Existen otras formas del criterio de independencia que son más útiles, desde el
punto de vista teórico. Ası́, a partir de la primera forma expuesta anteriormente,
se tiene:
n11 n − n11
= 1·
n·1 n − n·1
por tanto:
n − n·1 n − n12
= 1·
n·1 n12
y finalmente:
n12 n
= ·2
n1· n
De manera similar.
n12 n n n n n n
= 1· ⇒ n12 = 1· ·2 ⇒ 12 = 1· ·2
n·2 n n n n n
Esta última forma obtenida aquı́ descriptivamente, corresponde al criterio de
independencia probabilı́stica entre dos eventos cualesquiera, que para el caso
de la intersección de los mismos expresa que:
lo cual equivale a que si entre dos clases de dos variables existe independencia,
la proporción de casos en la clase conjunta, con respecto al total de casos, es
igual al producto entre las proporciones de casos, con respecto al total, de cada
clase.
Si la anterior relación se verifica, relaciones análogas se verificarán para las
otras tres clases conjuntas y por tanto se puede encontrar otra forma del criterio
de independencia, considerando que:
n1· n·2 n2· n·1
n12 n21 =
n2
38 CAPÍTULO 4. ANÁLISIS DE VARIABLES NO CUANTITATIVAS
n11 n
> 1·
n·1 n
porque es evidente que si la mayorı́a de casos considerados son B1 , esto
es que se aproximan a n entonces la relación de los A1 a los B1 se
aproximará necesariamente a su relación con el total de casos, aunque la
diferencia de relación con los B2 sea considerable, por lo que la segunda forma
se presta a confusiones.
Las comparaciones que se basan en proporciones respecto al total de filas y/o
columnas, son conocidas como perfiles fila y perfiles columna respectivamente, y
constituyen la base de métodos más avanzados del análisis de correspondencias.
En el caso esencialmente descriptivo, además de valorar la relación de
concordancia entre clases, algunos autores han propuesto “indicadores” de
la intensidad de la relación, que involucre no solo a algunas clases de las dos
variables, sino a estas en su conjunto.
En la determinación de tales indicadores, son deseables las siguientes
caracterı́sticas:
a. El ı́ndice tendrá un valor máximo fijo (usualmente 1) para todos los casos
de correspondencia completa y un valor fijo (generalmente 0) si existe
independencia (esto no excluye la posibilidad de que ocasionalmente el
indicador sea negativo)
40 CAPÍTULO 4. ANÁLISIS DE VARIABLES NO CUANTITATIVAS
Se deduce que:
2Y
Q=
1+Y2
Los anteriores indicadores son fundamentalmente descriptivos, pero no implican
necesariamente la existencia de independencia o de relación, ya que para
rechazar el supuesto de independencia, es necesario desarrollar pruebas de
hipótesis estadı́sticas, tema que se presentará posteriormente en estas notas.
Sin embargo se expone la prueba más conocida, para el supuesto de
independencia entre dos variables de naturaleza no – cuantitativa clasificadas
dicotómicamente, basada en una variable Chi – cuadrado, con distribución Chi
– cuadrado con un grado de libertad. La variable tiene la forma:
2
2 n |n11 n22 − n12 n21 | − n2
χ =
(n11 + n12 ) (n21 + n22 ) (n11 + n21 ) (n12 + n22 )
Esta variable resulta de comparar las frecuencias observadas en las clases
conjuntas, con las correspondientes esperadas si la hipótesis de independencia
se cumpliera. La prueba es unilateral a la derecha y requiere que las frecuencias
esperadas no sean muy pequeñas (no menores que cinco).
4.2. ANÁLISIS BÁSICO EN TABLAS 2 X 2 41
C1 C2
CLASES TOTAL
B1 B2 B1 B2
A1 n111 n121 n112 n122 n1··
A2 n211 n221 n212 n222 n2··
TOTAL n·11 n·21 n·12 n·22 n
1. n121 ≥ 0
2. n121 ≤ n·21 ; n121 ≤ n1·1 ; n121 ≤ n12·
3. n121 ≤ n1·· ; n121 ≤ n·2· ; n121 ≤ n··1
4. n111 + n112 + n121 + n122 + n211 + n212 + n221 + n222 = n
n121 n1·1
1. n·21 > n··1
n121 n·21
2. n1·1 > n··1
n121 n111
3. n·21 > n·11
n121 n221
4. n1·1 > n2·1
44
5.1. MEDIDAS CARACTERÍSTICAS UNIDIMENSIONALES 45
1. −∞ ≤ M (x) ≤ ∞
2. M (x − x̄) = 0
3. M (x − x̄)2 = mı́n
4. M (k) = k
!
m
P m
P
5. M xj = M xj
j=1 j=1
6. M (x ± k) = M (x) ± k
7. M (kx) = kM (x)
8. M (k1 ± k2 x) = k1 ± k2 M (x)
!
m
Q m
Q
9. M xj = M xj si las variables son independientes.
j=1 j=1
46 CAPÍTULO 5. ANÁLISIS DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA
5.1.2. La Varianza
Partiendo del hecho de que la tendencia generalizada de los datos se
ha representado o sintetizado por el promedio, será pertinente observar la
diferencia entre los datos (representados) y la media (representante), para tener
alguna idea de que tan buena es tal representación. Si en suma tales diferencias
son pequeñas, se deberá a buena representación o sea que los datos realmente
tienen alguna tendencia. En caso contrario, esto último deberá descartarse.
Para corroborar lo anterior, obsérvense los tres conjuntos de dalos siguientes:
1. V (x) ≥ 0
2. V (k) = 0
!
m
P m
P
3. V xj = V xj si las variables son independientes.
j=1 j=1
4. V (x ± k) = V (x)
5. V (kx) = k 2 V (x)
0.01tn − Nk−1
Pt = ẋk−1 + ck
nk
5.1.5. La Moda
Conocida también con los nombres de Modo, Promedio Tı́pico o Valor
Modal se define como el valor de la variable que más se repite o sea el que
aparece con mayor frecuencia En términos de probabilidad corresponde al valor
más probable.
50 CAPÍTULO 5. ANÁLISIS DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA
nk − nk−1
Md = ẋk−1 + ck
2nk − nk−1 − nk+1
6.1. La regresión
En múltiples estudios estadı́sticos, aparece como una gran necesidad
práctica, el considerar simultáneamente dos o más variables, con el fin de
analizar si entre ellas existe alguna relación, si la misma se puede formalizar
y que tan intensa es la misma. Se trata de establecer fundamentalmente, con
respecto a la relación:
la existencia
la forma
la intensidad
Los métodos estadı́sticos utilizados para éstos análisis son conocidos como
Métodos de Regresión y Correlación y el supuesto de partida para su desarrollo,
considera que algunas de las variables explican en parte, el comportamiento
de otras. Este supuesto establece una división general entre las variables
consideradas, clasificándolas en dos grupos constituidos por las variables
explicativas y las variables explicadas.
El objetivo de este tipo de procesos es tratar de estimar o predecir
o conjeturar valores de las variables explicadas, con base en valores
dados o supuestos de las explicativas. Por tal razón son llamadas también
éstas, variables explicativas o predictoras y las anteriores variables
estimadas o predictando. Otros nombres no muy adecuados, son los de
51
52 CAPÍTULO 6. ESTUDIOS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS
Y = β0 + β1 x1 + β2 x2 + · · · + +βp xp + u = E(Y ) + u
R2 , o sea:
Variación explicada
R2 =
Variación total
Como se anotó anteriormente, esta descomposición es trascendental en el
análisis e interpretación del modelo, ası́ como en los procesos inferenciales
correspondientes y aunque no es la única, si es fundamental para otros análisis
similares más complejos.
CAPÍTULO 7
n
P Aj = j
n
nj =resultados favorables; n =resultados posibles
P Aj ∪ Ak = P (Aj ) + P (Ak ) − P (Aj ∩ Ak ); si Aj ∩ Ak 6= ∅
Generalización
m
! m m
[ X X
P Ai = P (Ai ) − P (Ai ∩ Aj )
i=1 i=1 i<j
m m
!
X \
m−1
+ P (Ai ∩ Aj ∩ Ak ) − · · · + (−1) P Ai
i<j<k i=1
si Ai ∩ Aj 6= ∅ ∀i 6= j
55
56 CAPÍTULO 7. ALGUNOS CONCEPTOS DE PROBABILIDAD
P (Ai ) P Aj ;
si Ai y Aj son independientes
P Ai ∪ Aj =
P (Ai ) P Aj |Ai ; si Ai y Aj no son independientes
m
! m
\ Y
P Ai = P (Ai ); si los eventos son independientes dos a dos
i=1 i=1
m
!
\
P Ai = P (A1 )P (A2 |A1 )P (A3 |A1 A2 ) · · · P (Am |A1 A2 . . . Am−1 )
i=1
P (Aj ∩ Ai )
P (Aj |Ai ) = ; con P (Ai ) > 0
P (Ai )
P (Ek )P (A|Ek )
P (Ek |A) = P
m ; siendo 1 ≤ k ≤ m
P (Ei )P (A|Ei )
i=1
ii. P
fX (x) = 1
en el caso discreto
∀x
R
fX (x)dx = 1 en el caso continuo
∀x
P (X ≤ xj )
P∞
xfX (x) si la variable es discreta
x=−∞
E(X) = µ =
R∞
xfX (x)dx si la variable es continua
−∞
PROPIEDADES
1. −∞ ≤ E(X) ≤ ∞
2. E(X − µ) = 0
58 CAPÍTULO 7. ALGUNOS CONCEPTOS DE PROBABILIDAD
6. E(X ± k) = E(X) ± k
7. E(kX) = kE(X)
8. E(k1 ± k2 X) = k1 ± k2 E(X)
!
m
Q m
Q
9. E Xj = E Xj si las variables son independientes.
j=1 j=1
7.5. La varianza
P∞ ∞
2
x2 fX (x) − µ2
P
(x − µ) fX (x) = si la variable es discreta
x=−∞
x=−∞
V (X) = σ 2 =
R∞ 2 R∞ 2
(x − µ) fX (x)dx = x fX (x)dx − µ2 si la variable es continua
−∞ −∞
PROPIEDADES
1. V (X) ≥ 0
2. V (k) = 0
!
m
P m
P
3. V Xj = V Xj si las variables son independientes.
j=1 j=1
4. V (X ± k) = V (X)
5. V (kX) = k 2 V (X)
6. V (k1 ± k2 X) = k22 V (X)
7.6. FUNCIONES ESPECIALES DE PROBABILIDAD 59
7.6.2. Binomial
a. Se realizan “n” repeticiones independientes de un proceso Bernoulli.
b. Interesa determinar la probabilidad de que se presenten “x” aciertos en las
n repeticiones,
c. Se define:
X = número de aciertos en las n repeticiones
x = 0, 1, 2, 3, . . . , n
7.6.4. Geométrica
En la binomial negativa se quiere que k = 1, por tanto:
x = l, 2, 3, 4, 5, . . .
La función adquiere entonces la forma:
BN (x; P ) = P Qx−1
Y además:
1 Q
E(X) = ; V (X) =
P P2
7.6.5. Hipergeométrica
a. De un conjunto o población de “N ” elementos, se seleccionan al azar y sin
Reemplazamiento “n” de ellos.
b. En los N elementos existen “M ” con cierta caracterı́stica de interés.
c. Se quiere determinar la probabilidad de encontrar “x” elementos con la
caracterı́stica de interés, en los n que se seleccionen.
7.6. FUNCIONES ESPECIALES DE PROBABILIDAD 61
La función es de la forma:
M N −M
x n−x
H(x; N, n, M ) = N
n
nM nM (N − M ) N − n
E(X) = ; V (X) =
N N2 N −1
7.6.6. Poisson
a. Se asocia con fenómenos o sucesos definidos en determinados intervalos de
tiempo y/o regiones de espacio.
b. La probabilidad de que el fenómeno suceda por lo menos una vez, es
directamente proporcional al tamaño del intervalo de tiempo y/o región
espacial.
c. La probabilidad de que el fenómeno ocurra mas de una vez, en intervalo y/o
regiones relativamente pequeños es tan pequeña que se puede despreciar.
d. La ocurrencia del suceso en determinado intervalo y/o región es
independiente de su ocurrencia en otros.
e. Interesa la probabilidad de que el suceso se presente “x” veces en el intervalo
y/o región determinados.
f. Se tendrá entonces:
x = 0, 1, 2, 3, . . .
E(X) = V (X) = λ
62 CAPÍTULO 7. ALGUNOS CONCEPTOS DE PROBABILIDAD
7.6.7. La multinomial
a. Se realizan “n” repeticiones independientes de un proceso que puede resultar
en alguna de “m” categorı́as.
b. La probabilidad de que el proceso resulte en cada una de las categorı́as es
conocida e igual a Pj , j = l, 2, 3, . . . , m).
c. Interesa determinar la probabilidad de que se presenten “xj ” casos de la
categorı́a j en las n repeticiones.
d. Se define
Xj = número de casos j en las n repeticiones
x = 0, 1, 2, 3, . . . , nj
7.6.9. La normal
Función fundamental de múltiples procesos aplicados y teóricos de la
Estadı́stica, asociada con variables de muy diversa ı́ndole.
Se define:
−∞ < x < ∞
para la cual: ( 2 )
2 1 1 x−µ
n(x; µ, σ ) = √ exp −
2πσ 2 σ
siendo:
E(X) = µ; V (X) = σ 2
64
8.1. GENERALIDADES ACERCA DE INFERENCIA 65
Que se utiliza para evidenciar los juicios mixtos, es decir, elaborados sobre
objetos ideales, pero con antecedente y referencial existencial.
Aquı́ la verdad de estos juicios, es la conformidad del pensamiento con la
realidad (concepto trascendente de verdad). La certeza con que se poseen estos
juicios es fáctica y se apoya en una necesidad de hecho entre el predicado y
el sujeto del juicio. No es que repugne a la mente pensar el juicio contrario, lo
que sucede es que haciendo esto se irı́a contra los hechos de la naturaleza.
σ2 N − n
E(X̄) = µ, V (X̄) =
n N −1
y además que:
PQ N − n
E(P̂ ) = P, V (P̂ ) =
n N −1
Como se anotó anteriormente, en la práctica estos procedimientos para deducir
la distribución de una estadı́stica y sus propiedades básicas, es objeto de estudio
de la Teorı́a Estadı́stica y aunque actualmente se cuenta con muchas de tales
distribuciones, es todavı́a muy extenso el camino por recorrer en este sentido, lo
que se convierte en una gran cantea aún por explotar en la ciencia, estadı́stica.
El modelo de probabilidad de las estadı́sticas, o sea su distribución muestral,
es la base teórica para medir la confianza y los errores de los procesos
inferenciales, determinar cuál debe ser el estimador de un parámetro, pero aún
mas cual es el mejor o mas bondadoso estimador del mismo y consecuentemente
la base de sustentación de las pruebas o contrastes de hipótesis estadı́sticas.
Preguntas como: ¿qué tan probable es que la información muestral
esté reflejando bastante bien la situación poblacional; ¿qué tanto se puede
confiar en tal información?, ¿cuál será la probabilidad de que ante una hipótesis
planteada, la información muestral permita llegar a una buena decisión en
el sentido de rechazar el supuesto si es falso o no rechazarlo si es cierto?;
¿qué tan grande será la probabilidad de llegar a conclusiones erradas? y otras
similares, solo pueden ser respondidas si se conoce la distribución muestral de
las estadı́sticas y sobre todo si se tiene claridad conceptual sobre la filosofı́a de
tales distribuciones.
CAPÍTULO 9
La estimación estadı́stica
9.1. Generalidades
72
9.2. ALGUNAS PROPIEDADES DE UN BUEN ESTIMADOR 73
9.2.1. Insesgamiento
9.2.2. Consistencia
Es esta una propiedad asociada con el error del estimador o mejor con su
error cuadrático medio:
h i
2
ECM (T ) = E (T − θ)
9.2.4. Suficiencia
X̄ − µ
Z= √
σ/ n
tanto se calculen los valores de los lı́mites con base en una muestra dada, caso
en el cual solo se puede decir que el obtenido es un intervalo de tal nivel
de confianza para estimar la media muestral.
La buena utilización de los procesos de estimación, tanto puntual, como más
usualmente por intervalo, solo se logra en la medida que se tenga la suficiente
claridad conceptual sobre la filosofı́a que sustenta tales procesos.
CAPÍTULO 10
78
10.2. ERROR TIPO I – ERROR TIPO II 79
DECISIÓN
HIPÓTESIS No rechazarla Rechazarla
Verdadera Correcto Error tipo I
Falsa Error tipo II Correcto
80 CAPÍTULO 10. PRUEBAS DE HIPÓTESIS ESTADÍSTICAS
cola.
Una prueba de hipótesis consiste entonces, en términos muy simples, en
observar si entre el supuesto que.la hipótesis nula contenga y la información
proporcionada por la muestra, existe diferencia significativa que lleve al rechazo
de aquella, o si tal diferencia es insignificante y se debe a las fluctuaciones
propias del azar, caso en el cuál se considera que no existe evidencia suficiente
para rechazarla. Por esta visión del proceso se habla también de PRUEBAS
DE SIGNIFICANCIA, y de allı́ el nombre de nivel de significancia asociado
con la probabilidad de cometer error tipo I.
El concepto del nivel de significancia implica establecer los puntos de
referencia, denominados puntos crı́ticos, hasta los cuáles se consideran
insignificantes las diferencias y los cuales a su vez, generan las llamadas zona
de rechazo y zona de no rechazo de la hipótesis.
La base teórica del nivel de significancia o probabilidad de cometer error
tipo L, hace corresponder a esta con la proporción de muestras de un tamaño
dado, que pueden llevar a rechazar la hipótesis siendo cierta y por ser su
valor en general muy pequeño (1 %, 5 %, 10 %), conlleva la confianza de que al
rechazar la hipótesis con base en la información de una muestra dada, no se
habrá cometido el error I.
Es necesario enfatizar que la preocupación por el error I, solo se presentará si
la decisión ha sido de rechazar la hipótesis, en tanto que al no rechazarla,
quedará la incertidumbre respecto a si era falsa o sea de haber cometido error
tipo II.
83
84 Bibliografı́a