Está en la página 1de 62

UNIDAD DIDACTICA I.

LA ESTADÍSTICA DESCRIPTIVA, MUESTREO Y


DISTRIBUCIÓN DE PROBABILIDAD CONTINUA

INTRODUCIÓN

Se trata de una asignatura de formación básica, obligatoria de la carrera de Ing.


Civil, la cual debe tener como requisito previo la asignatura matemática básica. El
objetivo general de esta disciplina es lograr que el estudiante obtenga
herramientas estadísticas que le permitan entender y analizar la variabilidad
observada en la naturaleza de un parámetro de interés para darle solución efectiva
a problemas comunes que se puedan presentar en su área de formación,
analizando la información recopilada en un conjunto de datos, a través de las
técnicas de la estadística descriptiva y el manejo de las teorías de las
probabilidades.
Durante el desarrollo del curso el estudiante logrará obtener herramientas para la
utilización de las técnicas del muestreo y de los modelos de distribución de
probabilidad continua, así como también el uso de las técnicas más apropiadas
para la estimación de parámetros, describiendo con claridad las propiedades de
un buen estimador. El estudiante tendrá la capacidad para determinar la
importancia de la inferencia estadística en la solución de problemas en los trabajos
de investigación científica y para valorar la utilidad de la estadística empresarial en
el campo de la Ingeniería civil, pudiendo realizar inferencias sobre hipótesis
construidas a partir de pruebas paramétricas y no paramétricas. Obtendrá
capacidades para determinar el grado de relación entre variables, tomando como
base el valor del coeficiente de correlación y para formular el modelo de regresión
lineal que mejor se ajuste a las variables en estudio. Adicionalmente, podrá
realizar inferencias sobre la importancia de utilizar diagramas de diagnóstico para
el control y seguimiento de la calidad en la producción de bienes y servicios.

OBJETIVOS

Al finalizar la unidad didáctica, el estudiante podrá realizar cálculos de


medidas de tendencia central o dispersión, construir una distribución de
frecuencias a partir de datos, identificar variables discretas y continuas,
diferenciar los tipos y métodos de muestreo, así como también, calcular áreas o
probabilidades para variables aleatoriasn continuas.

COMPETENCIAS

 Calcula e interpreta medidas de concentración y dispersión a partir de


datos no agrupados y agrupados en distribuciones de frecuencias.
 Identifica de forma autónoma diferentes métodos de muestreo, tamaño de
muestra y la selección de las unidades muestrales.
 Aplica los diferentes modelos de distribución de probabilidad continua y
utiliza de manera apropiada las tablas estadísticas.
 Interactúa fácilmente con el resto de los compañeros, resolviendo
problemas presentados en su área de actuación.

CAPACIDADES

 Identifica los conceptos necesarios y las fórmulas adecuadas para el


cálculo de medidas de concentración y dispersión a partir de datos
agrupados y sin agrupar.
 Identifica los tipos y métodos de muestreo. Cálculo del tamaño de muestra
 Calcula e interpreta probabilidades a partir de tablas para variables
continuas: Normal, t de student, Ji-cudrado y F de Fisher-Snedecor.
RESUMEN DE CONTENIDOS

Introducción al curso, Conceptos, Importancia de la estadística, Estadística


descriptiva, Análisis de Frecuencias, Variables continuas y discretas,
Fundamentos de muestreo, Técnicas de muestreo (Probabilístico y no
probabilístico), Determinación del tamaño de una muestra, Error muestral,
La medición y las escalas de medición, Los modelos de distribución de
probabilidad continua: La distribución Normal, La distribución de Student, La
distribución Chi cuadrada, La distribución F de Fisher-Snedecor.

METODOLOGÍA DE ENSEÑANZA – APRENDIZAJE

El modelo pedagógico que asegura el proceso de enseñanza – aprendizaje


de la Universidad Nacional Autónoma de Tayacaja es a través de un 1)
docente inter-estructurante que propone el objeto de aprendizaje, 2) un
estudiante auto-estructurante que construye su propio conocimiento y
aprehende, 3) un docente y estudiante problematizador donde identifica
correctamente la situación problemática y formula la estrategia adecuada
para la resolución, 4) la interdisciplinaridad permite al estudiante realizar
actividades de aprendizaje para el desarrollo de competencias básicas,
transversales y específicas y 5) la generación de innovación que permite
tener al estudiante un actitud propositiva.

La metodología de la asignatura se centra en el Aprendizaje por


Competencias en la Educación Superior, cuya finalidad es el desarrollo
integral del estudiante tanto en el:
 Saber conocer; el docente propicia el desarrollo de nuevos
conocimientos, lo cual debe tener relación con la formación permanente
y a lo largo de toda su vida, y en todos los ámbitos; académica,
profesional y social.
 Saber hacer; el docente promueve el dominio de métodos, estrategias y
técnicas enfocadas al desarrollo de diversas tareas profesionales y
personales.
 Saber ser; el docente genera ambientes de trabajo de manera
permanente para que el estudiante tenga un conjunto de actitudes y
formas de actuar con las personas, lo cual permitirá desarrollar
competencias sociales y consecuentemente las actitudes hacia la
iniciativa, el liderazgo, el emprendimiento y la motivación frente a las
tareas de su vida diaria.

ESTRATEGIAS DE ENSEÑANZA – APRENDIZAJE

De acuerdo a la naturaleza de la asignatura, se hará uso de las siguientes


estrategias de enseñanza – aprendizaje:

A. Clase invertida.
B. Aprendizaje con estrategias de elaboración de esquemas en grupos.
C. Aprendizaje con estrategias complementarias

INSTRUMENTOS DE ENSEÑANZA – APRENDIZAJE

La evaluación del proceso enseñanza – aprendizaje de la asignatura con


base en el Aprendizaje por Competencias en la Educación Superior en la
Universidad Nacional Autónoma de Tayacaja son:

A. Exámenes escritos.
B. Exámenes orales.
C. Prácticas calificadas.
D. Cuestionarios.
E. Portafolio de evidencias.
F. Rúbricas de evaluación.
INTRODUCCIÓN

La estadística es la ciencia que abarca desde la recopilación de datos


cuantitativos o cualitativos concernientes de individuos u objetos o hechos,
pasando por la organización, presentación y análisis, hasta llegar a la
interpretación para la toma de decisiones y previsiones futuras. Las técnicas
estadísticas se aplican de manera amplia en todas las áreas de las ciencias
fácticas, tanto sociales como económicas y naturales como herramienta primordial
para la toma de decisiones necesarias para garantizar el éxito en el logro de los
objetivos planteados en una investigación.

El éxito del mundo institucional y empresarial depende en gran parte del valor que
le dé a la información, que por sí mismos no producen conocimiento, no generan
ideas ni facilitan la toma de decisiones cruciales para el desarrollo; pero si lo
producen con la aplicación de métodos estadísticos que disminuyan la
probabilidad de cometer errores en las interpretaciones a priori, de manera tal que.
Las variables que caracterizan los procesos, se organizan en bases de datos
diseñadas para someter los valores a aplicaciones estadísticas con grandes
volúmenes de estos, para suministrar información precisa, oportuna, ordenada y
concreta. La estadística tiene aplicación en cualquier campo y mientras más
complicado, es más importante ya que ofrece herramientas adecuadas y válidas
para resolver una situación determinada. La Estadística descriptiva, considerada
como el componente básico de la Estadística, se dedica a recolectar, organizar,
presentar y tratar los datos a partir de análisis sencillos pero fundamentales en
todo estudio y sus resultados permiten comparar evidencias experimentales con
teorías e hipótesis planteadas, validando inferencias empíricas a partir de
modelos diseñados para tal fin.

IMPORTANCIA Y ALCANCE DE LA ESTADISTICA.

La importancia de la estadística radica en que de simple instrumento de análisis,


se ha convertido en el criterio del saber y de la acción cotidiana en los procesos de
investigación al descifrar el poder de los números y podríamos asegurar que el
mundo moderno está dirigido por la estadística, al apoyar las decisiones relativas
a la vida de cada ser y de cada empresa o institución. La estadística permite
recurrir a documentos como: expedientes, informes, registros, fotografías, mapas,
entre otros, para extraer datos de diversa naturaleza y correlacionarlos
matemáticamente en apoyo de alguna metodología, y a partir de la invención del
computador, los datos han adquirido una relevancia vital, cuyo valor depende del
tratamiento que le demos en cualquier área del conocimiento científico, así que
podemos resumir el alcance y la importancia de la estadística al siguiente
esquema integral:

ALCANCES DE LA ESTADISTICA

Ciencias Ciencias
Biológicas Sociales

INVESTIGACIÓN

HIPÓTESIS

METODOS
ESTADISTICOS

TOMA DE
DECISIONES
CONCEPTOS BÁSICOS

ESTADISTICA: Ciencia o Rama de las matemáticas aplicadas cuyo objeto es el


estudio o interpretación de un conjunto de datos numéricos, a la luz de la
incertidumbre. Dicho de otra manera, es la Ciencia que se encarga de la
RECOLECCIÓN, ORGANIZACIÓN, PRESENTACIÓN, ANÁLISIS e
INTERPRETACIÓN de datos numéricos.

ESTADÍSTICA DESCRIPTIVA. Se limita a la descripción cuantitativa y/o cualitativa


de una muestra o población de acuerdo a las características estudiadas

ESTADÍSTICA INDUCTIVA O INFERENCIAL. Permite generalizar (a la luz de la


incertidumbre) la información proveniente de una muestra a toda la población

POBLACIÓN: Es el conjunto de elementos (Objetos o individuos) sobre los que se


observa un carácter común de interés y se representa como N.

MUESTRA: Subconjunto de unidades de una población que va desde n=1 hasta


n=N-1.

MUESTRA REPRESENTATIVA: Una muestra es representativa de una población


en la medida de que la distribución de los elementos que la conforman es más
parecida a la distribución de la población. Esto se logra con aplicación de métodos
de muestreo adecuados a la distribución de los elementos de acuerdo a las
variables de interés y sus relaciones con otras y con el tamaño de la muestra. Se
representa con la letra n.

UNIDAD DE MUESTREO: Está formada por uno o más elementos de la


población. El total de unidades de muestreo conforman la población.
PARÁMETRO: Es un resumen numérico de alguna variable (Característica
común) observada de la población, los parámetros normalmente estudiados son:
La media poblacional µ, la desviación típica σ y la Proporción P.

ESTADÍSTICO: Es una variable aleatoria, cuyos valores están dados como una
función a partir de los valores de la muestra seleccionada y su distribución de
probabilidad, se conoce como “Distribución muestral del estadístico ẑ ”.
OBSERVACIÓN: Es el valor o atributo que caracteriza a un elemento de la
población
VARIABLE: Característica común en los elementos de la población cuyo valor o
atributo puede variar de un elemento a otro
VARIABLE CUANTITATIVA: Son aquellas que toman valores numéricos continuos
o discretos (Pesos, alturas, longitudes, conteos etc.)
VARIABLES CUALITATIVAS: son aquellas variables que se evalúan por medio de
atributos o cualidades, (Color, sexo, estado civil, condición, grado de instrucción
etc)
FRECUENCIA ABSOLUTA: Es el número de veces que ocurre un evento
particular ( fi o fa)
FRECUENCIA RELATIVA: Es el número de veces que ocurre un evento en
relación al total de eventos ocurridos (fr) o lo que es lo mismo, fi/total
PROBABILIDAD: Se aplica el término probabilidad, a la frecuencia relativa cuando
se determina en toda una población. Y se define como P(A)=fi(A)/N
Razón: Es la relación cuantitativa entre dos cantidades, ejemplo: si en un grupo
de 9 personas 3 fuman, la razón de fumadores es 1:2
PROPORCIÓN: es la relación anterior pero usando como base la unidad, es decir:
la proporción de fumadores es 3/9=0,333
PORCENTAJE: Es una relación cuantitativa que usa como base 100 en vez de 1,
por ejemplo, en el caso anterior, el porcentaje de fumadores es de 33,3%
TASA: Es la relación cuantitativa que usa como base, cualquier cantidad distinta
de 1 y/o 100, por ejemplo: Pendiente de un terreno= 2/1.000, tasa de
mortalidad=1/10.000 o concentración de un ingrediente activo=25ppm.
ESTADISTICA DESCRIPTIVA

La estadística descriptiva Se limita a la descripción cuantitativa y/o cualitativa de


una muestra o población de acuerdo a las características estudiadas. Es una
especie de fotografía numérica que explica el comportamiento y la distribución de
un conjunto de valores.

MEDIDAS DE CONCENTRACIÓN O TENDENCIA CENTRAL.

Son valores ( estadisticos o parñametros según el caso) que indican los puntos de
mayor concentración de los datos estudiados, así como también la ubicación de
los valores a lo largo de la distribución.

1.1. Media aritmética o Promedio ( X ) ó (μ)

Dado un conjunto de valores X1, X2, …. Xn; la media aritmética se define como la
suma de los n valores dividida por n.

X
n
i
X f i
X  i 1
(datos no agrupados) ; X  i 1
i

n n

f
i 1
i

Propiedades:

o La suma de las desviaciones de un conjunto de datos con respecto a la


media es cero
n

(X
i 1
i  X)  0

o La suma de los cuadrados de las desviaciones con respecto a la media, es


mínima; es decir:

(X
i 1
i  X ) 2  mínimo
o Si a cada observación se le suma o se le resta una constante k, la media
también se aumenta o disminuye en la misma magnitud k.

o Si cada observación es multiplicada o dividida por una constante k, la media


también se ve afectada en la misma forma

Ventajas de la media: Permite manipulación algebraica, puede calcularse en


situaciones donde otras medidas de concentración no.

Desventajas: Es muy sensible a valores extremos, no se puede calcular


directamente en distribuciones abiertas, no es una medida representativa en
distribuciones muy asimétricas

1.2. Mediana (Me)


Es el valor que divide a una serie ordenada de valores en dos grupos con
igual número de valores cada uno (50 % y 50%)

1.3. Modo o Moda (Mo)

Es el valor con mayor frecuencia en una serie o el dato que más se repite.

2. Otras medidas de concentración ( Consultar Bibliografía)


2.2. Media geométrica (Mg)
2.3. Media armónica (Mh)
2.4. Media cuadrática (Mc)
2.5. Media Móvil ( Mm)

2. MEDIDAS DE DISPERSIÓN

2.1. Desviación media (DM)


Es el promedio de las desviaciones absolutas de un grupo de valores con respecto
a su media aritmética.
 Xi  X
DM 
N
2.2. Varianza o Variancia (σ2)
Es el promedio de las desviaciones cuadráticas de un conjunto de valores con
respecto a su media aritmética.
Varianza poblacional

( Xi  X ) 2
 
2

N
Varianza muestral

( Xi  X ) 2
S2 
n 1

2.3. Desviación estándar o Desviación típica (σ)


Es el promedio de las desviaciones de un conjunto de valores con respecto al
promedio.

  2 ó S S2

2.4. Coeficiente de variación (CV)


Es la variación relativa de un conjunto de valores con respecto a la media
S
CV  *100
X

Ejercicios:

Si en un estudio de contaminación ambiental se mide la concentración de un


agente contaminante (ppm) en aguas servidas y se obtiene lo siguiente:

Muestra 1 2 3 4 5
Conc.ppm 4 5 2 6 3
Conc.Ordenada 2 3 3 5 7
Calcular las medidas de concentración y dispersión:

Promedio:


n
Xi 45263
X  i 1
 4
n 5

Mediana:

Me=3, ya que es el valor central de de la serie ordenada.


Nota: Si la serie es par entonces hay dos valores centrales y la Me=promedio de
los dos valores

MO=3, ya que es el más se repite:

Nota si ningún valor se repite, entonces la serie es amodal, si hay dos que se
repiten igual, entonces la serie es bimodal.

Varianza:

Como se trata de una muestra; se utiliza S2.

 X
 
2

S2 
( Xi  X ) 2

X i
2 i
n  90  80  2,5
n 1 n 1 4

Desviación típica: Como S=√S2. Entonces,

S=√2,5=1,58

el C = S = 1,58/4)*100=39,5%
ORGANIZACIÓN Y PRESENTACION DE RESULTADOS

 CUADROS

1. Características
1.1. Número
1.2. Título (Que, Como, Cuando y Donde)
1.3. Encabezado
1.4. Cuerpo (Datos)
1.5. Fuente

2. Tipos de cuadro
2.1 Simples
2.2 Doble entrada
2.3 Distribución de frecuencias

 GRÁFICOS
1 Gráficos estadísticos
1.1 Polígono de frecuencias
1.2 Histograma
1.3 Ojivas (Curva de frecuencias acumuladas)

2. Otros gráficos
2.1 Pictogramas
2.2 Cartogramas
2.3 Gráficos circulares
2.4 Gráficos de barra
2.5 Gráficos de líneas

Construcción de una Distribución de frecuencias (Agrupación de datos)


Es una tabulación estadística que permite colocar grandes volúmenes de datos en
poco espacio y agrupados de tal manera que no se pierde información y se facilita
el cálculo de las medidas de tendencia central y dispersión y permite una
interpretación rápida de la información y de la distribución de los valores.

Pasos para la construcción de una distribución de frecuencias

1. Ordenar los valores de mayor a menor


2. Calcular la amplitud de Variación (Rango o Recorrido)
AV = Valor mayor – Valor menor

3. Calcular o fijar el número de clases (K)


o Fijarlo entre 5 y 15 según el número de valores
o Calcularlo utilizando la fórmula de Sturgess
K = 1+ 3.322LogN
Si la muestra es grande, calcularlo de la siguiente manera: √ .

4. Calcular la amplitud de clase o intervalo de clase


o AC = IC = AV/K

5. Completar el cuadro de frecuencias

Li CC Ls fi Fa Fr% Fra%

Donde: Li. Límite inferior, Ls. Límite superior, CC. Centro de clase, fi. Frecuencia
absoluta, Fa. Frecuencia acumulada, Fr. Frecuencia relativa, Fra. Frecuencia
relativa acumulada
Ejemplo 1 :

Cuadro 1. Resistencia a la penetración kg/pulgada2 de 56 mediciones en


diferentes puntos para áreas de construcción de una localidad en 2016.

8 10 10 10 12 20 10 5
25 10 5 10 8 10 15 5
25 8 5 6 8 8 8 4
22 8 5 6 20 18 10 9
15 10 2 11 8 10 4 20
14 15 10 30 10 10 6 4
10 10 8 20 15 10 8 7

a) Construya una distribución de frecuencias


b) Encuentre el número de puntos con resistencia mayor o igual a 10 kg y
el número de puntos con resistencia inferior a 14 kg.
c) Cuál es el porcentaje de puntos entre 10 y 13 kg inclusive ambos.
d) Calcule e interprete las medidas de concentración y dispersión incluidas
en el temario.
e) Elabore un Histograma, un polígono de frecuencia y una curva de
Frecuencias acumuladas (OJIVA). Interprete los gráficos resultantes.

a) Distribución de frecuencia

Paso1. Ordenar los datos de mayor a menor o de menor a mayor

Cuadro 2. Resistencia a la penetración kg/pulgada 2 de 56 mediciones en


diferentes puntos para áreas de construcción de una localidad en 2016. (Serie
ordenada)

2 4 4 4 5 5 5 5
5 6 6 6 7 8 8 8
8 8 8 8 8 8 8 9
10 10 10 10 10 10 10 10
10 10 10 10 10 10 10 10
11 12 14 15 15 15 15 18
20 20 20 20 22 25 25 30
Paso 2. Calcular la amplitud de variación o rango

R= AV = 30 – 2=28

Paso 3. Calcular o fijar el número de clases (K) o intervalos

Cálculo con formula de sturges:


K = 1+ 3.322LogN= +3,322 log 56 =6,8 ≈ 7

Fijación a conveniencia, dependiendo del número de datos:


Si consideramos la aproximación de Sturges y fijamos K=7

Paso 4. Calcular la amplitud de clases

AC=IC = AV/K=(28/7)=4

Paso 5. Completar el cuadro de frecuencias

Cuadro 3. Resistencia a la penetración kg/pulgada2 de 56 mediciones en


diferentes puntos para áreas de construcción de una localidad en 2016.
Distribución de frecuencias

Li CC Ls fi Fa Fr% Fra%
2 4 6 9 9 16 16
6 8 10 15 24 27 43
10 12 14 18 42 32 75
14 16 18 5 47 9 84
18 20 22 5 52 9 93
22 24 26 3 55 5 98
26 28 30 1 56 2 100

Nota1. Li. Límite inferior, Ls. Límite superior, CC. Centro de clase, fi. Frecuencia
absoluta, Fa. Frecuencia acumulada, Fr. Frecuencia relativa fi ∑fi , Fra.
Frecuencia relativa acumulada.
Nota 2. Es recomendable que los límites de clase sean enteros
independientemente de los valores tabulados y en este caso, para no complicar
los cálculos asumiremos intervalos abiertos por el límite superior y cerrados por el
límite inferior con la excepción del último cuando se termina exactamente en el
valor mayor.

Nota 3. Cuando no resultan en enteros los cálculos de K y AC y aproximamos, no


importa que iniciemos antes del menor y/o terminemos después del último y el
espacio sobrante se distribuye entre los extremos del cuadro.

b) Nº de puntos con resistencia ≥ =56-24=32 kg/pulg2 con la columna de Fa


y el Nº de puntos con menos de 14 es 42 kg/pulg2 en la misma columna,
también se puede responder con la columna de fi, pero en este caso hay
que sumar.

c) El número de puntos con resistencia entre 10 y 13kg/pulg.2 inclusive


ambos, es 32% en la columna de fr .

d) Calcular medidas:

d.1. Media o promedio:

 X 4 * 9  8 *15  .....  (28 *1)  11,64kg / pu lg 2


n
* fi
 i 1

i
X

n
fi 56
i 1

Nota, Xi=CC, es la aproximación que genera menor error

Interpretación: La resistencia promedio del grupo de puntos es de 11,64 kg/cm2

d.2 Mediana(Me). Se aplica en este caso de datos agrupados, una interpolación


buscando el 50%

Donde:

Li= Límite inferior de la clase mediana o donde se ubica la mediana


Fa ant.= Frecuencia acumulada hasta la clase anterior a la clase mediana

Interpretación: El 50% de los puntos de muestreo presentaron una resistencia


igual o superior a 10,29kg/pulg2.

d.3. Modo o Moda, Para datos agrupados, aplicamos

( ) ( )

Donde:
Li= Límite inferior de la clase modal o clase con mayor fi
Δi= Diferencia entre fi de clase modal y la clase inferior
Δs= Diferencia entre fi de clase modal y la clase superior

Interpretación: El valor más frecuente de las resistencias estudiadas, está


alrededor de 10,19 kg/pulg.2.

d.4. Varianza: En este caso de datos agrupados, la fórmula de la varianza queda


como:

(∑ )
(∑ ) ⁄

d.5. Desviación típica o estándar:

√ √

Interpretación: La resistencia a la penetración de estas muestras de suelo


presenta una desviación de 5,87 kg/pulg.2 con respecto a la media, es decir: que
se espera que la mayoría de las muestras tengan una resistencia de 11,64±5,87
kg/pulg.2.

d.6. Coeficiente de variación: CV%


̅

Interpretación: La resistencia a la penetración de estas muestras de suelo


presenta una desviación de 50,4% con respecto a la media, es decir: que se
espera que la mayoría de las muestras tengan una resistencia de 11,64 kg/pulg.2 ±
50,4%
FUNDAMENTOS DEL MUESTREO

El concepto de muestra, se utiliza para denominar a cualquier subconjunto posible


de una determinada población.

La estadística inferencial es la división de esta disciplina que se encarga de


estudiar las muestras, para realizar inferencias en relación a las poblaciones a
partir de las cuales se tomaron las muestras, para ello; se requiere que las
muestras sean representativas de las poblaciones de origen.

Se denomina ¨muestreo¨ al conjunto de procedimientos estadísticos que existen


para seleccionar muestras que sean representativas de la población
correspondiente, que son finalmente, el objeto de la investigación, de manera tal
que sea posible generalizar las conclusiones obtenidas con pequeños grupos, a
toda la población.
Con el objetivo de cumplir a cabalidad con esta terea, se han desarrollado
diversas técnicas de muestreo para la selección adecuada y válida de una
muestra.

Existen dos grandes tipos de muestreo:

1. El muestreo aleatorio o probabilístico


2. El muestreo no aleatorio, también conocido como: Muestreo no probabilístico
Cada uno de estos tipos de muestreo incluye diversos métodos o
procedimientos en función de las características o distribución de la población.

ESCALAS DE MEDICION DE VARIABLES


La medición puede definirse como la asignación de números a objetos y eventos
de acuerdo con ciertas reglas; la manera como se asignan esos números
determina el tipo de escala de medición. Esto conduce a la existencia de
diferentes tipos de escalas, por lo que el problema se transforma en explicitar tres
aspectos fundamentales de las escalas de medición:
a) Las reglas para asignar números.
b) Las propiedades matemáticas de las escalas resultantes.
c) Las operaciones estadísticas aplicables a las medidas hechas con cada tipo de
escala.
La clasificación de las escalas de medición tiene una historia interesante. La
Asociación Británica para el Avance de la Ciencia (British Association for the
Advancement of Science), en 1932 designó un comité para resolver el problema
de la medición de sensaciones humanas. Este comité, en representación de la
sección A (ciencias matemáticas y físicas) y la sección J (psicología) de la
asociación, fue instruido para considerar la posibilidad de estimar
cuantitativamente los eventos sensoriales (¿es posible medir la sensaciones
humanas?). Aún en 1938 no se había producido un resultado definitivo. El reporte
final del comité seleccionó un ejemplo concreto de escala sensorial. Tomó la
escala de ruido Sone (S.S. Stevens y H. Davis, 1938), que propone medir la
magnitud subjetiva de una sensación auditiva basándose en otra escala básica
usada para medir longitud y peso. Hubo desacuerdo en el comité de 19 miembros.
Uno de ellos declaró que cualquier norma que trate de expresar una relación
cuantitativa entre intensidad de una sensación y la intensidad del estímulo que la
produce no tiene significado hasta que pueda darse algún sentido al concepto de
adición aplicada a la sensación. Stevens, sin embargo, plantea que puede llegarse
a un acuerdo si se reconoce que la medición existe en varias formas y que las
escalas de medición pueden ser clasificadas en clases, según las operaciones
empíricas que deben hacerse en el proceso de medición y las propiedades
matemáticas de la escala.
Siguiendo a Stevens (1946, 1957), las escalas de medición se clasifican en cuatro
grupos: escala nominal, ordinal, intervalo y escala de razón. Desde el punto de
vista de las propiedades matemáticas y estadísticas, la escala de medición más
rudimentaria es la nominal, siendo la más completa la escala de razón.
Para entender y usar apropiadamente las diferentes técnicas del análisis
estadístico, es necesario identificar previamente la escala de medición
correspondiente, ya que cada escala tiene sus propiedades matemáticas, que
determinan el análisis estadístico apropiado en cada caso; esto, a su vez, requiere
conocer las propiedades del sistema numérico. Las propiedades matemáticas de
los números que se van a analizar determinan la clase de operación matemática
permitida, indicando, a su vez, el tipo de análisis estadístico que puede usarse.
Las propiedades del sistema numérico asociadas con las escalas de medición son
la identidad, magnitud, igual intervalo y cero absoluto (Stevens, 1957): 1-Identidad:
cada número tiene un significado particular. 2-Magnitud: los números tienen un
orden inherente ascendente o descendente. 3-Intervalos iguales: las diferencia
entre números en cualquier punto de la escala son las mismas (la diferencia entre
10 y 20 es la misma que entre 100 y 110). 4-Cero absoluto: el punto cero en la
escala de medición representa la ausencia de la propiedad que se estudia.

 ESCALA NOMINAL: Clasificación arbitraria de la variable en categorías mutuamente


exclusivas y colectivamente exhaustivas. En esta escala las unidades
observacionales (UO) se agrupan en clases excluyentes según determinada
propiedad, con lo que se define una partición sobre el conjunto de tales unidades.
Los números se usan como identificadores o nombres.
En esta escala no hay ninguna relación de orden ni distancia, solo se determina la
frecuencia de elementos en cada categoría (relación de equivalencia). Ejemplos:
Sexo, color, defectos, falta laboral, estado del tiempo, modelo, reacción, estado
civil etc.
Cuando se estudia el desempleo de un país y se incluye la variable sexo, se
codifica masculino como 1 y femenino como 2, por ejemplo; los números 1 y 2
representan categorías de datos: son simples identificadores y son completamente
arbitrarios. La operación matemática permitida es el conteo.

 ESCALA ORDINAL: Al igual que la anterior, se establecen categorías, pero


siguiendo un orden específico.
En este caso, se tiene una relación de orden, aunque no hay una distancia
específica entre una categoría y otra. Ejemplos: grado de instrucción, intensidad,
condición, jerarquía, escala de sabor, escala de calificación A, B, C, D, E, etc.
Surge a partir de la operación de ordenamiento; en esta escala se habla de
primero, segundo, tercero. No se sabe si quien obtiene el primer puesto está cerca
o lejos del segundo puesto. Los valores de la escala representan categorías o
grupos de pertenencia, con cierto orden asociado, pero no una cantidad
mensurable. La escala ordinal tiene las propiedades de identidad y magnitud. Los
números representan una cualidad que se está midiendo, y expresan si una
observación tiene más de la cualidad medida que otra UO. La distancia entre
puntos de la escala no es constante: no se puede determinar la distancia entre las
categorías, sólo es interpretable el orden entre sus valores. Ejemplos: situación
socioeconómica, nivel educativo.

 ESCALA DE INTERVALO: Las observaciones pueden ordenarse y además se


definen unidades de distancia pero el cero es arbitrario (Caso de la temperatura y escalas
arbitrarias). Hay relación de igualdad, orden y distancia (Arbitraria) .
Esta escala representa magnitudes, con la propiedad de igualdad de la distancia
entre puntos de escala de la misma amplitud.
Aquí puede establecerse orden entre sus valores, hacerse comparaciones de
igualdad, y medir la distancia existente entre cada valor de la escala. El valor cero
de la escala no es absoluto, sino un cero arbitrario: no refleja ausencia de la
magnitud medida, por lo que las operaciones aritméticas de multiplicación y
división no son apropiadas. Cumple con las propiedades de identidad, magnitud e
igual distancia. La igual distancia entre puntos de la escala significa que puede
saberse cuántas unidades de más tiene una UO comparada con otra, con relación
a cierta característica analizada. Por ejemplo, en la escala de temperatura
centígrada puede decirse que la distancia entre 25° y 30°C es la misma que la
existente entre 20° y 25° C, pero no puede afirmarse que una temperatura de 40°
C equivale al doble de 20° C en cuanto a intensidad de calor se refiere, debido a la
ausencia de cero absoluto. Así, los valores numéricos en la escala de temperatura
centígrada se pueden expresar en valores de la escala Fahrenheit mediante la
ecuación C=a+bF (a= -17.778; b=5/9).
 ESCALA DE PROPORCIÓN O RAZÓN: En esta escala se cumplen las relaciones
de igualdad, orden y distancia y además, el cero es real (indica ausencia).
Corresponde al nivel de medición más completo. Tiene las mismas propiedades
que la escala intervalos, y además posee el cero absoluto.
Aquí el valor cero no es arbitrario, pues representa la ausencia total de la
magnitud que se está midiendo. Con esta escala se puede realizar cualquier
operación lógica (ordenamiento, comparación) y aritmética. A iguales diferencias
entre los números asignados corresponden iguales diferencias en el grado de
atributo presente en el objeto de estudio. Las escalas pueden transformarse a una
de menor grado, lo contrario no es posible. Ejemplo: longitud, peso, diámetro,
altura en m, resistencia kg/cm2, potencia, ingresos, precios, dureza, rendimiento,
recorrido en km, volumen, número de faltas, tiempo, etc.

METODOS DE MUESTREO PROBABILISTICO


Hablamos de muestreo aleatorio o probabilistico, en los casos en que todos los
sujetos que forman parte de una población tienen la misma probabilidad de ser
seleccionados como parte de la muestra. Estos muestreos, son más conocidos y
útiles que los no aleatorios. Esto, motivado a que tienen una elevada
representatividad y permiten calcular el error de muestreo. En este tipo de
muestreo, las variables tienen la misma función de probabilidad y son
independientes entre ellas y la población puede ser finita o infinita, conocida o
desconocida.

1. MUESTREO ALEATORIO SIMPLE


Este método es el más utilizado en la estadística inferencial, pero es menos eficaz
en poblaciones muy grandes
Consiste en seleccionar n elementos de una población de tamaño N, de modo
que todas las muestras posibles de tamaño n (C N,n ) tengan la misma
probabilidad de ser seleccionadas ( 1/ C N,n )

1.1. Tamaño de muestra para la Estimación de una media


Si lo que deseamos estimar es una media, conociendo el tamaño de la población,
entonces:

Donde : N= tamaño de la población, e2 =k 2x (Error máximo admisible que


deseamos tener en la estimación)
2x = S2/ n y K es un valor de Z /2 para un nivel de confianza o seguridad
deseado

Haciendo n0 = K2 S2 / e2 en la fórmula anterior, se tiene que:


Si n0 / N es despreciable (Caso de población infinita), n 0 es una buena


aproximación a n; si no, debe obtenerse el tamaño de muestra por la fórmula
anterior.

Una opción en el muestreo

1.- Tomar la muestra del mayor tamaño posible


2.- Tomar una muestra piloto
3.- Seguir el procedimiento bietápico de STEIN, que consiste en tomar una
muestra inicial n1 y sí S1 x t n-1 y 1- resulta menor que d √ n , es suficiente

con n1, donde: √ ̅

Ejemplo1: en un proyecto de construcción de chalets playeros en madera, se


requiere estimar el diámetro promedio de´1000 árboles de una
plantación que será destinada para tal fin y se encuentra que en una
muestra piloto de 25 árboles produjo una desviación muestral de 22,36
cm. Calcule el tamaño de muestra definitivo para K=2(95% de
seguridad) y un error máximo admisible de e=7 cm.
Partiendo del enunciado anterior, calcular el tamaño de muestra definitivo
asumiendo:
a). N=10.000
b). N=100.000
c) N es desconocido o muy grande (Infinito)

a). usando la expresión anterior, tenemos que:

b).

c). Asumiendo población desconocida, tendremos que:

Corolario: Después de ciertos tamaños de población, los incrementos en N, no


implican incrementos en el tamaño de muestra, lo que implica que hay un tamaño
máximo y que trabajar con muestras mayores solo indica pérdidas de tiempo y
dinero, y aquí radica la importancia de saber con buena aproximación el tamaño
de muestra en una investigación
Nota1: El valor de Z α 2= Z 0,025=1,96, se aproxima en términos prácticos a 2 y Z α2

= Z 0,005= 2,575, se aproxima a 3, en los trabajos cotidianos de muestreo.

1.2. Estimación de una media con base en error relativo


El valor del error máximo admisible e, siempre debe fijarse considerando un CV no
mayor de 20% y como el anterior no nos da una idea acertada sobre esto, es
preferible utilizar la fórmula con base en el error relativo. A saber:
Donde:

Aplicándola al ejercicio anterior, con un coeficiente de variación muestral de 65% y


un error máximo admisible de 20%, tenemos:

1.3. Estimación de un total

De acuerdo con la ecuación fundamental del error


̅ ̅

Elevando al cuadrado y sustituyendo en la ecuación inicial, tendremos :

Ejemplo: Supongamos que, en el enunciado anterior, se desea estudiar el


volumen total de madera con un error máximo total de 50m3. Y se seleccionaron
20 árboles que produjeron un promedio de 1,64m3 y una desviación típica de 0,30
m3 por unidad, el tamaño de muestra re querido para saber el volumen total de
madera es

1.4. tamaño de muestra para estimar una proporción.

Si lo que deseamos estimar es una Proporción, entonces:

̂ ̂
( ) ̂ ̂

donde : e2 =k 2p (Error máximo admisible) y N es conocido


Para población desconocida

̂ ̂

Ejemplo: En una muestra piloto tomada de un laboratorio de control de calidad, el


29% de las pruebas de resistencia son invalidadas por fallas en el material o en
procedimientos, ¿Cuál debería ser el tamaño de muestra requerido para estimar la
proporción de fallas en una población de 500 muestras asumiendo un error
máximo de 10% y 99% de seguridad? .

̂ ̂
( ) ̂ ̂ ( )

Conclusión: se requieren 43 pruebas para estimar la proporción de fallas en una


población de 500 pruebas.
Asumiendo que la población de muestra es desconocida, se aplica:

̂ ̂
( )

Nota: Como la diferencia entre el conocimiento de la población no es relevante


para poblaciones de 500 elementos o más, es posible usar cualquiera de las dos
expresiones cuando se duda del tamaño de población ya que el castigo en trabajo
que nos produce, no es significativo.

2. MUESTREO ESTRATIFICADO

Consiste en dividir N en L subconjuntos o estratos, de acuerdo a variables de


control (Variables claves de estratificación) correlacionadas con la variable de
estudio, luego, en cada estrato se aplica muestreo aleatorio simple. Se trata en
este caso, de tener homogeneidad dentro del estrato sin importar la
heterogeneidad entre estratos, con el objetivo de Controlar del error de muestreo y
una lograr mayor precisión de las estimaciones que en el muestreo aleatorio
simple.

El procedimiento para repartir la muestra entre los diferentes estratos se llama


AFIJACION y se puede presentar en varias modalidades.

1) Afijacíón proporcional.

Consiste en repartir n proporcionalmente al número de elementos de cada


estrato con nh= wh n así:

, donde ( ⁄ ) , ⁄ y =

varianza de estrato.

2) Afijación óptima.

Consiste en repartir de acuerdo a:


Esta es la afijación que produce menor error de muestreo.

3) Afijación arbitraria.

Se selecciona un n cualquiera en cada estrato (no es la más recomendada)

3. MUESTREO SISTEMÁTICO

Consiste en enumerar los N elementos de 1 a N en cualquier orden y luego


dividirla en n partes de tamaño k (Intervalo sistemático), posteriormente se elige
un número al azar entre 1 y k y se toman los elementos que ocupan esa posición
en los intervalos sucesivos, para ello podemos hacer uso de tablas de números
aleatorios, disponibles en textos de estadística recomendados en la bibliografía.
4. MUESTREO POR CONGLOMERADOS

Consiste en dividir la población en conglomerados (Grupos representativos de la


población), luego se seleccionan al azar 1 ó varios conglomerados según lo
deseado y finalmente, los conglomerados seleccionados, se evalúan completos
(todos los elementos).

El objetivo es: Lograr homogeneidad entre conglomerados y heterogeneidad


dentro del conglomerado. Este muestreo es muy útil cuando se realiza muestreo
por encuestas.

5. MUESTREO POR ETAPAS

Consiste en dividir la población en conglomerados dentro de conglomerados


mayores

1ra división Conglomerados mayores (Unidades primarias de muestreo)

2da división Conglomerados de segunda etapa (Unidades Secundarias)

Se continúa de esta manera hasta llegar a la unidad elemental que es el individuo


o elemento al que se quiere evaluar.
MUESTREO NO PROBABILISTICO

Los métodos no probabilísticos de muestreo, utilizan criterios con poca


sistematización que procuran que la muestra tenga cierto grado de
representatividad y se emplean principalmente cuando no es posible aplicar
métodos probabilísticos, lo que es muy común motivado a los altos costos que
producen estos.

1. Muestreo intencional u opinático

En este tipo de muestreo, es la opinión del investigador la que prevalece al


escoger los elementos que conformaran la muestra, debido a las dificultades para
la aplicación de un método clásico, tratando de lograr la representatividad por el
conocimiento, grado de dispersión y / o la distribución de la población, Como por
ejemplo, un estudio de residuos sólidos en una ciudad grande, selección de
estudiantes para un estudio, sabiendo que tienes orígenes, niveles académicos e
intereses diferentes o seleccionar clientes en un automarcado o la toma de
muestras en un estudio de suelo para construcción.

En esta técnica de muestreo, los elementos se seleccionan basándose


únicamente en el conocimiento y la credibilidad del investigador. En otras
palabras, los investigadores eligen solo a aquellos que estos creen que son los
adecuados para lograr la representación de una población, no es un método
científico de muestreo y su desventaja es que los resultados pueden estar
influenciados por nociones percibidas del investigador. Por lo tanto, hay un riesgo
de ambigüedad involucrada en esta técnica.

2. Muestreo en cadena o bola de nieve

En este tipo de muestreo, el investigador establece contacto con determinados


individuos y luego estos se encargan de conseguir nuevos participantes, y así
sucesivamente hasta completar la muestra. Este muestreo es útil cuando se
trabaja con poblaciones de difícil acceso, como el caso de adictos a sustancias de
interés en el estudio u miembros de culturas dispersas en un espacio geográfico o
estimaciones de construcciones en ejes geográficos con muchas diferencias. Este
tipo de técnica ayuda a los investigadores a encontrar muestras cuando son
difíciles de localizar y funciona como el programa de referencia ya que una vez
que los investigadores encuentran sujetos adecuados, se les pide a estos ayuda
para buscar a sujetos similares y así poder formar una muestra de buen tamaño,.
Este tipo de muestreo se puede utilizar para realizar investigaciones que
involucran una enfermedad particular en pacientes o tal vez una enfermedad rara
también. Los investigadores pueden buscar ayuda de las personas enfermas para
que estos refieran a otros que sufran de la misma dolencia y con esto formar una
muestra completa.

3. Muestreo por cuotas o accidental

En el muestreo por cuotas, cuando el investigador selecciona un número concreto


de sujetos que cumplan una característica determinada a partir de su
conocimiento sobre los estratos que contiene la población como, por ejemplo: los
clientes que lleguen al automercado entre 8 y 10 de la mañana, mujeres mayores
de 50 años, densidad de vegetación en un eje geográfico, pero llegando por vías
existentes. Encuestas en sitios y a una hora determinados.

4. Muestreo por conveniencia

Es una técnica de muestreo donde la muestra de la población se selecciona solo


porque están convenientemente disponibles para el investigador. Estas muestras
se seleccionan solo porque son fáciles de reclutar y porque el investigador no
consideró seleccionar una muestra que represente a toda la población, Pero, en
algunas investigaciones, la población es demasiado grande para evaluar y
considerar a toda la población. Esta es la técnica de muestreo no probabilístico
más común, debido a su velocidad, costo, efectividad y facilidad de disponibilidad
de la muestra.
Cuando usar muestreo no probabilistico

 Este tipo de muestreo se usa para indicar si existe un rasgo o característica


particular en una población.
 Es ampliamente utilizada cuando los investigadores realizan estudios
cualitativos, estudios piloto o investigación exploratoria.
 Se aplica con frecuencia cuando los investigadores tienen un tiempo limitado
para llevar a cabo la investigación o tienen limitaciones presupuestarias.
 El muestreo no probabilístico se realiza para observar si un aspecto en
particular (Diagnóstico) necesita un análisis con más profundidad.

Ventajas de muestreo no probabilístico

1. Es un método práctico para los investigadores que implementan encuestas en la


realidad de los hechos. Es importante Destacar que los estadísticos prefieren el
muestreo probabilístico porque arroja datos numéricos con alta confiabilidad.
Pero la realidad es que si se hace correctamente, el muestreo no probabilístico
puede arrojar resultados similares y de la misma calidad.

2. Obtener respuestas utilizando el muestreo no probabilístico es más rápido y


más rentable en comparación al muestreo probabilístico ya que el investigador
conoce la muestra. Comúnmente los participantes están motivados para
responder rápidamente en comparación con las personas que se seleccionan al
azar.

Desventajas de muestreo no probabilístico

1. En el muestreo no probabilístico, el investigador necesita pensar las posibles


razones de los sesgos y así evitar su efecto. Es importante tener una muestra
que represente lo más cercano posible a la población.
2. Cuando se selecciona una muestra no probabilística, los investigadores deben
tener cuidado con los reclutas que puedan distorsionar los datos y se desvíe del
objetivo de obtener información válida y úti

VARIABLES ALEATORIAS DISCRETAS Y COTINUAS

Concepto: Una variable aleatoria (V.a.) es una característica común en los


elementos de una población y sus valores han sido tomados al azar de un Espacio
muestral (Población).

Definición Matemática
Si tenemos un experimento aleatorio EA y un espacio muestral (EM)
asociado a ese experimento. Una función F(X) que asigna un número real a cada
valor (S) de “EM” se llama. Variable Aleatoria

Luego:
Una variable aleatoria ( V.a ) es una función cuyo valor es un número real
para cada elemento de “EM”.
La V.a se denota por “X” y, para cada uno de sus valores se usará “x”.
Ejemplo:
Una caja contiene 6 fichas, 2 de ellas rojas y 4 negras. Si extraemos dos
fichas al azar sin reemplazo (EA) los resultados posibles son:

EM= RR, RN, NR, NN

Si la V.a considerada es: X= nº de fichas rojas

Los resultados posibles son: X= 0, 1, 2


Variables aleatorias discretas
Sea X una V.a, si el nº de valores de X es finito (o contablemente infinito)
llamamos a X “ ad”.
Ej: Para el e perimento “lanzar 2 monedas
EM= CC, CS, SC, SS

La V.a nº de caras puede tomar valores : X1 = 0, X2 =1, X3 =2

VARIABLES ALEATORIAS CONTINUAS

Si un EM tiene infinito nº de puntos, tales como: Alturas, Pesos, Temperaturas etc.


Se dice que es un EM continuo y una V.a definida sobre ese EM se llama V.a.c
(Variable aleatoria continua).

En general
V.a.c resultan de mediciones
V.a.d resultan de conteos

DISTRIBUCIONES DE PROBABILIDADES DISCRETAS

Si X es una v.a.d que toma valores X1, X2,.......Xn. Se puede calcular la


probabilidad con que X toma cada valor: P(X= X1), P(X=X2),.........., P(X=Xn)

La distribución de probabilidad de una v.a.d se define a través de una


Función de Probabilidad. f(X)

f(X) Función de Probabilidad

Y esa distribución está formada por el conjunto de pares ordenados

[ ( )] organizados de la siguiente manera:


X X1 X2 Xn

P(X=X) P(X=X1) Px=X2 PX=Xn

Distribución de probabilidades de la variable aleatoria discreta X

Es necesario que
N


x 1
P(X=1)= 1 Para que f(X) sea función de probabilidad

Ejemplo: Determinar la distribución de probabilidad para la v.a.d X= nº de caras


del ejemplo de lanzar 1 moneda 2 veces.

X 0 1 2
P(X=X 1/4 2/4 1/4

 P(X=X)= 1 es función de probabilidad


Luego: f(X)= X/4 cuando X= 0, 1, 2
Así: una v.a.d puede estar también representada por una función matemática f(X):
además, se puede construir un histograma de puntos.

Distribución de probabilidades para v.a continuas

Una v.a.c tiene probabilidad igual a cero para un punto X=x0 esto es:

( ) , por lo que ( ) ( ) [ ( )]
Esto se debe a que el nº de puntos del EM es infinito

Luego
“Se dice que X, es una v.a.c. si existe una función llamada función de densidad
de probabilidad (fdp) de X, que satisface las siguientes condiciones:

a) F(X)  0 para todo X



b) 

f ( x)dx  1

c) Para cualquier a, b tal que -  < a < b< + 


b
d) Tenemos: P(a  X  b) =  a
f ( x)dx

Ejemplo: Supongamos que X es una v.a.c con una función de densidad dada por

2X si 0<X<1
f(X) =
0 c.o.v

Antes de calcular cualquier probabilidad debe comprobarse si f(X) es fdp:


1

para ello debe cumplirse que  2xdx  1 ,


0
Luego si f(x) es Fdp se pueden calcular

probabilidades

P(X  1/2 =∫

P(X  1/2 / 1/3  X  2/3 )=?

Funcion de distribución
Si X es una v.a (discreta ó continua), la probabilidad de que X tome un valor tal
que X  x podemos llamar la F(X) = P(X  x)
Donde, F(X): es la función de distribución o función acumulativa de la v.a.x.
luego:

a). Si X es un v.a.c con función de densidad f(x) entonces F(x) estará definida
por:
x
F(x) =  f (s)ds


b) Si X es un v.a.d con una función de probabilidad f(x); entonces F(x) es la función


de distribución definida por:
k
F(x)  Pxi 
i 1

Esperanza matemática
a) Sea X una v.a.d con valores posibles X1, X2,.........., Xn y sea p(x)= P(X=xi)
el valor esperado de X (Esperanza Matemática de X) denotada por E(x),
será:
l
E(x) =  xi  xi 
x 1

“La esperanza matemática de un valor es igual al promedio: E(x): 

b) Sea X una v.a.c con una función de densidad f(x); el valor esperado de X
ó E(x) será:

E(x)=  x  f ( x)dx


PROPIEDADES DE LA ESPERANZA
1. Si C es una constante  E( C) = C
2. Si X es una v.a con fusión de probabilidad f(x): La E(x)= 
3. Si C es una constante y X una v.a entonces: E(cx) = C. E(x) = C 
4. Sean X e Y dos v.a cuyas funciones de probabilidad son f(x) y f(y); si X e
Y son independientes

E(X  Y) = E(X)  E(Y) = x  y

5. Si X e Y son independientes:
E(XY) = E(X). E(Y)

Varianza de una variable aleatoria


2
 

  xi  x 
   xi   
2

S2 = ó 2 
N 1 N

Le expresión de la varianza de una variable aleatoria en términos de su


esperanza matemática es: V(x) = E (X – M)2 = E (x)2 - E(x)2

Definición: Sea X una Va. la varianza de X se denota por V(x) ó  2


x y se define
como:

( ) { ( )} ( ) [ ( )]

La raíz cuadrada de V(x) se llamará la desviación estándar de X y se

denota por: x  V (x)

Propiedades de la varianza

1. Si X es una v.a cuya función de probabilidad es f(x) entonces: V ( x)   2


2. Si X es una v.a y C es una constante luego: V ( x  c)  V ( x)  V (c)  V ( x)
Ya que V(c)=0

3. Si X es una v.a y C una constante entonces: V (cx)  C 2V ( x)  C 2 . 2


4. Si X e Y son v.a cuyas funciones de probabilidad son f(x) y f(y)
respectivamente y además son independientes, entonces:
V ( x  y)  V ( x)  V ( y)  X2 ( y2)
DISTRIBUCIONES DE PROBABILIDAD CONOCIDAS

Variables discretas:

 Binomial
 Poisson

Variables continúas:
 Normal
 T de Student
 Ji-Cuadrado
 F de Fisher-Snedecor

Distribución Binomial

Cuando un experimento aleatorio tiene solo dos resultados posibles, los cuales
podemos llamar A y A’ (complementarios); P (A) = p y la probabilidad que no
ocurra A es P A’ = q. Esto indica que q = – p y se mantiene constante las n
veces que se repite el experimento.
Si definimos a X (variable aleatoria) como el número de veces que ocurra A en un
experimento que sigue la distribución binomial y llamamos p a la P (A) y q a la P
A’ ; la probabilidad de que X tome un valor viene dada por la e presión:
( ) ( ) dónde:

X = , ,…., n
N = número de repeticiones del experimento

DISTRIBUCIÓN NORMAL (CAMPANA DE GAUSS)

Definición:
Una variable aleatoria X sigue la distribución normal si su función de probabilidad
(fdp). Esta dada por.

( ) ( ) para

Dónde:
E(X) = µ
X = σ²
e = Base del logaritmo neperiano
π = 3. 4 6
Para indicar que una variable aleatoria sigue la distribución normal se usa la
expresión:
X N (µ ; σ²
El gráfico de f(x)

Figura 1. Distribución Normal

Características de la Distribución Normal

1. El área total bajo la curva es 1


2. El área entre dos puntos a y b, donde a < b, corresponde a la P (a< x < b).
3. Es una curva simétrica campaniforme
4. Es Asintótica con respecto al eje x (ambos lados)
5. Presenta un máximo que coincide con µ
6. Presenta dos puntos de inflexión que corresponde a µ - σ y µ + σ
7. La media = mediana = moda
8. El área entre:
 µ - σ y µ + σ = 68.27%
 µ - 2σ y µ + 2σ = 95.44%
 µ - 3σ y µ + 3σ = 99.72%

DISTRIBUCION NORMAL ESTANDARIZADA

Si X N µ ; σ² , entonces: también se distribuye normalmente con


una fdp dada por:

( ) Donde: Z N (0 ; 1)

-Z 0 Z

Figura 2. Distribución Normal estandarizada (Z)

Importancia de la distribucion normal

Es el modelo probabilístico más importante en la construcción de métodos


estadísticos debido a las siguientes razones:

1. Variables continuas que representan mediciones biométricas, en general,


siguen la distribución normal.
2. Algunas distribuciones de variables aleatorias discretas, tales como la
binomial, pueden aproximarse a la normal.
3. Muchos estadísticos se aproximan en su distribución a la Normal.
4. Existen otras distribuciones de probabilidades que se derivan de la Normal (
t de Student, Ji-cuadrado y F de Fisher-Snedecor etc.)

Ejemplo1: Si x N (50, 100), o lo que es lo mismo, µ= 5 y σ2= 100 encontrar.

a P ˃7
b) P ( X < 40)
c) P (43,2 < X < 62,5)

a). Usando la tabla Normal disponible en Walpole, Scheaffer y wackerly, que


indica el area hacia la derecha de Z Figura 3

0 Z

Figura 4. Areas bajo la curva de Walpole, Scheaffer y wackerly

Encontramos que el area solicitada esta por encima de 70 por lo que al


estandarizar tenemos que:

Por lo que : P X˃7 =P z˃2, = 1-0,9772 (Ubicamos

el 2,0 en la primera columna y el segundo 0 en la primera fila y Como la pregunta


es en el mismo sentido de la tabla: A saber:

Área=0,0228

0 Z=2,00

Figura 5. área solicitada


b). P(x< 40): Estandarizando tenemos que Z=(40-50)/10= -1,00 y como ahora
solicitan el área a la izquierda , es decir,

Área=0, 1587

-1,00 0

Figura 6. Area a la izquierda de la distribuciòn


Entonces, buscamos el área equivalente en el lado derecho por la simetria de la
distribución, encontrando el valor 0,1587.

c). P( 43,2<X<62,5): Estandarizando tendremos que Z 1=(43,2-50)/10= -0,68 y Z2=


(62,5-50)/10=1,25: En la tabla anterior visualizamos que:

Área=0,2483 Área=0,8944

Área=0,6461

-Z = -0,68 0 Z =1,25

Figura 7. Àrea central en la distribuciòn


Como el área de interés es la del centro, entonces, la P(43,2 <X<62,5)=P(-
0,68<Z<1,25)= 0,8944- 0,2483= 0,6461

Ejemplo 2. Si el período de duración de un bombillo tiene distribución Normal con


un promedio µ= 8 y σ=4 horas en horas; encontrar la probabilidad de que un
bombillo seleccionado al azar dure:
a) Entre 778 y 834 horas.
b) Más de 800 horas
c) Si la fábrica produce 2000 bombillos en un día, cuantos bombillos duraran
menos de 900 horas
a) Como: Z1=(778-800)/40= -0,55 y Z2= (834-800)/40=0,85: En la tabla
anterior visualizamos que:

Área=0,2912 Área=0,8023

Área=0,5111

-Z = -0,55 0 Z =0,85

Figura 8. Àrea central en la distribuciòn

De modo que: P(778 <X<834)=P(-0,55<Z<0,85)= 0,8023-0,2912=0,5111


Conclusiòn: La probabilidad de que un bombillo dure enre 778 y 834 horas es de
0,5111, dicho de otra forma, el 51,11% de los bombillos dura entre 778 y 834
horas

b) Como Z=(800-800 4 , entonces: P X˃8 =P z˃ , = ,5 Ubicamos el


0,0 en la primera columna y el segundo cero en la primera fila y Como la
pregunta es en el mismo sentido de la tabla y el àrea es 0,5 que indica que
el 50% de los bombillos dura mas de 800 horas

Área=0,50

Figura 9. Àrea a la derecha en la distribuciòn


c) Dada la pregunta, el nùmero de bombillos es igual a N P X˃9

Asi que estandarizando tenemos que Z= (900-800)/40=2,50, por lo que: la


P X˃9 =P z˃2,5 = (Ubicamos el 2,5 en la primera columna y el 0 en la fila
correspondiente a 2.5 a saber: 1-0.9938= 0,0062.

Área=0,0062

0 Z=2,50

Figura 10. Àrea central en la distribuciòn normal

DISTRIBUCIÒN T DE STUDENT

La distribución t de Student o distribución t es un modelo de probabilidad teórico


utilizado para aproximar el momento de primer orden (Media) de una población,
que tiene distribución normal cuando el tamaño de muestra es pequeño y se
desconoce la desviación típica. Dicho de otra forma, es una distribución de
probabilidad que estima el valor de la media de una muestra pequeña extraída de
una población que sigue una distribución normal y de la cual no conocemos su
desviación típica. Esto se aplica debido a que la desviación puede variar
considerablemente de una muestra a otra, entonces Student (Gosset) creo esta
distribución, introduciendo el término ¨Grados de libertad¨ (n-1) para garantizar la
no subestimación de la desviación típica). Básicamente es la misma distribución
normal, pero considerando el tamaño de muestra y ejerciendo una especie de
castigo por el tamaño de muestra utilizado (Figura 11).
Area Area

-t ; n-1 gl 0 t ;n-1gl

Figura 11. Distribuciòn t de Student

1. Ejemplo: Hallar los valores críticos de t para que el área de la cola de la


derecha de la distribución sea 0,05 si el número de grados de libertad es: a)
16 b) 25 c) 200.
Si ubicamos en tabla t de Student

Area = 0,05

0 t 0,05;16gl=1,746
t 0,05;25gl=1,708
t 0,05;200gl=1,645

Figura 12. Valores t de estudent para 16, 25 y 200 gl

Nota: Observe que en la medida que n aumenta su valor (Figura 12), el valor de t
se acerca a la distribución normal estandarizada, por este motivo, la tabla de
Student llega hasta 29 gl ya que se considera que de 30 en adelante se puede
usar la tabla normal

Ejemplo 2. Halle los valores críticos de t para que el área central de la distribución
t de Student sea: a) 0,90 b) 0,95 c) 0,99, con 27 grados de libertad.
a) Para el àrea central de 0,90, la distribuciòn queda:

Area = 0,05 Area= 0,05

Àrea= 0,90

-t 0,05 ; 27= -1,703 gl 0 t 0,05;27gl=1,703

Figura 13 valores de t para un área central de 0,90)

b) Para un àrea de 0,95, entonces cada cola vale 0,025, por lo que el
valor de
t 0,025; 27 gl = 2,052
c) Para un àrea central de 0,99, entonces cada cola vale 0,005, por lo
que el valor de t 0,005; 27 gl = 2,771

DISTRIBUCIÓN DE JI-CUADRADO O CHI-CUADRADO (χ2

La distribución de Pearson, conocida también como ji-cuadrado(a) o chi-


cuadrado (χ²), es una distribución de probabilidad para variable aleatoria continua

En realidad la distribución ji-cuadrada es la distribución muestral de s 2. O sea que


si se extraen todas las muestras posibles de una población normal y a cada
muestra se le calcula su varianza, se obtendrá la distribución muestral de las
varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer


el estadístico X2. Si se elige una muestra de tamaño n de una población normal
con varianza σ2, el estadístico:

( )

De manera que el estadístico ji-cuadrado está dado por:


( )

Donde n es el tamaño de la muestra, s2 la varianza muestral y σ2 la varianza de la


población de donde se extrajo la muestra. El estadístico ji-cuadrado también se
puede definir con la siguiente expresión:

∑( ̅̅̅)

Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 siempre son mayores o iguales que 0.


2. La forma de una distribución X2 depende de los gl=n-1; Por lo que , hay un
número infinito de distribuciones X2.
3. El área bajo una de estas curvas y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas que se extienden a la
derecha; esto es, están sesgadas a la derecha (Asimetría positiva)
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).

La siguiente figura ilustra la distribución de X2 tabulada

Área a la derecha

0 Χ2 α; k-1gl

Figura 14. Distribución X2 correspondiente a la fdp dada por:

para x>0
La tabla que se utilizará para estos apuntes es la del libro de probabilidad y
estadística de Mendenhall, Scheaffer y Wackerly, la cual da valores críticos χ2 (gl)
para 10 valores especiales de α.

Para denotar el valor crítico de una distribución X 2 con gl (grados de libertad) se


usa el símbolo χ2 (gl); este valor crítico determina a su derecha un área de α bajo
la curva X2.

Ejemplo 1: para encontrar X20.05(10gl) en la tabla se localiza 10 gl en el lado


izquierdo o derecho (primera columna o última) y α= 0,05 a o largo de la primera
fila de la misma tabla gráficamente sería:

α=0,05

Χ2 0,05; 10gl=18,307

Figura 15. Valor de χ 2 para un área de 0,05

2. Ejemplo 2: Para una distribución de χ 2 con 12 gl. Halle la probabilidad de


que χ 2:
a) Sea superior a 5,226.
b) Este entre 6,30 y 23,3.
c) Sea inferior a 21,0.

a) Para hallar la P ( χ 2 ˃ 5,23 , entramos a la tabla con 2 gl y en esa fila que


se origina ubicamos 5,23 y luego subimos hacia arriba y observamos a que
área corresponde y tal como lo ilustra la figura 16.
α=0,95

2
Χ 0,95; 12gl=5,23

Figura 16. Valor del area a la izquierda para 12 gl, para χ 2 =5,23

2 2 2
b) La P (6,30 < χ ˃23,3 viene siendo entonces : P( χ ˃ 6,30) -P( χ ˃
23,3)=0,90-0,025=0,875

Area total a la izq=0,90


Ärea=0,025

Area=0,875

2
Χ 12gl=6,30 2
Χ 12gl= 23,3

Figura 17. Valor del área central entre los ji-cuadrados de: 6,30 y 23,3

c). Para hallar la P χ 2 <21,0 ), entramos a la tabla con 12 gl y en esa fila que
se origina ubicamos 21,0 y luego subimos hacia arriba y observamos a que área a
la derecha corresponde, tal como lo ilustra la figura 18, a 0,05, de manera que el
área a la izquierda será P χ2 < 21,0 )= 1- P χ2 ˃2 , = ,95
Área=0,95

Área=0,05

2
Χ 12gl=21,0

2
Figura 18. Áreas bajo la curva de Ji-cuadrado con 21 gl para Χ =21,0

DISTRIBUCION DE LA RAZON DE VARIANZAS O DISTRIBUCIÓN F DE

FISHER-SNEDECOR

Podríamos comparar las varianzas de dos poblaciones, , utilizando la

razón de las varianzas muestrales ; si cercano a 1, se infiere que no hay

suficiente evidencia para indicar que sean diferentes. Por otra parte, un
valor mucho mayor que 1 o mucho más pequeño para la razón s21/s22,
proporcionará evidencia suficiente para indicar una diferencia entre las varianzas
de las dos poblaciones.

La variable aleatoria F se define como el cociente de dos varianzas de variables


aleatorias, distribuidas como ji-cuadrado c/u, e independientes, cada una dividida
entre sus respectivos grados de libertad, es decir:


Entonces la variable aleatoria F es no negativa, y la distribución tiene un sesgo


hacia la derecha. La forma de la distribución F es muy parecida a la distribución
ji-cuadrado; pero proporcionan una flexibilidad adicional con respecto a
esa forma. Luego:

Si s12 y s22 son las varianzas muestrales independientes de tamaño n 1 y n2


tomadas de dos poblaciones con varianzas respectivamente, entonces,
el estadístico:

( ) ( )

Para manejar la tabla de Fisher presentada en Mendenhall, Scheaffer y Wackerly,


buscamos primero los grados de libertad dos (Denominador) para luego localizar
el área correspondiente en la segunda columna, relacionándola con los grados de
libertad uno, (Numerador) y obtener así el valor de F (Figura 19)

Área = α

Fα; (n1-1) y (n2-1)gl

Figura 19. Forma de la distribución de F

Ejemplo 1. Para una distribución de F con 15 y 7gl. de libertad para el numerador


y denominador respectivamente. Encontrar:
a). P(F > 3,51)
b). P(3,51 < F < 6,31)
c). P(F < 3,51)

a). Como la P(F > 3,51) representa el área a la derecha de la distribución,


entonces entramos directamente a la tabla como lo indica la figura 19 y
encontramos que con 7 gl en el denominador y 15 en el numerador y encontramos
que el área α= , 5
b). Como en este caso, se trata de ubicar el área entre dos valores de F que
equivale a la P(3,51 < F < 6,31) entonces, la distribución queda repartida como lo
indica la figura 20:de manera que P(3,51 < F < 6,31) = P F ˃ 3,5 - P F ˃ 6,3
=0,05-0,01=0,04

α=0,05

α=0,01

Área=0,04
1

F; 15 y 7 gl= 3,51 F;15 y 7gl= 6,31

Figura 20; Valores de área para F entre 3,51 y 6,31

c). En este caso, solicitan el área del lado izquierdo que equivale a la
probabilidad P(F < 3,51) en la curva de F (Figura 20).

1-α = 0,95

α=0,05

F; 15 y 7 gl= 3,51

Figura 21. Valor del área a la izquierda de F=3,51 que equivale a P(F < 3,51), asi
en la tabla de F ubicamos el área a la derecha que por el item a, sabemos que es
α=0,05. Entonces la P(F < 3,51) = 1- P F ˃ 3,5 = -0,05=0,95

Ejemplo 2: . Para una distribución de F; encontrar.

a). F 0,05 con 15 y 7 gl.

b). F 0,99 con 24 y 12 gl.


a) A diferencia del ejemplo anterior, en este caso;nos piden lo contrario, es decir,
nos dan el área para que busquemos el valor de F, así que entramos a la tabla
con 7gl en denominador y 15 en el numerador y ubicamos el valor de F que le
corresponde a un α=0,05, y el valor de F=3,51

b) En este caso, por estar el area pequeña del lado izquierdo, repetimos el
procedimiento anterior con los grados de libertad invertidos, ya que se invierte
el cociente para usar la cola derecha de la curva que es la tabulada, es decir,
que entramos con 24 gl en el denominador y 12 en el numerador y
encontramos que el valor F=3,03 para el valor de α=0,01 a la derecha,
significa que para el lado izquierdo será F=1/3,03 =0,33, el area a la izquierda
tambien como el valor crítico de F para:

0,01

0,99

F; 12 y 24 gl= 1/3,03=0,33
EJERCICIOS PROPUESTOS

1. En el siguiente cuadro, se muestra la Precipitación promedio anual en


pulgadas entre 1960 -2010 en una región.

18,6 13,8 10,4 15,0 16,0 22,1 16,2 36,1 11,6 7,8
22,6 17,9 25,3 32,8 16,6 13,6 8,5 23,7 14,2 22,9
17,7 26,3 9,2 24,9 17,9 25,6 26,6 16,5 18,1 24,8
16,6 32,3 14,0 11,6 20,0 33,8 15,8 15,2 24,0 16,4
24,1 23,2 17,3 10,5 15,0 20,2 20,2 17,3 16,6 16,9

a) Elabore una distribución de frecuencias a partir de los datos del cuadro anterior
b) Calcule e interprete las medidas de concentración y dispersión vistas en clase.
c) Elabore un Histograma, un polígono de frecuencia y una curva de Frecuencias
acumuladas (OJIVA). Interprete la simetría de la distribución, con apoyo de la
literatura.

2. El siguiente cuadro muestra la distribución de frecuencias del grosor (mm) de


la capa de colmatación anual de una presa en 20 años

Li Ls Nº de años Nº relativo%. Nº Acum. Nº Acum Rel.

80 - 89
90 - 99 30 50
100 - 109 15
110 - 119 3
120 - 129

a). Complete el cuadro de frecuencias


b) ¿Qué porcentaje de años tiene menos de 100 pero más de 90 mm?
c) ¿Qué porcentaje de años tienen menos de 100 mm?.
d) ¿Qué porcentaje de años tiene más de 109 o menos de 90 mm?
e) ¿Cuál es el número de años con más de 119 mm.?
3. De las siguientes características, señale ¿cuáles son cualitativas, cuales son
cuantitativas, en caso de ser cuantitativas: diga si son continuas o discretas?.

a) Número de trabajadores.
b) Superficie total
c) Producción de una fábrica
d) Tipo de registro.
e) Clase de financiamiento.
f) Longitud de 20 tramos de vialidad.
g) Temperatura promedio diaria.
h) Censo anual del colegio de ingenieros.

4. Se tiene la siguiente estructura arbórea de un ecosistema:

Espacie Nº de árboles
Samán 1.000
Drago 500
Ceiba 100
Apamate 400

5. Utilizando la estructura del ecosistema anterior, señale:


a) ¿Cuál es la razón de las especies de Saman – Ceiba?.
b) ¿Cuál es la proporción de árboles de Apamate?.
c) ¿Cuál es el porcentaje de árboles de Drago?.

6. Se conoce que una franja de construcción hay 200 árboles maderables de


las especies Caoba, Teca y Pino caribe, distribuidos en las proporciones de
0,25; 0,40; y 0,35 respectivamente. ¿Cuál es el número de árboles de cada
especie?

7. Sea el experimento aleatorio (EA) lanzar una moneda tres veces. Si


definimos a X como la variable aleatoria “número de caras”. (Use apoyo
bibliográfico para responder):
a) Describa el espacio muestral del experimento.
b) Encuentre la distribución de probabilidades para el número de caras.
c) Construya el gráfico de probabilidades.
d) Calcule P(X=2)
e) Calcule la P X ≤ 2 .
f) Calcule la P(X > 2).

8. Sea X variable aleatoria continua que puede tomar valores entre X=1 y
X=3, y tiene una función de densidad de probabilidad dada por f(x)=1/2.
9. Demuestre que el área bajo la curva es igual a uno
10. Encuentre la P(2<X< 5/2).
11. Encuentre la P X ≤ 3 2 .

6.) Se tiene la siguiente estructura arbórea de un ecosistema:

Espacie Nº de árboles
Samán 1.000
Drago 500
Ceiba 100
Apamate 400

¿Cómo se estructuraría aleatoriamente una muestra, para estimas el perímetro de


tallo con el 20% de los árboles? Use apoyo bibliográfico.
a) Aplicando el muestreo aleatorio simple.
b) Aplicando el muestreo estratificado.
c) Justifique su respuesta
d) cual sería el tamaño de muestra requerido para estimar el promedio en
muestreo simple con un error máximo admisible e r=0,10 y 95% de confianza
asumiendo que la S de la muestra anterior fue de 12,5cm.

7. En una población de 400 casas se estimará la proporcion de casas con


techos que contienen asbesto, Cual será el tamaño de muestra requerido
con un error máximo admisible de 0,1 y 95% de confiabilidad, sabiendo que
una muestra piloto reportó que la proporcion muestral fue de 0,17.

8. Si x ~ N (40, 36), encontrar.


a.) El área por debajo de 32.
b.) El área por encima de 27.
c.) El área entre 42 y 51.
d.) El punto que tiene el 45% del área por encima de el.
e.) Los puntos que contienen el 68,26% del área central.

9. El perímetro de los tallos en una plantación forestal tiene una distribución


normal con una media de 65 cm. y una desviación estándar de 20 cm.
a) ¿Cuál es la probabilidad de que un árbol seleccionado al azar tenga un
perímetro entre 65 y 95,8 cm.
b) ¿Cuál es el valor de c tal que, el árbol escogido al azar tenga un perímetro
menor que c con una probabilidad de 0,8531.

10. ¿Cuál es la probabilidad de que una muestra aleatoria de 25 observaciones


que provienen de una población normal con varianza igual a 6, tenga una
varianza muestral:
a. Superior a 3,925.
b. Entre 3,45 y 9,85.
c. Menor que 4,75.
d. Menor que 2,73 ó mayor que 7,05.
11. Si X ~ N (1000, 484), y se escoge una muestra de 18 observaciones;
encuentre la probabilidad de que la varianza de la muestra sea:
a. Mayor que 288,57.
b. Menor que 585,71.
c. Un valor comprendido entre 247,71 y 788,57

12. Para una distribución de F; encontrar.


a). F 0,01 con 14 y 19 gl.
b). F 0,99 con 10 y 20 gl.
c). F 0,05 con 9 y 12 gl.

13. Si S12 y S22 representan las varianzas de dos muestras aleatorias


independientes de tamaño n1 = 25 y n2 = 31, tomadas de 2 poblaciones
normales con varianzas σ12 = y σ22 = 15. Encontrar:


P ( S12 S 22 )  1,26 

14. Si S12 y S22 representan las varianzas de dos muestras aleatorias


independientes de tamaño n1 = 8 y n2 = 12, tomadas de 2 poblaciones
normales con varianzas iguales. Encontrar:


a ) P S 12 S 22  4,89  
b) P S 1
2
S 22   3,01
c) P S 1
2
S 22   3,01
d ) P S 1
2
S 22   3,76
  2  
e) P 4,89   S1 2   5,86
  S2  
BIBLIOGRAFIA CONSULTADA

WACKERLY, D., Mendenhall, W. y Scheaffer, R. 2010. Estadística matemática con


aplicaciones. 7ma. Ed. Cengage Learning Editores, S.A. México D. F. Disponible en:
https://www.cimat.mx/ciencia_para_jovenes/bachillerato/libros/[Wackerly,Mendenhall
,Scheaffer]Estadistica_Matematica_con_Aplicaciones.pdf

LOPEZ, R. 996. “Cálculo de probabilidades e inferencia estadística. Tercera Edición.


Editorial Texto: de la Universidad Católica Andrés Bello. Caracas. Venezuela. 597 p.

LIND, D., Marchall W. y Mason R. 2004. “Estadística para administración y economía. 11ª.
Edición, .Edit. Alfaomega Colombiana S.A de C:V. Bogotá D.C. Colombia. 830 p.

PÁRRAGA, C. 2001. Problemario para prácticas del subproyecto estadística. Mimeog.


Universidad Nacional Experimental de los Llanos. Guanare. Venezuela. 60 p.

LAGUNA C. 2014. Introducción a la estadística. 3ra. Instituto Aragones de ciencias de la


salud. IACS. Aragon. España 12 p. Disponible en: https://www.ICS-
aragon.com/cursos/salud -publica/2014/ PDF/M2T01.pdf.

INSTITUTO TECNOLÓGICO DE CHIGUAHUA. (sin fecha). DISTRIBUCION JI-CUDRADA.


Chihuahua. Mexico.. Disponible en:
https://www.itchihuahua.edu.mx/academic/industrial/estadística/ cap 03 c.html. .

TORRES A. (sin fecha). Los 7 tipos de muestreo y su uso en las ciencias. España.
Disponible en: https://www.Psicologia y mente
.com/miscelaneas/tipos_de_muestreo..pdf.

.MONTGOMER , D. y Runger, G. C. 2 3. “Probabilidad y estadística aplicada a la


ingeniería. 2da. Edición. Edit. LIMUSA, S. A. de C.V. México. 937 p. Disponible en:
https://www.academia.edu/34899097/Montgomery_y_Runger_Probabilidad_y_Estadi
stica_Aplicada_a_La_Ingenieria

MURRAY R. Spiegel M. y Larry J. 2009. Stephens. Estadística. 4ta edición. Edit. McGraw-
Hill Interamericana. México. 601 p. Disponible en:
http://ensfep.edu.mx/enlinea/pluginfile.php/1531/mod_folder/content/0/Estad%C3%A
Dstica.%20Serie%20Schaum-%204ta%20edici%C3%B3n%20-
%20Murray%20R.%20Spiegel.pdf%20%281%29.pdf?forcedownload=1

PORRAS D., H. y Sánchez R., O. G. 2015. APUNTES DE ESTADÍSTICA APLICADA A LA


INGENIERÍA CIVIL. 3ra. Edición, Universidad Nacional de Santander. Bucaramanga,
Colombia. 115 p. Disponible en:
https://www.academia.edu/13819952/Porras_and_S%C3%A1nchez_Tercera_Edici%
C3%B3n_APUNTES_DE_ESTAD%C3%8DSTICA_APLICADA_A_LA_INGENIER%
C3%8DA_CIVIL.

STEEL, R. y J. Torrie 1988. Bioestadística: Principios y procedimientos. 2da edición,


McGraw-Hill /Interamericana, México. 622 pp. Disponible en:
https://clea.edu.mx/biblioteca/Steel%20Robert%20G%20-
%20Bioestadistica%20Principios%20Y%20Procedimientos%202ed.pdf

WACKERLY, D. D., Mendenhall, W. y Scheaffer, R. L. 2010. Estadística matemática con


aplicaciones. 7ma. Ed. Cengage Learning Editores, S.A. México D. F. Disponible en:
https://www.cimat.mx/ciencia_para_jovenes/bachillerato/libros/[Wackerly,Mendenhall
,Scheaffer]Estadistica_Matematica_con_Aplicaciones.pdf

WALPOLE, R. E, Myers, R. H. Myers, S. L. y Ye, K. 2012. Probabilidad y estadística para


Ingeniería y Ciencias. 9na. Edición, Edit. PEARSON. México. 816 p. Disponible en:
https://vereniciafunez94hotmail.files.wordpress.com/2014/08/8va-probabilidad-y-
estadistica-para-ingenier-walpole_8.pdf.