Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
PRESENTACION
Este material cuenta con tres capítulos de los cuales a continuación se describen
cada uno de ellos.
2
INTRODUCCIÓN
III
popular, aquella célebre frase que dice: “Hay tres tipos de mentiras...” Más bien
habría que decir que hay mentirosos que abusan de la ignorancia estadística de la
mayoría de la gente.
Este material tiene el objetivo de ser un material útil para los alumnos de maestría
que se inician en el conocimiento y aplicación de la estadística, por ello se explica
desde los conceptos más básicos que se requieren antes y durante un análisis
estadístico, así como en la interpretación de los resultados.
IV
CONTENIDO PÁG.
V
CONTENIDO PÁG.
VI
CRITERIOS Y PORCENTAJES DE EVALUACIÓN DEL CURSO
1) 30% Tarea 1.
2) 50% Tarea 2
3) 20% Profesor.
VII
UNIDAD I. LOS CONCEPTOS BÁSICOS Y PANORAMA GENERAL
DEL PROCESO DE UNA INVESTIGACIÓN ESTADÍSTICA
OBJETIVO:
TEMARIO
1.1 Definición de estadística
1.2 Conceptos básicos
1.3 Escalas de medición
1.4 Aplicaciones de los métodos estadísticos
1.5 Identificación en los problemas en los que no se utiliza la estadística para
resolverlos
1.6 Etapas de una investigación estadística
1.7 Los métodos estadísticos y la computadora
1.8 Colectivos estadísticos
1.9 Tipos de estudios estadísticos
Estrategia de aprendizaje.
• Trabajar en conjunto con el profesor, así como resolver todos y cada uno de
los ejercicios sugeridos al final de la unidad.
1
1.1 DEFINICIÓN DE ESTADÍSTICA
Estadística descriptiva
Estadística inferencial
Una vez consideradas las funciones de las dos áreas en que se clasifica la
estadística, se puede resumir el concepto de estadística como se menciona a
continuación:
Estadística
2
muestrales a las técnicas de hacer inferencias en base a los resultados de una
muestra. Esta idea que se tiene de la estadística, no quiere decir, que el tema de
la estadística se haya vuelto estable e inflexible, sino por el contrario, se siguen
creando nuevas técnicas estadísticas para satisfacer necesidades específicas. Por
ejemplo, recientemente se han creado algunas nuevas técnicas descriptivas
conocidas con el nombre de "análisis exploratorio de datos". Estas técnicas
permiten antes de efectuar cualquier otro tipo de análisis, examinar de manera
preliminar el comportamiento de nuestros datos y de acuerdo con este
comportamiento ajustar a tales datos el modelo más adecuado.
Población
Una población es un conjunto de elementos con alguna característica en
común. Una lista de los empleados de una fábrica es un ejemplo de una
población. El número de elementos de una población generalmente se denota por
N.
Muestra
Una muestra es un subconjunto de la población. El número de elementos
de una muestra lo indicaremos con n.
Parámetro
Un parámetro es una característica numérica de una población. Los
parámetros generalmente se denotan por letras griegas. Algunos parámetros
3
comúnmente de interés son: el de la media, el total, la proporción, la varianza y la
desviación estándar que se denotan respectivamente por µ, τ, ρ, σ2 y σ.
Estadístico
Medida numérica que describe la característica de una muestra.
Variable
Una variable es una característica que puede tomar diferentes valores. De
esta manera, el ingreso, la producción y el sexo son variables dado que pueden
tomar diferentes valores cuando se estudian distintos elementos de una población.
Las variables pueden ser discretas y continuas. (En métodos estadísticos como en
diseños de experimentos y regresión, las variables se clasifican en dependientes e
independientes.).
Variable discreta
Una variable discreta es aquella para la cuál sus resultados se pueden
numerar, por ejemplo, el número de clientes atendidos diariamente durante un
mes en una institución bancaria, el número de ventas efectuadas por 20 agentes
de seguros de una compañía, el número de hijos por matrimonio de cierta ciudad,
etc., obsérvese que estos valores generalmente son obtenidos a través de un
proceso de contar.
Variable continúa
Una variable continua es aquella variable que puede tomar cualquier valor
dentro de un rango de valores. Obsérvese que estos valores son obtenidos a
través de un proceso de medir, por ejemplo, el tiempo que esperan en ser
atendidos 10 personas en un consultorio médico, el consumo de energía eléctrica
de las viviendas de una colonia durante un bimestre, la altura de 100 plantas de
café sembradas en una hectárea, etc.
4
Constante
Una variable se diferencia de una constante ya que al valor de ésta última
nunca se puede alterar. Algunos ejemplos de constantes son: el número de días
del mes de mayo indistintamente del año, el número de centímetros que tiene un
metro y el número de lados que tiene un pentágono.
Dato
Un dato es un resultado de observar, contar o medir una característica
específica de interés. Generalmente existen dos tipos de datos: cualitativos y
cuantitativos.
Observación:
El esquema siguiente ilustra los conceptos anteriores.
5
Dato
Cualitativo Cuantitativo
o o
Atributo Numérico
Discreto Continuo
6
Escala Nominal.
Las cualidades, categorías o clases no reflejan un
orden, por eso en este tipo de escala sólo es posible
decir si son iguales o diferentes. Por ejemplo, al
registrar la profesión de un grupo de empleados se
podría obtener como resultado: Agrónomo, Biólogo,
Contador, etc.
Cualitativos
Escala Ordinal
En esta escala los datos pueden ordenarse de un modo
lógico en forma ascendente o descendente. Por
ejemplo, la calidad de un producto puede clasificarse
como malo, regular o bueno.
Datos
Escala de Intervalo.
En esta escala existe un cero arbitrario, que no indica
ausencia de medición y se puede establecer distancias
entre dos observaciones. Por ejemplo, la temperatura
medida en grados centígrados.
Cuantitativos
Escala de Razón.
En esta escala existe un cero absoluto (real), aquí el
cero indica ausencia de medición. Además de
establecer "distancias" entre dos observaciones es
posible establecer un porcentaje de diferencia entre dos
observaciones. Por ejemplo, el ingreso de un grupo de
empleados.
7
1.4 APLICACIONES DE LOS MÉTODOS ESTADÍSTICOS
8
• En la Industria para conocer la proporción de artículos producidos que
resultan defectuosos.
9
1.6 ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA
10
1.7 LOS MÉTODOS ESTADÍSTICOS Y LA COMPUTADORA
11
2. Los productores del cultivo de maíz del estado de Veracruz son la población
objetivo si se desea hacer un estudio sobre este cultivo.
Nótese que en estos ejemplos la población objetivo son finitas, esto es, se
conoce el número de elementos N que la conforman.
12
1.9 TIPOS DE ESTUDIOS ESTADÍSTICOS
• Estudios observacionales.
• Estudios experimentales.
• Estudios de muestreo.
En las tres clases de estudio se realiza la fase del diseño, que consiste en
la planeación de las actividades hasta que se han colectado los datos. En los
estudios experimentales el investigador cuenta con una serie de unidades de
estudio a las que asigna un conjunto de tratamientos (estímulos) y observa una
serie de variables respuesta. En el caso de los estudios de muestreo el
investigador selecciona de una población mayor las unidades a estudiar, y les
observa tanto las variables explicatorias como las variables respuesta. Un estudio
experimental se puede combinar con un muestreo, por ejemplo en un estudio
sobre ecología en cultivos de caña de azúcar. Aquí podríamos considerar un
experimento de fertilización sobre grandes áreas donde se prueban cuatro
diferentes fórmulas. Sin embargo, al no poder evaluar las variables respuesta
sobre las grandes extensiones, entonces se hace un muestreo por áreas, como el
que se ha especificado para el ejemplo de la diversidad vegetal presentado antes.
Por otro lado, los estudios observacionales son aquellos en los que las unidades
ya están dadas (no hay muestreo) y se observan las características de interés.
Típicos ejemplos son aquellos en los que se usan expedientes, sistemas
periódicos de información, estudios con voluntarios, etc.
13
AUTOEVALUACIÓN
14
b. Si se seleccionaron 500 estudiantes y se les pidió que tomaran nota en sus
gastos de libros de texto y que informaran la cantidad total. Las 500
cantidades resultantes forman una muestra. Mencione el estadístico de
interés en el presente estudio.
6. Identifique cada uno de los siguientes casos como ejemplo de variable (1) de
atributo, (2) discreta, o (3) continúa.
a. La resistencia de la ruptura de un determinado tipo de cuerda.
b. EL color del cabello de los niños que estén viendo por televisión una película.
c. EL número de señales de tránsito en poblados con menos de 500 habitantes.
d. Si una llave de lavabo está defectuosa o no.
e. El número de preguntas contestadas correctamente en un examen.
f. El tiempo que se necesita para contestar una llamada telefónica en una oficina
de bienes raíces.
7. Identifique cada uno de los siguientes casos como ejemplo de variable: (1) de
atributo, (2) discreta o (3) continúa.
a. El resultado de la encuesta a un votante posible acerca del candidato de su
preferencia.
b. El tiempo necesario para que una herida cicatrice cuando se utiliza un nuevo
medicamento.
c. El número de llamadas telefónicas recibidas en un conmutador cada 10
minutos.
d. La distancia a la que puede llegar un balón de fútbol al ser pateado por las
jóvenes del primer grado de la Universidad Veracruzana.
15
e. El número de páginas escritas por cada trabajo en una impresora de
computadora.
8. Supóngase que un niño de doce años quiere saber la diferencia entre muestra y
población.
a. ¿Qué información daría como respuesta?
b. ¿Qué razones se le daría sobre el porqué se debe tomar una muestra en
vez de estudiar todos los miembros de la población?
16
UNIDAD II. MÉTODOS TABULARES Y GRÁFICOS PARA LA
ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS
Objetivo:
TEMARIO
2.1 Introducción.
2.2 Método tabulares para representación de datos.
2.2.1 Distribución de frecuencia.
2.2.2 Conceptos.
2.2.3 Construcción de una tabla de frecuencia.
2.3 Método gráfico para la representación de los datos.
2.3.1 Gráfica de barras.
2.3.2 Gráfica circular.
2.3.3 Histograma.
2.3.4 Polígono de frecuencias.
2.3.5 Ojiva o polígono de frecuencia acumulada.
Estrategia de aprendizaje.
• Trabajar en conjunto con el profesor, así como resolver todos y cada uno de
los ejercicios sugeridos al final de la unidad.
17
2.1 INTRODUCCIÓN
18
Tabla 2.1. Número de empleadores del sexo masculino en algunas dependencias
gubernamentales
Dependencia Total de hombres empleadores
Secretaria de Educación Pública 135,716
Secretaría de Marina 19,443
Secretaria de Obras Públicas 35,444
Secretaria de Recursos Hidráulicos 53,725
Secretaría de Salubridad y Asistencia 28,851
Secretaria de la Reforma Agraria 6,680
Esta tabla nos permite visualizar fácilmente las características de los datos.
Una forma de presentación que será muy útil para nuestro propósito es el
que resulta de organizar los datos en tablas de frecuencias o tablas de distribución
de frecuencia.
2.2.2 Conceptos.
Límite de clase: Son los puntos que limitan a cada una de las clases.
Límite Inferior de Clase: Son los valores menores que pertenece a esa clase.
19
Limite Superior de Clase: Son los valores máximos que pertenecen a cada
clase.
Punto Medio o Marca de Clase: Es el número que representa a cada una de las
clases y se obtiene dividiendo la suma de los limites de cada clase entre dos y se
denota de la siguiente forma (Vi).
20
3. Elección de límite inferior de la primera o superior de la última clase y
cálculo de los límites de los demás clases.
4. Calculo de los valores medios ( Vi ). Si Li es el límite inferior de la i-ésima
clase y Ls el límite superior, entonces
Li + Ls
Vi =
2
fi
pi =
Número total de observacio nes
21
Ejemplo 2.1. Obtener la tabla de frecuencia para los datos de la Tabla 2.1.
Tabla 2.2. Rendimiento (en kilogramos) de plantas de maíz atacadas por el barrenador
europeo.
3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96
7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64 8.82 10.08 5.64
8.26 7.90 10.27 6.65 7.25 6.26 6.43 7.71 7.52 6.68 7.98
7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14
10.34 6.91 7.82 6.76 7.75 7.36 8.52 7.23 7.63 6.95 778
6.65 6.86 7.74 6.67 7.12 4.00 7.10
22
Ejemplo 2.2. A continuación se presentan las edades de 83 investigadores en
instituciones de investigación agropecuaria en México.
(25.5, 30.5] 28 42 42 83 45 83 42
(30.5, 35.5] 33 21 21 83 66 83 66
(35.5, 40.5] 38 7 7 83 73 83 73
(40.5, 45.5 43 3 3 83 76 83 76
(45.5, 50.5] 48 2 2 83 78 83 78
(50.5, 55.5] 53 2 2 83 80 83 80
(55.5, 60.5] 58 2 2 83 82 83 82
(60.5, 65.5] 63 1 1 83 83 83 83
23
2.3 MÉTODOS GRÁFICOS PARA LA REPRESENTACIÓN DE LOS DATOS
24
60
50
Número de Individuos
40
30
20
10
CATOLICA PROTESTA OTRA
RELIGION
25
El gráfico circular correspondiente a los datos de la Tabla 2.6 se presentan
en la Figura 2.2.
2.3.3 HISTOGRAMA
26
Tabla 2.7. Velocidad de 55 automóviles registrados en la avenida de cierta ciudad.
27 23 22 38 43 24 35 26 28 18 20
25 23 22 52 31 30 41 45 29 27 43
29 28 27 25 29 28 24 37 28 29 18
26 33 25 27 25 34 32 36 22 32 33
21 23 24 18 48 23 16 38 26 21 23
27
Se observa que en la Figura 2.3 que la mayor parte de los automóviles
circulan a una velocidad entre 13 y 33 kms/hr., mientras que una minoría circula a
velocidades mayores de los 33 kms/hr. La distribución muestra una asimetría
positiva.
18
16
14
Número de automóviles
12
10
0
<= 15 (15,20] (20,25] (25,30] (30,35] (35,40] (40,45] (45,50] (50,55] > 55
Velocidades
28
2.3.5 OJIVA O POLÍGONO DE FRECUENCIAS ACUMULADAS
60
40
R 20
E
C.
A
C
0
40 60 80 100
PESO
29
Se puede observar en la Figura 2.5 que aproximadamente 15 alumnos
tienen un peso menor o igual de 60 kilos, que aproximadamente 55 alumnos
tienen un peso menor o igual que 80 kilos.
30
AUTOEVALUACIÓN
31
frecuencias agrupadas que considere usted adecuada e interprete el
comportamiento de los datos.
32
Tabla 5. Grado máximo de estudios de 720 votantes elegidos al
azar en una encuesta de opinión política en la ciudad de Xalapa
Ver.
Máximo grado de estudios Número de ciudadanos
Sin estudios 44
Primaria 176
Secundaria 155
Bachillerato 177
Licenciatura 144
Otros 24
Total 720
33
UNIDAD III. ESTADÍSTICA DESCRIPTIVA
OBJETIVOS:
TEMARIO
3.1 Medidas de tendencia central.
3.1.1 Media.
3.1.2 Mediana.
3.1.3 Moda.
3.1.4 Comparaciones de la media, mediana, moda.
3.1.5 Media ponderada.
3.2 Medidas de dispersión.
3.2.1 Amplitud.
3.2.2 Varianza.
3.2.3 Desviación estándar.
3.2.4 Coeficiente de variación.
3.2.5 Comparación de las medidas de dispersión.
3.2.6 Significado de la desviación estándar.
3.3 Medidas de localización.
3.3.1 Cuartiles.
3.3.2 Percentiles.
3.4 Coeficiente de asimetría y curtosis.
3.4.1 Coeficiente de asimetría.
3.4.2 Curtosis.
34
Estrategias de enseñanza por unidad de aprendizaje.
• El propio estudiante será el gestor de su propio aprendizaje guiado por el
profesor únicamente en lo que corresponde a indicar el camino que debe
recorrer y evaluando el aprendizaje adquirido.
Estrategia de aprendizaje.
• Trabajar en conjunto con el profesor, así como resolver todos y cada uno de
los ejercicios sugeridos al final de la unidad.
35
Una vez que los datos han sido obtenidos y organizados, el investigador
está listo para realizar un análisis descriptivo. Este capítulo se muestra la forma
en que los datos obtenidos pueden condensarse en un solo valor central
alrededor del cual todos los datos muestrales se distribuyen. Por esta razón, a
menudo se denomina a un valor central como una medida de tendencia central.
Existen muchos tipos de valores centrales; las medidas utilizadas con mayor
frecuencia son la media aritmética, la mediana y la moda.
36
3.1.1. LA MEDIA
n
∑ xi
i =1
x= 3.1
n
n
∑ (x1 − x ) = 0
i =1
37
Ejemplo 2: Un conjunto de datos consta de cinco valores 6, 3, 8, 6 y 4. Encuentre
la media.
3.1.2. LA MEDIANA.
38
de cuál extremo de los datos (mayor o menor) ordenados se
encuentre. De hecho, contar desde ambos extremos sirve como una
comprobación excelente
Solución:
Solución:
PASO 1: Los datos ordenados de manera creciente, son 6, 7, 8, 9, 9 y 10.
PASO 2: n +1 6 +1
Profundidad de la mediana: d( Me ) = = = 3.5 (la “3.5ava”
2 2
posición)
PASO 3: Es decir, la mediana está a la mitad entre las porciones de datos tercera y
cuarta. Para encontrar el número situado a la mitad de dos valores
39
cualesquiera, se suman los dos valores y el resultado se divide entre 2. en
este caso se suman el tercer valor (8) y el cuarto valor (9), luego se divide
8+9
entre 2. La mediana es Me = = 8.5 , número que está a medio camino
2
entre los dos números.
3.1.3 LA MODA.
Solución:
Las modas son 7, 8 y 9.
Ejemplo 3.6: Encuentre la moda de los pesos de 10 individuos: 63, 52, 78, 49, 71,
62, 68, 48, 56 y 67.
Solución:
La moda no existe.
40
3.1.4 Comparaciones de la media, mediana y moda.
Sin embargo, hay algo que debe recodarse. Existen varios tipos de medidas
ordinariamente conocidas como promedios y cada una proporciona una
representación distinta de las cifras que se supone está representado.
Considere un ejemplo. A continuación se presentan los ingresos anuales de 10
familias.
41
La mediana. Como ya habrá observado, seis familias ganan menos que la
media y cuatro ganan más que ésta. Tal vez también quiera representar este
grupo variado por medio del ingreso de la familia que está justo en medio de todo
grupo. Para lograrlo, es necesario encontrar la mediana. Sería fácil si el grupo
estuviese integrado por 11 familias. La sexta familia con respecto al valor máximo
(o sexta con respecto al mínimo) estaría a la mitad y tendría la mediana del
ingreso. Sin embargo, con 10 familias no hay familias de en medio. Así, se suman
los dos ingresos centrales ($31500 y $25500 en este caso) y se divide entre dos.
Resulta que la mediana es $33375.
De esta forma se han obtenido tres promedios diferentes, cada uno de los
cuales es válido, correcto e informativo. Sin embargo, ¡cuánto difieren!
Media aritmética $35400
Mediana $33375
Moda $31500
¡Y serían aún más diferentes si sólo una familia del grupo fuese millonaria; o una
estuviese desempleada!
42
alguien dice “promedio” hace alusión a una cuantificación matemáticas literal. No
es así. Todo mundo dice a menudo “la persona promedio” sin querer implicar una
media, una mediana o una moda. Todo lo que intenta expresarse es la idea de
que hay personas que en gran medida se parecen bastante al resto de las demás.
La Figura 3.1 muestra las posiciones de la media, la mediana y la moda. Si
la distribución es simétrica, como se aprecia en a), las tres mediadas de tendencia
central coinciden, es decir, se verificará la igualdad x = Me = Mo . Si la distribución
es asimétrica positiva, como se observa en b), las tres medidas de tendencia
central divergen, de tal forma que se cumple la relación x > Me > Mo . Finalmente,
si la distribución es asimétrica negativa, como se aprecia en c) las tres medidas de
tendencia central divergen, verificándose en tal caso la relación x < Me < Mo . Al
respecto cabe mencionar, que si una distribución presenta dos o más modas, la
dirección de ésta se determina comparando únicamente la media y la mediana.
43
n
w1x1 + w2 x 2 + L + wn x n
∑ wi xi
i =1
xp = = (3.3)
w1 + w2 + L + wn n
∑ wu
i =1
Tabla 3.1 Resultados obtenidos del cultivo de maíz en 5 ejidos elegidos al azar en un
municipio.
Ejido Superficie Rendimiento Producción Precio Valor de la
cosechada (has) por ha.(tons) (tons) producción (miles)
De la Tabla 3.1 obtenemos que el rendimiento por hectárea del cultivo del maíz es
de
44
50(1. 200) + 120(1. 650) + ... +40(1. 050) 623
xp = = = 1. 416 tons / ha
50 + 120 + ... +40 440
y el precio de comercialización es de
45
cuales la medida de dispersión es cero. No hay limite respecto a cuán dispersos
pueden ser los datos; en consecuencia, las medidas de dispersión pueden ser
muy grandes.
La Figura 3.2 muestra que una medida de tendencia central no es suficiente para
caracterizar dos conjuntos de datos, puesto que, es posible tener dos o más
distribuciones con la misma medida de tendencia central y pertenecer a
distribuciones muy diferentes. Por ejemplo, hay que apreciar en la Figura 2, la
diferencia en la interpretación de la observación 80. En a) se observa que la
distribución tiene menor dispersión, es decir, las observaciones están
estrechamente distribuidas alrededor de la media, tanto así, que la observación de
80 está situada casi en el extremo de la distribución y puede por lo tanto
considerarse como una observación muy alta. En b), por el contrario, las
observaciones están más dispersas alrededor de la media. En este caso, la
observación de 80 no se localiza tan al extremo de la distribución puesto que,
tiene encima de ella un buen número de observaciones, tal como lo indica el área
situada a la derecha de 80.
Figura 3.2 Dos distribuciones con la misma medida de tendencia central pero con
diferente dispersión.
46
3.2.1 AMPLITUD.
3.2.2. LA VARIANZA.
47
∑ (x − x )2
S 2
= (3.5)
n −1
donde n es el tamaño de la muestra, es decir, el número de datos que hay en la
muestra.
∑ (x − x )
2
∑x 6−5 =1
6 ( 1) 2 = 1 ∑ (x − x )
2
x= S 2
=
3 n 3 − 5 = −2 ( −2 ) 2 = 4 n −1
8 25 8−5 = 3 ( 3)2 = 9 18
x= S2 =
5 4
5 5−5 = 0 ( 0 )2 = 0
3 x =5 3 − 5 = −2 ( −2 ) 2 = 4 S 2 = 4.5
∑ x = 25 ∑ (x − x )
2
= 18
NOTAS
48
3.2.3 DESVIACION ESTÁNDAR.
S = S2 (3.6)
Para los ejemplos que se muestran en las Tabla 3.2, la desviación estándar es
4.5 o 2.1.
∑ (x − x )
2
∑x 6 − 4.8 = 1.2
6 ( 1.2 ) 2 = 1.44 ∑ (x − x )
2
x= S 2
=
3 n 3 − 4.8 = −1.8 ( −1.8 ) = 3.24
2 n −1
∑ x = 24 ∑ (x − x )
2
= 22.8
49
El procedimiento aritmético para este ejemplo puede volverse más
complicado porque la media contiene dígitos diferentes de cero a la derecha del
punto decimal. No obstante, la “suma de cuadrados de x ”, el numerador de la
fórmula (3.4), puede volver a escribirse como
Suma de cuadrados: SC ( x ) = ∑ x −
(∑2x)
2
(3.8)
n
Al combinar las fórmulas (3.7) y (3.8) se obtiene la formula de atajo:
(suma de x ) − (suma de x )
2
2
número
Varianza muestral: var ianza muestral =
número − 1
(∑ x)
2
∑x − n
2
S2 = (3.9)
n −1
Las formulas (3.8) y (3.9) se denominan “de atajos” porque ahorran el cálculo de
x . Los cálculos para SC ( x ) , S 2 y S aplicando las fórmulas (1.8), (1.9) y (1.6) se
realizan como se muestran en la tabla 3.4.
6 62 = 36
SC ( x ) = ∑ x −
(∑ x)
2
S 2
=
∑ (x − x )
2
3 32 = 9 n n −1
8 82 = 64
SC( x ) = 138 −
(24)2 S2 =
22.80
5 4
5 52 = 25
2 22 = 4 SC ( x ) = 138 − 115.2 S 2 = 5.7
∑ x = 24 ∑ x 2 = 138 SC ( x ) = 22.8
50
3.2.4 COEFICIENTE DE VARIACION
S
C.V . =
X
S
C.V . = x 100
X
51
debe emplearse con precaución, puesto que su valor depende únicamente de los
dos valores extremos del conjunto.
52
embargo, a manera de ilustrar el significado de la desviación estándar
consideremos el aspecto que se presenta a continuación.
Supóngase que se desea medir la distancia que hay entre las plantas de un
jardín. Se podría efectuar la medición de éstos, ya sea en metros o en
centímetros. Por ejemplo, que el rosal esta a una distancia de 3 metros del tulipán
o que la gardenia esta a 95 centímetros de la noche buena. Pero, ¿cómo medir la
anchura del eje horizontal de un polígono de frecuencias?. Del mismo modo en
que se midieron las plantas del jardín en metros o en centímetros, se puede medir
también el eje horizontal de un polígono de frecuencias en unidades de desviación
estándar. Desde este punto de vista, la desviación estándar se constituye en una
especie de "vara de medir", que nos permite comparar datos de dos o más
conjuntos.
3.3.1 CUARTILES.
Los Cuartiles son los valores de la variable que dividen en cuartos a los datos
ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil, Q1 , es
un número tal que cuando mucho el 25% de los datos es menor en valor que Q1 y
datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor
que Q3 .
53
El procedimiento para determinar el valor de los cuartiles es el mismo que
para los percentiles y se muestra a continuación.
3.3.2. PERCENTILES.
Los Percentiles, son los valores de la variable que dividen a un conjunto de datos
en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-
ésimo percentil, Pk , es un valor tal que cuando mucho k% de los datos son más
NOTAS:
1. El primer cuartil y 25avo percentil son iguales; es decir Q1 = P25 . También,
Q3 = P75 .
2. La mediana, el segundo cuartil, y el 50avo percentil son iguales,
Me = Q2 = P50 . Así cuando se pida encontrar P50 o Q2 , aplique el
54
Figura 3.3. Procedimiento para encontrar Pk
Ejemplo 3.10. Con la muestra de 50 calificaciones del examen final del curso de
Estadística I que se observa en la Tabla 3.4, determinar el primer cuartil, Q1 , el
58avo percentil P58 y el tercer cuartil, Q3 .
55
Solución:
Paso 1 Ordenar los datos: puede establecerse un listado ordenado (consultar
Tabla 3.5) o puede utilizarse una representación gráfica que muestre los
datos ordenado.
Se encuentra Q1 :
Paso 2 nk nk (50 )(25)
Encontrar : = = 12.5 ( n = 50 y k = 25 , ya que Q1 = P25 ).
100 100 100
Paso 3 Encontrar la profundidad de Q1 : d(Q1 ) = 13 (debido a que 12.5 contiene
una fracción, B está más próximo al siguiente entero más grande, 13)
Paso 4 Encontrar Q1 : Q1 es el 13avo valor contando a partir del mínimo
Encontrar P58 :
Paso 2 nk nk (50)(58)
Encontrar : = = 29 ( n = 50 y k = 58 , ya que P58 ).
100 100 100
56
Paso 2 nk nk (50)(25)
Encontrar : = = 12.5 ( n = 50 y k = 75 , ya que Q3 = P75 y
100 100 100
k > 50 ; usar 100 − k = 100 − 75 = 25 )
Paso 3 Encontrar la profundidad de Q3 a partir del máximo : d(Q3 ) = 13
Paso 4 Encontrar: Q3 : Q3 es el 13avo valor contando a partir del máximo (
Solución:
Q1 = 67 y Q3 = 86 , como se encontró en el ejemplo 1.9. Así
57
Q1 + Q3 67 + 86
cuartil medio = = = 76.5
2 2
1 n
∑ (x − x )3
n i =1 i
ax =
Sx 3
Donde
n
∑ ( xi − x ) 2
Sx = i =1
n −1
Para las distribuciones que presentan un solo pico, si a x < 0, se dice que la
58
a) Asimétrica negativa b) Simétrica c)Asimétrica positiva.
3.4.2 CURTOSIS
1 n
∑ ( x − x )4
n i =1 i
a *x =
Sx 4
59
Figura 3.5 Diferentes tipos de distribución de un conjunto de datos. a) Leptocúrtica
b) Platicúrtica, c) Mesocúrtica.
60
AUTOEVALUACIÓN
61
GLOSARIO DE TÉRMINOS
ÁREA BAJO LA CURVA entre dos puntos: Si la curva viene dada por una
función de densidad teórica, representa la probabilidad de que la variable aleatoria
tome un valor dentro del intervalo determinado por esos dos puntos
62
CONTRASTE DE HIPÓTESIS: Es el proceso estadístico que se sigue para la
toma de decisiones a partir de la información de la muestra. Comparando el valor
del estadístico experimental con le valor teórico rechazamos o no la hipótesis nula
CORRELACIÓN: Expresa la concordancia entre dos variables según el sentido de
la relación de estas en términos de aumento ó disminución
CUARTILES: Existen tres cuartiles: Q!, Q2 y Q3. Estos números dividen a los
valores muestrales , una vez ordenados, en cuatro partes homogéneas en cuanto
a número de observaciones. Así Q1 determina el valor que hace que haya un 25%
de valores muestrales por debajo de éste, y un 75% por encima de éste. Q2 es la
mediana
63
ESTADÍSTICOS: Son funciones de la muestra. Su valor variará según la muestra,
pero nos permite hacer estimaciones de parámetro poblacionales o construir
estadísticos experimentales para tomar decisiones acerca de la
ESTIMADOR: Función de la muestra que sirve para dar valores candidatos a los
valores desconocidos poblacionales.
64
HIPOTESIS ALTERNATIVA: Aquella que queremos probar. Representa la
hipótesis renovadora
MÍNIMO: Es un valor muestral de forma que por debajo de este no hay valores
muestrales
65
NIVEL DE CONFIANZA: Se define como 1 menos el nivel de significación. Se
suele expresar en tanto por ciento
66
RECTA DE REGRESIÓN: Es el modelo que sirve para explicar una variable
respuesta continua en términos de un único factor o variable explicativa
REGRESION: Técnica estadística que relaciona una variable dependiente (y) con
la información suministrada por otra variable independiente (x).ambas variables
deben ser continuas. Si asumimos relación lineal, utilizaremos la regresión lineal
simple. Entre las restricciones de la RLS se incluyen:
Los residuos deben ser normales
Las observaciones independientes
La dispersión de los residuos debe mantenerse a lo largo de la recta de regresión
67
VARIABLE INDEPENDIENTES O EXPLICATIVAS: Variables que no sirven para
construir un modelo que explique el comportamiento de una o más variables
respuesta
68
BIBLIOGRAFÍA
69
Control de Calidad e Informática (Ojeda y Behar, Editors). Universidad
Veracruzana.
70