Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPÍTULO 1
EL CONOCIMIENTO CIENTÍFICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1. EL CONOCIMIENTO CIENTÍFICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2. EL MÉTODO CIENTÍFICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
CAPÍTULO 2
INTRODUCCIÓN A LA ESTADÍSTICA Y SU APLICACIÓN A LOS
ESTUDIOS POLICIALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
6. LA ESTADÍSTICA DE CRIMINALIDAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
CAPÍTULO 3
RECOPILACIÓN, AGRUPACIÓN Y REPRESENTACIÓN DE DATOS . . . . . . . . 45
7. OTRAS REPRESENTACIONES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
CAPÍTULO 4
MEDIDAS DE CENTRALIZACIÓN Y DE POSICIÓN . . . . . . . . . . . . . . . . . . . . 65
2. LA MEDIA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4. LA MODA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
CAPÍTULO 5
MEDIDAS DE DISPERSIÓN Y DE FORMA . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
EJERCICIOS PROPUESTOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
CAPÍTULO 6
NÚMEROS ÍNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
CAPÍTULO 7
PROBABILIDAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
1. INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
1. INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
CAPÍTULO 9
GRÁFICOS DE CONTROL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
1. INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
CAPÍTULO 11
REGRESIÓN Y CORRELACIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
1. INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
BIBLIOGRAFÍA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
10
Capítulo 1
EL CONOCIMIENTO CIENTÍFICO
Estadística - Capítulo 1
1. EL CONOCIMIENTO CIENTÍFICO
Siguiendo a Pérez Juste (1989) sabemos que por el solo hecho de vivir, el
hombre entra en relación con la realidad, que tiene una doble dimensión: natural
y social. Mediante la actividad humana aparecen relaciones de los hombres entre
sí y de éstos con la naturaleza exterior, la práctica o praxis de estas relaciones
es la que genera los distintos tipos de conocimiento: el cotidiano y el
científico.
13
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
14
Estadística - Capítulo 1
Concluimos este epígrafe con la regla de oro que propone Bunge, perfectamente
válida en la investigación científica policial “para conseguir el conocimiento
científico es necesario audacia en el conjeturar y rigurosa prudencia en el someter
a contrastación”.
2. EL MÉTODO CIENTÍFICO
La palabra método tiene el significado de camino, procedimiento, medio,
manera, etc., por ello puede decirse que el método es la forma racional, ordenada
y objetiva de la actividad científica, que establece el camino o proceso que aquélla
debe seguir para alcanzar su fin. La racionalización de los métodos de búsqueda
con el fin de obtener la máxima información con la máxima economía de
pensamiento es lo que constituye la base de todo método.
15
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
16
Estadística - Capítulo 1
En quinto lugar el método científico es crítico. Con ello se quiere decir que
se debe someter constantemente a examen y juicio todas las fases, operaciones
y resultados, o lo que es lo mismo, a contraste y verificación; además, también
se quiere significar que en ningún caso los logros del método científico son defi-
nitivos y que siempre están sujetos a la revisión, que se pueden derivar nuevos
conocimientos y puntos de vistas científicos.
17
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Resumiendo las ideas básicas sobre el método científico podríamos decir que
son: La duda, la problematización, la conjetura o hipótesis, la prueba empírica
como criterio último de verificación y la precisión o exactitud.
18
Estadística - Capítulo 1
19
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
20
Estadística - Capítulo 1
21
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
II. Los puntos de vista, que son las opiniones de la gente o las distintas
perspectivas desde las cuales se puede considerar una cuestión; es el
aspecto subjetivo.
22
Estadística - Capítulo 1
d) Actitudes Mentales para la Acción (¿Qué hacer?, ¿Por qué hacerlo?, ¿Para
qué hacerlo?, ¿Cómo hacerlo?)
Aquí las preguntas a responder son del tipo: ¿Qué hacer?, ¿por qué hacerlo?,
¿para qué hacerlo?, ¿cómo hacerlo?.
Nuestra primera fase debe tratar de explicitar los valores y principios que
inspiran y guían la acción. En los valores y principios se fundamenta la acción y,
al mismo tiempo, el modelo a alcanzar en cuanto que proporciona reglas para la
acción y una jerarquía de valores.
23
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
24
Estadística - Capítulo 1
25
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
26
Estadística - Capítulo 1
· Etc.
· Análisis de datos.
· Tratamiento estadístico.
27
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
28
Capítulo 2
INTRODUCCIÓN A LA
ESTADÍSTICA Y SU APLICACIÓN
A LOS ESTUDIOS POLICIALES
Estadística - Capítulo 2
31
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
32
Estadística - Capítulo 2
Veamos un ejemplo en el cual se resaltan las distintas fases del proceso esta-
dístico. Una empresa de seguros desea ampliar la cobertura de sus pólizas a
otros siniestros que hasta ahora no cubría. Le interesa conocer la siniestrabili-
dad de éstos, que viene a ser la probabilidad de que se produzcan y decidir el
importe de las pólizas que hagan rentable la cobertura de los siniestros. Para ello
debe:
33
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
34
Estadística - Capítulo 2
35
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
• Soltero.
• Casado.
• Viudo.
• Separado o divorciado.
36
Estadística - Capítulo 2
6. LA ESTADÍSTICA DE CRIMINALIDAD
La Estadística Criminal es aquella parte de la Ciencia estadística aplicada al
estudio de las actuaciones del conjunto social constituidas por infracciones lega-
les punibles, de las personas que las realizaron y de las medidas penales que se
les aplicaron. No obstante, en torno al concepto “estadística criminal” suele
haber gran confusión y carencia de unanimidad; así pues encontramos que para
unos, la estadística criminal está constreñida al estudio de las estadísticas de los
delincuentes y sus características, mientras para otros se trata de las estadísticas
referidas al problema de la criminalidad, y según la parcela de la que se ocupen,
pueden ser policiales, judiciales, penitenciarias, etc., dependiendo del organismo
que las produzca. Con cierta vaguedad, se suele aplicar el término a la estadís-
tica que aporta datos numéricos sobre delitos o delincuentes, que proceden de
diversos organismos oficiales (policía, fiscalía, tribunales, instituciones peniten-
37
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
38
Estadística - Capítulo 2
c) Otras Estadísticas
39
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
40
Estadística - Capítulo 2
41
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
- etc.
42
Estadística - Capítulo 2
43
Capítulo 3
RECOPILACIÓN, AGRUPACIÓN
Y REPRESENTACIÓN DE DATOS
Estadística - Capítulo 3
· Censos oficiales.
Lo más cómodo es acudir a ellos. Lo cierto es que una vez fijado el pro-
blema que pretendemos estudiar, debemos consultar la bibliografía; ésta
nos informará de otros estudios parecidos, o incluso puede que iguales,
sugiriéndonos ideas, formas de trabajar, y sobre todo, en lo que a infor-
mación se refiere, fuentes de datos. Muchas veces estos datos se ofrecen
sin elaborar, tal y como se recogieron. Algunos estudios ya están realizados,
pero quizá no sea lo que a nosotros nos interesa y debemos operar con
ellos en otra dirección. En cualquier caso debemos hacer siempre mención
de la fuente de datos utilizada y el año; la primera nos habla de la garantía
que nos merece y la segunda de su actualidad, cuestión esta de primerísi-
ma importancia en una sociedad tan cambiante como la actual.
47
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
2) Datos Directos. Son los datos que recopilamos nosotros y de los cuales
somos responsables. Fundamentalmente son datos de encuestas y de
observación o experimentales, que veremos con detenimiento más adelante.
Sobre ellos, deberemos también especificar cómo fueron obtenidos, en
qué circunstancias, en qué momento, etc. De tal forma que no dejemos
dudas sobre su alcance y significado.
· ¿Qué partido político piensa usted que ganará las próximas eleccio-
nes?.
a. Entrevistas personales.
c. Entrevistas telefónicas.
48
Estadística - Capítulo 3
TIPOS DE
VENTAJAS INCONVENIENTES
ENCUESTAS
El entrevistador El entrevistador
ENTREVISTAS
puede orientar, puede influir en las
PERSONALES
informar, etc. respuestas.
Una parte
importante puede
No hay influencia
CUESTIONARIOS A no remitir los
del entrevistador.
CUMPLIMENTAR cuestionarios.
Más baratos.
No podrán ser
orientados.
Son rápidas (p. ej.
ENTREVISTAS
para medir niveles Deben ser breves.
TELEFÓNICAS
de audiencia.
Parece evidente que en cada caso particular, nos merecerá la pena una u otra
opción, dependiendo de estos factores más o menos generales, o de otros que
aquí no hemos considerado. La mayor parte de las encuestas se realizan a una
muestra de la población, especialmente cuando éstas son numerosas.
49
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
titativa, continua o discreta. Los criterios para establecer las clases son muy arbi-
trarios en algunos casos, y en otros casi son impuestos por las propias caracterís-
ticas de la variable. De todas formas, las clases se elaboran para comodidad de
quien posteriormente tiene que trabajar con los datos. Esto ayudará a tomar
decisiones.
Tipos de clases
a. De valor único
b. De intervalo
Para variables continuas por lo general. El intervalo está definido por los
límites del mismo. Ejemplo: la altura (en metros) de un grupo de personas
se puede agrupar en las siguientes clases:
XI ≤ X ≤ XS
XI X < XS
Si no se indica cómo son las clases, como sucede en el ejemplo de las alturas
de un grupo de personas, entenderemos que son semiabiertas por la derecha,
esto es [1’60 - 1’70) las personas que miden exactamente 1’70 m no están incluidas
en este intervalo y sí en el siguiente, [1’70 – 1’75) etc.
50
Estadística - Capítulo 3
También es frecuente encontrar clases a las que les falta un extremo. Así, al
agrupar los alumnos atendiendo a la edad, podríamos establecer una clase de 30
años o más.
Ai = XSi – XIi
donde XSi y XIi son los límites de la clase. De la misma forma la marca de esta
clase se define como el valor intermedio del intervalo XIi , XSi:
51
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
- 40 - -
40 - 50 10 45
50 - 55 5 52,5
55 - 60 5 57,5
60 - 70 10 65,0
70 - - -
52
Estadística - Capítulo 3
fi·100 = pi
N4 = n1 + n2 + n3 + n4
La frecuencia relativa acumulada (Fi) tiene el mismo significado pero para fre-
cuencias relativas, y si lo expresamos en porcentajes obtendremos la frecuencia
porcentual acumulada (Pi).
Nota ni fi pi Ni Fi Pi
53
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Los reclusos que han obtenido una puntuación entre 5 y 7, son en total 100
y representan el 0’3571 (en tanto por uno) o el 35’71 %. La frecuencia acumula-
da de esta clase es 230, lo cual significa que 230 reclusos han obtenido una
puntuación por debajo de 7, esto es el 82’14 %. Debe observarse que las sumas
de fi y pi podrían no alcanzar exactamente el 1 y 100 % respectivamente, debido
a los redondeos.
Distribuciones Bidimensionales
Para un mismo individuo del colectivo en estudio podemos estar interesados
en más de una característica, por ejemplo, la puntuación que obtuvo y la edad,
dando lugar a una serie bidimensional. Los datos sin agrupar tendrían el aspecto
que se muestra en la tabla:
VARIABLE X
26 27 27 28 30 etc.
(Edad: años)
VARIABLE Y
5,3 4,5 6,1 5 6,5 etc.
(Puntuación)
54
Estadística - Capítulo 3
con edades comprendidas entre los 31 y 40 años. Una tabla semejante podría
haber ofrecido las frecuencias relativas.
Año
Edades 1999 2000 2001 TOTALES
Menores de 16 1 2 0 3
De 16 a 18 6 3 0 9
De 19 a 25 57 44 23 124
De 26 a 30 86 64 48 198
De 31 a 40 156 154 109 419
Más de 40 37 33 19 89
Desconocida 1 2 2 5
TOTAL 344 302 201 847
También son de destacar las Series cronológicas, que dan cuenta de la evo-
lución de un fenómeno a lo largo de un periodo de tiempo. Así, la tabla siguien-
te informa de la evolución de un determinado tipo de delito leve, en el periodo
1993–2001:
55
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Gráficas de Barras
Es uno de los gráficos mas utilizados y puede aplicarse a cualquier tipo de
variable. Se dibujan rectángulos (barras) para cada clase o modalidad estableci-
da de un ancho arbitrario y de altura la frecuencia de cada clase, utilizando como
referencia un sistema cartesiano de ejes x–y. Los diferentes tipos de delitos
cometidos contra la libertad sexual en España, se muestran en la tabla.
DELITOS CONTRA LA
1997 % 1998 %
LIBERTAD SEXUAL
Agresión 3.673 52,8 3.960 5,34
Abuso 1.668 24,0 1,786 2,41
Acoso 370 5,3 433 5,8
Exhibicionismo 820 11,8 805 10,9
Provocación 177 2,5 188 2,5
Corrupción menores 64 0,9 70 0,9
Coacción prostitución 176 2,5 168 2,3
Pornografía menores 15 0,2 8 0,1
Total 6.963 100,0 7.418 100,0
56
Estadística - Capítulo 3
57
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Para finalizar, queremos mencionar que las escalas utilizadas y los orígenes,
deben conducir a la representación gráfica centrada, clara, presentable, etc.
Algunas veces, la libertad para elaborar la representación conduce a picarescas
que no son otra cosa que resaltar lo que a cada uno le interesa.
Gráficas secuenciales
Muy útiles para representar evoluciones temporales. Así la evolución del
número de delitos leves en Madrid y en toda España en el periodo 1993–2001, se
muestra en el siguiente gráfico.
58
Estadística - Capítulo 3
Diagramas de sectores
Los diagramas de sectores se utilizan para variables generalmente cualitativas
y de pocas clases; éstas se representan mediante sectores circulares que se
reparten los 360o de la circunferencia. Los sectores son proporcionales a la
frecuencia de las clases, y se calculan mediante una regla de tres semejante al
cálculo de un porcentaje sustituyendo 100 por 360:
59
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
60
Estadística - Capítulo 3
xi ni pi Ni Pi
0 - 10 8 4 8 4
10 - 20 10 5 18 9
20 - 30 12 6 30 15
30 - 40 22 11 52 26
40 - 50 32 16 84 42
50 - 60 50 25 134 67
60 - 70 28 14 162 81
70 - 80 18 9 180 90
80 - 90 12 6 192 96
90 - 100 8 6 200 100
61
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
hi = ni /Ai
EDAD (años) ni Ai hi
[21,23) 20 2 10,0
[23,25) 15 2 7,5
[25,30) 30 5 6,0
[30,35) 25 5 5,0
62
Estadística - Capítulo 3
En la clase 21–23 años, la densidad 10’0 significa que hay 10 personas por
año, que en este caso es la unidad del intervalo, mientras que en la clase de 25
a 30 años hay sólo 6, siendo menos densa aunque más numerosa debido a la
mayor amplitud del intervalo. El histograma de esta distribución quedará:
Obtenemos así, un histograma que nos informa de las clases mas densas,
independientemente de las amplitudes elegidas en cada clase. El área de los
rectángulos es el número de personas de la clase, es decir, la frecuencia
absoluta: hiAi = ni.
7. OTRAS REPRESENTACIONES
Hasta ahora no hemos hecho otra cosa que exponer los principios básicos
de las representaciones gráficas. Lo cierto es que, sin alterarlos, se pueden
conseguir, con un poco de imaginación, otras formas de representación más
expresivas. Si además contribuyen mejor a mostrar cómo se distribuyen las
63
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
64
Capítulo 4
MEDIDAS DE CENTRALIZACIÓN
Y DE POSICIÓN
Estadística - Capítulo 4
2. LA MEDIA
La media o media muestral, es el promedio de las observaciones muestrales.
Es decir, en el caso de datos no agrupados se tiene:
67
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
En general:
68
Estadística - Capítulo 4
APROBADO 0
NOTABLE 1
SOBRESALIENTE 2
MATRICULA 3
En general escribiremos:
69
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Me = (3 + 4)/2 = 3’5
70
Estadística - Capítulo 4
xi ni Ni Cuartiles
3 2 2
3,5 2 4
4 3 7 Q1
4,5 1 8
5 3 11 Q2
6 2 13 Q3
7 3 16
8 1 17
xi ni Ni Pi Percentiles
3 2 2 11,8 Hasta el P11
3,5 2 4 23,5 Desde el P12 hasta el P23
4 3 7 41,2 Desde el P24 hasta el P41
4,5 1 8 47,1 Desde el P42 hasta el P47
5 3 11 67,7 Desde el P47 hasta el P64
6 2 13 76,5 Desde el P65 hasta el P76
7 3 16 94,1 Desde el P77 hasta el P94
8 1 17 100 Desde el P95 hasta el P99
71
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
72
Estadística - Capítulo 4
73
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
74
Estadística - Capítulo 4
Hasta ahora lo que hemos hecho es dado un lugar buscar el valor de la variable
que lo ocupa. También podemos definir el problema contrario; es decir, dado un
valor de la variable encontrar el lugar que ocupa.
Despejando:
75
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Así que, la persona que pesa 52 kg tan solo supera al 8’50% de las 300 per-
sonas de la distribución de pesos, sólo hay un 8’50% de personas que pesan
menos o igual que 52 kg en la muestra. Redondeando, vemos que se trata del
percentil P9.
4. LA MODA
La Moda es otro parámetro de centralización, al igual que media y mediana,
que nos informa del valor de la variable más frecuente, que más veces se repite.
Algunas características diferencian a este parámetro con la media y la mediana:
76
Estadística - Capítulo 4
Cálculo de la Moda
Es inmediato para variables cualitativas y para cuantitativas agrupadas como
variables discretas en clases de valor único; basta aplicar la definición, la clase
más numerosa es la moda.
77
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Se puede observar que los triángulos ACO y DBO son semejantes, por lo que:
78
Estadística - Capítulo 4
Cuantitativas o
Para variables Cuantitativas Cuantitativas
cualitativas
Adopta valores Único Único Único o varios
Sólo los de la
Intervienen en el Sólo los de la
Todos los valores clase modal y
cálculo clase media
contiguas
Influencias de los
Importante No influyen No influyen
valores extremos
Sólo para hacer
En distribuciones En distribuciones
Conviene utilizar referencia a lo
poco asimétricas asimétricas
más habitual
79
Capítulo 5
MEDIDAS DE DISPERSIÓN
Y DE FORMA
Estadística - Capítulo 5
· Alumno A: 2, 8, 1, 9.
· Alumno B: 4, 5, 6, 5.
Si calculamos la media, veremos que en ambos casos vale 5, según esto los
alumnos no se diferencian. Pero es fácil ver que el alumno A es muy irregular
(sus notas se alejan bastante del valor medio) cosa que no sucede para el alumno
B, que obtuvo siempre resultados próximos a 5. Los parámetros de dispersión
diferencian estas dos situaciones; de aquí su importancia. Veamos algún
ejemplo más:
· Dos países con la misma renta per cápita (ingresos medios) pueden
tener un reparto de la riqueza muy diferente, si la distribución de ésta es
muy concentrada o dispersa. Así, en el caso de dispersión alta, se darán
importantes diferencias en los ingresos, mientras que si la dispersión es
pequeña, los ingresos no se diferenciarán demasiado de unos individuos
a otros.
83
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
· Desviación media.
· Varianza.
· Desviación típica.
84
Estadística - Capítulo 5
A: 2, 8, 1, 9 ————> RA = 9 – 1 = 8
B: 4, 5, 6, 5 ————> RB = 6 – 4 = 2
Otras medidas de dispersión, que vamos a ver, evitan esta situación, haciendo
participar en ellas a todos los individuos de la distribución de frecuencias.
RI = Q3 – Q1 (5.2.1)
85
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
86
Estadística - Capítulo 5
87
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Que si bien no aporta nada nuevo como medida de dispersión, tiene la ventaja
de tener las mismas unidades que la variable y así, entre otras cosas, puede
representarse en el eje X. Además para una distribución normal, como veremos
más adelante, el intervalo x ± S , contiene al 68’26% de todos los casos estudiados.
Análogamente el intervalo x ± 2S , contiene el 95’45% y el intervalo x ±3S el
99’73%.
y su correspondiente cuasidesviación:
Altura Número de
(metros) aspirantes
1,65 - 1,70 30
1,70 - 1,75 70
1,85 - 1,90 80
88
Estadística - Capítulo 5
RI = Q3 – Q1
Altura Número de
Ni
(metros) aspirantes
1,65 - 1,70 30 30
89
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
90
Estadística - Capítulo 5
Distribuciones Simétricas
Coinciden los valores, media, mediana y moda. Los valores se distribuyen por
igual a la izquierda y derecha de los parámetros de centralización. Las alturas,
pesos, coeficientes de inteligencia, etc, de colectivos grandes de personas
siguen modelos simétricos de distribución. La distribución Normal es la más
representativa de las distribuciones simétricas.
91
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
92
Estadística - Capítulo 5
Primer coeficiente:
Segundo coeficiente:
b) Simétrica o normal:
Md = Me = x AP1 = 0 y AP2 =0
93
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
94
Estadística - Capítulo 5
Curtosis Percentílica
95
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
g2 = 0 la distribución es mesocúrtica.
96
Estadística - Capítulo 5
EJERCICIOS PROPUESTOS
1. Dada la siguiente serie de valores se desea agrupar los datos y formar una
distribución de datos agrupados en intervalos de clase de primer extremo inferior
igual a 130 y de amplitud 10.
138 167 151 170 175 138 148 153 178 142
137 157 145 146 148 155 167 142 154 133
133 152 157 149 169 159 148 150 153 145
140 161 156 149 152 140 146 151 143 140
152 138 160 153 165 157 158 162 155 144
Solución: Intervalos [130, 140), [140, 150), [150, 160), [160, 170) y [170, 180),
con frecuencias absolutas 6, 16, 18, 7 y 3 y frecuencias porcentuales 12%, 32%,
36%, 14% y 6%.
Solución: Alturas de las barras: 6, 16, 18, 7 y 3, también podría hacerse con las
porcentuales; amplitudes de los sectores: 43º, 115º, 130º, 50º y 22º
Altura Número de
(metros) aspirantes
1,65 - 1,70 30
1,70 - 1,75 70
1,75 - 1,80 120
1,80 - 1,85 150
1,85 - 1,90 80
97
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Solución: Frec. acumuladas Ni: 30, 100, 220, 370 y 450; Me = 1’802 m ≈ 1’80 m,
Q1 = 1’755 m ≈ 1’76 m, Q3 = 1’839 m≈ 1’84 m
a) Media y moda.
c) Coeficiente de variación.
98
Estadística - Capítulo 5
16 - 17 6 30 - 39 19
18 - 19 8 40 - 49 25
20 - 21 7 50 o más 8
22 - 25 12 TOTAL 100
99
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
2’3 2’5 3’2 3’8 4’0 4’5 4’9 6’4 7’0 7’1
9. En una comunidad formada por 100 vecinos, éstos han sido clasificados
atendiendo al número de personas que forman cada familia. Se pide que:
d) Calcule la curtosis.
100
Estadística - Capítulo 5
Puntos
Prueba “Importancia” A B C
1 0,20 4 6 5
2 0,10 5 4 7
3 0,30 7 7 5
4 0,30 6 8 4
5 0,10 5 4 6
Se pide:
c) Para este tipo de pruebas la media aritmética ponderada es, por lo general,
de 7’40 puntos. ¿ Qué comentarios le merecen los tres candidatos que se
han presentado?.
45 - 75 25
75 - 105 30
105 - 135 35
135 - 165 10
101
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Se pide que:
[16, 30) 62
[30, 40) 16
[40, 50) 11
[50, 60) 9
[60, 65) 2
102
Estadística - Capítulo 5
13. Una Comisaría anota todos los meses los viajes efectuados y las distancias
recorridas en cada viaje que realizan los funcionarios a ella adscritos en tareas
de investigación.
[2, 4) 20
[4, 6) 25
[6, 10) 10
[10, 20) 6
70 1
150 1
Se pide:
Solución: En los datos agrupados por intervalos hay que calcular las marcas
de clase xi = 1, 3, 5, 8 y15 km; a) x = 7'56 km por viaje, Me = 4'32 km por
viaje; b) 590 km (aprox.) en los 78 viajes, no tiene por qué coincidir, pues
al agrupar datos en intervalos se pierde información y el trabajar con marcas
de clase es una aproximación; c) Utilice un diagrama de barras con alturas
fi = 0'1923, 0'2564, 0'3205, 0'1282, 0'0769, 0'0128 y 0'0128 o bien uno
103
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
104
Capítulo 6
NÚMEROS ÍNDICES
Estadística - Capítulo 6
(6.2.1)
107
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(6.2.2)
El resto hasta 100, que vale 7’65, indica que en esa comisaría se producen
un 7’65% menos de detenciones que la media nacional. A lo que habríamos lle-
108
Estadística - Capítulo 6
Aunque los números índices pueden venir dados de varias formas diferentes:
Ii , Ii·100 (%),∆Ii y ∆Ii ·100 (%), que en el ejemplo del índice de detenidos con referen-
cia temporal, valían respectivamente, 1’1377, 113’77%, 0’1377 y 13’77%, y que
tienen el mismo significado, lo más habitual es expresarlos como variaciones
porcentuales, esto es, de la última forma.
(6.3.1)
Esto equivaldría a sumar todos los índices elementales, y dividir por el número
de ellos.
109
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(6.3.2)
110
Estadística - Capítulo 6
111
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
plo en 2000 se calcula viendo las modificaciones de los precios de lo diferentes artí-
culos, considerando que la distribución de gastos (“importancias”) son las de
1991.
Los índices compuestos deben entenderse como lo que son, medias aritmé-
ticas ponderadas, y así, la disminución de un índice compuesto sobre la delin-
cuencia, no quiere decir la disminución de todos los tipos de delitos que lo
componen, algunos pueden haber aumentado y ello debe ser detectado mediante
los índices simples.
112
Estadística - Capítulo 6
113
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
los índices, por ejemplo, de eficacia en las comisarías deberán estar construidos
de la misma forma.
114
Estadística - Capítulo 6
Aunque las cifras de delitos en esta comisaría y en toda España sean muy
diferentes, puede que cien veces mayor en España, los índices simples calculados
pueden compararse fácilmente. El siguiente gráfico pone de manifiesto que los
delitos tipo 1 (contra la propiedad) apenas han variado, han aumentado los delitos
tipo 2, 3 y 4 con respecto al año anterior y que han disminuido los de tipo 5 y
6. Además esta comisaría ha tenido un comportamiento similar al de toda
España.
115
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
116
Estadística - Capítulo 6
EJERCICIOS PROPUESTOS
1. En una comisaría la evolución del número de robos que superan cierta can-
tidad, ha evolucionado con el tiempo según se muestra en la tabla.
AÑO 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
Robos 67 85 89 78 97 105 93 112 88 117 115
Se desea saber:
117
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
3. Aceptando que los productos que entran a formar parte del Índice de
Precios al Consumo no modificaran su valor y que la gasolina disminuyera su
precio actual en un 7%, calcule la disminución del I.P.C. originado por esta baja-
da del precio de la gasolina. (Dato: La participación o "importancia" de la gasoli-
na en el I.P.C. es del 6%).
2004 930 7%
2006 970 6%
a) Calcule los números índices del salario y compararlos con las variacio-
nes del I.P.C.
Solución: a) ∆ IS: ---, 5'68%, 4´30%, son menores que el ∆ IPC; b) Pérdidas = ---,
1'32%, 1'70%; c) 998'10 euros
118
Estadística - Capítulo 6
Día 1ª 2ª 3ª 4ª 5ª
Lunes 624 621 614 617 603
Martes 814 816 804 798 794
Miercoles 816 812 812 809 808
Jueves 824 830 830 824 817
Viernes 975 973 972 964 945
Sabado 996 987 988 984 945
Domingo 936 942 930 936 930
119
Capítulo 7
PROBABILIDAD
Estadística - Capítulo 7
1. INTRODUCCIÓN
A lo largo de los temas de Estadística vistos, hemos tenido ocasión de aprender
a recoger, clasificar y presentar de forma resumida la información que nos sumi-
nistra un conjunto de observaciones. Esta tarea de descripción de conjuntos finitos
de datos, que corresponde a la Estadística Descriptiva, es sólo una parte de los
métodos estadísticos, ya que generalmente nos interesa conocer las propiedades
de la población, y en muchas ocasiones nos vemos obligados a inferirlas a
través de las propiedades observadas en sus muestras representativas.
Con este fin, y sin poder extendernos mucho, damos entrada a este tema de
probabilidades en el que conceptualizaremos un modelo que nos llevará a un
conjunto de propiedades (teoremas), deducibles de unos axiomas por razo-
namientos lógicos.
123
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
124
Estadística - Capítulo 7
Ejemplo
Sea un espacio muestral en el que están incluidos todos los españoles. Sea
el suceso A todos los españoles que son policías y el suceso B todos los espa-
ñoles nacidos en Madrid. Queremos interpretar el significado de los sucesos
A ∪ B, A ∩ B y Ac. Las figuras siguientes muestran gráficamente el significado
de la Unión, Intersección y Suceso Contrario:
A ∩ B es el suceso que contiene a todos los españoles que son policías y ade-
más han nacido en Madrid.
Es claro que para poder aplicar esta fórmula, conocida como Regla de
Laplace, es preciso que el espacio muestral _ sea finito y que los resultados sean
equiposibles, hecho éste conocido como principio de indiferencia, y que significa
que todos los casos posibles tienen la misma probabilidad de que ocurran.
125
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Pues bien, ese número hacia el que tiende la frecuencia relativa de un suce-
so es el que se le asigna como probabilidad.
Ejemplo
Sea el mismo dado del ejemplo anterior. Tenemos sospechas de
que puede estar trucado y no pensamos que sea adecuado asignar probabi-
lidades por el procedimiento clásico. Realizamos un experimento que consiste
en tirar un dado 50 veces, por ejemplo, y anotar el número de cincos que
salen. Continuar hasta cien veces y repetir las operaciones.
126
Estadística - Capítulo 7
127
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
que puede generalizarse fácilmente, de tal forma que si los sucesos A1,
A2, ..., An, son incompatibles dos a dos, entonces:
Por ejemplo, para calcular la probabilidad de que al sacar una carta de una
baraja española (40 cartas) se obtenga una copa o un basto podemos
considerar los sucesos:
que son sucesos compatibles ya que hay una copa que a la vez es as (el
As de copas) luego:
128
Estadística - Capítulo 7
= 0’325 = 32’5%
P(Ac) = 1 – P(A)
5. PROBABILIDAD CONDICIONADA
Cuando repetimos varias veces un experimento aleatorio los distintos resul-
tados constituyen un suceso compuesto. La probabilidad de un suceso compuesto
viene dada por el producto de las probabilidades elementales de cada experi-
mento.
y los sucesos A y B se dice que son independientes en caso contrario se dice que
son dependientes.
Se saca una carta de una baraja española tres veces, devolviéndola en cada
caso; la probabilidad de que se obtenga siempre un oro es:
129
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
6. LA DISTRIBUCIÓN NORMAL
Hasta ahora hemos presentado los resultados de la Estadística Descriptiva
con una visión fundamentalmente de sucesos que ya habían acontecido, según
esto, la Estadística se limita a levantar acta pormenorizada de los comportamientos
Ejemplo de los diferentes colectivos a tiempo pasado, como si fuera un rama
de la Historia. Y es cierto, debe saber cómo suceden las cosas para llegar a pre-
decir cómo debemos esperar que sucedan en el futuro; este “salto” sólo puede
realizarse a través de la probabilidad y el cálculo de probabilidades, de tal mane-
ra que, lo que ayer fue una distribución de frecuencias, pueda ser utilizada hoy,
como una distribución de probabilidad de cara a saber lo que pasará mañana.
130
Estadística - Capítulo 7
Así, un empresario que ha venido observando en los últimos años que el 30%
de sus trabajadores, cuando llega el invierno, están de baja 3 días, el 20% alre-
dedor de una semana y un 5% dos semanas o más, debe pensar, que si no
exactamente así, es muy probable que algo parecido suceda este año, de forma
que lo tenga en cuenta al diseñar la plantilla que necesita.
Las variables aleatorias pueden ser, como las estadísticas, discretas o conti-
nuas, dando lugar a distribuciones de probabilidad discretas o continuas. El
número de accidentes que un individuo puede tener en su vida laboral es una
variable aleatoria discreta: 0, 1, 2, etc. Si a cada uno de estos valores asignamos
una probabilidad, el resultado será una distribución de probabilidad discreta. Por
el contrario si la variable aleatoria es continua, en un intervalo de ésta , tendremos
infinitos valores, sin que podamos averiguar la probabilidad de cada uno,
aunque sí la del intervalo. Veremos pronto como hacerlo.
Los pesos, las alturas, los coeficientes de inteligencia, las habilidades, los
rendimientos, etc, de un gran colectivo de personas siguen con frecuencia
distribuciones, que al representar sus polígonos de frecuencias, tienen un gran
parecido en la forma, con el aspecto que se muestra en la figura:
131
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Φ(–z) = 1 – Φ (z)
132
Estadística - Capítulo 7
p1 = 1 – 0’78814 = 0’21186
133
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
134
Estadística - Capítulo 7
135
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
EJERCICIOS PROPUESTOS
1. Utilizando la tabla de la normal estándar, justifique que en cualquier dis-
tribución Normal los intervalos centrales: media ± desviación típica, media ± dos
desviaciones típicas y media ± tres desviaciones típicas, contienen el 68’27%,
95’45% y 99’73% de probabilidad respectivamente.
136
Estadística - Capítulo 7
Solución: 45’62%
Solución: 77’28%
Solución: 51’10%
137
Capítulo 8
ESTIMACIÓN ESTADÍSTICA
Estadística - Capítulo 8
1. INTRODUCCIÓN
Anteriormente ya se ha mencionado que podíamos dividir la Estadística en
dos partes: Descriptiva e Inferencial. Hasta ahora sólo se ha hablado de la
Descriptiva como opción para resumir y describir los datos. Pero con esto no nos
podemos quedar, hemos de ir más allá. Hemos de encontrar una “fórmula” que
nos “generalice” esa información. Estamos acostumbrados a oír en cualquier
medio de comunicación, en cualquier libro, en cualquier escrito, frases como “La
estatura media de los aspirantes a ese trabajo es de 1’75 m”, pero ¿hemos medido
a la totalidad de aspirantes?, la respuesta, en general, es NO. Seguramente hayamos
tomado una parte de todo el conjunto y estemos generalizando la información;
esto es lo que hace la Estadística Inferencial. También es posible que nos
estemos haciendo una pregunta: ¿Ese valor es verdadero? ¿No cometo errores?;
la respuesta es que SÍ, pero la Estadística Inferencial también valora parte de
esos errores utilizando la teoría de la Probabilidad, de la que ya se ha hablado
anteriormente. Así, podríamos plantear el siguiente esquema:
Hablaremos de esos errores, de los tipos con los que nos podemos encontrar,
pero para ello, vamos a introducir algunos conceptos.
141
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
2. POBLACIÓN Y MUESTRA
Lo primero que hemos de distinguir son dos conceptos con los que se trata
en Estadística: población y muestra. Se da el nombre de población a cualquier
conjunto, colectivo o conglomerado numeroso de objetos por estudiar. Pero esta
definición es tan general que prácticamente no dice nada y, de hecho, no adquiere
verdadero significado sino cuando se asocia a la definición de muestra, que es
alguna parte o subconjunto de una población, ordinariamente seleccionada al
azar, para que las propiedades de la población se pongan de relieve.
Teóricamente las poblaciones pueden ser finitas o infinitas, aunque estas últimas
son algo artificiales o conceptuales; por ejemplo, el conjunto de todos los números
positivos o de todas las posibles estaturas de personas o de todos los lanzamientos
de un dado que podrían hacerse hasta la eternidad. Por oposición, toda población
de entidades físicas es finita: todos los habitantes de España, todos los asilados
en la UE, el parque automovilístico de Madrid, etc. En términos de estadística
inferencial no es necesario ocuparse demasiado de la diferencia entre poblaciones
finitas e infinitas siempre y cuando el tamaño de la muestra sea 100 veces infe-
rior al de la población de la cual se tomó, ya que en este caso las
técnicas estadísticas para poblaciones finitas e infinitas tienden a dar esencialmente
los mismos resultados. Si denotamos con N el tamaño de la población y con n el
de la muestra, la relación f = n/N se conoce como fracción de muestreo:
142
Estadística - Capítulo 8
143
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Defraudaciones
Comisaría X
1 703
2 771
3 418
4 160
5 90
6 70
7 91
8 88
9 110
10 220
11 277
12 81
13 37
144
Estadística - Capítulo 8
En relación con lo que se obtiene en esta salida, que por otra parte suele ser
muy similar a la que se obtendría con otros programas, podemos hacer las
siguientes observaciones y comentarios. En primer lugar observar que lo que
se obtiene como varianza y desviación típica son la cuasivarianza y la cuasides-
viación típica respectivamente; estos valores son los que se utilizan en
estadística como varianza y desviación típica de la población de donde
proceden los datos. Si estuviéramos interesados en calcular la varianza y la
desviación típica de la muestra tendríamos que hacer los siguientes cálculos:
145
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
O también:
3. TIPOS DE MUESTREO
Siempre que nos disponemos a hacer cualquier estudio o investigación nece-
sitamos partir de una población o colección de elementos de los que deseamos
hacer alguna inferencia (ej.: censo electoral en una comunidad). Como casi siempre
es imposible estudiar todos los individuos de la población deberemos tomar una
146
Estadística - Capítulo 8
147
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Por otra parte, aun cuando se trate de muestras bien diseñadas y bien ejecu-
tadas, habrá casos en que la muestra no represente de manera adecuada a la
población en estudio, simplemente porque sólo represente a una parte de esa
población. En tales casos la información contenida en la muestra puede dar lugar
a inferencias incorrectas acerca de la población madre, es decir, puede cometerse
un error al estimar las características de la población sobre la base de la infor-
mación muestral. Los errores de esta naturaleza, que representan las diferencias
que pueden existir entre un estadístico muestral y el parámetro poblacional que
se está estimando, reciben el nombre de errores muestrales. Obviamente tales
errores pueden presentarse en todos los procedimientos de recogida de datos,
excepto en un estudio completo de la población, esto es, en un censo.
148
Estadística - Capítulo 8
sorteo, extraer papeletas de una urna, etc. El método tradicional era la tabla de
números aleatorios, que prácticamente ha quedado en desuso al sustituirse por
el ordenador personal. Muchos son los programas de cálculo o estadísticos que
nos permiten obtener números aleatorios (EXCEL, SPSS, STATGRAPHICS,
STATVIEW).
149
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
El diseño de una muestra con igual probabilidad de elección para cada uno
de los elementos de la población requiere el uso de procedimientos muestrales
cuidadosamente controlados. El procedimiento corriente consiste en efectuar un
150
Estadística - Capítulo 8
(8.4.1)
Ejemplo 8.4.1. En esta población vamos a tomar todas las posibles muestras
de tamaño 2, con reposición y sin reposición, y para cada una de estas mues-
tras vamos a calcular la media, la varianza y la cuasivarianza. Los resultados
están recogidos en las siguientes tablas:
151
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
152
Estadística - Capítulo 8
(8.4.2)
(8.4.3)
(8.4.4)
153
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
, en este ejemplo
154
Estadística - Capítulo 8
155
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Por otro lado, como Sc2 = Varianza = 3593’300 (en la mayoría de los programas
estadísticos lo que llama varianza es en realidad la Cuasivarianza y lo que llama
desviación típica o estándar es en realidad la cuasidesviación típica), el muestreo
es sin reposición y la fracción del muestreo mayor del 1%, deberemos utilizar
para estimar la varianza de la población (de las 19 brigadas):
156
Estadística - Capítulo 8
Solución: Tanto que la muestra haya sido obtenida con reposición como sin repo-
sición, e independientemente del tamaño N que tenga el colectivo de todos los
drogadictos que hay en el país, la proporción p de los que trafican con cocaína se
estima por medio de la proporción que hay en la muestra, es decir:
157
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
esto es, la proporción de drogadictos que trafican con cocaína puede estimarse en
un 30%, y esta proporción tiene una variabilidad de muestreo que puede quedar
cuantificada por medio de una desviación típica de 4’61%.
158
Estadística - Capítulo 8
159
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(8.5.1)
160
Estadística - Capítulo 8
(8.5.2.)
En otras palabras:
(8.5.3)
(8.5.4)
donde el coeficiente z depende del grado de confianza con que se trabaje; sus
valores son los siguientes:
161
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
donde el valor exacto de t hay que calcularlo con una distribución de probabili-
dad denominada t de Student, que tiene una forma muy parecida a la de una
normal, y considerando unos grados de libertad igual al tamaño de muestra
menos uno (g = n – 1). En la siguiente tabla 8.5.2 damos los valores de t para
distintos grados de libertad y tres grados de confianza (90, 95 y 99%). Obsérvese
que a medida que aumenta el tamaño de la muestra aumentarán los grados de
libertad y que entonces los valores de los coeficientes t se aproximan hacia unos
valores límites (n = ∞) que son precisamente los coeficientes z anteriores, obtenidos
para el caso en que la varianza es conocida. También conviene observar que
cuando el coeficiente de confianza es del 95% entonces los valores de t están por
lo general muy próximos a 2, por lo que muchas veces se suele trabajar con un
intervalo de confianza de la forma:
(8.5.6)
(8.5.6)
162
Estadística - Capítulo 8
163
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Ejercicio 8.4.1. Con los datos del ejercicio 8.4.1 podemos construir el
siguiente intervalo de confianza del 95% para el número medio de hechos esclare-
cidos por las 19 Brigadas de Seguridad Ciudadana de Madrid:
N = tamaño de la población = 19
n = tamaño de la muestra = 5
En consecuencia:
así pues, con una confianza del 95% se puede estimar que el número medio de
hechos esclarecidos por las 19 Brigadas de Seguridad Ciudadana estará
comprendido entre 74’51 y 202’29. El error de estimación en la media es de
63’89, valor que es grande debido a que se ha utilizado una muestra muy peque-
ña (5 valores).
Esta claro que el intervalo de confianza nos sirve para verificar ciertas hipó-
tesis de magnitudes de parámetros; es decir, en el ejemplo anterior podríamos
aceptar como válido para el número de hechos esclarecidos el valor de 77 o 150,
pero no serían válidos ni 300, ni 60, por ejemplo. Si el valor hipotético cae
dentro del intervalo la hipótesis planteada es aceptable, si queda fuera, la hipótesis
planteada es rechazada. En otro tema veremos estos tipos de problemas de deci-
sión conocidos como contrastes de hipótesis.
164
Estadística - Capítulo 8
y la desviación típica ´de p , σ( p ), vendrá dada por la raíz cuadrada de las expre-
siones anteriores; por lo tanto, teniendo en cuenta las propiedades de la distri-
bución normal, dado un coeficiente o grado de confianza g (del 90%, 95%, 99%,
etc.) podemos encontrar un coeficiente z (vea la tabla 8.5.1) que verifica que:
es decir: (8.6.3)
165
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Con reposición
Sin reposición
(8.6.4)
Ejercicio 8.6.1. Con los datos del ejercicio 8.4.2, y con un grado de confianza
del 95%, podemos afirmar que la proporción p de los drogadictos que trafican con
cocaína se puede estimar en:
esto es, entre un 20’97% y un 39’03%; para ese grado de confianza el error de
muestreo para esa proporción es de ±9’03%.
Ejercicio 8.6.2. Con los datos del ejercicio 4.3, y con un grado de confianza
del 95%, encontramos que la proporción de jóvenes que han consumido anfetami-
nas en los últimos 6 meses se puede estimar en:
esto es, entre un 1’84% y un 7’64%; el error de muestreo para ese grado de
confianza es de ±2’90%.
166
Estadística - Capítulo 8
(8.6.5)
(8.6.6)
siendo
167
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
es decir, habría que tomar una muestra sin reposición de n = 1029 jóvenes.
es decir, habría que tomar una muestra sin reposición de 1894 jóvenes;
obsérvese que en ambos casos hemos redondeado por exceso el tamaño
final de la muestra.
168
Estadística - Capítulo 8
169
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Esto significa que si a una determinada cuestión hay del orden de un 50% de
respuestas en un determinado sentido, entonces la proporción en la población
estará comprendida entre el 46’8% y el 53’2% con un grado de confianza del
95’5%. Así, a la pregunta “¿Hasta qué punto cree que es importante para España
mantener unas buenas relaciones con Marruecos?” respondieron “Muy
Importante” un 32% de los encuestados, por lo que la proporción de población
que considera que es muy importante para España mantener buenas relaciones
con Marruecos se puede estimar entre un 32 – 3’2 = 28’8% y un 32 + 3’2 = 35’2%
aproximadamente.
http://www.pdipas.us.es/v/vmanzano/programas/programas.html nos
muestra el programa estima.exe, que calcula intervalos de confianza para
medias y proporciones, y con cualquier grado de confianza.
170
Estadística - Capítulo 8
Datos de la muestra:
Tamaño de la muestra: 256
Varianza: 100
Valor medio: 144
Datos de la población:
La población es prácticamente infinita.
Probabilidad:
Probabilidad de errar en la estimación: 0,05
Calcula.
Distancia estandarizada: 1,96 (z de la normal)
Error tipo: 0,6262 (factor del error sin la z)
Error de precisión: 1,2274 (todo el error del intervalo)
Intervalo de estimación: (142,7726 ; 145,2274)
(Pasando el ratón por encima de cada uno de los valores nos indica a qué corresponde)
b) También son varias las páginas de Internet que nos prestan métodos de
cálculo para el tamaño de la muestra:
http://www.pdipas.us.es/v/vmanzano/programas/programas.html nos
muestra el programa MAS.exe, que nos permite calcular todos los valores que
intervienen en la fórmula del cálculo del tamaño de muestra.
171
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
a) Con p conocida:
172
Estadística - Capítulo 8
EJERCICIOS PROPUESTOS
1. Con los datos referentes a 13 sustracciones en vehículos se ha observado
que la valoración de lo sustraído en los mismos, en euros, es de205, 335, 435,
275, 200, 415, 300, 345, 280, 415, 360, 345 y 280. Estime el valor medio de lo
sustraído en un vehículo y dé un intervalo de confianza del 95 % para dicho valor.
Jefatura M B V S Bi Z Va
Jefatura LC O Gr LP PM P
173
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Se pide:
Soluciones. n = 1157
Soluciones. n = 594
174
Estadística - Capítulo 8
8. De entre los años 1997 a 2001, ambos inclusive, se han elegido al azar
cinco meses y se ha contabilizado el número de homicidios (de todo tipo) que se
han cometido en cada uno de ellos, obteniéndose los valore 57, 48, 54, 53 y 47.
Estime el número medio de homicidios por mes que se han cometido durante
ese período de tiempo y calcule un intervalo de confianza del 95 % para dicho
valor medio.
Detenciones Cuerpo
Total
Motivo Policía Guardia Civil Conjunto
Delito 39
Falta 13 1
Rerclamados 6 36
Otros motivos 34
175
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Soluciones. Falta: 14, Reclamados: 30, Total: 49, Delito: 136 y 175, Otros: 3 y 37;
18’70%; IC = (13’97%, 23’43%)
Detenciones Cuerpo
Total
Motivo Policía Guardia Civil Conjunto
Esclarecidos 52
Denunciados 990
13. ¿Qué tamaño de muestra hay que tomar para estimar una proporción con
un error de muestreo de ±3 %, en condiciones desfavorables y con un grado de
confianza del 95%?.
176
Estadística - Capítulo 8
Soluciones. n = 1.068
177
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Utilización
Fuerza en Violencia
Hechos ilegítima de Resto Total
las cosas personas
vehículos
29
Esclarecidos 30 11
Denunciados 55 64 500
Se pide:
178
Capítulo 9
GRÁFICOS DE CONTROL
Estadística - Capítulo 9
1. INTRODUCCIÓN
Cuando se estudia la evolución de una determinada magnitud a lo largo del
tiempo puede observarse que la misma posee una tendencia (creciente o decre-
ciente), también puede presentar unas fluctuaciones de tipo periódico, etc., pero
lo que más nos interesa para este capítulo es el poder determinar aquellas situacio-
nes en que la magnitud o variable objeto de estudio se encuentra en una situación
tal que pueda afirmarse que el valor medio de la misma permanece constante a
lo largo del tiempo y que lo mismo ocurre con su varianza, esto es, con las fluc-
tuaciones alrededor de su media. Esta situación o régimen, que podríamos
denominar estacionario o estable, es importante poderlo detectar porque
estimando sus parámetros estadísticos (media, varianza, etc.) podemos conocer
su comportamiento futuro y, en consecuencia, hacer predicciones y previsiones
sobre cuestiones relacionadas con el mismo. En otras ocasiones es posible
actuar en el entorno que influye sobre los valores de dicha magnitud y, en
consecuencia, podremos influir en su comportamiento, logrando así modificar
su tendencia o alterar su valor medio o variabilidad.
La principal ayuda estadística para estos trabajos son los gráficos de control
y sus modificaciones particulares. Los Gráficos de Control son herramientas que
se usan fundamentalmente para el análisis de datos, ya sean cualitativos o cuan-
titativos, los cuales han sido generados en un determinado período de tiempo.
Estos procedimientos fueron desarrollados inicialmente por el Dr. Walter A.
Shewhart, de la Bell Telephone Laboratories, en 1924, quien sugirió que los
gráficos de control podían cumplir tres funciones básicas:
181
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Los gráficos de control han tenido una gran difusión siendo ampliamente
utilizados en el control de procesos industriales. Sin embargo, con la reformulación
del concepto de Calidad y su extensión a las empresas de servicios y a las
unidades administrativas y auxiliares, se han convertido en métodos de control
aplicables a procesos llevados a cabo en estos ámbitos.
Las ventajas y utilidades de los gráficos de control las podemos resumir en:
182
Estadística - Capítulo 9
183
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
184
Estadística - Capítulo 9
control, que está fijado en 7’62. Si se hiciera uso de los límites de alerta enton-
ces, durante los años 75 y 85, habría que haber estado preparados para poder
tomar las medidas oportunas en caso de que dicha relación sobrepasara los límites
de control, y además explicar la causa por la cual la valoración de los comisos
quedaba muy por debajo de sus valores esperados en relación con las multas
(fraude en las peritaciones, cambio de estrategia de los contrabandistas, dismi-
nución del valor real de los géneros intervenidos, endurecimiento de las sanciones,
cambio de legislación, etc.).
185
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
186
Estadística - Capítulo 9
ya que el análisis de las causas que la producen supone una oportunidad para
reducir la variabilidad del proceso. Para identificar este estado conviene situar en
el gráfico dos líneas a cada lado de la línea central que dividan al intervalo de
control en 6 partes iguales, para lo cual se trazan a una y dos desviaciones típi-
cas; en condiciones de normalidad el 68% de los puntos deberían estar entre las
dos líneas centrales y el 32% entre las siguientes (vea la Fig. 9.2.5). El encontrar
16 puntos consecutivos entre las líneas que están a una desviación típica de la
media se puede considerar como presencia de superestabilidad. Una acumula-
ción de puntos en esta zona central indica que los límites de control están mal
calculados, que se han tomado incorrectamente los datos o que se ha producido un
cambio positivo temporal en el proceso; en cualquier caso conviene investigar la
causa.
187
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Una segunda etapa es investigar las causas que producen valores fuera de
control; cuando la aparición de un punto atípico en un gráfico de control supo-
ne buscar una causa, corregir sus efectos mediante un ajuste del proceso y tomar
medidas para evitar su aparición futura, estamos utilizando los gráficos de
control para aprender sobre el proceso y mejorarlo.
188
Estadística - Capítulo 9
V. Trazar estos límites de control sobre una hoja de trabajo e iniciar el regis-
tro de los resultados de las muestras de un tamaño dado, seleccionadas a
determinados intervalos periódicos y conforme se vayan tomando.
3. GRÁFICO ( X , σ)
En este apartado vamos a suponer que el gráfico de control se realiza sobre
una característica medible X cuyo valor medio es µ y cuya desviación típica es σ.
189
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(9.3.1)
190
Estadística - Capítulo 9
(9.3.2)
Línea Central = LC = X
191
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
192
Estadística - Capítulo 9
La media y desviación típica estimadas con los 27 meses restantes son ahora
X = 1’8341 y la cuasidesviación típica Sc = 0’2160, lo que nos conduce a la
siguientes líneas de control:
193
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
194
Estadística - Capítulo 9
4. GRÁFICO DE PROPORCIONES
Los gráficos de control por atributos se construye a partir de la observación
de la presencia o ausencia de una determinada característica (atributo o defecto)
en cada una de las unidades, entonces se acepta o se rechaza contando cuantas
unidades tienen o no el defecto, o comprobando el número de tales eventos que
ocurren en la unidad, grupo o área, y comparando con el criterio de aceptación
establecido. Se acepta o rechaza la pieza o el lote sin asociar un valor concreto.
El atributo a controlar se suele elegir de forma que sea fácilmente observable y
por tanto económico de controlar. Los tipos de gráficos de control por atributos
que estudiaremos son:
195
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Año 2002
Denuncias
Hechos %
Mes Denun Escla Efecti
1 327 103 31’5
2 308 75 24’4
3 269 63 23’4
4 202 45 22’3
5 250 54 21’6
6 260 56 21’5
7 233 69 29’6
8 222 42 18’9
9 224 39 17’4
10 209 52 24’9
11 275 53 19’3
12 340 75 22’1
Total 3119 726 23’3
196
Estadística - Capítulo 9
(9.4.1)
197
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
donde podemos observar que dichos límites dependen del tamaño de la mues-
tra utilizada. Así pues, si todas las muestras son del mismo tamaño entonces los
límites de control (y los de alerta) serán fijos, pero si los tamaños muestrales
varían, como sucede en el ejemplo anterior de las efectividades mensuales del
G.S.C., resulta que dichos límites son variables. Para paliar esta situación se
suele tomar una de estas dos soluciones:
198
Estadística - Capítulo 9
II. Utilizar una gráfica estandarizada, para lo cual se representan las mag-
nitudes Zi dadas por:
(9.4.3)
Como el valor exacto de p suele ser desconocido, se estima con datos retros-
pectivos que muestren una situación estable o estacionaria, esto es, sin tenden-
cias, sin rachas y sin valores fuera de los límites de control utilizados; conviene
además que por lo menos se hayan utilizado al final de todo un total de 20 períodos
de tiempo o conjuntos de muestras en esas condiciones de estabilidad.
199
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Año 2002
Denuncias
Hechos Efectividad
Mes Den Escl p,^ i Zi
1 327 103 0’315 4’45
2 308 75 0’244 1’26
3 269 63 0’234 0’81
4 202 45 0’223 0’30
5 250 54 0’216 0’08
6 260 56 0’215 0’05
7 233 69 0’296 3’06
8 222 42 0’189 –0’90
9 224 39 0’174 –1’46
10 209 52 0’249 1’23
11 275 53 0’193 –0’86
12 340 75 0’221 0’30
200
Estadística - Capítulo 9
(9.4.4)
(9.4.5)
201
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Año 2000
Denuncias
Hechos Efectividad
Mes Den Escl p,^ i Zi
1 327 103 ——— ———
2 308 75 ——— ———
3 269 63 ——— ———
4 202 45 ——— ———
5 250 54 ——— ———
6 260 56 ——— ———
7 233 69 ——— ———
8 222 42 0’189 –0’80
9 224 39 0’174 –1’35
10 209 52 0’249 1’34
11 275 53 0’193 –0’74
12 340 75 0’221 0’43
202
Estadística - Capítulo 9
De cara al futuro, años 2003 y 2004 por ejemplo, se calcularía mes a mes la
eficacia del Grupo, que denotamos por p^i, y a partir de ella el valor estandari-
zado dado por la siguiente fórmula (9.4.6):
(9.4.6)
Fig. 9.4.3: Gráfica estandarizada en una segunda etapa del proceso de cálculo de p.
203
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(9.5.1)
es decir: (9.5.2)
204
Estadística - Capítulo 9
Nº Robos 45 58 57 64
205
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
En este ejemplo el estar por debajo de los límites LIA o LIC, esto es, el no
tener robos en un mes puede conducir a una situación evidentemente positiva,
en el sentido de que haya disminuido ese tipo de delincuencia. El que haya 9, 10
u 11 robos en un mes puede conducir a una situación de alerta por si está incre-
mentándose mucho ese tipo de delincuencia. El tener 12 o más robos en un mes
puede conducir a tener que tomar medidas específicas para prevenir ese tipo de
delincuencia (mayor vigilancia y presencia policial en gasolineras durante los
meses siguientes, por ejemplo).
X-Barra, R, S
206
Estadística - Capítulo 9
Tabla 9.6.1
S M T S M T S M T
1 1 12,02 4 2 12,25 7 3 12,21
1 2 12,15 4 3 12,09 7 4 12,02
1 3 12,10 4 4 12,07 7 5 12,01
1 4 12,20 4 5 11,96 8 1 12,17
1 5 12,12 5 1 12,17 8 2 12,18
2 1 12,14 5 2 12,04 8 3 12,10
2 2 12,07 5 3 11,97 8 4 12,09
2 3 11,99 5 4 11,88 8 5 12,15
2 4 11,98 5 5 12,05 9 1 12,32
2 5 12,02 6 1 11,90 9 2 12,26
3 1 12,04 6 2 11,91 9 3 12,18
3 2 12,09 6 3 12,05 9 4 12,09
3 3 12,20 6 4 12,07 9 5 12,14
3 4 12,05 6 5 11,86 10 1 12,04
3 5 12,24 7 1 12,08 10 2 12,13
4 1 12,14 7 2 12,09 10 3 12,21
207
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
S M T S M T S M T
10 4 12,41 14 1 11,90 17 3 11,72
10 5 12,03 14 2 11,90 17 4 11,91
11 1 12,20 14 3 11,91 17 5 11,82
11 2 12,31 14 4 11,91 18 1 11,85
11 3 12,16 14 5 12,01 18 2 11,87
11 4 12,15 15 1 12,02 18 3 11,92
11 5 12,24 15 2 11,86 18 4 11,96
12 1 12,09 15 3 12,03 18 5 11,87
12 2 12,11 15 4 12,03 19 1 12,14
12 3 12,28 15 5 12,05 19 2 12,07
12 4 12,02 16 1 12,08 19 3 12,99
12 5 12,15 16 2 12,09 19 4 11,98
13 1 12,00 16 3 11,93 19 5 12,32
13 2 12,14 16 4 12,09 20 1 12,24
13 3 11,92 16 5 12,08 20 2 11,79
13 4 11,88 17 1 12,02 20 3 12,20
13 5 11,81 17 2 11,85 20 4 12,15
20 5 12,04
Se puede observar que los grupos 17, 18 y 19 presentan una media de tiempo
fuera de los límites de control. Por lo cual habrá que eliminarlos y repetir el
proceso.
a) Gráficos p
Ejemplo 9.6.2. Una determinada empresa, cada día, realiza un control sobre
sus productos eligiendo al azar una muestra de tamaño n variable, como se recoge
en la tabla siguiente (R = Rechazados):
208
Estadística - Capítulo 9
209
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Ejemplo 9.6.3. Una determinada empresa, cada día, realiza un control sobre
sus productos eligiendo al azar una muestra de tamaño constante n = 100, como
se recoge en la tabla siguiente (D = Disconformidades). Como puede observarse,
el gráfico de control no presenta ninguna anomalía, por lo tanto, los límites de
control nos servirán de referencia para controlar la evolución del proceso.
210
Estadística - Capítulo 9
c) Gráficos c
211
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
212
Estadística - Capítulo 9
d) Gráficos u
Ejemplo 9.6.5. Una determinada empresa realiza cada día un control sobre
sus productos eligiendo al azar una muestra de tamaño variable. Los datos se
recogen en la tabla siguiente, y, como puede observarse, el gráfico de control no
presenta ninguna anomalía, por lo tanto, los límites de control nos servirán de
referencia para controlar la evolución del proceso.
213
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Unidades Disconformidades
Día Disconformidades
inspeccionadas por unidad
1 110 120 1.0909
2 82 94 1.1463
3 96 89 0.9271
4 115 162 1.4087
5 108 150 1.3889
6 56 82 1.4643
7 120 143 1.1917
8 98 134 1.3673
9 102 97 0.9510
10 115 145 1.2609
11 88 128 1.4545
12 71 83 1.1690
13 95 120 1.2632
14 103 116 1.1262
15 113 127 1.1239
16 85 92 1.0824
17 101 140 1.3861
18 42 60 1.4286
19 97 121 1.2474
20 92 108 1.1739
21 100 131 1.3100
22 115 119 1.0348
23 99 93 0.9394
24 57 88 1.5439
25 89 107 1.2022
26 101 105 1.0396
27 122 143 1.1721
28 105 132 1.2571
29 98 100 1.0204
30 48 60 1.2500
214
Estadística - Capítulo 9
215
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
EJERCICIOS PROPUESTOS
1. De datos retrospectivos se sabe que las Radiopatrullas de una determinada
Brigada de Seguridad Ciudadana tienen un Cociente mensual
(Detenidos/Funcionarios) de 0’89 con una desviación típica de 0’12. Establezca
un gráfico de control para esas Radiopatrullas, coloque sobre el mismo los
siguientes cocientes mensuales: 0’54, 0’69, 0’56, 1’34, 1’12 y 0’72; comente
dicho gráfico.
Solución: µ = 0’89, σ = 0’12, LSC = 1’25, LSA = 1’13, LC = 0’89, LIA = 0’65, LIC =
0’53, no hay rachas ni tendencias significativas. El mes 4 (abril) supera el LSC,
analizar las causas y tomar medidas; los mese 1 y 3 (enero y marzo) por debajo
del LIA, prevención para los siguientes meses
Se pide:
216
Estadística - Capítulo 9
Se pide:
Se pide:
217
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Solución: a) Gráfico tipo c, con c = 691/48 = 14'3958, LSC = 25'78, LSA = 21'98,
LC = 14'40, LIA = 6'81, LIC = 3'01; c) no hay rachas significativas, tendencia decre-
ciente significativa de meses 4 a 11 (abril a noviembre), ver causas y adoptar medidas,
mes 12 (diciembre) por debajo del LIA, prevención en enero de 2005).
A\M Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
2001 1'69 1'81 2'00 1'47 1'12 0'86 1'67 1'72 0'88 1'07 0'62 0'71
2002 0'89 1'21 1'90 0'85 1'00 0'96 1'62 2'00 1'76 2'50 1'85 0'80
2003 1'00 1'56 1'95 1'39 0'79 2'31 1'63 3'05 2'60 1'30 1'46 0'89
A\M Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
2001 75 77 95 59 68 63 60 52 51 53 51 39
2002 47 58 72 40 45 42 49 44 56 97 65 49
2003 67 71 73 56 48 73 54 86 86 67 57 45
218
Estadística - Capítulo 9
Solución: Hay dos meses fuera de control, el 29 por debajo del LIC y el 32 por
encima del LSC; hay una tendencia decreciente significativa entre los meses 22 y
29, también hay una racha significativa por debajo de la LC entre los meses 5 y 12
219
Capítulo 10
CONTRASTES DE HIPÓTESIS
Estadística - Capítulo 10
LO VERDADERO
H0 H1
Decisión Error tipo II
CONCLUSIÓN H0
Correcta Riesgo β
DEL
CONTRASTE Error tipo I Decisión
H1
Riesgo α Correcta
223
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
2) Elección de a.
224
Estadística - Capítulo 10
de 1’35 (que es el valor que viene a tomar la media nacional); para ello tiene que
realizar una prueba estadística que permita comparar su valor medio con el valor
1’35.
(10.2.1)
Con el nivel de significación a con el que estemos trabajando (que suele ser
α = 0’05 = 5%), vamos a las tablas estadísticas de la t de Student, con g = n – 1
grados de libertad, y buscamos el valor crítico Tc para una prueba bilateral (vea
la tabla 8.5.2). Por último se compara el valor observado de T y se decide del
siguiente modo:
225
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Este valor T = Tobs hay que compararlo con el valor crítico Tc obtenido de
una tabla de la t de Student con g = n – 1 = 11 grados de libertad, prueba bila-
teral y nivel de significación α = 5%; en la Tabla 8.5.2 encontramos Tc = 2’2010
que es menor que el valor observado Tobs = 8’8741, en consecuencia rechazamos
la hipótesis nula y afirmamos que el Cociente medio mensual del Grupo de
Seguridad Ciudadana difiere estadísticamente de la media nacional (en este caso
es superior a la media nacional).
Como este valor observado está dentro de los límites de ±Tc = ±2’2010 se
acepta la hipótesis nula sobre la igualdad y se puede afirmar que estadísticamente
no hay diferencias significativas entre el valor medio observado en los últimos
12 meses ( X = 1’845833 ≈ 1’85) y el valor medio tradicional (µ0 = 1’80).
226
Estadística - Capítulo 10
El primer cuadro nos presenta los cálculos hechos con la muestra de los
estadísticos descriptivos:
gl = grados de libertad = n – 1 = 11
Sig. (bilateral) = Significación = p = 0’000
Diferencia de medias = X – µ0 = 0’4958
Considerando un nivel de significación de 0’05, y comparando p con él,
vemos que p = 0.000 < 0’05, por lo que rechazamos la hipótesis nula; es decir,
hay una diferencia significativa entre el cociente de esta Brigada de Seguridad
Ciudadana y el cociente nacional.
227
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
gl = grados de libertad = n – 1 = 11
228
Estadística - Capítulo 10
a) Grupos Independientes
En este caso tenemos que estudiar una sola variable en dos grupos diferentes.
(10.3.1)
(10.3.2)
y buscamos el valor crítico Tc para una prueba bilateral (vea la Tabla 8.5.2); por
último, se compara el valor observado de T y se decide del siguiente modo:
229
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(10.3.3)
(10.3.4)
(10.3.5)
230
Estadística - Capítulo 10
C. Brig. 1 C. Brig. 2
1’69 0’89
1’81 1’46
2’00 1’30
1’47 2’60
1’12 3’05
1’63
2’31
0’79
H0 : µ 1 = µ2
H1 : µ1 ≠ µ2
Estadísticos de grupo
231
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Esta primera parte de la salida nos muestra la estadística descriptiva para las
muestras de ambos grupos. Tenemos, de izquierda a derecha, el tamaño de
muestra de cada grupo, la media correspondiente, la cuasidesviación típica y el
error típico de la media.
Cociente mensual
Se han No se han
Estadísticos asumido asumido
varianzas varianzas
iguales iguales
Prueba de Levene F 5,011
para la igualdad de
varianza Sig. ,047
232
Estadística - Capítulo 10
= 10’038 (que son los que darían la aproximación de Welch (10.3.2)). Para este
contraste la significación es 0’686 (“Sig. (bilateral)”), y puesto que p = 0’686 >
0’05, aceptamos la hipótesis nula de que las medias son iguales. Con lo que
concluimos que los cocientes medios en ambas brigadas se pueden considerar
iguales.
lo que significa que la diferencia real entre las medias es un valor próximo a cero
(lo mismo puede ser una pequeña cantidad negativa que positiva); como el intervalo
de confianza del 95% contiene al cero es por lo que el contraste de hipótesis
permite aceptar la igualdad de las medias (con un error de tipo I: α = 100 – 95 = 5%).
Estadísticos de grupo
233
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
En esta primera parte, igual que antes, se nos muestra la estadística descrip-
tiva para ambos grupos. Tenemos, de izquierda a derecha, el tamaño de la mues-
tra de cada grupo, la media correspondiente, la cuasidesviación típica y el error
típico de la media.
Cantidad robada en ¤
Se han No se han
asumido asumido
varianzas varianzas
iguales iguales
Prueba de Levene F 3,508
para la igualdad de
varianza Sig. ,088
Elegimos, por tanto, la opción de “Se han asumido varianzas iguales”, con lo
que nuestro estadístico de contraste será Tobs = t = 2’608 (que es el valor que
234
Estadística - Capítulo 10
lo que significa que la diferencia real entre las medias es un valor positivo (superior
en el caso de los hombres que en el de las mujeres); como el intervalo de
confianza del 95% no contiene al cero y es todo él positivo es por lo que el
contraste de hipótesis permite rechazar la igualdad de las medias (con un error
de tipo I complementario al grado de confianza: a = 100 – 95 = 5%), y decir, en
este ejemplo que en media lo robado por hombres es superior que lo robado por
mujeres (entre 4’76 y 56’24 euros más).
b) Grupos Apareados
En este caso tenemos que estudiar dos variables en un solo grupo. Con
frecuencia se diseñan experimentos de forma que las observaciones estén
apareadas, por ejemplo, cuando a un grupo se les estudia un comportamiento
antes de ingerir alcohol y después de ingerirlo. En esta situación tenemos pares
de valores (X1, Y1), (X2, Y2), ..., (Xn, Yn) que forman dos grupos de observaciones
X e Y. Pretendemos contrastar los valores medios teóricos µX y µY. Por ejemplo,
si ha cambiado la tensión arterial antes y después de consumir alcohol. Las hipóte-
sis a contrastar vienen dadas por:
, siendo D = X - Y.
235
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(10.3.6)
(10.3.7)
ene feb mar abr may jun jul ago sep oct nov dic
A 1’76 1’47 2’21 1’99 1’86 1’80 1’73 1’69 1’97 1’79 1’81 2’07
B 1’56 2’03 2’25 1’87 2’01 1’98 1’58 1’98 2’50 2’03 1’50 2’09
236
Estadística - Capítulo 10
N Correlación Sig.
Par 1 Cocientes Brigada A &
12 ,404 ,192
Cocientes Brigada B
237
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
lo que significa que la diferencia real entre los cocientes medios es un valor
próximo a cero (lo mismo puede ser una pequeña cantidad negativa que positi-
va); como el intervalo de confianza del 95% contiene al cero es por lo que el
contraste de hipótesis permite aceptar la igualdad de las medias (con un error
de tipo I complementario el grado de confianza: a = 100 – 95 = 5%).
238
Estadística - Capítulo 10
4. COMPARACIÓN DE PROPORCIONES
En este apartado vamos a ver algunos métodos aproximados para contrastar
proporciones, o frecuencias relativas, tanto con valores dados como entre dos de
ellas; estos métodos son aplicables para tamaños de muestra que no sean muy
pequeños.
(10.4.1)
(y x100 si en %) (10.4.2)
(10.4.3)
si no hay corrección por población finita (caso del muestreo con reposición o del
muestreo sin reposición y fracción de muestreo pequeña, f ≤ 0’01), o bien:
(10.4.4)
239
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(10.4.5)
Ejemplo 10.4.1. En una manifestación hubo unas 500 personas que alteraron
el orden público y de entre ellas se detuvo a 14 hombres y 6 mujeres. ¿Puede
aceptarse que entre las personas que alteraron el orden público la proporción de
hombres y mujeres fue similar?
240
Estadística - Capítulo 10
(10.4.6)
(10.4.7)
(10.4.8)
241
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Al ser |Z | = 1’1370 < 1’96 = Zc, podemos aceptar la hipótesis nula y afirmar
que las diferencias entre ambas eficacias no son significativas (hemos considerado
α = 5%).
242
Capítulo 11
REGRESIÓN Y CORRELACIÓN
Estadística - Capítulo 11
1. INTRODUCCIÓN
En los capítulos anteriores hemos estudiado el uso de la información muestral
para hacer inferencias, contrastar hipótesis o modificar opiniones acerca de las
características de una población estadística. En este capítulo nos ocuparemos de
un problema relacionado con lo anterior, que incluye dos o más variables: es el
de hacer inferencias acerca de la forma en que los cambios en un conjunto de
variables están relacionados con los cambios en otro conjunto. La descripción de
la naturaleza de la relación entre dos o más variables se llama análisis de regre-
sión, en tanto que la investigación y medida de la fuerza o grado de tal relación
se denomina análisis de correlación.
245
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
y = a + bx (11.2.1)
de la recta, siendo positiva para rectas crecientes, negativa para rectas decre-
cientes y cero para rectas horizontales; se puede calcular dividiendo lo que
aumenta o disminuye y, ∆y, para un aumento dado de x, ∆x, esto es, b = ∆y/∆x.
La ordenada en el origen es el valor de y para x = 0.
246
Estadística - Capítulo 11
Coeficientesa
Coeficientes
Modelo estandarizados
B Error típ. Beta t Sig.
1 (costantes) -337,5926 231,0478 -1,461 ,158
COMISOS 5,9179 ,4061 ,950 14,573 ,000
a. Variable dependiente: MULTAS
247
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
y = –337’5926 + 5’9179´400 =
(11.2.3)
= 2029’57 millones de pts.
y = –337’5926 + 5’9179´1710’52 =
(11.2.4)
= 9785’09 millones de pts.
y = a + bx + ε (11.2.6)
εi = yi – y(xi ) = yi – a – bxi
248
Estadística - Capítulo 11
249
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
modelo (que son los parámetros desconocidos) así como la varianza σ2 del error
a partir de la observación de n parejas de datos (xi, yi), i = 1, 2, 3, ..., n. En el
ejemplo mencionado las n parejas de datos son los 25 pares de valores corres-
pondientes a los valores de comisos (x) y multas (y) correspondientes a los 25
años comprendidos entre 1961 y 1985.
Fig. 11.2.2: Sanciones motivadas por las actuaciones del Servicio de Vigilancia
Aduanera entre los años 1961 y 1985
250
Estadística - Capítulo 11
y = bx + ε (11.2.7)
lo que da una recta de regresión y = bx que pasa por el origen (y = 0, para x = 0).
Más adelante veremos que la propia interpretación estadística de los resultados
tiende a confirmar que para este ejemplo el modelo (11.2.7) es tan bueno o mejor
que el formulado anteriormente en (11.2.6).
(11.3.1)
251
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(11.3.2)
(11.3.3)
(11.3.4)
(11.3.5)
(11.3.6)
(11.3.7)
252
Estadística - Capítulo 11
(11.3.8)
(11.3.9)
253
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Tabla 11.3.1: Salida de una regresión lineal para los datos de la tabla SVA.
254
Estadística - Capítulo 11
(11.3.10)
(11.3.11)
(11.3.12)
255
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(11.4.1)
SXY = r SX SY (11.4.2)
esto es: “La covarianza es el producto del coeficiente de correlación lineal por las
desviaciones típicas de las variables”. Si esta expresión de la covarianza la susti-
tuimos en la fórmula (11.3.4) de la recta de regresión obtenemos:
(11.4.3)
o lo que es equivalente:
(11.4.4)
256
Estadística - Capítulo 11
257
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(11.4.5)
y como SCE ≥ 0 deberá ser r2 ≤ 1; además, cuanto mayor sea r2 tanto más pequeña
será la suma de cuadrados de los errores y, en consecuencia, los pares de datos
observados (xi, yi) se encontrarán más próximas a la recta de regresión; con lo
cual podemos establecer las siguientes afirmaciones:
(11.4.7)
258
Estadística - Capítulo 11
y debido a ello suele multiplicarse por 100 y darse en tanto por cien. En la salida
proporcionada por el SPSS (Tabla 11.3.1, Resumen del modelo) vemos que se nos
informa del valor del coeficiente de correlación, r (R) = 0’949883, así como de
su cuadrado, r2 (R cuadrado) = 0,902278 = 90,23 %. Podemos también comprobar
que se cumple la relación (11.4.7):
259
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(11.5.1)
(11.5.2)
Para no tener que consultar tablas estadísticas el programa SPSS da las sig-
nificaciones muestrales p (Sig.) que tienen las hipótesis nulas; si estos valores
son menores o iguales que a se rechaza la hipótesis nula, y si son mayores que
a se acepta la hipótesis nula correspondiente. Con los datos de nuestro ejemplo
y un error de tipo I del 5% = 0’05 vemos que se acepta la hipótesis nula a = 0 ya
que p = 0’158 > 0’05 = α (Sig (Constante) = ,158) y que para la pendiente se
rechaza la hipótesis nula (b = 0) por ser p = Sig. (COMISOS) = 0’000 < 0,05 = α.
260
Estadística - Capítulo 11
predicciones del valor medio ym = a + bx, esto es, del valor que tendría y sobre
la recta de regresión teórica, así como del valor real de la observación y = a + bx + ε,
dado el valor x de la variable explicativa, basta con sustituir x en la recta de
regresión calculada, obteniendo en ambos casos:
(11.5.5)
que es una estimación centrada tanto de ym como para un valor aislado y. Para
un total anual decomisado de 1500 millones de pts. estimamos un total de mul-
tas por valor de:
261
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
262
Estadística - Capítulo 11
Es claro que cuanto mayor sea el valor observado de F tanto mayor será el
cuadrado medio de la regresión, CMR, y tanto menor el cuadrado medio del
error, CME; recíprocamente, cuanto menor sea el valor observado de F tanto
menor será CMR y tanto mayor CME. En consecuencia los valores grandes de F
están asociados a modelos cuya variabilidad explicada es grande (hipótesis H1),
mientras que los valores pequeños de F se asocian con modelos que explican
poca variabilidad (hipótesis H0). Así pues, por debajo de un cierto valor crítico Fc
(Región de Aceptación) se acepta la hipótesis nula y por encima (Región Crítica)
se rechaza; la regla de decisión queda por tanto de la siguiente manera:
en donde, fijado el error α de tipo I, el valor crítico Fc hay que consultarlo en unas
tablas estadísticas conocidas como tablas de la distribución F de Snedecor. Para
no tener que consultar tablas el programa el SPSS (y muchos otros programas
estadísticos) proporcionan la significación muestral de la hipótesis nula, que
suele denotarse con p y que en nuestro caso es prácticamente cero (Sig = ,000);
de este modo la regla de decisión es como sigue (forma estándar para todos los
contrastes de hipótesis, aceptar la hipótesis nula si p > α y rechazarla cuando
sea p ≤ α):
H0 : b = 0
(11.5.10)
H1 : b ≠ 0
263
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
y = bx (11.6.1)
y = bx + ε (11.6.2)
(11.6.3)
(11.6.4)
(11.6.5)
264
Estadística - Capítulo 11
(11.6.6)
(11.6.7)
Tabla 11.6.1: Salida de una regresión lineal por el origen para los datos del SVA
Variables introducidas/eliminadasb,c
Variables Variables
Modelo Método
introducidas eliminadas
1 COMISOS ª , Introducir
a. Todas las variables solicitadas introducidas
b. Variable dependiente: MULTAS
c. Regresión lineal a traves del origen
a. Para la regresión a través del origen (el modelo sin térrmino de intersección),
R cuadrado mide la proporción de la variabilidad de la variable dependiente expli-
cado por la regresión a través del origen. NO SE PUEDE comparar lo anterior con
la R cuadrado para los modelos que incluyen una intersección
265
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
ANOVAc,d
Suma de cua- Media
Modelo gl F Sig.
drados cuadrática
1 Regresión 249624046 1 2,50E+08 286,325 ,000ª
Residual 20923668 24 871819,516
Total 270547714b 25
a. Variables predictoras: COMISOS
b. Variable dependiente: Delitos Esclarecidos
c. Variables dependientes: MULTAS
d. Regresión lineal a través del origen
Coeficientesa,b
Coeficientes no Coeficientes
Modelo estandarizados estandarizados
B Error típ. Beta t Sig.
1 COMISOS 5,554 ,328 ,961 16,921 ,000
266
Estadística - Capítulo 11
Esto nos indica que existe una dependencia lineal del número de delitos
esclarecidos con el número de funcionarios y el número de detenidos, además el
modelo lineal con a = 0 puede explicar bastante bien esta relación.
267
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Variables introducidas/eliminadasb
Variables Variables
Modelo Método
introducidas eliminadas
Nº Detenidos
1 Nº Funcionarios , Introducir
Pol. Judicial
ANOVAb
Coeficientesª
Coeficientes no Coeficientes Intervalo de confianza
estandarizados estandarizados para B al 95%
Modelo
Límite Límite
B Error típ. Beta t Sig. inferior superior
1 (Constante) 1,046 2,844 ,368 ,715 -4,748 6,840
Nº Funcionarios
,688 ,107 ,577 6,436 ,000 ,471 ,906
Pol. Judicial
Nº Detenidos ,834 ,177 ,423 4,724 ,000 ,474 1,193
268
Estadística - Capítulo 11
269
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
la varianza del error viene estimada por σ̂ 2 = CME = 87’346 (Residual: Media
cuadrática), (vea Error tip. de la estimación) y la
relación:
Variables Variables
Modelo Método
introducidas eliminadas
Nº Detenidos
1 Nº Funcionarios , Introducir
Pol. Judicial ª
270
Estadística - Capítulo 11
a. Para la regresión a través del origen (el modelo sin término de intersección),
R cuadrado mide la proporción de la variabilidad de la variable dependiente
explicado por la regresión a través del origen. NO SE PUEDE comparar lo anterior
con la R cuadrado para los modelos que incluyen una intersección.
b. Variables predictoras: Nº Detenidos, Nº Funcionarios Pol. Judicial
ANOVAc,d
Coeficientesa,b
271
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Si con la fórmula (11.7.4) calculamos los valores ajustados así como los resi-
duales obtenemos los resultados mostrados en la siguiente Tabla 11.7.4, que
puede calcularse con el propio programa SPSS.
272
Estadística - Capítulo 11
a) Correlación de Spearman
Es frecuente que las unidades estadísticas de una muestra se ordenen
respecto de una cierta característica observada, para lo cual es necesario que tal
característica sea numérica o, al menos, ordinal. Tal es el caso de ordenar un
conjunto de individuos en función de sus tallas, o de una calificación obtenida
en una prueba, o un conjunto de objetos según la preferencia de un cierto suje-
to, o unos acontecimientos según su gravedad, etc. El número de orden (1, 2, 3,
..., n) que cada unidad estadística ocupa dentro de la ordenación establecida se
denomina rango; pues bien, si una misma muestra se ordena según dos carac-
terísticas entonces tendremos pares de rangos (x1, y1), (x2, y2), ..., (xn, yn),
donde x1 es el rango que le corresponde a la unidad estadística 1 en la primera
ordenación e y1 el que le corresponde según la segunda ordenación, x2 e y2 los
rangos que le corresponden a la unidad estadística 2 según la primera ordena-
ción y según la segunda respectivamente, etc. En este caso se llama correlación
de Spearman a la correlación ordinaria (de Pearson) que hay entre los rangos (x1,
y1), (x2, y2), ..., (xn, yn); el coeficiente de correlación de Spearman lo representare-
mos por rS y puede calcularse mediante la fórmula siguiente:
273
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Ahora basta calcular las diferencias di = xi – yi, luego sus cuadrados di2,
sumarlas y aplicar la fórmula (11.8.1):
274
Estadística - Capítulo 11
(11.8.2)
Denuncias Rangos
H. Den. H. Esc. di2
B.S.C. H. Den. H. Esc. di = xi – yi
(xi) (yi)
Arganzuela 390 128 5 10 –5 25,00
Buenavista 499 159 8 13 –5 25,00
Carabanchel 348 70 3 4 –1 1,00
Cármenes, Los 416 76 6 5 1 1,00
Centro 1369 440 19 19 0 0,00
Chamartín 1244 122 18 9 9 81,00
Chamberí 680 212 15 18 –3 9,00
Entrevías 525 36 13 1 12 144,00
Estrella, La 1088 186 17 16 1 1,00
Fuencarral 810 183 16 15 1 1,00
Latina, La 549 111 14 7 7 49,00
Mediodía 504 115 9 8 1 1,00
Retiro 386 162 4 14 –10 100,00
San Blas 516 158 12 12 0 0,00
Tetuán 507 50 10,5 2 8,5 72,25
Universidad 507 190 10,5 17 –6,5 42,25
Usera 315 65 1 3 –2 4,00
Vallecas 341 144 2 11 –9 81,00
Ventas 450 109 7 6 1 1,00
TOTAL 638,50
275
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
b) Coeficiente Φ
En el caso de que se quiera estudiar la asociación o correlación entre dos
variables dicotómicas, esto es, cada una dividida en dos modalidades, cuya tabla
de frecuencia absolutas sea de la forma:
276
Estadística - Capítulo 11
X \Y y1 y2 TOTAL
x1 a b a+b
x2 c d c+d
(11.8.3)
Ejemplo 11.8.2. Con los datos que obran en cierta Comisaría se han clasifi-
cado 53 detenidos en función de si han sido o no condenados por delitos
contra la propiedad y su hábito de consumir drogas duras. Los resultados son
los que se muestran en la siguiente tabla:
Consumo de Drogas
Tipo de Duras TOTAL
Delitos
Sí No
Propiedad 8 3 11
Otros 2 40 42
TOTAL 10 43 53
277
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
(11.8.4)
así pues existe una cierta correlación o asociación entre el consumo de drogas
duras y la comisión de delitos contra la propiedad y el no consumo de drogas
duras con otros tipos de delitos.
(11.8.5)
donde X 1 y X 0 son los valores medios de los xi para los que Y es igual a uno y
cero respectivamente, SX es la desviación típica de las observaciones X y p y q
son las frecuencias relativas de las observaciones de Y iguales a uno y cero
respectivamente. La correlación biserial puntual no es más que la correlación de
Pearson entre las variables X e Y, por lo que tomará valores entre –1 y +1, de
modo que rbp » +1 indicará una asociación entre valores altos de X con Y = 1 y
valores bajos de X con Y = 0, de forma análoga rbp » –1 es señal de una asocia-
ción de valores altos de X con Y = 0 y valores bajos de X con Y = 1, mientras que
rbp » 0 es síntoma de que no hay asociación o correlación entre los valores de X
y los de Y.
278
Estadística - Capítulo 11
940, 990, 860, 1010, 1070, 770, 1070, 960, 1040, 1390, 690, 960, 1040, 1080
y 1130 (también en euros). Si queremos ver si existe algún tipo de asociación o
correlación entre el valor (variable numérica) y el tipo de delito (variable dicotó-
mica) podemos utilizar la correlación biserial puntual, para ello codificamos con
0 si se trata de una estafa con cheques y codificamos con 1 si se trata de un
tirón; de ese modo se podría construir una tabla como la siguiente:
en consecuencia obtenemos:
(11.8.6)
279
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
por lo que podemos afirmar que existe una cierta correlación o asociación entre
el tipo de delito y la valoración. Además, como la correlación sale negativa
significa que las valoraciones mayores están relacionadas con el delito codificado
con 0 (estafas con cheques) mientras que las valoraciones menores están rela-
cionadas o asociadas al tipo de delito codificado con 1 (tirones), en otras palabras,
por el método del tirón se tiende a sustraer menos que lo que se estafa con
cheques al descubierto.
280
Prácticas
Estadística - Prácticas
1.1. Introducción
Al iniciar una sesión con el SPSS nos encontramos con una hoja similar a una
hoja de cálculo, es el Editor de datos, es la ventana principal que se abre
automáticamente al entrar en el programa.
Es aconsejable, para todo aquél que no haya manejado el SPSS, que haga uso
de la ayuda para hacer un recorrido a través del Tutorial: ? (Ayuda) Tutorial
Las barras de menús contienen una serie de menús desplegables que permiten
controlar la mayor parte de las acciones que el SPSS puede llevar a cabo. Se
encuentran en la parte superior de cada ventana, justo debajo del nombre de la
ventana. Cada ventana tiene su propia barra de menús, aunque algunos son
comunes a todas. Con el Editor de menús es posible añadir o eliminar menús,
personalizando así la barra de menús;
283
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
284
Estadística - Prácticas
2.1. Introducción
Para poder llevar a cabo un análisis estadístico, necesitamos, en primer lugar,
datos sobre los que efectuar el análisis. El Editor de datos es la ventana del SPSS
que contiene el archivo de datos en que se basan todos los análisis. Se trata de
una ventana tipo hoja de cálculo diseñada para crear y editar archivos de datos.
Entrar en el Editor de datos equivale entrar en el SPSS y cerrarlo a salir del SPSS.
III. Con la acción anterior, nos situamos frente a la base de datos del SPSS
que presenta las opciones de vista de datos y vista de variables.
285
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
VI. A partir del punto iii) podemos tomar la decisión de dar nombre al
fichero. Para ello nos vamos a la opción del menú principal Fichero y tomamos
la opción guardar como, apareciendo un barra donde poder dar nombre al
fichero, su longitud no deberá exceder los 30 caracteres.
Al crear una nueva variable, el SPSS le asigna por defecto un nombre consis-
tente en el prefijo var y una secuencia de 5 dígitos: var00001, var00002, etc.
Para asignar nombre a una variable basta con situar el cursor en la casilla corres-
pondiente a la variable y escribir el nuevo nombre, teniendo en cuenta: que debe
286
Estadística - Prácticas
empezar por una letra y no terminar con punto, con un máximo de 8 caracteres,
entre los que no valen los espacios en blanco, los signos de exclamación e
interrogación, el apóstrofe y el asterisco. No se hace distinción entre mayúsculas
y minúsculas. Existen nombres reservados que no se pueden usar como nombres
de variables: ALL, AND, BY, EQ, GE, LE, LT, NE, NOT, OR, TO y WITH.
- Fecha (admite como valores válidos fechas y horas, con diferentes formatos
disponibles).
· Asignar etiquetas
287
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Pueden ser de dos tipos, los definidos por el sistema (cualquier casilla vacía),
y los definidos por el usuario (si se quiere distinguir, por ejemplo, entre los que
no saben la respuesta a una pregunta, los que simplemente no responden y los
que no desean responder). Para definir valores perdidos, situar el cursor en la
columna Perdidos y pulsar el botón puntos suspensivos para acceder al cuadro
de diálogo Valores perdidos . Todos los tipos de variable admiten valores perdidos
definidos por el usuario excepto las variables de cadena larga.
La opción por defecto es No hay valores perdidos (indica que no existen valores
perdidos definidos por el usuario, solo las casillas vacías se consideran valores
perdidos). Valores perdidos discretos. Permite definir como valores perdidos
hasta tres valores concretos, todos los valores que coincidan con los establecidos
se consideraran valores perdidos. Sólo es válida para variables numéricas y de
cadena corta. Rango más un valor perdido discreto opcional. Permite definir
como valores perdidos un determinado rango de valores y, opcionalmente, un
valor concreto no perteneciente al rango. No es válido para variables de cadena
· Alinear texto
288
Estadística - Prácticas
que contiene esa casilla con las tres opciones disponibles: izquierda, derecha o
centro
289
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Datos Insertar variable. Permite insertar una variable nueva entre dos
variables existentes. Lo mismo se consigue pulsando el botón-icono Insertar
variable de la barra de herramientas (si se encuentra en ella). La variable inser-
tada pasa a ocupar la columna inmediatamente anterior a la de la variable donde
se encontraba el cursor.
Datos Insertar caso. Inserta un caso nuevo entre dos casos existentes. (O
pulsar el botón-icono Insertar caso) El caso insertado pasa a ocupar la fila inme-
diatamente anterior a la del caso en que se encontraba el cursor.
290
Estadística - Prácticas
Antes de introducir los datos, definimos las variables. Para empezar a definir
variables podemos hacer doble clic con el ratón en el nombre de la variable
(parte superior de la columna) o pasar a la hoja Vista de variables, sin más que
picar sobre su pestaña (parte inferior izquierda). En la tabla que aparece a
continuación se recoge la información necesaria para realizarlo:
291
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Anchura 8 8
Decimales 0 2
1=Administrativo
Valores 2=Seguridad
3=Directivo
Perdidos
Columnas 10 12
292
Estadística - Prácticas
Haga una copia de seguridad del fichero de datos anterior con la opción:
Archivo Guardar con el nombre pract21.sav
Las variables que encabezan las columnas de los datos tienen las siguientes
etiquetas:
A01I PATRULLAJE-IDONEIDAD
A01F PATRULLAJE-FRECUENCIA
A02I OBSERVACION-IDONEIDAD
A02F OBSERVACION-FRECUENCIA
293
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
1 = Mal
2 = Regular
3 = Bien
4 = Muy bien
1 = De 0 a 3 veces al mes
2 = De 4 a 6 veces al mes
3 = De 7 a 9 veces al mes
4 = De 10 a 12 veces al mes
294
Estadística - Prácticas
Fichero de datos
CODJF A01I A01F A02I A02F A03I A03F A04I A04F A05I A05F B06I B06F
1 3 4 3 4 2 1 3 3 3 3 3 4
1 3 4 3 4 2 1 3 3 3 3 3 4
2 2 2 2 2 3 3 4 4 4 3 1 3
2 3 2 3 3 2 2 3 2 2 2 3 3
2 1 2 1 2 2 2 2 1 2 2 3 3
1 4 5 3 5 3 1 3 1 3 1 3 5
1 3 5 3 5 3 1 3 1 3 1 4 5
1 3 5 3 5 3 1 3 1 3 1 4 5
6 3 5 3 1 3 1 3 1 2 5 3 1
6 , 1 , 1 , 1 , 1 , 1 3 1
6 3 5 , , , , , , 2 5 , ,
3 3 2 3 4 2 1 3 3 1 1 3 3
3 , , , , , , , , , , 3 4
3 3 5 3 5 3 2 4 3 3 3 4 ,
4 3 5 4 5 2 2 2 1 3 1 3 2
4 4 5 3 5 2 2 3 2 3 1 4 3
4 3 5 4 5 2 3 3 3 3 2 4 2
2 2 3 3 3 2 2 2 2 2 2 2 2
2 3 2 2 3 2 3 3 2 2 1 1 1
2 3 2 2 3 3 2 2 2 2 1 1 1
4 3 5 3 5 2 2 2 1 3 5 3 5
5 3 4 3 4 2 1 3 2 3 2 3 2
4 3 5 3 3 2 1 2 1 1 1 3 2
1 3 , 3 , 2 , 1 , 2 , 3 ,
1 3 5 2 2 1 1 2 3 3 1 3 5
1 3 5 3 2 3 1 3 4 3 1 4 5
2 3 4 3 4 3 1 4 2 4 4 4 3
2 3 4 3 4 3 1 3 2 4 4 4 3
5 3 4 3 2 3 2 3 3 4 4 3 3
2 4 5 4 5 3 3 3 2 3 1 4 ,
5 4 5 4 5 3 3 3 2 3 1 4 3
3 , , , , , , , , , , 4 ,
6 3 4 3 2 2 2 3 3 3 3 4 5
6 2 4 3 3 2 2 3 3 2 3 3 5
295
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
3.1. Introducción
En ocasiones, los datos de un archivo serán de tal índole que será posible
aplicar directamente sobre ellos el análisis estadístico deseado, pero lo habitual
será encontrarse con archivos de datos que necesitarán ser cuidadosamente
preparados antes de poder aplicar
3.2. Calcular
El SPSS incluye varias opciones para crear nuevas variables a partir de otra u
otras existentes poniendo a disposición del usuario una gran cantidad de funciones
diferentes.
296
Estadística - Prácticas
Pulsando el botón Si... haremos que la expresión numérica escrita afecte sólo a
un conjunto de casos, mediante una expresión condicional; los casos no seleccio-
nados se tomarán como valores perdidos en la nueva variable.
3.3. Recodificar
Transformar Recodificar. Permite cambiar los códigos asignados a los
valores de una variable. La recodificación resulta útil para agrupar en un único
valor diferentes valores de una variable, y para transformar variables con formato
de cadena en variables con formato numérico. Puede efectuarse sobre las
mismas variables (cambiando los códigos de una variable existente) o sobre
variables distintas (creando una variable nueva a partir de otra ya existente).
297
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
298
Estadística - Prácticas
299
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
300
Estadística - Prácticas
b) Cree una nueva variable cualitativa con el nombre nivel con tres valores:
BAJO si comisos es menor de 50, MEDIO si está entre 50 y 500 y ALTO en
el resto.
d) Cree un nuevo fichero con las variables fecha, multas y nivel2 con el
nombre mezcla01.sav
Indicaciones: Datos -> Fundir archivos -> Añadir variables -> (seleccione el fichero
contra.sav). Con un * se señalan las del fichero actual (segurid01.sav) y con un +
las del fichero seleccionado (contra.sav). Esta variables se pueden mover de la
ventana de excluidas a la ventana del nuevo archivo de datos de trabajo y al revés
a conveniencia del usuario.
Indicaciones: 1. Datos -> Segmentar archivo -> Organizar los resultados por
grupos -> Grupos basados en: nivel.
301
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
1. SPSS portatil
2. dBASE IV
3. Excel
Importe de nuevo el fichero con formato Excel (Archivo -> Abrir ->Datos
-> Ficheroe.xls).
· Construya una variable que sea la Edad del trabajador y elimine la variable
Nacido, poniéndola en su lugar. Transformar Calcular Variable destino: Edad
Tipo y etiqueta: Edad del trabajador, Numérico Expresión numérica:
2001-Nacido Aceptar. Si aparece con decimales, vamos a la definición de la
variable en Vista de variables y ponemos Decimales 0. Para suprimir la variable
Nacido, la seleccionamos: Edición Eliminar. Para colocar la nueva variable en
su lugar seleccionamos la variable Edad : Edición Cortar, seleccionamos la
variable E_civil: Datos Insertar variable y con la nueva variable seleccionada
(var00001): Edición Pegar.
· Cree una nueva variable con el nombre Nivel, (se refiere al nivel salarial)
con tres valores: “Bajo” si el salario es menor de 30,000 euros, “Medio” si está
entre 30,000 euros y 60,000 euros y “Alto” en el resto. Transformar
Recodificar En distintas variables Variable de entrada: Salar Variable
resultado Nombre: Nivel, Etiqueta: Nivel salarial Cambiar Valores
302
Estadística - Prácticas
antiguos y nuevos Valor antiguo Rango: Del menor hasta 30,000 Las
variables de resultado son cadenas Valor nuevo: Bajo Añadir. Valor antiguo
Rango: 30,000 hasta 60,000 Valor nuevo: Medio Añadir. Valor antiguo
Rango: 60,000 hasta el mayor Valor nuevo Alto Añadir Continuar
Aceptar.
· Calcular una variable (Inicial) que recoja el salario que tenían los trabajadores
de la empresa hace cinco años, sabiendo que a los Administradores se les incre-
mentó el salario en un 5%, a los de Seguridad en un 10% y a los Directivos en un
15%. Transformar Calcular Variable destino: Inicial Tipo y Etiqueta: Salario
Inicial, Numérico. Si Incluir si el caso satisface la condición Categori=’1’
Continuar Expresión numérica Salario*(100/105) Aceptar
· Separe el fichero de datos en dos: uno para las mujeres y otro para los
hombres: Datos Segmentar archivo Organizar los resultados por grupos
Grupos basados en: Sexo (Para volver al estado anterior: Datos Segmentar
archivo Analizar todos los datos no crear los grupos)
303
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
4.1. Introducción
Para llevar a cabo un análisis descriptivo de los datos, se hace necesario
cubrir previamente una serie de etapas. De manera sucinta éstas son:
III. Entrada de los datos. Llevar los datos a una base de datos, en nuestro
caso a la del programa del SPSS. Esta fase supone definir correctamente la
variable en cuanto al tipo, etiqueta, valores perdidos, etc.
IV. Análisis de los datos. Operaciones con los datos que proporcionan los
valores, parámetros o “estadísticos” que caracterizan al grupo, es decir,
aplicar las técnicas estadísticas adecuadas a nuestro objetivo.
304
Estadística - Prácticas
iii) tener en cuenta las limitaciones impuestas por los métodos empleados
y iv) señalar las implicaciones de los descubrimientos para su aplicación
práctica y para futuros trabajos.
Variable Cuantitativa
305
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
valores distintos y no nos llevaría a ver nada claro; de entre los estadísticos:
todos; y gráficos histograma. Escogemos los percentiles más comunes. Los cuar-
tiles 1 y 3 coinciden con los percentiles 25 y 75, respectivamente, y el 50 con la
mediana o cuartil 2.
Práctica 4.2. Abra el fichero contra.sav y cree una nueva columna TOTAL con
el total de las sanciones (en miles de euros.) y la relación entre el valor de las
sanciones por multas y decomisos:
Calcule:
Mediana = .......................
Abra el fichero contra.sav y rellene la tabla siguiente para las variables mul-
tas y comisos (Analizar->Estadísticos descriptivos-> Frecuencias):
306
Estadística - Prácticas
4.2. Gráficos
De manera resumida vamos a ver los gráficos más característicos:
Práctica 4.3. Cree un fichero con los datos de la tabla y llámelo robos.sav.
Realice los siguientes gráficos:
b) Diagrama de sectores con el número total de robos en los tres años. Cada
sector indicará el número de robos en ese año.
307
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
a) Histograma de multas.
Práctica 4.4. Abra el fichero PRACT5 del SPSS y realice un análisis estadístico
descriptivo de las variables que contiene.
Nota: Esta práctica se recogerá al final de la clase. En las respuestas que den
debe figurar:
a) Tipo de variable.
Gráficos Interactivos
308
Estadística - Prácticas
El gráfico aparecerá en la ventana del visor y se hace doble click sobre él para
activarlo. Aparecerá una ventana con barras de herramientas. Si paseamos el
ratón por encima de los iconos nos mostrará qué es cada uno de ellos.
Con los otros botones se puede cambiar color de fondo, la forma de relleno,
... También podemos ayudarnos del botón derecho del ratón.
Separe por sexos en dos diagramas de sectores. Además de por sexos por
su nivel de rechazo a la violencia (violen).
Elegimos estilo para que los sectores se diferencien por su forma de rellenado
en vez de por el color. “Cliqueteamos” dos veces sobre el gráfico. Sobre un sec-
tor con el botón derecho seleccionamos Etiquetas de los sectores: Categoría y
Porcentaje. Además, podemos cambiar colores, tramas, etc.
309
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Tipo de
Importancia w (%) 2000 2001
actuación
A 20 150 190
B 30 200 220
C 15 315 300
D 25 80 100
E 10 65 80
AÑO 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Robos 77 95 99 88 107 115 103 122 98 127 125
Se desea saber:
310
Estadística - Prácticas
311
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
2. Dirección: http://www.ine.es/.
Otros casos:
312
Estadística - Prácticas
P1 Zp1 P2 Zp2
1.6448 0.50
1.9599 0.60
2.3263 0.70
2.5758 0.75
3.0903 0.80
3.2905 0.90
1. Crear un fichero con las variables que aparecen en la tabla. Introducir los
datos que se recogen en las tablas.
2. Se sabe que el tiempo que duran las llamadas telefónicas entre los “capos”
de la droga se puede representar por una variable aleatoria, X, que sigue una
distribución normal de media 8 minutos y desviación típica 2 minutos. ¿Qué
proporción de la duración de las llamadas estarán entre 7.5 y 8.2 minutos?
313
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
314
Estadística - Prácticas
· Seleccione proporciones.
Solución: ..............................................................................
Solución: ..............................................................................
· Introduzca los datos que piden (Si necesita algún valor obténgalo a través
del SPSS).
Solución: ..............................................................................
315
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
S M T S M T S M T
1 1 12,02 5 2 12,04 9 3 12,18
1 2 12,15 5 3 11,97 9 4 12,09
1 3 12,10 5 4 11,88 9 5 12,14
1 4 12,20 5 5 12,05 10 1 12,04
1 5 12,12 6 1 11,90 10 2 12,13
2 1 12,14 6 2 11,91 10 3 12,21
2 2 12,07 6 3 12,05 10 4 12,41
2 3 11,99 6 4 12,07 10 5 12,03
2 4 11,98 6 5 11,86 11 1 12,20
2 5 12,02 7 1 12,08 11 2 12,31
3 1 12,04 7 2 12,09 11 3 12,16
3 2 12,09 7 3 12,21 11 4 12,15
3 3 12,20 7 4 12,02 11 5 12,24
3 4 12,05 7 5 12,01 12 1 12,09
3 5 12,24 8 1 12,17 12 2 12,11
4 1 12,14 8 2 12,18 12 3 12,28
4 2 12,25 8 3 12,10 12 4 12,02
4 3 12,09 8 4 12,09 12 5 12,15
4 4 12,07 8 5 12,15 13 1 12,00
4 5 11,96 9 1 12,32 13 2 12,14
5 1 12,17 9 2 12,26 13 3 11,92
316
Estadística - Prácticas
S M T S M T S M T
13 4 11,88 16 1 12,08 18 3 11,92
13 5 11,81 16 2 12,09 18 4 11,96
14 1 11,90 16 3 11,93 18 5 11,87
14 2 11,90 16 4 12,09 19 1 12,14
14 3 11,91 16 5 12,08 19 2 12,07
14 4 11,91 17 1 12,02 19 3 12,99
14 5 12,01 17 2 11,85 19 4 11,98
15 1 12,02 17 3 11,72 19 5 12,32
15 2 11,86 17 4 11,91 20 1 12,24
15 3 12,03 17 5 11,82 20 2 11,79
15 4 12,03 18 1 11,85 20 3 12,20
15 5 12,05 18 2 11,87 20 4 12,15
20 5 12,04
Práctica 9.2. Una determinada empresa realiza cada día un control sobre sus
productos eligiendo al azar una muestra de tamaño n variable. como se recoge en
la tabla siguiente (R = Rechazados):
317
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Práctica 9.5. Una determinada empresa realiza cada día un control sobre sus
productos eligiendo al azar una muestra de tamaño variable. Los datos se recogen
en la tabla siguiente:
Unidades
Día Disconformidades
inspeccionadas
1 110 120
2 82 94
3 96 89
4 115 162
5 108 150
6 56 82
7 120 143
8 98 134
9 102 97
10 115 145
11 88 128
12 71 83
13 95 120
14 103 116
318
Estadística - Prácticas
15 113 127
16 85 92
17 101 140
18 42 60
19 97 121
20 92 108
21 100 131
22 115 119
23 99 93
24 57 88
25 89 107
26 101 105
27 122 143
28 105 132
29 98 100
30 48 60
319
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Contraste de varianzas
III. Selección del estadístico de contraste. cuya distribución debe ser conocida
para H0 verdadera. en nuestro caso la F de Snedecor.
Contraste de medias:
H0: µ1 = µ2
H1: µ1 ≠ µ2
H0: µ1 = µ2
H0: σ12 = σ22
H1: µ1 ≠ µ2
320
Estadística - Prácticas
donde si p ≤ α__se rechaza la H0 . es decir. se acepta H1. Si p > α__se se acepta H0.
H0: µ1 = µ2
H0: σ12 ≠ σ22
H1: µ1 ≠ µ2
321
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Para dar respuesta a los apartados anteriores. configure un fichero con los
datos anteriores y elija Analizar Comparar Medias Prueba T para muestras
independientes Contrastar variables: concent. Variable de agrupación
estación (1. 2).
Práctica 10.3. Las horas semanales que ven los chicos la televisión. ¿son iguales
en el medio rural que en el urbano para un nivel de confianza del 99%?.
Experto 1 2 3 4 5 6 7 8 9 10
Antes 6 7 8 4 5 7 9 6 5 9
Después 6 8 7 5 7 7 8 8 7 8
322
Estadística - Prácticas
Realizada a los 175 chicos una primera pregunta sobre los libros leídos anualmen-
te. se obtuvieron los datos recogidos en la variable “lect”. Pasado un tiempo se
volvió a hacer la misma pregunta y se recogieron los datos en “lectp”. Para una
significación de 5%. ¿Ha variado la tasa de lectura?.
Practica 10.5. (Continuación) Esta práctica tiene tres partes que consisten en:
Lo que tenemos en este caso es una prueba T para una sola muestra. quere-
mos ver si una población tiene un valor en un parámetro. la media. Eligiendo la
opción de Estadísticos Comparar Medias Prueba T para una muestra Valor
para la prueba 65.
323
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
GRUPO 1: 29, 48, 62, 39, 28, 59, 43, 45, 40, 59, 51, 49, 40, 30, 47, 64,
37, 31, 56, 47, 41, 45, 54, 57, 43
GRUPO 2: 45, 53, 55, 76, 34, 81, 87, 67, 65, 64, 94, 49, 86, 35, 57, 43, 51,
46, 64, 81, 69, 56, 65, 48, 53
324
Estadística - Prácticas
325
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
11.1. Introducción
El concepto de relación o correlación se refiere al grado de variación conjunta
existente entre dos o más variables. La forma más intuitiva de formarnos una
primera impresión sobre el tipo de relación existente entre dos variables es a través
de un diagrama de dispersión (Gráficos Dispersión...). La nube de puntos nos
da una idea de la relación existente entre las variables.
326
Estadística - Prácticas
327
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
En Practica
primer lugar
12.1. vamos a calcular las correlaciones de Pearson y de Spearman
entre estas variables numéricas y vamos a ver qué variables presentan correla-
ciones significativamente distintas de cero con la talla actual para un nivel de sig-
nificación del 5%.
Practica
Vamos 12.2. una relación lineal que explique el salario actual en función de
a buscar
las demás:
Vamos a seleccionar
Practica 12.3. variables por regresión paso a paso hacia adelante:
328
Estadística - Cuestionario de autoevaluación
CUESTIONARIO DE AUTOEVALUACIÓN
Primer Cuatrimestre
Tema 1
a) Analizar.
b) Predecir y actuar.
c) Explicar.
329
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Tema 2
a) Análisis de datos.
b) Recopilación de datos.
c) Ordenación de datos.
a) Estadístico.
b) Muestra.
c) Parámetro.
Tema 3
a) Un control policial.
b) Un tipo de encuesta.
c) Un muestreo.
330
Estadística - Cuestionario de autoevaluación
b) El porcentaje absoluto.
c) La frecuencia relativa.
a) Abierto.
b) Semiabierto.
c) Cerrado.
Tema 4
a) La Mediana.
b) La moda.
c) La media.
331
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
a) La moda.
b) La media.
c) La media.
Tema 5
a) Tendencia Central.
a) Dispersión.
b) Asimetría.
c) Curtosis.
d) Tendencia Central.
a) Dispersión.
b) Forma.
c) Tendencia central.
332
Estadística - Cuestionario de autoevaluación
a) Dispersión.
b) Forma.
c) Tendencia central.
Tema 6
a) Índices incrementales.
c) Índices absolutos.
a) Índices simples.
b) Índices simples.
333
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
Segundo Cuatrimestre
Tema 7
a) Cero.
b) Un medio.
c) Uno.
d) Más de uno.
a) Z = (X – 12)/160.
b) Z = (X – 160)/12.
c) Z = (X – 12) 160.
d) Z = (X – 160) 12.
a) Cero.
b) Un cuarto.
c) Un medio.
d) Uno.
Tema 8
b) Los estratos sean parecidos entre sí, aunque dentro de cada estrato
puede haber mucha diferencia entre las unidades estadísticas.
334
Estadística - Cuestionario de autoevaluación
d) Los estratos sean muchos para poder elegir unos cuantos al azar.
d) Sus unidades de medida son las mismas que las de los datos.
la muestra.
Tema 9
1. Un gráfico de control:
335
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
c) Cero.
Tema 10
a) La probabilidad de equivocarse.
336
Estadística - Cuestionario de autoevaluación
Tema 11
b) La muestra es pequeña.
337
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
7.1 7.2 7.3 8.1 8.2 8.3 9.1 9.2 9.3 10.1 10.2 10.3 11.1 11.2 11.3
a) X X X X
b) X X X
c) X X X X
d) X X X X
338
Estadística - Bibliografía
BIBLIOGRAFÍA
ALCAIDE A. (1976): “Estadística Aplicada a las Ciencias Sociales”. Ed. Pirámide.
Madrid.
ARDANUY ALBAJAR R.; CANELO BARRADO, C.; MARTIN MARTIN Q.; LOPEZ FIDALGO,
J. y ALCALA HERNÁNDEZ, A. (1999): “Metodología de la Invstigación en Ciencias
Policiales. Aplicaciones Estadísticas”. Dirección General de la Policía. División de
Formación y Perfeccionamiento.
339
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
340
Estadística - Notas
NOTAS
341
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
342
Estadística - Notas
343
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
344
Estadística - Notas
345
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
346
Estadística - Notas
347
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
348
Estadística - Notas
349
CIENCIAS DE LA SEGURIDAD. UNIVERSIDAD DE SALAMANCA
350
Estadística - Notas
351