Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
¿QUÉ ES ESTADÍSTICA?
Según la RAE
Por mucho tiempo, la palabra estadística se refería a información numérica sobre los
estados o territorios políticos. Las estadísticas como las conocemos hoy día tardaron
en desarrollarse varios siglos.
ANTECEDENTES
Economía y sociedad
Política y sociología
Salud pública
Demografía
Física
Psicología
…
ÁMBITOS DE LA ESTADÍSTICA
Éstadística en la Ingeniería
La Estadístca es la Ciencia de la
ad
ilid
ba • deducir las leyes que rigen esos fenimenos,
o b
Pr
c ia
ren• y poder de esa forma hacer previsiones sobre los mismos, tomar
n fe
I decisiones u obtener conclusiones.
Vamos a plantear un caso práctco
9
Vamos a plantear un caso práctco
10
Datos recopilados de 78 individuos
Vamos a plantear un caso práctco
ad
ilid
a b
o b o ¿Cuál es la probabilidad de que una persona esté
Pr conectada menos de 30 minutos? ¿Y si es chino?
12
Vamos a plantear un caso práctco
13
ELEMENTOS BÁSICOS
Ejemplo:
Sexo (hombre, mujer), tiempo (soleado,lluvioso), nacionalidad
(española, francesa, inglesa), tipo de material (duro, blando)
Ejemplo:
Sexo, se puede asignar a los hombres el 0 y a las mujeres el 1.
ELEMENTOS BÁSICOS
Variables cuantitativas
se le pregunta ¿qué
edad tiene?, la respuesta
suele venir dada por un
número entero, lo que
DATOS
le confiere un
tratamiento como
variable discreta.
Por lo tanto, pueda ser
considerada como una
variable discreta o
continua.
DISCRETAS CONTINUAS
CUALITATIVAS CUANTITATIVAS
BLOQUE 1
ESTADISTICA DESCRIPTIVA
ESTADISTICA DESCRIPTIVA
OBJETIVOS:
EST. DESCRIPTIVA UNIVARIANTE
Variables Cualitatvas
Supongamos que tenemos una variable cualitativa, que toma una serie de
posibles valores (categorías).
Ej. Sexo
Dos categorías (k=2): Hombre,
Mujer
Total: n=78
SEXO F.A. F.R. PORCENT.
HOMBRE 42 0.538 53.8
MUJER 36 0.462 46.2
TOTAL 78 1 100
Variables Cualitatvas
Supongamos que tenemos una variable cualitativa, que toma una serie de
posibles valores (categorías).
F.A. F.R.
%
Xi ni fi=ni/n
x1 n1 f1 100*f1
x2 n2 f2 100*f2
... ...
...
...
xk nk fk 100*fk
PAÍS ORIGEN F.A. F.R. PORCENT.
USA 27 0.346 34.6
ESPAÑA 30 0.385 38.5
CHINA 21 0.269 26.9
TOTAL 78 1 100
1. ORGANIZACIÓN DE LOS DATOS
...
...
...
xk nk fk Nk=n Fk=1 100*fk
1. ORGANIZACIÓN DE LOS DATOS
...
intervalo
ci=li-li-1 100*f
[lk-1,lk) xk nk fk Nk=n Fk=1
k
2. REPRESENTACIONES GRÁFICAS
Variables Cualitatvas
Diagrama de
Barras
PAÍS ORIGEN F.A. F.R. PORCENT.
ESTADOS 27 0.346 34.6
UNIDOS
ESPAÑA 30 0.385 38.5
CHINA 21 0.269 26.9
TOTAL 78 1 100
2. REPRESENTACIONES GRÁFICAS
Gráfico de Sectores
2. REPRESENTACIONES GRÁFICAS
• Como norma general, se toman como alturas de los rectángulos las densidades de frecuencias hi: hi
=ni/ci, o bien las densidades de frecuencias relativas tomando fi en vez de ni: hi =fi/ci.
• Cuando los intervalos tienen la misma longitud, se simplifica tomando como altura las frecuencias ni
o fi.
A partir de este gráfico se puede obtener el polígono de frecuencias.
3. MEDIDAS DE SÍNTESIS
Media (aritmétca)
k
x n x n xk nk xn i i k
x 1 1 2 2 i 1
xi f i
n n i 1
Característcas:
Para obtenerla es necesario utliiar todos los valores. min(xi ) x max(xi )
• Es sensible a valores extremos, por ello no se suele utliiar como medida
central de distribuciones muy asimétricas.
• Se expresa en la misma unidad que los datos.
• No se ve afectada por el orden en el que vengan los datos.
• Centro de gravedad de los datos (la suma de las desviaciones de los valores
k
de la distribuciin respecto a la media es igual a cero) ( x x) 0
i 1
i
3.1. MEDIDAS DE TENDENCIA CENTRAL
Media (aritmétca)
k
x n x n xk nk xn i i k
x 1 1 2 2 i 1
xi f i
n n i 1
Característcas:
• Si a cada dato de la variable X se le suma una constante, se
obtene una nueva variable Y con media igual a la anterior más la constante.
• Si cada dato de una variable X se multplica por una constante, la media de
la nueva variable resultante queda multplicada por dicha constante.
yi a bxi y a b x
Mediana
Ocupa el lugar central respecto a los datos ordenados (primer valor que
deja por debajo de sí al menos 50% de los datos).
Característcas:
• No se ve afectada por observaciones extremas.
• No depende de los valores que toma la variable sino del orden.
• La media y la mediana tendrán valores similares, salvo cuando existan
valores atpicos o cuando el histograma de los datos sea muy asimétrico.
3.1. MEDIDAS DE TENDENCIA CENTRAL
Mediana. Ejemplo 1
Conex. F.A. F.R. F.A.A. F.R.A
Semanales
1 6 0,08 6 0,08
2 10 0,13 16 0,21
3 17 0,22 33 0,43
4 14 0,18 47 0,61 Me = 4
5 12 0,15 59 0,76
6 10 0,13 69 0,89
7 9 0,11 78 1
TOTAL 78 1
3.1. MEDIDAS DE TENDENCIA CENTRAL
Moda
Moda
Moda. Ejemplo 1
Moda. Ejemplo 2
Cuantles
Si, por ejemplo, un niño de 4 años pesa 13 kilos, ¿está desnutrido? ¿está
sano? Depende:
Por ejemplo, en Estados Unidos los niños son en general más grandes
que, por ejemplo, en Japin.
Quiiá más que el peso nos interese saber qué posiciin relatva tene el
peso del niño dentro de la poblaciin de la que forma parte.
Por ejemplo, si nos dicen que el niño está entre el 1% de los niños que
menos pesan, probablemente tene un problema de crecimiento.
3.2. MEDIDAS DE POSICIÓN
Cuantles
Cuartles.
Son tres valores que, una vei ordenada de menor a mayor la
distribuciin, la dividen en cuatro partes iguales. Es decir, en cuatro
intervalos dentro de cada uno de los cuales está contenido un 25% de
los valores. Los representaremos por Q1, Q2 y Q3.
3.2. MEDIDAS DE POSICIÓN
Cuantles
Cuantles
Q1 = P25
Q2 = P50 = Me
Q3 = P75
3.2. MEDIDAS DE POSICIÓN
1 6 0,08 6 0,08 8
P30 = D3 = 3 2 10 0,13 16 0,21 13
P60 = 4 3 17 0,22 33 0,43 22
P75 = Q3 = 5 4 14 0,18 47 0,61 18
5 12 0,15 59 0,76 15
6 10 0,13 69 0,89 13
7 9 0,11 78 1 11
TOTAL 78 1 100
3.3. MEDIDAS DE DISPERSIÓN
Si los datos están agrupados cerca de la media, ésta será muy
representatva. Por el contrario, si los datos están muy
dispersos, la media no será un buen representante de las
observaciones.
3.3. MEDIDAS DE DISPERSIÓN
Ejemplo 1
La media del salario de los españoles en 2005 fue de 18.750
euros al año. Ahora bien, esa media incluye tanto a las regiones
más desarrolladas como a las más desfavorecidas y,
evidentemente, la cifra generará mucho malestar en gran parte
de la poblaciin (con toda seguridad, más del 50 %), cuyo salario
está por debajo.
Ejemplo2
Existe una frase muy conocida que dice que la Estadístca es el
arte por el cuál si un español se come un pollo y otro no se come
ninguno, se ha comido medio pollo cada uno.
Esa frase se usa en muchas ocasiones para ridiculiiar a la
Estadístca, cuando en realidad debería servir para desacreditar a
quien la dice, por su ignorancia.
Debemos proporcionar cada media junto con
alguna medida de dispersión
3.3. MEDIDAS DE DISPERSIÓN
Rango
Característcas:
• Es fácil de calcular.
•Tiene la misma unidad de medida que la variable.
•No utliia todas las observaciones.
•Se puede ver afectado por observaciones extremas.
•Es útl en situaciones en las que se requiera medir la dispersiin con
mucha frecuencia y sobre pocos valores.
3.3. MEDIDAS DE DISPERSIÓN
Recorrido Intercuartlico
Característcas:
• Presenta como ventaja respecto al recorrido, la eliminaciin del
posible efecto que pudieran tener algunos valores extremos.
3.3. MEDIDAS DE DISPERSIÓN
• Cuanto más pequeña sea una variania de unos datos, más agrupados
u homogéneos son dichos datos.
2 1 k 2 1 k 2 n 2 Cuasivarianza
s
c ( xi x ) ni xi ni x
n 1 i 1 n 1 i 1 n 1
Observa que: 2 n 2
s
c S
n 1
3.3. MEDIDAS DE DISPERSIÓN
Españoles
8.180881, 10.503650, 8.210198, 13.096271, 9.259044
15.540982, 7.854185, 12.010111, 8.725924, 11.712810
Americanos
5100.636, 4987.702, 5035.441, 5321.591, 5502.833
4737.402, 4537.105, 4731.434, 4742.981, 4444.282
Coefciente de Variación
Característcas:
• Es una medida adimensional.
• Da informaciin sobre la representatvidad de la media. Cuanto más
priximo a 0, mas representatva será la media (dudaremos de la
representatvidad si CV>0.5)
• Permite comparar la dispersiin de varias distribuciones.
• Es invariante frente a cambios de escala.
• El C.V. pierde signifcado cuando la media se aproxima a 0.
3.3. MEDIDAS DE DISPERSIÓN
Coefciente de Variación
Españoles
8.180881, 10.503650, 8.210198, 13.096271, 9.259044
15.540982, 7.854185, 12.010111, 8.725924, 11.712810
Americanos
5100.636, 4987.702, 5035.441, 5321.591, 5502.833
4737.402, 4537.105, 4731.434, 4742.981, 4444.282
2 12 6 2 2 10 7 2 9
s 4.052 3.13
78
1,77
S 3,13 1,77 C.V . 0,44
4,05
TIPIFICACIÓN
Ejemplo. Los alumnos de primero de GITI ha obtenido en estadística una nota media de
6.5 con desviación típica 2.3, y en matemáticas una media de 7.1 con desviación típica
3.4. Si un alumno ha obtenido un 6.8 en estadística y un 7.2 en matemáticas, ¿en cuál de
ellas ha obtenido mejor puntuación?
xx
Z
s
6.8 6.5 7.2 7.1
Z estadística 0.1304 Z matemáticas 0.0294
2.3 3.4
EJERCICIO 1
Sol: (a) media = 9.26, Me = 9, Mo = 10.2, S^2 = 1.11; (b) P25 = 8.6 y P90 = 10.5,
respectvamente; (c) nueva media = 9.76, Me = 9.5, Mo = 10.7, S^2 = 1.11.
3.4. MEDIDAS DE FORMA
Asimetría
Kurtosis o apuntamiento
3.4. MEDIDAS DE FORMA
Coefciente de Asimetría
• Cuando los datos están repartdos de igual forma a uno y otro lado de
la media se conoce como SIMETRÍA y se dice en ese caso que la
distribuciin de los datos es SIMÉTRICA.
Coefciente de Asimetría
Coefciente de Asimetría
1 0
1 0
1 0
3.4. MEDIDAS DE FORMA
Ejemplo 1.
1 6 0,08 6 0,08 8
2 10 0,13 16 0,21 13
3 17 0,22 33 0,43 22
4 14 0,18 47 0,61 18
5 12 0,15 59 0,76 15
6 10 0,13 69 0,89 13
7 9 0,11 78 1 11
TOTAL 78 1 100
x 4,05 s 1,77
1 Asimetría 0.09
2 Curtosis 0.95
4. ANÁLISIS EXPLORATORIO DE DATOS
min 28 , Q1 51
min 91 , Me 58
x 60,17 , Q3 70
Q3
Q1
Mediana Media
4. ANÁLISIS EXPLORATORIO DE DATOS
18 17 18
16
16 16 15 15
14
14 14
12
12 12
10 10 10
10 9 10 9
8
8 8
6
6 6 5
4 4
2 2
0 0
1 2 3 4 5 6 7 1 2 3 4 5 6 7
4. ANÁLISIS EXPLORATORIO DE DATOS
f1 = Q1 − 1,5RI;
f2 = Q3 + 1,5RI
Toda observaciin que quede fuera de los bigotes conceptúa
como valor animalo que debería ser estudiado.
4. ANÁLISIS EXPLORATORIO DE DATOS
Fin
Bigote
Dcho
Q3
Inicio
Bigote
Q1
Izdo Mediana Media
EJERCICIO 2