Documentos de Académico
Documentos de Profesional
Documentos de Cultura
México.
Licenciatura en Matemáticas
Actividad 1
Unidad 1
Docente:
Materia: Estadística I
Nombre del alumno: Gustavo Hernandez Garacia
Matricula: ES1821004569
1.- Investiga: (realiza una descripción de media cuartilla de cada inciso)
a) Estadística.
b) Estadística descriptiva.
La estadística descriptiva está formada por procedimientos empleados para
resumir y describir las características importantes de un conjunto de mediciones.
Si el conjunto de mediciones es toda la población, sólo es necesario sacar
conclusiones basadas en la estadística descriptiva. No obstante, podría ser
demasiado costoso o llevaría demasiado tiempo enumerar toda la población.
Quizá enumerar la población la destruiría, como en el caso de la prueba de
“tiempo para falla”. Por éstas y otras razones, quizá el lector sólo tenga una
muestra de la población que, al verla, usted desee contestar preguntas acerca de
la población en su conjunto
c) Estadística inferencial.
La estadística inferencial está formada por procedimientos empleados para hacer
inferencias acerca de características poblacionales, a partir de información
contenida en una muestra sacada de esta población
El objetivo de la estadística inferencial es hacer inferencias (es decir, sacar
conclusiones, hacer predicciones, tomar decisiones) acerca de las características
de una población a partir de información contenida en una muestra.
d) Probabilidad.
La probabilidad es simplemente qué tan posible es que ocurra un evento
determinado.
Cuando no estamos seguros del resultado de un evento, podemos hablar de la
probabilidad de ciertos resultados: qué tan común es que ocurran. Al análisis de
los eventos gobernados por la probabilidad se le llama estadística.
e) Combinatoria.
La Combinatoria es una herramienta que nos permite contar el número de
situaciones que se pueden dar al someter a un conjunto finito a las acciones de
ordenar y/o elegir entre sus elementos
()
C n , x= n =
n!
x x ! ( n−x ) !
Donde
n =Observaciones totales
x = Numero de elementos seleccionados
Donde
n =Observaciones totales
x = Numero de elementos seleccionados
Las acciones de algunas empresas que presentan volatilidad, las materias primas
o incluso el mercado de divisas (FOREX) presentan este tipo de comportamiento.
La media es más o menos constante a lo largo del periodo pero se caracterizan
por cambios grandes en una u otra dirección.
2.- Investiga:
a) La historia de la Estadística.
La palabra Estadística procede del vocablo “Estado”, pues era función principal de
los Gobiernos de los Estados establecer registros de población, nacimientos,
defunciones, impuestos, cosechas... La necesidad de poseer datos cifrados sobre
la población y sus condiciones materiales de existencia han debido hacerse sentir
desde que se establecieron sociedades humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la
civilización han existido formas sencillas de estadística, pues ya se utilizaban
representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y
paredes de cuevas para contar el número de personas, animales o ciertas cosas
b) Culturas de la antigüedad que tengan registros estadísticos de sus poblaciones.
En china existían los censos chinos ordenados por el emperador Tao hacia el año
2.200 a.C.
3.- Responde:
¿Cuál es la estadística paramétrica?
La estadística paramétrica es una rama de la estadística inferencial que
comprende los procedimientos estadísticos y de decisión que están basados en
distribuciones conocidas. Estas son determinadas usando un número finito de
parámetros
Por su parte la estadística es otra rama de las matemáticas cuyo objeto de estudio
son los datos, es decir valores o atributos que tienen los objetos del estudio de
nuestro interés, por ejemplo: personas, máquinas o números de una acción
financiera, siendo su propósito describir la estructura de los datos, mediante el
desarrollo de números resumen, tales como promedios o varianzas, así como
mediante el establecimiento de cierto tipo de gráficas, como histogramas o
diagramas de pastel, que son materia de estudio de la estadística descriptiva, y
realizar inferencias, es decir generalizaciones, sobre alguna variable de interés de
una muestra hacia la población analizada. Por ejemplo, si tomamos una muestra
de estudiantes de la UNAM para conocer el ingreso promedio de todos los
alumnos, en este caso se lleva a cabo un estudio de estadística inferencial.
4.- Definir:
Inferir
La inferencia estadística es el conjunto de métodos y técnicas que permiten
inducir, a partir de la información empírica proporcionada por una muestra, cual es
el comportamiento de una determinada población con un riesgo de error medible
en términos de probabilidad.
Muestra
Es un subconjunto o parte del universo o población en que se llevará a cabo la
investigación. Hay procedimientos para obtener la cantidad de los componentes
de la muestra como fórmulas, lógica y otros que se vera más adelante. La muestra
es una parte representativa de la población.
Muestra representativa
Una muestra representativa es una pequeña cantidad de personas que refleja, con
la mayor precisión posible, a un grupo más grande. Entonces podemos aplicar, por
ejemplo, una encuesta online a una muestra de la población buscando que sea lo
más representativa de nuestra población objetivo.
Población.
Es el conjunto de personas u objetos de los que se desea conocer algo en una
investigación. "El universo o población puede estar constituido por personas,
animales, registros médicos, los nacimientos, las muestras de laboratorio, los
accidentes viales entre otros". (PINEDA et al 1994:108) En nuestro campo pueden
ser artículos de prensa, editoriales, películas, videos, novelas, series de televisión,
programas radiales y por supuesto personas.
5.- Realiza un cuadro comparativo y/u organizativo de:
Fórmulas de Medidas de Tendencia Central y Medidas de Dispersión, para
población y muestra, y para datos agrupados y no agrupados.
Media
presenta el reparto equitativo, el equilibrio, la equidad. Es el valor que tendrían los
datos, si todos ellos fueran iguales. O, también, el valor que correspondería a cada
uno de los datos de la distribución si su suma total se repartiera por igual.
Mediana
se ordenan todos los datos, de menor a mayor, la mediana es el valor que ocupa
la posición central. Si el número de datos es par, la mediana es la media aritmética
de los dos centrales.
Moda
es el valor que más se repite o, lo que es lo mismo, el que tiene la mayor
frecuencia.
Varianza
es una medida de dispersión que representa la variabilidad de una serie de datos
respecto a su media.
Covarianza
La covarianza es el valor que refleja en qué cuantía dos variables aleatorias varían
de forma conjunta respecto a sus medias.
Nos permite saber cómo se comporta una variable en función de lo que hace otra
variable. Es decir, cuando X sube ¿Cómo se comporta Y? Así pues, la covarianza
puede tomar los siguiente valores:
Covarianza (X,Y) es menor que cero cuando “X” sube e “Y” baja. Hay una relación
negativa.
Covarianza (X,Y) es mayor que cero cuando “X” sube e “Y” sube. Hay una
relación positiva.
Covarianza (X,Y) es igual que cero cuando no hay relación existente entre las
variables “X” e “Y”.
Desviación estándar
Desviación media
desviación media de un conjunto de datos, es la media aritmética de los valores absolutos de lo
que se desvía cada valor respecto a la media aritmética.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación. La desviación típica se representa por .
Medidas de posición
Las medidas de posición relativa se llaman en general cuantiles y se pueden
clasificar en tres grandes grupos: Cuartiles, quintiles, deciles, percentiles.
Las medidas de posición como los cuartiles, quintiles, deciles y percentiles dividen
a una distribución ordenada en partes iguales. Para calcular las medidas de
posición es necesario que los datos estén ordenados de menor a mayor.
Cuartil
son los tres valores de la variable de una distribución que la dividen en
cuatro partes iguales, es decir, al 25%, 50% y 75%. Para calcular el valor de uno
de los cuatro Cuartiles, se utiliza la fórmula:.
Q k=k (n /4)
En donde:
Qk = Cuartil número 1, 2, 3 ó 4
n = total de datos de la distribución.
Se advierte que la posición del segundo cuartil corresponde a la ubicación de la
mediana, es decir que el segundo cuartil será siempre igual a la mediana.
Percentil
Los percentiles (Pn): son los noventa y nueve valores de la variable de una
distribución que la dividen en cien partes iguales es decir, al 1%, al 2%... y al 99%
de los datos. Los percentiles se designan por P1, P2,... P99
P50 coincide con la mediana.
Decil
Corresponden a los 9 valores que dividen a estos en 10 partes iguales es decir, al 10%, al
20%... y al 90%. Los Deciles se designan por D1, D2,..., D9
Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
σ
C . V .=
X
El coeficiente de variación se suele expresar en porcentajes
σ
C . V .= .100
X
El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas,
siempre que sus medias sean positivas.
Diagrama de caja
El diagrama de caja es un gráfico utilizado para representar una variable
cuantitativa (variable numérica). El gráfico es una herramienta que permite
visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría,
los valores extremos, la posición de la mediana, etc. Se compone de:
Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3).
Dentro de la caja una línea indica dónde se encuentra la mediana (segundo
cuartil Q2)
Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y
otro que empieza en el tercer cuartil y acaba en el máximo.
Los datos atípicos (o valores extremos) que son los valores distintos que no
cumplen ciertos requisitos de heterogeneidad de los datos
Coeficiente de correlación
La correlación, también conocida como coeficiente de correlación lineal (de
Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal
que el conjunto de puntos representados se aproxima a una recta.
Coeficiente de determinación
El coeficiente de determinación, se define como la proporción de la varianza total
de la variable explicada por la regresión. El coeficiente de determinación, también
llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que
pretender explicar.
Es importante saber que el resultado del coeficiente de determinación oscila entre
0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a
la variable que estamos intentando explicar. De forma inversa, cuanto más cerca
de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.
Regresión lineal
La regresión lineal simple consiste en generar un modelo de regresión (ecuación
de una recta) que permita explicar la relación lineal que existe entre dos variables.
A la variable dependiente o respuesta se le identifica como Y y a la variable
predictora o independiente como X.
diagrama de dispersión
El Diagrama de dispersión es una herramienta utilizada cuando se desea realizar
un análisis gráfico de datos bivariados, es decir, los que se refieren a dos
conjuntos de datos. El resultado del análisis puede mostrar que existe una relación
entre una variable y la otra.
Distribución de probabilidad
Una distribución de probabilidad la podemos concebir como una distribución
teórica de frecuencia, es decir, es una distribución que describe como se espera
que varíen los resultados. Dado que esta clase de distribuciones se ocupan de las
expectativas son modelos de gran utilidad para hacer inferencias y tomar
decisiones en condiciones de incertidumbre.
Función de probabilidad
Se define la función de probabilidad de la variable aleatoria X como la que
asocia una probabilidad pi a cada valor posible de X ( x 1 , x 2 , … …. , x n ) .respecto
a las probabilidades, se cumple siempre que:
❑
0 ≤ pi ≤1 p1 + p2+ p 3+ …+ pn=∑ pi=1
i
Función de distribución
Sea X una variable aleatoria discreta cuyos valores suponemos ordenados de
menor a mayor. Llamaremos función de distribución de la variable X , y
escribiremos F ( x ) a la función:
F ( x )=P( X ≤ x)
Media
Es la suma de todas los valores entre el numero total de datos
2+4 +7+7+5+ 9+5+8+ 3+5+7+3+2 67
x= = =5.15
13 13
moda
Num. de clases clases frecuencia
1 2 2
2 3 2
3 4 1
4 5 3
5 7 3
6 8 1
7 9 1
Por lo tanto como hay dos valores con la misma frecuencia la moda toma dos
valores
^x =5
^x =7
Mediana
Para calcular la mediana es el dato central ordenado de menor a mayor
2
2
3
3
4
5
5
5
7
7
7
8
9
El dato que esta iluminado en azul es la mediana
Media recortada al 5%
Eliminamos los extremos el 5% ósea un dato:
2
2
3
3
4
5
5
5
7
7
7
8
9
Ahora calculamos la media
2+3+3+ 4+5+5+ 5+7+7+7+ 8 56
x= = =5.09
13−2 11
Varianza
n
∑ f (x ¿¿i−x)2
2 i=1
s= ¿
n−1
Sustituimos
2 63.6925
s= =5.3077
13−1
Entonces la varianza es 5.3077
Para calcular la desviación típica usamos la ecuación para una muestra
√
n
∑ f ( x¿ ¿i−x)2
i=1
s= ¿
n−1
Sustituimos
s= √5.3077=2.3038
Entonces la desviación típica o desviación estándar es 2.3038
Para calcular el coeficiente de variación utilizamos la siguiente ecuación
s
cv = (100)
x
Sustituimos
2.3038
cv = ( 100 )=44.73 %
5.15
Problema 2:
Observa la siguiente tabla de datos ordenada por intervalos:
Clase interval Frecuencia
o
1 25-37 4
2 37-49 6
3 49-61 17
4 61-73 25
5 73-85 13
marca de
Frecuenci
marca de clase por
Clase intervalo a
clase(x) frecuenci
(f )
a
1 25-37 4 31 124
2 37-49 6 43 258
3 49-61 17 55 935
4 61-73 25 67 1675
5 73-85 13 79 1027
65 4019
x=
∑ ( x )( f )
n
Sustituimos
4019
x= =61.83
65
Por lo tanto la media es 61.83
Para calcular la mediana primero el numero de datos lo dividimos entre 2 el
numero de datos
65
posicion= =32.5
2
Luego hacemos la frecuencia absoluta acumulada
marca de frecuencia
Frecuenci marca de clase por absoluta
Clase intervalo
a clase frecuenci acumulad
a a (F)
1 25-37 4 31 124 4
2 37-49 6 43 258 10
3 49-61 17 55 935 27
4 61-73 25 67 1675 52
5 73-85 13 79 1027 65
65 4019
mediana=61+12 ( 32.5−27
25 )
=61+12 (
25 )
5.5
=61+ 2.64=63.64
Problema 3:
Dado los datos: (no agrupados)
4 3 19 17 3 11 8
7 6 2 10 2 9 6
4 24 7 9 9 2 4
7 11 4 7 5 7 9
3 5 11 6 3 5 4
9 3 14 15 11 8 1
Problema 4.
Se realiza una investigación en un Bachillerato tecnológico a 165 adolescentes de
15 a 17 años, donde se les preguntó, el número de horas a la semana (de lunes a
domingo) que pasan viendo videos en la nueva red social Tik Tok.
Los resultados arrojaron los siguientes datos (horas a la semana)
32 50 51 36 37 23 38 40 30 34 17
39 47 37 30 46 48 44 45 40 29 29
49 32 42 53 33 62 48 57 47 28 40
38 36 37 37 36 40 25 58 45 52 48
37 43 38 39 42 41 33 52 32 42 46
47 52 32 42 23 40 59 46 22 48 45
34 41 26 27 36 38 36 30 31 62 40
34 34 35 40 34 39 46 39 32 46 33
40 40 42 29 38 32 31 37 32 37 33
37 33 46 36 31 40 37 42 41 36 46
35 52 30 58 40 35 61 40 23 50 37
47 31 52 41 55 41 34 37 31 45 53
41 46 29 32 40 43 43 49 32 29 39
29 32 35 47 38 37 46 33 49 41 46
Fuentes de consulta
María Teresa González Manteiga y Alberto Pérez de Vargas. (2009). Estadística
Aplicada Una visión Instrumental. España: Diaz de Santos.