Universidad Autónoma de Nuevo León
Facultad de Ingeniería Mecánica y Eléctrica
Tarea 1 Definiciones
Alumno: Cristian Humberto Aguilar García
Matricula: 1982102
Materia: Estadística Inferencial
Grupo: 013
Estadística descriptiva: Es el campo de la estadística que estudia el conjunto
de datos obtenidos de una investigación con el objetivo de describir las
características y comportamiento de este
conjunto mediante tablas o gráficos.
Teorema de Chebyshev: Proporciona una
estimación conservadora
de la probabilidad de que
una variable aleatoria
con varianza finita
Diagrama de tallo y hojas: Es un semigráfico
que permite presentar la distribución de una
variable cuantitativa, separando cada dato en el
ultimo digito (Hoja) y las cifras delanteras
restantes (Tallo).
Rango: Se identifica con la letra R o también llamado recorrido
estadístico es la diferencia entre el valor máximo y el mínimo de
un conjunto de
elementos.
Teorema de Rouche-Frobenius: Un sistema de ecuaciones
lineales es compatible si y sólo si el rango de la matriz de
coeficientes es igual al rango de la matriz ampliada con los
términos independientes.
Numero de clase: Es el numero de subconjuntos
en que se han agrupado los datos, cada clase se
puede denominar mediante una letra, un numero o
alguna característica del subconjunto. Con la fórmula
de Sturges (k=1+3.322log(n)).
Regla de Sturges: Es un criterio utilizado para
determinar el numero de clases o intervalos que son
necesarios para representar gráficamente un
conjunto de datos estadísticos.
Anchura de intervalos: La diferencia entre el extremo
mayor y el extremo menos del intervalo, también llamada
longitud.
Tablas de frecuencia: Muestra de forma ordenada
un conjunto de datos estadísticos y a cada uno de ellos
le asigna una frecuencia que, en pocas palabras, son
las veces que se repiten un numero o dato. Tipos de
frecuencias: Frecuencias absoluta; los números de
veces que se repite un numero en un conjunto de
datos, F. Absoluta acumuladas; la suma de las
frecuencias absolutas, F. Relativa acumulada; la suma
de frecuencias relativas.
Frecuencia relativa: (Fi) las veces que se repite un
numero en un conjunto de datos respecto al total
expresado en porcentaje.
fi/N: siendo n el numero total de datos del conjunto.
Corresponde con la proporción de veces que aparece
ese dato con respecto al total.
Prueba de hipótesis: Evalúa la
probabilidad asociada a la hipótesis nula de
que no hay efecto o diferencia. El valor de p
obtenida refleja la probabilidad de rechazar
la Ho siendo esta verdadera; en ningún caso
prueba que la hipótesis alternativa, de que,
si hay efecto o diferencia, sea verdadera.
x/n, donde x es el número de aciertos en la
muestra y n es el tamaño de la muestra.
Prueba de hipótesis para muestras pequeñas: regla que especifica
cuando se puede aceptar o rechazar una afirmación sobre una población
dependiendo de la evidencia proporcionada por una muestra de datos.
Df=n-1 (conocido como prueba t)
Prueba de hipótesis para muestras
grandes: Considerada
como muestra grande
cuando el tamaño de la
muestra es mayor o igual
a 30
Prueba de hipótesis para una muestra: Regla que
especifica cuando se puede acepar o rechazar una
afirmación sobre una población dependiendo de la
evidencia proporcionada por una muestra de datos.
Prueba de hipótesis para 2 muestras: Similar
al test, se especifica una hipótesis nula, en la
mayoría de los casos se propone que las medidas
de las dos poblaciones son iguales y se establece la
hipótesis alternativa (Uni o Bilateral).
Media en datos agrupados y no agrupados: En
agrupados también conocida como
promedio, se calcula como la suma de todos
los datos dividida entre el número total de
datos.
No agrupados, también conocida como promedio aritmético en el
cual es el valor encontrado en el centro del conjunto de los datos
luego de haber sido ordenados
Moda en datos agrupados y no agrupados: En
agrupados, representa el valor que se repico con mayor
número de veces, además se aplica para datos no
agrupados, se clasifica en 3 tipos; unimodal, bimodal y
multimodal. Para no agrupados se diría que la moda es el
dato que mas se repite sin realizar ningún calculo.
Mediana en datos agrupados y no agrupados: En
agrupados, se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias
absolutas.
Para no agrupados, es el valor encontrado en el centro del conjunto de los
datos luego de haber sido ordenados.
Desviación estándar en datos agrupados y no
agrupados: En datos
agrupados, es la
dispersión promedio de
todos los puntos de los
datos alrededor de su
medida grupal. En no
agrupados, son medidas
de dispersión o variabilidad, indican la separación o disposición de un conjunto
de datos.
Población: de una población es normalmente representado por una letra sigma
cuando se calcula sobre la base de toda la población
Muestra: Mide la dispersión de una distribución de
datos, entre más dispersa esta una distribución de
datos, mas grande es su desviación estándar
Varianza: Es una medida de dispersión que representa la variabilidad de una
serie de datos respecto a su medida, formalmente se calcula como la suma de
los residuos al cuadrado
divididos entre el total de
observaciones.
Asimetría: Indica el grado en que los datos se
distribuyen equilibradamente alrededor del punto
central de la distribución. N la cual se puede
conocer el coeficiente de asimetría de Fisher el cual
se Conoce como CAf la cual evalúa la proximidad
de los datos a su media, cuanto mayor sea la suma,
mayor será la asimetría.
Asimetría de Pearson, la cual se conoce como
CAp y mide la diferencia entre la media y la
moda respecto a la dispersión del conjunto X
Histograma de frecuencia: Es un gráfico que se utiliza
para representar la distribución de frecuencias de
algunos puntos de datos de una variable.
W=R/K donde R es el rango y K es el número de intervalos.
Diagrama de pastel: Es una grafica
circular dividida en sectores, que ilustran
magnitudes o frecuencias relativas.
Polígonos de frecuencia relativa: Son
diagramas de línea que se obtienen al unir los
puntos medios del laso superior de cada
rectángulo del histograma correspondiente, se
pueden formar uniendo los extremos de las
barras de un diagrama de barras mediane
segmentos.
Cuortosis: Es una medida
estadística que determina el
grado de concentración que
presentan los valores de una
variable alrededor de la zona
central de la distribución de
frecuencias, también conocida como medida de puntuación.
Probabilidad: Este término se utiliza para definir el
cálculo matemático que establece todas las posibilidades
que existen de que ocurra un fenómeno en determinadas
circunstancias de azar. Tipos de probabilidad; Binomial,
determina el éxito o fracaso de un evento que tenga
únicamente dos posibles resultados, Lógica; plantea que
un evento ocurra a partir de leyes inductivas,
Condicionada; explica la probabilidad de que suceda un evento según lo
ocurrencia previa de otro, por lo que uno depende de otro.
Intervalo de confianza: Es una técnica de estimación utilizada
en estadística inferencial que permite acotar un par o varios pares
de valores, dentro e los cuales se encontrara la estimación puntual
buscada con una determinada probabilidad σx = σ / √n
Ojiva: Es la gráfica acumulativa de una serie de datos,
es decir, la ojiva es un gráfico que muestra la
frecuencia acumulada asociada a un conjunto de
datos, por lo general sirve para saber el numero de
datos que se encuentran por debajo de un valor
determinado.
Diagrama de pastel: Es una gráfica circular dividida
en sectores, que ilustran magnitudes o frecuencias
relativas. Tipo de diagramas.
Población: Es el total de individuos o conjunto de ellos
que presentan o podrían presentar el rasgo característico
que se dese estudiar o averiguar. Tipo de población;
Población finita, es aquella en la que el numero de valores
que la componen tienen un fin. Población infinita, se trata
de aquella población que no tiene un fin.
Muestra: Es un subconjunto de datos que
pertenecen a una población de datos,
debe estar constituido por un cierto
numero de observaciones que
representen adecuadamente el total de
los datos.
Simbología utilizada en probabilidad y estadística:
• P ( A ): Función de probabilidad, la cual dice la probabilidad del evento A
ejemplo, P ( A )=o.5
• P ( A ∩ B ): Probabilidad de intersección de eventos, probabilidad de los
eventos A y B por ejemplo, P ( A ∩ B )= 0.5
• P ( A ∪ B ): Probabilidad de unión de eventos A o B ejemplo, P ( A ∪ B )= 0.5
• P ( A | B ): Función de probabilidad condicional, probabilidad de que ocurra
un evento determinado B ejemplo, P ( A | B )= 0.3
• f ( x ): Función de densidad de probabilidad, ejemplo ∫ f ( x ) dx
• F ( x ): Función de distribución acumulativa ejemplo, F ( x ) = P ( X ≤ x )
• μ: media de los valores de población ejemplo, μ=10
• E ( X ): valor esperado de la variable aleatoria x E(X)=10
• E ( X | Y ): expectativa condicional, valor esperado de la variable aleatoria X
dando Y ejemplo, E(X|Y=2)=5
• var ( X ): diferencia, varianza de la variable aleatoria x ejemplo, var(X)=4
• σ^2: Diferencia, varianza de los valores de la población ejemplo, σ^2=4
• estándar ( X ): desviación estándar, desviación de la variable aleatoria x
ejemplo, estándar(X)=2
• σ X : Desviación estándar, valor de desviación estándar de la variable
aleatoria x ejemplo, σ X=2
• : media, valor medio de la variable aleatoria x ejemplo, =5
• cov ( X , Y ): covarianza, covarianza de variables aleatorios X e Y ejemplo,
cov(X, Y)=4
• corr ( X , Y ): correlación, correlación de variables aleatorias X e Y ejemplo,
corr(X, Y)=o.6
• ρ X , Y: correlación, correlación de variables aleatorias X e Y ejemplo, ρ X , Y =
0,6
• Mo: Modo, valor que ocurre con mayor frecuencia en la oblación
• MR: Rango medio MR=(xmax+xmin)/2
• Md: mediana de la muestra, la mitad de la población esta por debajo de este
valor.
• Q1: primer cuartil, 25% de la población esta por debajo de este valor
• Q2: segundo cuartil, 50% de la población esta por debajo de este valor
• Q3: Tercer cuartil, 75% de la población esta por debajo de este valor
• 𝐱ത: muestra promedio, media aritmética ejemplo, x = (2 + 5 + 9) / 3 = 5.333
• 𝐬^𝟐: varianza de la muestra, estimador de varianza de muestra de población
ejemplo, s^2=4
• S: desviación estándar de la muestra ejemplo, S=2
• Zx: puntuación estándar ejemplo, Zx=(x-x)/s
• F ( k 1 , k 2 ): distribución F
• Bin(n, p): distribución binomial f(k)=nCkP
• Poisson (λ): distribucion de veneno f(k)= λ^k e^- λ
• n!: Factorial ejemplo, 5!= 1x2x3x4x5=120
• nPk: permutación nPk=n!/(n-k)!
Datos agrupados Datos no agrupados
Media Se suman los datos y se divide entre el Multiplicar la marcade clase por
número de datos totales su frecuencia absoluta, luego
dividir la suma por el total de
datos.
Moda El valor que representa la mayor La moda será la que se repita
frecuencia absoluta más de una ves
Mediana La mediana se puede calcular poniendo N+1/2 si son impares
los números en orden ascendente y luego Para datos pares n/2
localizando el número del centro de esa
distribución.
Desviación Usar modo estadístico (shift) estadística, Mode, estadística, 1, llenar los
estándar introduciendo los datos, en shit 2 nos datos, AC, Optn, 2
mostrara si queremos obtener la media,
desviación estándar y eligiendo la opción
tres y al igual para obtener el resultado
Variaza Usar modo estadístico (shift) estadística, Mode, estadística, 1, llenar los
introduciendo los datos, en shit 2 nos datos, AC, Optn, 2
mostrara si queremos obtener la media,
desviación estándar y eligiendo la opción
tres y al igual para obtener el resultado
1er cuartil Mode, estadística, 1 o 2, llenar los valores, Mode, estadística, 1 o 2, llenar
Optn, 3 los valores, Optn, 3
Decil Multiplicar el número del decil por la suma Multiplicar el número del decil
del número total de datos más uno y por la suma del número total de
dividirlo entre diez K(n+1)/10 datos más uno y dividirlo entre
diez K(n+1)/10
Percentil Dividiendo el producto del percentil por el Dividiendo el producto del
numero de elementos de la muestra de la percentil por el número de
que partimos entre cien P=(k*n)/100 elementos de la muestra de la
que partimos entre cien
P=(k*n)/100