Está en la página 1de 18

Clase digital 1 “Técnicas de conteo”

Permiten determinar el número posible de arreglos dentro de un conjunto o varios


conjuntos de objetos.

• Principio de la suma: Lo que se realiza es sumar la cantidad de formas en las que


se puede realizar cada alternativa. Los eventos no ocurren simultáneamente (o).
Ejemplo: Pedro dispone de 5 lápices de pasta, 4 de tinta y 3 de grafito; entonces,
¿de cuantas maneras diferentes puede elegir un lápiz para hacer una tarea?
R= Pedro debe escoger solo un lápiz y tiene 5+4+3=12

• Principio multiplicativo: Si un suceso ocurre en k etapas distintas, y se sabe que la


primera puede ocurrir en n1 formas, la segunda de n2 formas y así sucesivamente.
Los eventos ocurren simultáneamente (y).
Ejemplo: En un restaurante, el menú consiste en un plato principal, un segundo y
un postre. Hay 4 opciones para plato principal, hay 5 para el segundo plato y 3
para el postre. ¿De cuántas formas se puede escoger el menú?
R= El menú puede formarse de 4*5*3=60

Se sugiere que para distinguir cuándo se requiere de utilizar el principio de


multiplicación o de la suma es necesario considerar que si se trata de una secuencia de
acciones se implementa el principio multiplicativo, en cambio sí en una sola acción se
tienen formas distintas de realizarse, debe usarse el principio de la suma.

• Permutaciones: Son arreglos sin reemplazo o sin


repetición, donde no importa el orden de los
elementos, para calcular se utiliza la siguiente fórmula:
P = permutación
n = número de elementos diferentes
k = tamaño del arreglo
En las permutaciones, cada decisión comprende una opción menos que la
anterior.

Ejemplo: ¿De cuántas formas se pueden seleccionar las letras A, B, C, D y E?


R= Para el primer lugar, se pueden seleccionar las 5; en segundo lugar, se pueden
seleccionar solo 4; en tercer lugar, solo se pueden seleccionar 3 letras; en cuarto
lugar, solo se pueden seleccionar 2 letras y, en quinto lugar, solo se puede
seleccionar 1 letra.
5! / (5-5)! =
5! / 0! =
5! / 1 =
5*4*3*2*1 / 1 = 120
• Combinaciones: Una combinación es un arreglo donde el orden
no es importante, se determina mediante la siguiente fórmula:
C = combinación
n = número de elementos diferentes
k = tamaño del arreglo
Ejemplo: En una clase hay 35 alumnos y se quieren formar equipos de 3 personas.
¿Cuántos equipos diferentes se pueden formar?
35! / 3! (35-3)! =
35! / 3! (32)! =
35*34*33*32! / 3! (32!) =
35*34*33 / 3*2*1 =
39,270 / 6 = 6,545

• Diagrama de árbol: Es una representación grafica de los posibles resultados de


un experimento.
Ejemplo: Isabel se comprará un helado, del cual tiene 2 opciones de tamaño y 3
sabores diferentes.

Factorial:

El factorial de un número es la multiplicación


consecutiva que empieza en el número dado
hasta el número 1.

Ejemplo: 5! = 5*4*3*2*1 = 120


Clase digital 2 “Probabilidad de eventos”
• Experimento aleatorio: Es aquel experimento que se realiza al azar y proporciona
diferentes resultados aun así se repita en las mismas condiciones.
Al conjunto de los posibles resultados de un experimento aleatorio se le conoce
como espacio muestral, se le identifica con la letra S.
El subconjunto del espacio muestral de un experimento aleatorio se le conoce
como evento.

• Axiomas de probabilidad: Los axiomas no requieren demostración, únicamente


de la aplicación de la teoría resultante, constituyen el fundamento para deducir
un amplio número de resultados.
Axioma 1. Probabilidad de un evento
Si A es un evento S, la probabilidad del evento A es:
0≤P(A)≤1
Axioma 2. Eventos mutuamente excluyentes
Si dos eventos son mutuamente excluyentes (que no pueden ocurrir de forma
simultánea), la probabilidad de obtener A o B es igual a la probabilidad de
obtener A más la probabilidad de obtener B.
P(A∪B)=P(A)+P(B)
Axioma 3
Si A es un evento cualquiera de un experimento aleatorio y A´ es el complemento
de A, entonces:
P(A´)=1-P(A)

• Teoremas: Por medio del uso de los axiomas de probabilidad es posible realizar
la deducción de reglas aplicables a este tema, lo que se conoce como teoremas.

Si P(A) y P(B) son las probabilidades de los eventos A y B mutuamente excluyentes,


entonces

P(A∪B)=P(A)+P(B)
P(A∩B)=Ø

Si P(A) y P(B) son las probabilidades de los eventos A y B, tienen puntos muestrales
en común, entonces

P(A∪B)=P(A)+P(B)-P(A∩B)

• Probabilidad: Se define como a la posibilidad de que ocurra un suceso, sus


valores se encuentran entre 0 y 1. Un valor cercano a 0 quiere decir que existen
pocas posibilidades de que ocurra, por el contrario, un valor cercano a 1 señala
que existen mayores posibilidades de ocurrir. Cuando toma el valor de 1 se dice
que es un evento seguro. Cuando su valor es 0 es un evento imposible.
• Probabilidad condicional: Se puede describir utilizando el espacio muestral y una
tabla de doble entrada en donde se escribe la probabilidad marginal.
La probabilidad condicional de un suceso A dado que el suceso B ya ha ocurrido,
se expresa como P(A/B) que se lee probabilidad condicional de A dado B.

• Eventos independientes: Se considera que dos eventos son independientes


cuando la probabilidad de que suceda A no se afecta porque haya o no sucedido
B. El proceso que genera el elemento aleatorio no elimina ningún posible
resultado o puede eliminarlo cuando el resultado es sustituido antes de que
suceda una segunda acción, esto último se le conoce como reemplazo.

• Teorema de Bayes: Permite determinar la probabilidad después de que se realizó


un experimento que se fundamenta en sucesos observados. Sean A1, A2, …An
eventos mutuamente excluyentes tales que, cualquier evento B en el espacio
muestral pertenece a uno y sólo uno de los eventos. La probabilidad de que
ocurra el evento Ai dado que ha ocurrido el evento B, está determinado por:
Clase digital 3 “Estadística descriptiva”
La Estadística es la rama de las matemáticas que se encarga de recopilar y organizar
datos.

La Estadística Descriptiva se encarga de recolectar, presentar describir, analizar e


interpretar un conjunto de datos, la que estudiaremos en este curso.

La Estadística Inferencial analiza el comportamiento de una población a partir de


muestra.

• Población: Conjunto de individuos sobre el que se va estudiar una característica.


Es un grupo bien definido de individuos u objetos que poseen una característica
en común o de interés.

• Individuo: Es una unidad estadística, es cada uno de los elementos que


componen la población.

• Muestra: Se le conoce como muestra a la parte de la población que se elige de


forma aleatoria (al azar). Un conjunto representativo de la población.

• Espacio muestral: Es el conjunto de todas las posibilidades de un experimento


aleatorio.

• Muestreo: Es el conjunto de todas las posibilidades de un experimento


aleatorio.
Hay diferentes tipos de muestreo:
a) Probabilístico (Aleatorio simple, aleatorio sistemático, aleatorio estratificado,
aleatorio estratificado).
b) No probabilístico (Por cuotas, intencional o de conveniencia, bola de nieve,
discrecional).

• Variable: Es la característica de interés, que puede ser ingresos familiares,


número de integrantes en la familia, nivel de estudios, etc.
Las variables se clasifican por:
a) Cualitativas (Nominal y Ordinaria)
Nominal: son aquellas que no son representadas por números ni cifras de
ningún tipo. Tampoco cuentan con un orden determinado. Esto las
transforman en las menos precisas para darles una colocación matemática
determinada. Un ejemplo pueden ser los colores como el negro, el rojo, el
verde o el azul. También ingresan dentro de este grupo el sexo femenino o
masculino. Inclusive el estado civil puede formar parte de esto como casado,
soltero, viudo, separado o divorciado.
Ordinaria: La variable cualitativa ordinaria, también conocida como variable
cuasicuantitativa, es representada por una modalidad que no requiere
números pero sí consta de un orden o un puesto.
Por ejemplo, el nivel socioeconómico: alto, medio, bajo.

b) Cuantitativas (Discreta y Continua)


Discreta: La variable discreta otorga cifras que se encuentran separadas en
escalas, es decir que no poseen valores entre ellas, sino que el resultado
comprende un valor exacto.
Por ejemplo, una persona puede tener 1, 2, 3 o más perros, pero no un perro
y medio.
Continua: Otorga un valor de cualquier intervalo o medición, es decir que
puede haber otros valores en medio de dos exactos. Generalmente estos
son representados por valores decimales, por lo cual la cifra será mucho más
específica.
Por ejemplo, la estatura de una persona puede ser de 1,75 centímetros.

Diferencias entre Variables Cualitativas y Cuantitativas:

• Los valores de las variables cualitativas se expresan en cualidades o


características, mientras que los valores que aportan las variables cuantitativas
son numéricos.
Clase digital 4 “Recopilación y ordenación de datos”
• Tabla de distribución de frecuencias:
Permite realizar la agrupación de los datos, lo cual se realiza mediante clases, en
este sentido los estudiosos sugieren que deben ser entre 6 y 15 clases.
Es una herramienta eficaz para utilizar tanto con variables cualitativas o
cuantitativas.
Pasos para su construcción:
1. Determinar el número total de los elementos de la muestra (n).
Se sugiere que los datos se ordenen de menor a mayor
2. Establecer el número de clases y la amplitud.
a. Determinar el dato mayor (Xmax) y el dato menor (Xmin)
b. Calcular el rango; R=Xmax-Xmin
c. Determinar el número de clases o intervalos. Se utiliza la regla de
Sturges.
 K=1+1.33log n
K = número de clases
log = logaritmo base 10
n = número total de datos
3. Límites. En este punto los datos inician a integrarse en la tabla de
frecuencias.
a. Para la clase 1: el límite inferior corresponde al dato menor (Xmin),
para obtener el límite superior (Ls) Se necesita realizar la suma del dato
menor más el ancho de clase.
b. Para clase 2: el límite inferior se determina sumando 1 al límite
superior de la clase anterior. El límite superior se obtiene de sumar el
ancho de clase al límite inferior. Para las clases subsecuentes se repite
este procedimiento.
4. Límites reales de clase (Lr). A partir de los límites de clase es posible
determinar el límite real inferior (Lri) y límite real superior (Lrs).
Para la determinación a partir de los límites reales inferiores se le resta
0.5 y a los límites superiores se les suma 0.5 en cada una de las clases.
5. Marca de clase (xi). Representa la mitad de la clase.
 xi=(Ls+Li2 / 2)
xi = marca de clase
Ls = límite superior de clase
Li = Límite inferior de clase
6. Frecuencia de clase (F). Se determina a partir de todos los datos,
realizando un conteo para determinar cuántos datos pueden integrarse
en cada clase.
a. Primera clase, contar de los datos cuántos corresponden a los límites
de la clase, en la columna de frecuencia se indica el número.
b. Para las clases posteriores se realiza el procedimiento anterior.
c. Una forma de comprobar si has realizado el conteo de cada frecuencia
es sumar todos los valores de la columna de frecuencia el cuál debe ser
igual al número de datos. En caso de que se mayor o menor deberás de
realizar nuevamente el conteo para cada clase.
7. Frecuencia acumulada (Fa) Se determina a partir de los datos de la
frecuencia (F).
a. Primera clase, poner el dato en la columna de (Fa) que corresponde al
número de la frecuencia.
b. Segunda clase se suma la frecuencia de la clase anterior con la
frecuencia de clase. Para las clases posteriores se realiza el
procedimiento anterior.
c. Para comprobar el último dato de la frecuencia acumulada deberá ser
igual al número total de datos de la muestra.
8. Frecuencia relativa (Fr). Este dato se calcula para cada clase, es la
frecuencia dividida entre el número de datos.
 Fr = F / N
Fr = frecuencia relativa
F = frecuencia
N = número total de datos
El valor final de la frecuencia relativa será 1 o muy cercano a 1. Es
importante mencionar que si se multiplica el valor obtenido por 100 se
estará expresando en porcentaje, lo que se le conoce como frecuencia
relativa porcentual.
9. Frecuencia relativa acumulada (Fra). A partir de la frecuencia relativa
a. Primera clase. Es el mismo dato de la frecuencia.
b. Segunda clase. Se suma la frecuencia de la clase anterior con la de la
clase correspondiente y así sucesivamente para las siguientes clases.
c. El último valor de la columna de la frecuencia relativa acumulada
deberá ser 1 o muy cercano a 1.
Clase digital 5 “Presentación grafica de la distribución de frecuencia”
• Importancia de la representación gráfica en Estadística:
Las representaciones gráficas permiten el análisis visual del comportamiento de
los datos y tienen la posibilidad de la construcción de modelos.
Es elemental la previa organización y categorización de los datos, por medio de
la Tabla de distribución de frecuencias.
Existen diferentes tipos de gráficos, que se utilizan a partir del tipo de variable,
entre los que se encuentran:

a) Histograma o histograma de frecuencia: Representa


datos obtenidos de variables cuantitativas continuas
o discretas.
Está formada por un grupo de rectángulos unidos,
es una representación gráfica por medio de barras,
se utilizan barras contiguas, se representa por medio
de dos ejes, en el eje horizontal se indican los límites
superior e inferior de cada clase y en el eje vertical
se representan los valores de las frecuencias.

b) Polígono de frecuencia: Esta gráfica está relacionada


con el histograma, por lo que para su construcción
puede utilizarse el histograma, de tal manera que por
medio de una línea se unan los segmentos medios de
cada una de los rectángulos que lo conforman. Se
utiliza cuando se requiere de resaltar distintas
distribuciones de forma conjunta ya que permite
realizar comparaciones del comportamiento en un
mismo gráfico.

c) Ojiva: Se trata de una gráfica lineal en donde se representa en el eje vertical


la frecuencia acumulada; en el eje horizontal se indican los límites superiores
de cada clase. Existen dos tipos de ojivas, “mayor que” y “menor que”, se
usan para conocer cuántos elementos tienen un valor mayor o menor que,
con relación a los límites superiores de cada clase. Se utiliza para representar
datos cuantitativos.
d) Sector circular: Esta gráfica también se le
conoce como circular, de pastel, de tarta o
de 360º. Se utiliza para la representación de
variables cuantitativas o cualitativas,
expresada en porcentajes y proporciones,
se sugiere que en este gráfico se
representen más de 4 sectores.
Clase digital 6 “Medidas de Tendencia Central y Dispersión”
• Medidas de tendencia central:
Son indicadores estadísticos que muestran algunos valores centrales en donde
se agrupan los datos.

a) Media: Es el valor que resulta de dividir la sumatoria del conjunto de datos


entre el número total de datos.

• Media para datos no agrupados:


µ=media para datos no agrupados
N=número de datos totales de la población
xi=valor de dato i hasta N

• Media para datos agrupados:


X = media para datos agrupados
n = número de datos totales de la muestra
xi = valor de dato

b) Mediana: Es el valor que divide a una serie de datos en dos partes iguales, es
decir, los datos que quedan debajo de la mediana son iguales que los que
quedan arriba.

• Mediana para datos no agrupados:


1. Ordenar los datos de menor a mayor.
2. Si el total de datos es impar la mediana corresponde al dato central,
en caso de que el número de datos sea par, la mediana será el
promedio de los dos datos centrales.

• Mediana para datos agrupados:

n/2 = dato en donde se localiza la mediana


Me = Mediana para datos agrupados
Li = límite inferior en el que se encuentra la mediana
n = número de datos de la muestra
Fi = Frecuencia del intervalo en el que se encuentra la mediana
Fa-1= Frecuencia acumulada de la clase anterior a la mediana
Ai = Amplitud o ancho de clase del intervalo en el que se encuentra la
mediana
c) Moda: Es el dato que se repite con mayor frecuencia, para datos no
agrupados es posible identificarlo debido a que será el que se presente en
un mayor número de ocasiones.

• Moda para datos agrupados:

Mo = Moda para datos agrupados


Li = límite inferior en el que se encuentra la moda
Fi = Frecuencia del intervalo en el que se encuentra la moda
Fi-1 = Frecuencia del intervalo anterior en el que se encuentra la moda
Fi+1 = Frecuencia del intervalo siguiente en el que se encuentra la moda
Ai = Amplitud o ancho de clase del intervalo en el que se encuentra la
moda

• Medidas de posición: Permiten conocer datos referentes a los porcentajes, de


acuerdo con el número en el que se dividan.

a) Cuartiles: Divide la muestra en 4 grupos. Cada uno de ellos corresponde a un


25% de la muestra.

▪ Cuartiles para datos no agrupados:


1. Ordenar los datos de menor a mayor.

2. Buscar el lugar que ocupa cada cuartil, para ello utilizar la siguiente
expresión:
k∙N4
k = 1, 2, 3 corresponde al número de cuartil buscado
N = número total de datos

3. En el caso de tener número par de datos, el número obtenido


corresponde al número de datos.

4. En el caso de tener número impar de datos, se obtendrá un número


decimal, por lo que corresponde al promedio de los datos entre los que
se encuentra el número obtenido.

▪ Cuartiles para datos agrupados:


Qx = Cuartil
Li = Límite inferior de la clase en donde se encuentra el cuartil
k = valor del cuartil, desde 1 a 3
n = número de datos de la muestra
Fi = frecuencia de clase donde se encuentra el cuartil
Fa-1 = frecuencia acumulada de la clase anterior donde se encuentra el cuartil
Ai = Amplitud o ancho de clase donde se encuentra el cuartil

b) Percentiles o centiles: Divide la muestra en 100 grupos. Cada uno corresponde a


1% de la muestra. Es importante destacar que el percentil 50 coincide con la
mediana y con el segundo cuartil, el percentil 75 coincide con el tercer cuartil.

▪ Percentil para datos no agrupados:


1. Ordenar los datos de menor a mayor.
2. Determinar la posición en la que se encuentra el percentil deseado, para
ello es necesario utilizar:
3. En el caso de que el resultado quede entre dos valores, resultado con
decimal, se realiza una interpolación para determinar el valor exacto.

▪ Percentil para datos agrupados:

Px = Percentil
Li = Límite inferior de la clase en donde se encuentra el percentil
k = valor del percentil, desde 1 a 99
n = número de datos de la muestra
Fi = frecuencia de clase donde se encuentra el percentil
Fa-1 = frecuencia acumulada de la clase anterior donde se encuentra el
percentil
Ai = Amplitud o ancho de clase donde se encuentra el percentil

c) Gráficos de caja: Son una forma de representación estadística que utiliza una
sola escala que corresponde a la variable que representa.
Están formados por:

▪ Caja: Rectángulo que abarca el recorrido o rango, por lo que el tramo de la


escala va desde el primer cuartil hasta el tercero.

▪ Mediana: Por lo general se dibuja con una línea, aunque también se utiliza
un asterisco o una cruz dentro de la caja.
▪ Bigotes: Líneas que se ubican a los costados de la caja y donde se ubican las
observaciones que están por fuera del 50% central de la distribución.

▪ Cercados interiores y exteriores: Señalan la finalización de los bigotes, por lo


regular no se dibujan.
Clase digital 7 “Medidas de dispersión para datos no agrupados y
agrupados”
• Rango: El rango se define como la diferencia entre los dos valores extremos que
toma la variable, el uso del valor que arroja esta variable es restringido. El valor de
esta medida se utiliza como una forma de obtener la dispersión de los datos de la
muestra.

A) Rango para datos no agrupados: R = Xmax-Xmin


R = rango
Xmax = dato mayor de la muestra
Xmin = dato menor de la muestra

B) Rango para datos agrupados: Para determinarlo debe realizarse la diferencia


entre el límite superior de la última clase y el límite inferior de la primera clase.

• Varianza: Representa la dispersión promedio de todos los datos alrededor de su


media grupal.

A) Varianza para datos no agrupados:


σ2 = varianza de la población
xi = dato
μ = media
N = número total de datos de la población

B) Varianza para datos agrupados:


s2 = varianza de la muestra
fi = frecuencia de clase
xi = Marca de clase
x = media
n = número total de datos de la muestra

• Desviación estándar: Representa una medida de dispersión, constituye la


variabilidad de los datos con respecto a la media.

A) Desviación estándar para datos no agrupados/ desviación típica:

B) Desviación estándar para datos agrupados


• Medidas de forma: Son las medidas
que permiten conocer la morfología de la distribución de los datos.
A) Curtosis o apuntamiento:

• Curtosis para datos no agrupados:

g = coeficiente de curtosis
n = número de datos
xi = dato i
s = desviación estándar
X = media
Si g<0 es platicúrtica, para g=0 mesocúrtica y g>0 leptocúrtica

• Curtosis para datos agrupados: Este coeficiente analiza el grado de


concentración que presentan los valores alrededor de la zona central de
la distribución, existen 3 tipos:

1. Mesocúrtica, esta gráfica presenta una distribución alrededor de los


valores centrales de la variable, semejante a la distribución. K=0

2. Leptocúrtica, en esta gráfica se tiene una gran concentración


alrededor de los valores centrales. K>0

3. Platicúrtica, la gráfica presenta un menor grado de concentración en


los valores centrales de la variable. K<0

K = coeficiente de curtosis
P75, 25, 90, 10=percentil 75, 25,90, 10
• Asimetría o sesgo:
A) Sesgo para datos no agrupados: Se utiliza la fórmula de asimetría de Pearson.
Cas=coeficiente de asimetría para datos no agrupados
μ = media
Me = mediana
σ = desviación estándar
Si Cas<0 sesgo a la izquierda
Si Cas=0 no existe sesgo
Si Cas>0 sesgo a la derecha

B) Sesgo para datos agrupados:


1. Curva simétrica. Es la curva en la que existe la misma concentración de
valores tanto a la derecha como a la izquierda. El valor obtenido es igual a
cero.
2. Asimetría positiva. En esta curva existe una concentración mayor de datos a
la derecha de la media. El valor que se obtiene es positivo.
3. Asimetría negativa. Es la curva en donde existe una concentración mayor de
datos a la izquierda de la media. El valor obtenido es negativo.
Clase digital 8 “Correlación de Pearson”
• Coeficiente de relación:
Es una medida que permite conocer la relación o dependencia que existe entre dos
variables, por lo que es bidimensional.

Sus propiedades son:


➢ No presenta ninguna variación cuando la escala de medición cambia.
➢ El signo es el mismo que el de la covarianza, se interpreta de la siguiente forma:
a. Se tiene una correlación directa cuando la covarianza es positiva.
b. La correlación es inversa cuando la covarianza es negativa.
c. No se tiene ninguna relación cuando la covarianza es nula.
➢ Es un número real que se encuentra comprendido entre -1.0 y 1.0.
➢ Cuando el coeficiente de correlación lineal es cercano a 1 se considera que la
correlación es directa y fuerte.
➢ Por el contrario, se considera que la correlación es débil cuando los valores son
cercanos a cero.
➢ Se considera una dependencia funcional cuando los puntos están sobre la recta
creciente o decreciente, si r=1 o -1.

• Recta de regresión:
Permite predecir algún aspecto particular de interés en función de otros aspectos, el
modelo lineal es el más sencillo, en donde se utiliza la función de la recta que
permite predecir el valor de una variable a partir de los datos observados.

También podría gustarte