Está en la página 1de 15

Estadística 1

PROFESORA: MC. Gloria A. Olguín


Zúñiga.
Actividad 1: Conceptos Unidad 1.
Alumnos:
Juan José Martínez Hernández.
Chávez Méndez María Daniela.

06-junio-2023 Ciudad Reynosa, Tamaulipas.


- Concepto de estadística:
La estadística es una disciplina científica formal y deductiva, a menudo considerada
rama de las matemáticas, que estudia la variabilidad y las leyes de la probabilidad, a
través de herramientas diversas, tanto conceptuales como de muestreo.

El campo de la estadística comprende los métodos y procedimientos necesarios para


recolectar información de la realidad y organizarla, contextualizarla y clasificarla para
poder obtener conclusiones viables, expresadas matemáticamente. Puede decirse que
es la ciencia del manejo de los datos.

- Uso de la estadística:
La estadística se ocupa de establecer leyes generales a partir de los datos
correspondientes a muestra, mediante la aplicación del cálculo de probabilidades. La
misma la podemos utilizar para obtener información de un censo de población. Se
asocia a estudios demográficos, económicos y sociológicos.

- Concepto y ejemplo de estadística:


El concepto de estadística se refiere a la ciencia y la rama de las matemáticas que se
ocupa de recoger, organizar, presentar, analizar e interpretar datos numéricos para sacar
conclusiones, predecir fenómenos y tomar decisiones sobre poblaciones o grupos de
elementos

- Ejemplos:
Ejemplos de estadística descriptiva: Se puede señalar que la estadística descriptiva es la
que resume, se encarga de organizar e intenta simplificar al conjunto de datos que
puede ser un número muy elevado o complicado. Puede abarcar múltiples temas, y su
representación suele ser en gráficos de barras, aunque también pueden ser
representados en otros tipos de gráficos.

Ejemplos de estadística de probabilidad: Este tipo de estadística se encarga de analiza


situaciones en donde el azar puede jugar un valor importante. El ejemplo más sencillo
para comprender este concepto es cuando se lanza un dado y se estudian las
posibilidades de encontrar un número en específico.

Ejemplos de estadística de experimentos y muestreo: Este tipo de estadística se utiliza


para representar las observaciones de números no muy extensos. Este tipo de datos
suelen ser aplicados para analizar a una pequeña porción de la población, para de esta
manera y según los datos que fueron recogidos, generar una conclusión con relación a
los habitantes de la población objetivo.

- Concepto y ejemplo de estadística descriptiva:


La estadística descriptiva es una rama de la estadística que se encarga de describir un
conjunto de datos a través de números, lo que ayuda a resumirlos y facilita su
comprensión. Esto nos permite visualizar cómo están distribuidos los datos, los valores
más frecuentes y los valores centrales.

- Ejemplo:
Algunos ejemplos de estadística descriptiva serían la media de la edad, el porcentaje de
género y el histograma de distribución de la edad de una población.

- Concepto de población:
La población estadística es el colectivo o conjunto completo de elementos con
características en común y que se quiere estudiar. Estos elementos pueden ser personas,
seres vivos, objetos inanimados, eventos, actitudes hacia algún suceso y negocios
diversos.

- Concepto de Muestra
Una muestra estadística es un subconjunto de datos perteneciente a una población de
datos. Estadísticamente hablando, debe estar constituido por un cierto número de
observaciones que representen adecuadamente el total de los datos.

- Concepto de variable:
La variable estadística es una característica o cualidad de un individuo que está
propensa a adquirir diferentes valores. Estos valores, a su vez, se caracterizan por poder
medirse.

- Tipos de Variable:
- Variable cuantitativa: Son variables que se expresan numéricamente.
- Variable continua: Toman un valor infinito de valores entre un intervalo de datos.
El tiempo que tarda un corredor en completar los 100 metros lisos.
- Variable discreta: Toman un valor finito de valores entre un intervalo de datos.
Número de helados vendidos.
- Variable cualitativa: Son variables que se expresan, por norma general, en
palabras.
- Variable ordinal: Expresa diferentes niveles y orden.
- Variable nominal: Expresa un nombre claramente diferenciado. Por ejemplo el
color de ojos puede ser azul, negro, castaño, verde, etc.
- Concepto y ejemplo de variables cualitativas:

Una variable cualitativa es un tipo de variable estadística que describe las cualidades,
circunstancias o características de un objeto o persona, sin hacer uso de números. De
esta manera, las variables cualitativas permiten expresar una característica, atributo,
cualidad o categoría no numérica. Por ejemplo, el sexo de una persona es una variable
cualitativa, ya que es masculino o femenino.

- Ejemplos:
El nivel económico de una persona: se puede clasificar en pobre, clase media o rico. Cuál
es la mano dominante: una persona.

- Variable cuantitativa:
La variable cuantitativa es un término matemático que se basa principalmente en una
cantidad numérica antes que cualquier otro tipo de argumento al momento de realizar
una investigación. Esta variable es utilizada principalmente al momento de realizar
evaluaciones en la estadística investigativa y en el desarrollo de proyectos
metodológicos.

- Ejemplo:
Pongamos el ejemplo de una investigación; se quiere investigar cómo influye el peso
(variable independiente cuantitativa) en la cantidad de dinero que se tiene ahorrado
(variable dependiente cuantitativa).

Al contrario, las variables que describen algo o indican una cualidad son cualitativas. Por
ejemplo, el color de pelo, etnia o la nacionalidad.

Pongamos el ejemplo de una investigación; se quiere investigar cómo influye el peso


(variable independiente cuantitativa) en la cantidad de dinero que se tiene ahorrado
(variable dependiente cuantitativa).
El muestreo probabilístico es un tipo de muestra estadística que se centra en analizar y
estudiar grupos específicos de una población estadística, utilizando la selección
aleatoria o probabilístico:

- Ejemplo:
Por ejemplo, si queremos hacer un análisis estadístico de los empleados de una
empresa multinacional, obviamente no podemos hacer la investigación con todos sus
trabajadores, sino que debemos seleccionar una muestra y luego extrapolar los
resultados obtenidos a toda la población. Para ello, podríamos escoger a los
participantes de manera totalmente aleatoria empleando un muestreo aleatorio simple.

- Muestreo no probabilístico:
El muestreo no probabilístico es un método que sirve para seleccionar los individuos
que formarán parte de la muestra de un estudio estadístico. En particular, en el
muestreo no probabilístico se seleccionan a los individuos basándose en el criterio
subjetivo de los investigadores.

- Ejemplo muestreo no probabilístico:


Por ejemplo, se puede realizar un muestreo no probabilístico del tipo intencional
haciendo un estudio estadístico sobre la población de un país en el cual se usa el
conocimiento de una persona experta para seleccionar qué regiones participarán en el
estudio.

- Distribución de frecuencias:
En estadística, la distribución de frecuencias es una tabla en la que se agrupan los
diferentes valores de una muestra en filas y en cada columna se muestra un tipo de
frecuencia de cada valor. Por lo tanto, la distribución de frecuencias sirve para mostrar
todos los tipos de frecuencias de un conjunto de datos.

En concreto, una distribución de frecuencias incluye la frecuencia absoluta, la frecuencia


absoluta acumulada, la frecuencia relativa y la frecuencia relativa acumulada.

- Ejemplo:
Veamos un ejemplo de una tabla de distribución de frecuencias:

- Rango estadístico:
En la estadística, el rango es un parámetro utilizado para diferenciar el valor máximo y
mínimo de una muestra característica o una población particular. También se utiliza
para estudiar variaciones y obtener la dispersión total de una determinada muestra.

- Ejemplo:
Para una muestra de datos (4, 6, 9, 8) el valor mínimo es 4, y el valor máximo es 9.
Calcular el rango.

- Frecuencia absoluta:
La frecuencia absoluta (fi) es la cantidad de veces que aparece un dato o valor en un
conjunto de datos. Es simplemente contar cuántas veces ocurre algo. Por ejemplo, si
tienes un conjunto de datos con las edades de tus amigos y la edad de 20 años aparece
5 veces, entonces la frecuencia absoluta de 20 años es 5.

En otras palabras, una forma simple y directa de contar cuántas veces algo sucede en un
conjunto de datos. La frecuencia absoluta se utiliza para obtener una visión clara de la
distribución de datos y entender qué valores son más comunes. En general, es como un
conteo básico, pero muy útil para analizar datos.

- Frecuencia relativa:
La frecuencia relativa es un concepto estadístico que te permite expresar la proporción
o porcentaje de un evento o valor específico en relación con el total de observaciones o
datos disponibles. Es una medida que te permite entender la proporción de un valor en
comparación con el conjunto completo de datos.

- Histograma:
El histograma es entonces un gráfico que permite mostrar cómo se distribuyen los datos
de una muestra estadística o de una población. Esto, respecto a alguna variable
numérica.

En el histograma se suelen usar barras, cuya altura dependerá de la frecuencia de los


datos, que corresponde al eje Y. En tanto, en el eje X podemos observar la variable de
estudio.

Para esto, debemos recordar que en estadística la frecuencia es la cantidad de veces que
se repite un suceso.
https://economipedia.com/definiciones/histograma.html

- Grafica de caja:
El diagrama de caja es un instrumento gráfico comúnmente empleado en el área de
estadísticas, porque permite calcular cualquier variable que encaje en varios grupos a la
vez.

Se trata de una herramienta a la que, gracias a su singular diseño, también se le conoce


como “esquema de caja y bigote”, “caja y brazos”, o simplemente por el nombre de
“boxplot”, el cual proviene de su denominación en inglés.

- Ejemplo como se realiza:


Pasos para hacer un diagrama de caja

- Para poder hacer un diagrama de caja de manera correcta, necesitas una serie de
datos que combinados te permitan poder calcular la mediana y a partir de esto poder
realizar el gráfico que caracteriza este tipo de diagramas. Para ello vamos a usar una
sencilla serie de números: 1, 2, 3, 4 y 5.

- De esos números del 1 al 5 tenemos que encontrar ahora la mediana ( o segundo


cuartil), es decir, el número central del grupo que será el 3.

- Ahora tendríamos que calcular la mediana de la parte inferior, es decir, del 1 al 2.


De este modo, la mediana que resulta de estos dos números sería el 1,5 (este sería el
primer cuartil de nuestro diagrama de caja).

- Proseguimos haciendo lo mismo con la mediana de la mitad superior o tercer


cuartil. Es decir, la mediana que salga del 4 y del 5 que será evidentemente 4,5.

- A continuación, cogemos papel y lápiz y dibujamos una gráfica en la que


tenemos que colocar todos estos datos, y además dejamos un espacio extra al lado de
cada dato.

- Escribe los tres cuartiles que hayas obtenido, haciendo una marca vertical para
cada cuartil.

- El siguiente paso consistirá en dibujar una caja y para ello, tenemos que trazar
líneas horizontales que unan los cuartiles por la parte superior. Tienes que unir los
cuartiles tanto por arriba como por abajo.
- Además, tienes que señalar los cinco números a lo largo del diagrama. Desde el
más pequeño hasta el más grande.

- Por último, tienes que unir los valores máximos el margen escaso, que es una
línea horizontal que acabará de cerrar tu diagrama de caja.

- Grafica de pastel:
Un diagrama de pastel es un círculo dividido en partes, donde el área de cada parte es
proporcional al número de datos de cada categoría.

- Medidas de tendencia central:


Las medidas de tendencia central, también llamadas de centralización, son las que se
utilizan para describir la distribución de los valores de alguna variable con respecto al
centro de los datos.

Hay muchos tipos de medidas de tendencia central. No obstante, las de uso más
frecuente son: la mediana, la moda y la media.

- Ejemplos:
MODA:

En una agencia de viajes se observó que durante una semana se atendieron la siguiente
cantidad de personas:

Lunes: 10

Martes: 15

Miércoles: 8

Jueves: 10

Viernes: 12

¿Cuál es la media de atención al cliente semanalmente?

Para este sencillo cálculo, solo basta con realizar la sumatoria de la cantidad de personas
por día y dividirla entre los 5 días de la semana. Es decir:

x̄= 55 / 5

x̄ = 11
Por lo tanto, la media muestra el valor más común, que en este caso específico fue 11.
Además, la media se utiliza como punto de equilibrio de los datos.

Estadísticamente, también se puede aplicar la media armónica, geométrica, ponderada o


cuadrática, de acuerdo a la naturaleza de la información.

-Mediana:

Por ejemplo:

Para obtener la mediana de 2, 5, 10, 15, 3, 8, se ordenan las cantidades y se toma el


valor intermedio central.

2, 3, 5, 8, 10, 15.

Luego, se calcula el promedio entre 5+8, que sería igual a:

5 + 8 / 2 = 6,5.

Entonces, la mediana en este ejercicio es 6,5.

-Moda:

Por ejemplo:

En el siguiente conjunto: 2, 6, 7, 3, 4, 6, 7, 7, se puede ver que la moda o dígito más


repetitivo es el 7.

Medidas de tendencia central – Qué es, concepto y definición (conceptoabc.com)

-Medidas de dispersión:

Las medidas de dispersión consisten en números que otorgan información acerca de la


variabilidad de los datos. Es decir, se encargan de mostrar qué tan juntos o separados se
encuentran los datos de una distribución. Por lo general, se usa junto con las medidas
de tendencia central, como la media o la mediana, para proporcionar una descripción
general de un conjunto de datos.

-Importancia de las medidas de dispersión:

1. Ayudan a entender el conjunto de datos

El uso más importante de las medidas de dispersión es que ayudan a comprender la


distribución de los datos. A medida que los datos se vuelven más diversos, el valor de la
medida de dispersión aumenta.
Por eso, el conocimiento de la dispersión es vital en la comprensión de la estadística.
Básicamente, te ayuda a comprender conceptos como la diversificación de los datos,
cómo se distribuye y cómo se mantienen sobre el valor central o la tendencia central.

Además, la medida de dispersión en la estadística te brinda una forma de obtener


mejores conocimientos sobre la distribución de datos. Por ejemplo, 3 muestras distintas
pueden tener la misma media, mediana o rango, pero niveles de variabilidad
completamente diferentes.

2. Complementan la información dada por las medidas de tendencia central

Las medidas de dispersión también se denominan promedios de segundo orden, es


decir, promediar por segunda vez las desviaciones de una medida de tendencia central.

Proporciona una estimación de los fenómenos a los que se refieren los datos dados
(originales). Esto aumenta la precisión del análisis y la interpretación estadísticos, por lo
que podrás estar en posición de sacar inferencias más confiables.

3. Hacen posible la comparación entre diferentes grupos

Si los datos originales se expresan en unidades diferentes, no será posible realizar


comparaciones. Pero con la ayuda de medidas de dispersión relativas, todas estas
comparaciones se pueden hacer fácilmente. La comparación precisa entre la variabilidad
de dos series conducirá a resultados confiables.

4. Sirven como un control útil para evitar conclusiones erróneas en la comparación de


datos

La media aritmética puede ser la misma de dos grupos diferentes, pero no revelará la
prosperidad de un grupo y el atraso de otro. Este tipo de composición interna puede
conocerse mediante la aplicación de las medidas de dispersión.

Por lo tanto, con la ayuda de las medidas de dispersión o variabilidad, no concluirás que
ambos grupos son similares. Puedes encontrar que un grupo es próspero y el otro está
atrasado al conocer la cantidad de variabilidad alrededor de las medidas de tendencia
central.

Las medidas de dispersión son de gran valor en un análisis estadístico siempre que se
pongan en práctica los coeficientes de dispersión. De lo contrario, las conclusiones
extraídas no serán fiables en gran medida.

5. Controlan la variabilidad
Diferentes medidas de dispersión te brindan datos de variabilidad desde diferentes
ángulos, y este conocimiento puede resultar útil para controlar la variación. Sobre todo,
en el análisis financiero de los negocios y la medicina, estas medidas de dispersión
pueden resultar muy útiles.

Además, proporcionan la base para análisis estadísticos posteriores, como el cálculo de


la correlación, la regresión, la prueba de hipótesis, etc.

- Las medidas de dispersión


Medidas de dispersión absoluta

Las medidas de dispersión absoluta se encargan de presentar qué tan separados o


juntos están los datos, así como mostrar la variabilidad en función al promedio de las
desviaciones de observación. Todo ello apoyándose en medidas que mencionaremos, a
continuación:

1. Rango

El rango o recorrido es una medida de dispersión que hace referencia a la diferencia


entre los valores extremos de un conjunto. Es decir, la resta entre su valor máximo y el
mínimo.

R: Xmax - Xmin

Donde:

Rango: R

Valor Máximo de la muestra: Xmax

Valor Mínimo de la muestra: Xmin

Características

El recorrido permite conocer la distancia entre el máximo y el mínimo valor.

Es la medida de dispersión más simple.

Es más sencillo de entender y calcular.

El uso del rango se limita a la concepción de ideas iniciales.

Solo considera a los valores extremos, más no a los que se ubican en el intermedio.
2. Desviación media

Esta medida de dispersión es la diferencia entre los valores de la variable estadística y la


media aritmética. Es decir, la media de las desviaciones absolutas, la cual se expresa de
la siguiente manera:

Dm = 1/n [| x1 – A |+| x2– A |+| xn – A |]

Características

La desviación media utiliza todas las observaciones para el cálculo.

Es compleja y poco comprensible.

El cálculo demanda bastante tiempo.

3. Desviación estándar o típica

Otra de las medidas de dispersión es la desviación estándar o típica. Se trata de la raíz


cuadrada de la media aritmética de los cuadrados de los valores de las desviaciones. En
resumen, es la raíz cuadrada de la varianza y es representada de la siguiente manera:

S= +√ [|x1 – A |2 n1] / N

S=+√S2

Características

La desviación típica presta mayor atención a las desviaciones extremas respecto al resto
de desviaciones.

Es difícil de comprender y calcular.

Resulta cero si las demás observaciones permanecen iguales.

4. Varianza

La última de las medidas de dispersión absoluta es la varianza. Esta representa la


variabilidad de un conjunto de datos respecto a su media aritmética. Se representa
como el cuadrado de las desviaciones frente a la media de una distribución estadística y
es expresada a través de la siguiente sintaxis:

S2= Σ |x1 – A |2 n1 / N

Características
Se le puede añadir un valor a cada puntuación de la variable y la varianza permanecerá
constante.

La varianza no cuenta con valores negativos, solo positivos o cero.

Medidas de dispersión relativa

Las medidas de dispersión relativa se utilizan para comparar la distribución de diversas


muestras. Es decir, te permiten saber qué tan separados o dispersos se encuentran las
puntuaciones en la distribución estadística, independientemente de cómo se presenten.
Para ello, se apoyan en las siguientes medidas de dispersión relativa:

1. Coeficiente de variación

Esta medida de dispersión relativa brinda información sobre la dispersión relativa de un


conjunto de datos respecto a la media o promedio aritmético y a su vez, la dispersión
de los datos entre sí.

Básicamente, se utiliza para comparar el conjunto de datos con respecto a la


homogeneidad o consistencia. Esta se expresa en forma de porcentaje de la siguiente
manera:

CV = (σ / X) 100

X = desviación estándar

σ = media

Características

El coeficiente de variación es calculado como cociente entre la desviación estándar y la


media aritmética.

Representa un número abstracto.

Indica el grado de variabilidad de un conjunto de datos.

Revela la representatividad de la media

Medidas de dispersión relativa

Las medidas de dispersión relativa se utilizan para comparar la distribución de diversas


muestras. Es decir, te permiten saber qué tan separados o dispersos se encuentran las
puntuaciones en la distribución estadística, independientemente de cómo se presenten.
Para ello, se apoyan en las siguientes medidas de dispersión relativa:

2. Coeficiente de rango

Es la medida de dispersión relativa que consiste en la relación entre la diferencia del


valor más alto y valor el más bajo en un conjunto de datos, y la suma del valor más alto
y valor más bajo.

En pocas palabras, se calcula como la razón de la diferencia entre los términos mayor y
menor de la distribución, a la suma de los términos mayor y menor de la distribución.
Esta es la fórmula:

L-S / L + S

donde L = valor más grande

S = valor más pequeño

3. Coeficiente de desviación media

Se puede definir como la relación entre la desviación media y el valor del punto central
a partir del cual se calcula. Esta medida de dispersión relativa se representa de la
siguiente manera:

Desviación media utilizando la media: ∑ | X-M | / norte

Desviación media utilizando la media: ∑ | X-X1 | / norte

4. Coeficiente de desviación del cuartil

Es la razón de la diferencia entre el tercer cuartil y el primer cuartil a la suma del tercer y
primer cuartil. La fórmula de esta medida de dispersión relativa se define así:

(T3 – T3) / (T3 + T1)

Q3 = Cuartil superior

Q1 = Cuartil inferior

5. Coeficiente de desviación estándar

Otra de las medidas de dispersión relativa es el coeficiente de desviación estándar. Se


trata de la relación de la desviación estándar con la media de la distribución de
términos. Esta es su fórmula:

σ = ( √( X – X1)) / (N - 1)
Desviación = (X – X1)

σ = desviación estándar

N= número total

En definitiva, las medidas de dispersión absoluta y relativa son muy útiles al calcular
diferentes aspectos de los datos. De hecho, cuando las usas con la ciencia de datos,
lograr esto se vuelve más fácil, de modo que puedas incorporar la automatización de
procesos en tu empresa fácilmente.

- Bibliografías:

(Equipo editorial, 05)

(Brainly, 04)

(Crehana, 2022)

(Equipo editorial, 05)

(Hidalgo, 2021)

(López, 2021)

(MX)

(WIKIECONOMICA, s.f.)

(Westreicher, 2021)

(Zapata, lifeder, 2020)

(Zapata, lifider, 2022)

(editorial, 2019)

(iejemplos, 2015)

(secst)

También podría gustarte