Está en la página 1de 10

Tarea 1

Rivera Barrero Susana

¿QUÉ ES LA ESTADÍSTICA?

Por definición, la estadística es la disciplina científica que se ocupa de la obtención,


orden y análisis de un conjunto de datos con el fin de obtener explicaciones y
predicciones sobre fenómenos observados. Sin embargo, más allá de la definición, se
podría decir que la estadística es la parte más humana de las matemáticas. Esto se debe
a que estudia las mediciones humanas, se encarga de obtener y analizar cualquier dato
obtenible. Por esta misma razón, es una rama de las matemáticas muy amplia que, a
diferencia de otras, todavía tiene mucho campo de estudio. Por esta razón, se puede
decir que es una disciplina “viva”, además de ser relativamente joven.

UN POCO DE HISTORIA …

ANTECEDENTES MÁS ADELANTE

El término estadística surge Con la navegación se inició la


debido a la necesidad de idea de lo que después
contabilizar y administrar el conoceríamos como los bancos,
dinero que se debía dar al rey aplicando la estadística.
en los Estados contabilizados en A los viajantes en Europa se
los reinos. les daba una tabla específica
De esta forma, se reportaban, que se comparaba con una tabla
contabilizaban y administraban igual en el puerto de llegada
los bienes que los duques, para entregarle el oro al
caballeros, condes, etc., debían viajante. De esta forma no
dar al rey. Si éstos no pagaban, tendrían que cargarlo durante el
perderían sus tierras. viaje y evitaban los robos.
CRUZADAS 1810
Durante la guerra de las Se cree haber encontrado un
cruzadas, surge un grupo de nuevo planeta, pero después
caballeros brillantes que del primer avistamiento, ya no
deciden continuar con la idea se puede volver a encontrar.
de los bancos: los Caballeros
Se invita a matemáticos a
Templarios.
“reencontrar” este “planeta”.
Cuando el papa y el losRey de se
reyes
El matemático Gauss, crea el
Francia se dan
dan cuenta cuenta
de la amenazade laque
método de mínimos cuadrados
amenaza
representanquedebido
representan
a su poder
para trazar la trayectoria del
debido a su poder económico,
económico, deciden deshacerse
planeta y así poder calcular su
deciden deshacerse
de ellos por medio de delas
ellos. Sin
posición cierto día a cierta hora.
embargo,
cruzadas. algunos lograron
Sin embargo, algunos
permanecer
permanecen escondidos
escondidos yy Gracias a esto se descubre que
fundar los siendo
continúan primeroslosbancos,
primeros lo que se cree era un nuevo
mismos que permanecen hasta
banqueros. planeta, en realidad era el
la actualidad. asteroide Ceres. Así mismo, se
considera a éste el inicio de la
estadística.

Gauss y el método de mínimos cuadrados.

1850
A raíz de la epidemia de la cólera, John Ejemplo de histograma
Snow crea el primer diagrama “x vs y” el
cual fue clave para descubrir que la raíz
1890
del problema se encontraba en un pozo
de agua contaminada. El cuñado de Darwin
crea los conceptos de
Es a raíz de esto que se desarrollan los
media aritmética y
primeros mapas estadísticos e
desviación estándar.
histogramas.
1917 FIN DE LA 2GM
Para 1910, los mejores Al término de la segunda
estadistas se encontraban en los guerra mundial, los
países eslavos, sin embargo, para estadounidenses que
finales de la 1GM, debido a originalmente eran campesinos
problemas climáticos, escasearon en Estados Unidos y habían ido
las cosechas en estos países a la guerra, se sentían bien
provocando que muchos acogidos en Europa y sin ganas
pobladores de estos países de regresar.
incluyendo a muchos de estos
Por esta razón, E.U. empieza a
estadistas se mudaran a Estados
tener problemas de falta de
Unidos.
trabajadores del campo y se
inicia el diseño de experimentos
estadísticos para aumentar la
producción de cereales en E.U. a
través del análisis estadístico.

El curso puede dividirse en tres estadísticas:

1. Estadística descriptiva: Parte histórica de la estadística. Aborda lo que se desea


contar acerca de los datos. Utiliza datos obtenidos en distintas situaciones.
2. Estadística diferencial: Predice el futuro suponiendo comportamiento
independiente de éste.
3. Estadística Bayesiana: Toma en cuenta lo que ha ocurrido antes para predecir el
futuro.

ESTADÍSTICA HISTÓRICA (DESCRIPTIVA)

Recordemos que la parte histórica de la estadística es aquella que se encarga de contar


justamente la historia de los datos, es decir, sirve para mostrar lo que quiero contar de
los datos.

Al conjunto de sujetos o elementos sobre los cuales se desea realizar el estudio


estadístico, se le llama población. Por otro lado, la muestra es un subconjunto de la
población que se puede tomar para llevar a cabo el estudio estadístico.
Si los datos tomados son de toda la población, entonces se está llevando a cabo un
censo. Pero, si los datos son POBLACIÓN
únicamente de la muestra, se está Censo
llevando a cabo una encuesta. μ/N

Así bien, si obtengo los datos de Símbolos griegos


la población, al tamaño del censo MUESTRA
(cantidad de datos) se representa Encuesta
con la letra griega μ o con la letra n
N mayúscula. Mientras que el
Símbolos romanos
tamaño de muestra se representa con la letra n minúscula.

Por último, para los datos de la población, utilizo símbolos griegos, mientras que,
para los datos de la muestra, utilizo símbolos romanos. Los censos se llevan a cabo
únicamente por los Estados (debido a la magnitud de los datos), mientras que las
empresas que desean conocer algún tipo de información acerca de la población, realizan
más bien encuestas.

Se ha demostrado estadísticamente que, si se tiene una encuesta bien planteada con


una buena hipótesis, mostrará los mismos resultados que un censo. De esta forma, la
encuesta tiene una gran ventaja sobre el censo ya que éste último es inasible, en otras
palabras, como el censo es un proceso que requiere de mucho tiempo (en caso de la
población de un país, meses, por ejemplo), para el momento en el que se termine el
censo, los datos probablemente habrán cambiado. Por lo tanto, es más conveniente
llevar a cabo una encuesta, ya que a pesar de que no será un dato exacto, es posible
estimar un valor que puede considerarse como verdadero.

LAS MEDIDAS DE TENDENCIA CENTRAL

I) MEDIA ARITMÉTICA
 Pondera el “peso” de los datos más grandes con los datos chicos.
 Se puede comparar con una
balanza en equilibrio, ya que
tendremos el valor de los datos
más pequeños, así como el valor
de los datos más grandes, será
el mismo.
Se calcula con la suma de todos los datos dividida entre el número de datos que
existen. Su notación es la siguiente : 𝑥̅ para la media aritmética poblacional y
𝑥̅𝑛=7 o 𝑥̅ (𝑛 = 7) para la muestral.
Para ejemplificar todas las medidas de tendencia central, se recopilaron los datos de la
altura de todas las mujeres del grupo. Se recopilaron 46 datos
de la población y de ahí, se tomó una muestra de 7 datos con
la cual se calcularon cada una de las medidas de tendencia
central que veremos a continuación. Cada uno de los
ejercicios fue calculado con los mismos datos.

Para calcular la media aritmética en Excel se llevaron a cabo los siguientes pasos:

Opción A:

1. Calcular la suma del valor de los datos con la función =SUMA( en Excel,
seleccionando los datos de la muestra.
2. Calcular el total de los datos con la función =CONTAR( seleccionando los datos
de la muestra.
3. Calcular la media aritmética dividiendo el valor obtenido en el punto uno (suma
del valor de los datos) entre el valor obtenido en el punto 2 (total de los datos).

Opción B:

1. Utilizar la función =PROMEDIO( en Excel seleccionando los datos de los cuales


se desea obtener la media aritmética (en este caso, la muestra).
Como se muestra en la imagen, ambos cálculos dan el mismo resultado.

Si se manejan datos muy grandes, se puede hacer un ajuste de los datos (sumar, restar,
dividir, multiplicar, etc. Todos los datos por algún valor arbitrario), calcular la media
aritmética y después hacer un reajuste a la media aritmética obtenida haciendo el
proceso inverso del ajuste hecho anteriormente. En el ejemplo siguiente, restaremos 1.6 a
todos los datos y luego
multiplicaremos el valor
obtenido por 100,
calcularemos la media
aritmética y a este
resultado lo dividiremos
entre 100 y le sumaremos 1.6 para hacer el reajuste.

II) MEDIANA

Dato que se encuentra justo en medio o en el centro de todos los datos registrados si
éstos se ordenan ya sea de forma ascendente o descendente. Permite observar el límite
entre los datos chicos y los datos grandes. A pesar de que no hay una notación
reglamentada, dentro del curso utilizaremos la m minúscula para anotar la mediana.

Para calcular la mediana:

 Si el número de datos es impar… el dato de la mediana será el que se encuentre


en el lugar = (#datos +1)/2.
 Si el número de datos es par… el dato de la mediana será la media de los dos
números “vecinos” entre los que se encuentra el dato calculado en el lugar =
(#datos +1)/2. Ejemplo, si el dato es el dato número 7.5, entonces la mediana será
el valor del promedio de los datos 7 y 8.

< Recordemos que es VITAL ordenar los datos ya sea en forma ascendente o
descendente >

III) MODA

La moda es el dato que más se repite. Si no se tiene ningún dato que se repite más,
se dice que se tienen datos amodales, si se tienen dos datos como moda, se dice que
se tienen datos bimodales y si son de 3 a 5 datos como moda; multimodales. De 5
modas en adelante, se dice que se tienen datos amodales ya que en realidad no hay
una moda, no hay un conjunto de datos que sobresalga significativamente de los
demás. A pesar de que no hay una notación reglamentada, dentro del curso
utilizaremos la M mayúscula para anotar la moda.

En Excel, se puede calcular la moda de un conjunto de datos con la función


=MODA(, seleccionando los datos de los que se desea obtener la moda. En el
ejemplo, no utilizaremos dicha función ya que tenemos datos amodales.

Medida de tendencia central III


M = AMODAL

IV) MEDIA GEOMÉTRICA

Cálculo de la tasa de crecimiento porcentual promedio de alguna serie dada. Es


una ponderación utilizada para medidas que no son lineales como el promedio de
las medidas de un terreno o el promedio de las constantes producto de la presión por
el volumen. La notación utilizada para la media geométrica es la siguiente: 𝝁𝑮 para la
media geométrica poblacional y 𝑥̅ 𝑮 para la muestral.

La media geométrica NO se utiliza cuando:

 Alguno de los datos es CERO.


 El número de datos negativos es impar.
 El producto del valor de los datos es un número muy grande.

Se calcula como la raíz enésima del producto de datos o bien, con la exponencial de la
media aritmética del logaritmo de los datos. En Excel se puede calcular de tres formas
distintas.

Opción A:

1. Se calcula el producto de los datos con la función =PRODUCTO( seleccionando


todos los datos (x).
2. Se calcula el número de datos con la función =CONTAR( seleccionando todos los
datos (n).
3. Se calcula la raíz n de x, expresándola como potencia fraccionaria. Es decir,
x^(1/n).

Opción B:

1. Se calcula utilizando la función =MEDIA.GEOM( seleccionando todos los datos.


Ejemplo calculado con la muestra:

Opción C:

1. Calcular el logaritmo natural de cada uno de los datos con la función =LN(.
2. Calcular la media aritmética de los datos “nuevos” con la función
=PROMEDIO(.
3. Se calcula la exponencial de la media aritmética obtenida con la función =EXP(.

DATOS Y MUESTREO

En la estadística, se pueden tener dos tipos de datos:

a) Numéricos: Arroja únicamente números como datos (ejem.: edad, estatura, peso,
etc.).
b) Categóricos: Arroja datos no numéricos como datos (ejem.: nombres).

Una encuesta puede tener una parte de datos categóricos y otra de datos numéricos.

Ahora bien, en lo que va al muestreo de los datos, es decir, al método para seleccionar la
muestra, existen tres tipos principales:

I) Muestreo aleatorio simple: Se toman muestras totalmente al azar.


II) Muestreo aleatorio sistemático: Utilizado generalmente en las industrias,
consiste en dividir el número total de sujetos o elementos de la población
entre el número total de sujetos o elementos que se quiere utilizar para la
muestra. A continuación, se elige un número al azar de entre el resultado de
dicha división y se va sumando de forma constante el resultado de la división;
los elementos seleccionados forman parte de la muestra.
III) Muestreo aleatorio por conglomerados: Se utiliza generalmente cuando se
desea arreglar un problema. En este tipo de muestreo, se dividen los sujetos o
elementos en conglomerados y se toma una muestra de cada conglomerado.
Esta muestra debe ser aleatoria.
DIAGRAMA DE BURBUJAS

Diagrama que permite representar los datos de forma gráfica o visual para facilitar su
estudio.

Algoritmo de generación del gráfico de burbujas:

1. Recopilar los datos.


2. Ordenarlos de forma ascendente
3. Colocar una recta con cada uno de los datos.
4. Colocar un círculo o “burbuja” en la recta cada que se repita un dato. Ejemplo
(misma muestra de 7 estaturas):

Datos
1.53
1.58
1.59
1.63
1.64
1.65
1.77 o o o o o o o
1.53
1.54
1.55
1.56
1.57
1.58
1.59

1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69

1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.6

1.7
̅(𝒏 = 𝟕) = 1.6271
𝒙
m = 1.63
M = AMODAL
̅𝑮 = 1.6257
𝒙

También podría gustarte