Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Actividad
Protocolo individual de la unidad n°: 1
Análisis y síntesis:
Síntesis e interpretación personal de los temas vistos en la unidad
DESCRIPTIVA
La estadística descriptiva es, junto con la inferencia estadística o estadística inferencial, una
de las dos grandes ramas de la estadística. Su propio nombre lo indica, trata de describir algo.
Pero no describirlo de cualquiera forma, sino de manera cuantitativa. Pensemos en el peso de
una caja de verduras, en la altura de una persona o en la cantidad de dinero que gana una
empresa. De estas variables podríamos decir muchas cosas. Por ejemplo, podríamos indicar
que esta o aquella caja de tomates pesan mucho o pesan menos que otras. Siguiendo con
otro ejemplo, podríamos decir que el ingreso de una empresa varía mucho a lo largo del
tiempo o que una persona tiene una altura promedio.
Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy variable o poco
variable necesitamos variables de medidas. Esto es, necesitamos cuantificarlas, ofrecer un
número. Con esto en mente, podríamos utilizar los gramos o los kilogramos como unidad de
medida para saber el peso de tantas cajas de tomates como consideremos. Una vez pesemos
treinta cajas, sabremos cuales pesan más, cuales pesan menos, que cuantía es la que más se
repite o si existe mucha disparidad entre los pesos de las diferentes cajas.
Con esta idea nace la estadística descriptiva, con la de recoger datos, almacenarlos, realizar
tablas o incluso gráficos que nos ofrezcan información sobre un determinado asunto.
Adicionalmente, nos ofrecen medidas que resumen la información de una gran cantidad de
datos.
Si hay cinco personas con color de ojos azul y cinco con color de ojos verde, el promedio no
será que tienen un color de ojos promedio de azul-verde. Por tanto, en ese caso no sería
posible calcular algunos de los parámetros
Con el objetivo de resumir la información, se idearon diversas fórmulas que ofrecían medidas
de un determinado tipo. Así, están aquellas que nos ofrecen información sobre el centro, otras
sobre la dispersión o variabilidad y otras sobre la posición de un valor.
Fundamentos de Estadística
Sobre estadística se presentan diversos conceptos; por tal razón les presento los siguientes
conceptos sobre estadística:
La estadística es una rama de las matemáticas que se ocupa de reunir, organizar y analizar
datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma
de decisiones.
División de la estadística
Hablar de la historia de la estadística, implica hablar del inicio de la civilización. Existe una
gran diversidad sobre los inicios de la estadística. En este texto, haremos un recorrido breve
sobre el desarrollo de la Estadística.
El término Estadística fue empleado por primera vez por Gottfried Achenwall (1719-1772), el
cual proviene de la palabra de origen italiana "Statistik".
La estadística fue utilizada por los Egipcios para analizar los datos de la población, la renta
(Aproximadamente siglo XXXII A. de C). En el antiguo testamento, primera parte de la Biblia,
se encuentran los libros de "Números" y "Crónicas", donde se pueden observar algunos
registros estadísticos.
Se registros de que el Imperio romano fue el primero en recopilar gran cantidad de datos
sobre la población, superficie y la renta de todos las comarcas bajo su dominio.
Para hablar sobre el desarrollo de la estadística, hay que destacar los aportes de grandes
personalidades de la ciencia. A continuación se presentan algunas de estas grandes
personalidades:
Thomas Bayes (1702-1761): Sus actividades científicas, fueron las matemáticas y la inferencia
estadística. Después de la muerte de Bayes, Price, recibe de parte de los familiares de Bayes,
escritos sobre matemáticas que Bayes había dejado, para que Price los estudiara. El trabajo
de Bayes demuestra la divergencia de la serie log(n!), corrigiendo a la de Moivre. El ensayo
Bayes determina un intervalo de confianza bayesiano para el parámetro &µ de una
distribución de Bernoulli a partir de n repeticiones del experimento de Bernoulli.
Karl Pearson (1857-1936): En 1905 publicó un artículo titulado Sobre la teoría general de la
asimetría, la correlación y la regresión no lineal. Algunas contribuciones de K. Pearson a la
Teoría de la Probabilidad y a la Inferencia Estadística son:
las distribuciones, Beta asimétrica, la Beta simétrica, la Gamma y la Normal, entre otras.
Define el coeficiente de correlación lineal precisando las ideas introducidas por Galton.
Desarrolla el método de la Monografias.comde Pearson para medir el ajuste entre unos datos
y una distribución de probabilidad, y lo generaliza a las tablas de contingencia
● Valores de la variable: son los diferentes valores que toma la variable en el estudio.
● Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La
sumatoria de las frecuencias absolutas es igual al número de datos.
● Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica
cuantos datos se van contando hasta ese momento o cuántos datos se van
reportando.
● Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una
clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo
Se emplea cuando hay un número alto de datos. Estos se agrupan en intervalos o clases para
facilitar su tabulación y análisis. Está indicado para representarlos en un histograma.
Los pasos iniciales para formar una tabla de frecuencias con datos agrupados están
encaminados a determinar el número de intervalos y definirlos (siempre que no se conozcan
de antemano). Los pasos son:
Obtener el rango R de los datos. Es la diferencia entre el dato mayor y el menor del conjunto
de valores que toma la variable a tabular. Se llama también amplitud total.
R = Xmáx – Xmín
Fijar cuántos intervalos o clases se desea. Se tiende a que el número de clases sea impar y
que esté entre 5 y 15. Hay dos maneras de hacerlo:
El valor obtenido en esta división no tiene porqué ser un número entero. En ese caso, se
redondearía al valor entero más próximo. Los dos redondeos, el que se haya podido hacer en
el número de intervalos nint y el de la amplitud del intervalo I modificarán el valor de la
amplitud total o rango, apareciendo un nuevo valor ajustado, con los valores definitivos,
repartiendo la diferencia entre R’ y R entre los dos extremos del rango:
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo
Formar los diferentes intervalos o clases, partiendo del valor mínimo del nuevo rango R’. Cada
intervalo tendrá unos extremos a y b separados por la amplitud de clase o intervalo I. En
variables continuas, normalmente los intervalos son cerrados por la izquierda y abiertos por la
derecha, [a, b) en el que b no pertenece a este intervalo sinó que es el valor mínimo del
intervalo siguiente. En variables discretas ordinales o en variables continuas en los que el
procedimiento de medición no pueda apreciar más allá de un valor entero, los intervalos o
clases serán cerrados por los extremos [a, b].
Representará a los valores del intervalo o clase en los cálculos a partir de la tabla.
A partir de la columna de las clases, se formarán las columnas de las frecuencias, que son las
que se describen a continuación y que son comunes para las tablas de datos no agrupados
como en las de datos agrupados.
evaluación de eventos incontrolables (o factores), así como también la evaluación del riesgo
de sus decisiones. La idea original de la estadística fue la recolección de información sobre y
para el Estado. La palabra estadística no se deriva de ninguna raíz griega o latina, sino de la
palabra italiana state. La probabilidad tiene una historia mucho mas larga. LaProbabilidad se
deriva del verbo probar lo que significa "averiguar" lo que no es tan fácil de obtener o
entender. La palabra "prueba" tiene el mismo origen el cual proporciona los detalles
necesarios para entender lo que se requiere que sea cierto.
Los modelos probabilísticos son vistos de manera similar que a un juego; las acciones están
basadas en los resultados esperados. El centro de interés se mueve desde un modelo
determinístico a uno probabilístico usando técnicas estadísticas subjetivas para estimación,
prueba y predicción. En los modelos probabilísticos, el riesgo significa incertidumbre para la
cual la distribución de probabilidad es conocida. Por lo tanto, la evaluación de riesgo significa
un estudio para determinar los resultados de las decisiones junto a sus probabilidades.
Modelos Probabilísticos:
Los datos son conocidos como información cruda y no como conocimientos en sí. La
secuencia que va desde los datos hasta el conocimiento es (observe el siguiente cuadro): de
los Datos (Data) a la Información (Information), de la Información (Information) a los Hechos
(Facts), y finalmente, de los Hechos (Facts) al Conocimiento (Knowledge) . Los datos se
convierten en información, cuando se hacen relevantes para la toma de decisión a un
problema. La información se convierte en hecho, cuando es respaldada por los datos. Los
hechos son lo que los datos revelan. Sin embargo el conocimiento instrumental es expresado
junto con un cierto grado estadístico de confianza (gl).
La media aritmética
Un ejemplo:
Calcular la media de 2, 4, 6, 7, 9
La mediana
Para calcular la mediana de una serie de datos recolectados en su forma sin procesar,
primero debemos poner los datos en una clasificación ordenada. Después usamos la fórmula
de punto de posicionamiento:
3.
La moda
La moda o modo es el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la moda
no se ve afectada por la ocurrencia de los valores extremos.
Ejemplo: Los valores siguientes son las calificaciones de un alumno durante todo el año
Podemos afirmar entonces que el modo es igual a 8, dado que es el valor que aparece con
más frecuencia.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la
media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la
suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias
para salvar este problema. Una es tomando las desviaciones en valor absoluto
(desviación media) y otra es tomando las desviaciones al cuadrado (varianza).
* RANGO ESTADÍSTICO: Es la diferencia que existe entre el dato mayor y el dato menor.
Para ello deben ordenarse de acuerdo a tamaño.
* DESVIACIÓN MEDIA (Dm): Es otra medida de dispersión que tiene un significado intuitivo
es la desviación media (Dm), la cual puede visualizarse evaluando la distancia entre cada
observación (puntuación) y la media aritmética. El promedio de estas distancias da una
medida racional de la dispersión de los datos.
Discusión:
Dudas, desacuerdos, discusiones
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo