Está en la página 1de 13

Asignatura Datos del estudiante Fecha

Apellidos: Grondona Fuentes


PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

Actividad
Protocolo individual de la unidad n°: 1

Análisis y síntesis: 
Síntesis e interpretación personal de los temas vistos en la unidad
DESCRIPTIVA

La estadística descriptiva es una disciplina que se encarga de recoger, almacenar, ordenar,


realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de datos.

La estadística descriptiva es, junto con la inferencia estadística o estadística inferencial, una
de las dos grandes ramas de la estadística. Su propio nombre lo indica, trata de describir algo.
Pero no describirlo de cualquiera forma, sino de manera cuantitativa. Pensemos en el peso de
una caja de verduras, en la altura de una persona o en la cantidad de dinero que gana una
empresa. De estas variables podríamos decir muchas cosas. Por ejemplo, podríamos indicar
que esta o aquella caja de tomates pesan mucho o pesan menos que otras. Siguiendo con
otro ejemplo, podríamos decir que el ingreso de una empresa varía mucho a lo largo del
tiempo o que una persona tiene una altura promedio.

Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy variable o poco
variable necesitamos variables de medidas. Esto es, necesitamos cuantificarlas, ofrecer un
número. Con esto en mente, podríamos utilizar los gramos o los kilogramos como unidad de
medida para saber el peso de tantas cajas de tomates como consideremos. Una vez pesemos
treinta cajas, sabremos cuales pesan más, cuales pesan menos, que cuantía es la que más se
repite o si existe mucha disparidad entre los pesos de las diferentes cajas.

Con esta idea nace la estadística descriptiva, con la de recoger datos, almacenarlos, realizar
tablas o incluso gráficos que nos ofrezcan información sobre un determinado asunto.
Adicionalmente, nos ofrecen medidas que resumen la información de una gran cantidad de
datos.

Tipos de variables estadísticas

Dentro de la estadística descriptiva, podemos describir los datos de manera cualitativa o


cuantitativa.

● Variable cualitativa: Hace referencia a una cualidad. Ejemplos: el color de ojos de


una persona o el color de pelo.
● Variable cuantitativa: Hace referencia a una medida cuantitativa. Ejemplos: la altura
de una persona en centímetros o el peso de una persona en kilogramos.
Así pues, sobre estas variables se pueden calcular ciertos parámetros. Especialmente sobre
las variables cuantitativas. Ya que, por ejemplo, ¿cuál es el valor promedio del color de ojos?
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

Si hay cinco personas con color de ojos azul y cinco con color de ojos verde, el promedio no
será que tienen un color de ojos promedio de azul-verde. Por tanto, en ese caso no sería
posible calcular algunos de los parámetros

Parámetros estadísticos básicos

Con el objetivo de resumir la información, se idearon diversas fórmulas que ofrecían medidas
de un determinado tipo. Así, están aquellas que nos ofrecen información sobre el centro, otras
sobre la dispersión o variabilidad y otras sobre la posición de un valor.

● Medidas de tendencia central: Denominadas así porque ofrecen información sobre el


centro de conjunto de datos. Por ejemplo, la media es una medida de tendencia o
posición central ya que el promedio nos ofrece un valor centrado del conjunto de
datos. ¿Dónde podríamos decir que se encuentra el punto medio? En el centro, en la
mitad aproximadamente. Otro ejemplo de medida de tendencia central es la mediana.
● Medidas de dispersión: También son conocidas como medidas de variabilidad. Por
ejemplo, la desviación típica es una medida de variabilidad ya que nos dice si los
valores de un conjunto de datos son muy dispares o no. Dos ejemplos más sobre
medidas de dispersión podrían ser la varianza y el rango estadístico.
● Medidas de posición: No son las más conocidas, pero se utilizan frecuentemente. Un
ejemplo de ello, se encuentra en los percentiles o los deciles. Cuando un dato en
concreto se encuentra en el percentil 90, quiere decir que por debajo de ese dato se
encuentran el 90% de datos. Existen otras medidas de posición como los cuartiles o
algunas variantes como el primer cuartil.

Fundamentos de Estadística

Sobre estadística se presentan diversos conceptos; por tal razón les presento los siguientes
conceptos sobre estadística:

La estadística es una rama de las matemáticas que se ocupa de reunir, organizar y analizar
datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma
de decisiones.

La Estadística es la parte de las Matemáticas que se encarga de recoger datos, organizarlos,


tabularlos, representarlos gráficamente, interpretarlos y analizarlos, para sacar conclusiones,
tomar decisiones o predecir, a partir del estudio o investigación que se esté realizando sobre
alguna característica, propiedad o situación en una población determinada.
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

División de la estadística

La estadística se divide en dos grandes partes:

Estadística descriptiva: Se encarga de la recolección, descripción, visualización y resumen de


los datos, y que se pueden presentar de forma numérica o de forma gráfica.

La Estadística descriptiva, se encarga del "estudio sobre la población completa, observando


una característica de la misma y calculando unos parámetros que den información global de
toda la población".

Estadística inferencial: Se encarga de las predicciones relacionadas a los fenómenos


estudiados, considerando la selección de tipo aleatoria y la incertidumbre en las
observaciones.
La Estadística inferencial, "realiza el estudio descriptivo sobre un subconjunto de la población
llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población".

Bosquejo histórico de la estadística

Hablar de la historia de la estadística, implica hablar del inicio de la civilización. Existe una
gran diversidad sobre los inicios de la estadística. En este texto, haremos un recorrido breve
sobre el desarrollo de la Estadística.

El término Estadística fue empleado por primera vez por Gottfried Achenwall (1719-1772), el
cual proviene de la palabra de origen italiana "Statistik".

La estadística fue utilizada por los Egipcios para analizar los datos de la población, la renta
(Aproximadamente siglo XXXII A. de C). En el antiguo testamento, primera parte de la Biblia,
se encuentran los libros de "Números" y "Crónicas", donde se pueden observar algunos
registros estadísticos.

El libro de Números contiene dos censos de la población de Israel y el de Crónicas describe la


prosperidad económica de las tribus judías.
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

En sentido general, los grandes registros estadísticos de la antigüedad, descansan en censos


y cobro de impuestos.

Se registros de que el Imperio romano fue el primero en recopilar gran cantidad de datos
sobre la población, superficie y la renta de todos las comarcas bajo su dominio.

En 1662 se conoce como el primer estudio estadístico de mayor trascendencia sobre


población, el trabajo titulado "Observations on the London Bills of Mortality" (Londres).

Para hablar sobre el desarrollo de la estadística, hay que destacar los aportes de grandes
personalidades de la ciencia. A continuación se presentan algunas de estas grandes
personalidades:

John Graunt (1620-1674): Es el primer estadístico que se va a considerar como el padre de la


Estadística. En 1662 publicó "Observaciones naturales y políticas", fundamentado en los
boletines de mortalidad, considerándose este documento como el punto de partida de la
estadística.

Thomas Bayes (1702-1761): Sus actividades científicas, fueron las matemáticas y la inferencia
estadística. Después de la muerte de Bayes, Price, recibe de parte de los familiares de Bayes,
escritos sobre matemáticas que Bayes había dejado, para que Price los estudiara. El trabajo
de Bayes demuestra la divergencia de la serie log(n!), corrigiendo a la de Moivre. El ensayo
Bayes determina un intervalo de confianza bayesiano para el parámetro &µ de una
distribución de Bernoulli a partir de n repeticiones del experimento de Bernoulli.

Laplace (1749-1827): Pierre Simon de Laplace nace en Beaumont-en-Auge. En 1774 publica


Memoria sobre la probabilidad de las causas por los sucesos.

Karl Pearson (1857-1936): En 1905 publicó un artículo titulado Sobre la teoría general de la
asimetría, la correlación y la regresión no lineal. Algunas contribuciones de K. Pearson a la
Teoría de la Probabilidad y a la Inferencia Estadística son:

Introduce su familia de curvas y ajusta sus parámetros, introduciendo el método de los


momentos. Esta familia de curvas son las soluciones de una ecuación diferencial e incluye a
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

las distribuciones, Beta asimétrica, la Beta simétrica, la Gamma y la Normal, entre otras.

Define el coeficiente de correlación lineal precisando las ideas introducidas por Galton.

Desarrolla el método de la Monografias.comde Pearson para medir el ajuste entre unos datos
y una distribución de probabilidad, y lo generaliza a las tablas de contingencia

UNA TABLA DE FRECUENCIAS o distribución de frecuencias es una tabla que muestra


cómo se distribuyen los datos de acuerdo a sus frecuencias. Elaborar una tabla de frecuencias
es muy sencillo y en este artículo te mostraremos cómo hacerlo.

Tenemos dos tipos de tablas de frecuencias:

● Tablas de frecuencias con datos no agrupados.


● Tablas de frecuencias con datos agrupados.

Tablas de frecuencias con datos no agrupados

Usamos este tipo de tablas cuando tenemos variables cualitativas, o variables


cuantitativas con pocos valores.

Esta tabla está compuesta por las siguientes columnas:

● Valores de la variable: son los diferentes valores que toma la variable en el estudio.
● Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La
sumatoria de las frecuencias absolutas es igual al número de datos.
● Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica
cuantos datos se van contando hasta ese momento o cuántos datos se van
reportando.
● Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una
clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

datos del estudio.


● Frecuencia relativa acumulada: es la proporción de datos respecto al total que se
han reportado hasta ese momento. Es la suma de las frecuencias relativas, y se puede
calcular también dividiendo la frecuencia acumulada entre el número de datos del
estudio.
● Frecuencia porcentual: es el porcentaje de elementos que pertenecen a una clase o
categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por
100%.
● Frecuencia porcentual acumulada: es el porcentaje de datos respecto al total que se
han reportado hasta ese momento. Se puede calcular rápidamente multiplicando la
frecuencia relativa acumulada por 100%.
Construcción de la tabla de frecuencias

Cabe distinguir entre:

Tabla de frecuencias con datos agrupados.

Construcción de una tabla de frecuencias con datos no agrupados

En la primera columna se ordenan de menor a mayor los diferentes valores que tiene


la variable en el conjunto de datos.

En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y


las frecuencias absolutas acumuladas.

Las columnas cuarta y quinta contienen las frecuencias relativas y las frecuencias relativas


acumuladas.

Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima), representando


Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

la frecuencia relativa y la frecuencia relativa acumulada como tanto por cien.


Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.

El proceso se verá en el ejercicio 1.

Construcción de una tabla de frecuencias con datos agrupados

Se emplea cuando hay un número alto de datos. Estos se agrupan en intervalos o clases para
facilitar su tabulación y análisis. Está indicado para representarlos en un histograma.

Como en el caso anterior, se utiliza tanto para variables cuantitativas como en variables


cualitativas ordinales.

Los pasos iniciales para formar una tabla de frecuencias con datos agrupados están
encaminados a determinar el número de intervalos y definirlos (siempre que no se conozcan
de antemano). Los pasos son:

Obtener el rango R de los datos. Es la diferencia entre el dato mayor y el menor del conjunto
de valores que toma la variable a tabular. Se llama también amplitud total.

R = Xmáx – Xmín

Fijar cuántos intervalos o clases se desea. Se tiende a que el número de clases sea impar y
que esté entre 5 y 15. Hay dos maneras de hacerlo:

A criterio del investigador.

Mediante el método de Sturges, que emplea la siguiente fórmula:

Donde nint es el número de intervalos, el logaritmo es natural o base 10 y N es el número total


de datos. El resultado se redondea al número entero más próximo.

Determinar la amplitud del intervalo o clase I:

Es el resultado de dividir el rango R o amplitud total por el número de clases o


intervalos nint que se han fijado:

El valor obtenido en esta división no tiene porqué ser un número entero. En ese caso, se
redondearía al valor entero más próximo. Los dos redondeos, el que se haya podido hacer en
el número de intervalos nint y el de la amplitud del intervalo I modificarán el valor de la
amplitud total o rango, apareciendo un nuevo valor ajustado, con los valores definitivos,
repartiendo la diferencia entre R’ y R entre los dos extremos del rango:
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

Formar los diferentes intervalos o clases, partiendo del valor mínimo del nuevo rango R’. Cada
intervalo tendrá unos extremos a y b separados por la amplitud de clase o intervalo I. En
variables continuas, normalmente los intervalos son cerrados por la izquierda y abiertos por la
derecha, [a, b) en el que b no pertenece a este intervalo sinó que es el valor mínimo del
intervalo siguiente. En variables discretas ordinales o en variables continuas en los que el
procedimiento de medición no pueda apreciar más allá de un valor entero, los intervalos o
clases serán cerrados por los extremos [a, b].

Cada intervalo está representado por la llamada marca de clase. Es la media entre sus


extremos.

Representará a los valores del intervalo o clase en los cálculos a partir de la tabla.

A partir de la columna de las clases, se formarán las columnas de las frecuencias, que son las
que se describen a continuación y que son comunes para las tablas de datos no agrupados
como en las de datos agrupados.

MODELOS DETERMINÍSTICOS, una buena decisión es juzgada de acuerdo a los resultados.


Sin embargo, en los modelos probabilísticos, el gerente no está preocupado solamente por los
resultados, sino que también con la cantidad de riesgo que cada decisión acarrea.

Como un ejemplo de la diferencia entre los modelos probabilísticos versus determinísticos,


considere el pasado y el futuro: Nada que hagamos ahora puede cambiar el pasado, pero
cualquier cosa que hacemos influencia y cambia el futuro, a pesar de que el futuro tiene un
elemento de incertidumbre. Los gerentes se encuentran mucho más cautivados por darle
forma al futuro que por la historia pasada.

El concepto de probabilidad ocupa un lugar importante en el proceso de toma de decisiones,


ya sea que el problema es enfrentado en una compañía, en el gobierno, en las ciencias
sociales, o simplemente en nuestra vida diaria. En muy pocas situaciones de toma de
decisiones existe información perfectamente disponible – todos los hechos necesarios.- La
mayoría de las decisiones son hechas de cara a la incertidumbre. La probabilidad entra en el
proceso representando el; rol de sustituto de la certeza – un sustituto para el conocimiento
completo.

Los modelos probabilísticos están ampliamente basados en aplicaciones estadísticas para la


Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

evaluación de eventos incontrolables (o factores), así como también la evaluación del riesgo
de sus decisiones. La idea original de la estadística fue la recolección de información sobre y
para el Estado. La palabra estadística no se deriva de ninguna raíz griega o latina, sino de la
palabra italiana state. La probabilidad tiene una historia mucho mas larga. LaProbabilidad se
deriva del verbo probar lo que significa "averiguar" lo que no es tan fácil de obtener o
entender. La palabra "prueba" tiene el mismo origen el cual proporciona los detalles
necesarios para entender lo que se requiere que sea cierto.

Los modelos probabilísticos son vistos de manera similar que a un juego; las acciones están
basadas en los resultados esperados. El centro de interés se mueve desde un modelo
determinístico a uno probabilístico usando técnicas estadísticas subjetivas para estimación,
prueba y predicción. En los modelos probabilísticos, el riesgo significa incertidumbre para la
cual la distribución de probabilidad es conocida. Por lo tanto, la evaluación de riesgo significa
un estudio para determinar los resultados de las decisiones junto a sus probabilidades.

Modelos Probabilísticos:

El conocimiento es lo que sabemos. La información es la comunicación de conocimientos. En


cada intercambio de conocimientos, hay un remitente y un receptor. El remitente hace común
lo que es privado, hace la información, la comunicación. La información se puede clasificar
como formas explícitas y tácitas. La información explícita se puede explicar de forma
estructurada, mientras que la información tácita es inconsistente e imprecisa de explicar.

Los datos son conocidos como información cruda y no como conocimientos en sí. La
secuencia que va desde los datos hasta el conocimiento es (observe el siguiente cuadro): de
los Datos (Data) a la Información (Information), de la Información (Information) a los Hechos
(Facts), y finalmente, de los Hechos (Facts) al Conocimiento (Knowledge) . Los datos se
convierten en información, cuando se hacen relevantes para la toma de decisión a un
problema. La información se convierte en hecho, cuando es respaldada por los datos. Los
hechos son lo que los datos revelan. Sin embargo el conocimiento instrumental es expresado
junto con un cierto grado estadístico de confianza (gl).

Los hechos se convierten en conocimiento, cuando son utilizados en la complementación


exitosa de un proceso de decisión. Una vez que se tenga una cantidad masiva de hechos
integrados como conocimiento, entonces su mente será sobrehumana en el mismo sentido en
que, con la escritura, la humanidad es sobrehumana comparada a la humanidad antes de
escribir. La figura siguiente ilustra el proceso de razonamiento estadístico basado en datos
para construir los modelos estadísticos para la toma de decisión bajo incertidumbre.
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

MEDIDAS DE TENDENCIA CENTRAL


La medida de tendencia central (moda, media y mediana), parámetro de tendencia
central o medida de centralización es un número ubicado hacia el centro de la
distribución de los valores de una serie de observaciones (medidas), en la que se
encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más
utilizadas son: media, mediana y moda. Cuando se hace referencia únicamente a la
posición de estos parámetros dentro de la distribución, independientemente de que esté
más o menos centrada, se habla de estas medidas como medidas de posición.1 En este
caso se incluyen también los cuantiles entre estas medidas.

La media aritmética

La media aritmética es el promedio o medición de tendencia central de uso más común. Se


calcula sumando todas las observaciones de una serie de datos y luego dividiendo el total
entre el número de elementos involucrados.

La expresión algebraica puede describirse como:

Donde N es el numero de datos

Un ejemplo:

Calcular la media de 2, 4, 6, 7, 9

N= 5 (el número de datos)

Aplico la fórmula y queda la sumatoria de 2, 4, 6, 7 y 9, siendo igual a 28, dividido por la


cantidad de datos, es decir, dividido por 5. La media, entonces, es igual a 5,6.

La mediana

La mediana es el valor medio de una secuencia ordenada de datos. Si no hay empates, la


mitad de las observaciones serán menores y la otra mitad serán mayores. La mediana no se
ve afectada por ninguna observación extrema de una serie de datos. Por tanto, siempre que
esté presente una observación extrema es apropiado usar la mediana en vez de la media para
describir una serie de datos.
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

Para calcular la mediana de una serie de datos recolectados en su forma sin procesar,
primero debemos poner los datos en una clasificación ordenada. Después usamos la fórmula

de punto de posicionamiento:

Para encontrar el lugar de la clasificación ordenada que corresponde al valor de la mediana,


se sigue una de las dos reglas:

1. Si el tamaño de la muestra es un número impar, la mediana se representa mediante el valor


numérico correspondiente al punto de posicionamiento, la observación ordenada es (n+1)/2.

2. Si el tamaño de la muestra es un número par entonces el punto de posicionamiento cae entre


las dos observaciones medias de la clasificación ordenada. La mediana es el promedio de los
valores numéricos correspondientes a estas dos observaciones medias.

3.

La moda

La moda o modo es el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la moda
no se ve afectada por la ocurrencia de los valores extremos. 

Ejemplo: Los valores siguientes son las calificaciones de un alumno durante todo el año

7;  8;  9;  7;  9;  8;  8;  8;  7;  8

Podemos afirmar entonces que el modo es igual a 8, dado que es el valor que aparece con
más frecuencia.

MEDIDAS DE DISPERSIÓN
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

variabilidad de una distribución, indicando por medio de un número si las diferentes


puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese
valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media.
Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la
media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la
suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias
para salvar este problema. Una es tomando las desviaciones en valor absoluto
(desviación media) y otra es tomando las desviaciones al cuadrado (varianza).

* RANGO ESTADÍSTICO: Es la diferencia que existe entre el dato mayor y el dato menor.
Para ello deben ordenarse de acuerdo a tamaño.

* DESVIACIÓN MEDIA (Dm): Es otra medida de dispersión que tiene un significado intuitivo
es la desviación media (Dm), la cual puede visualizarse evaluando la distancia entre cada
observación (puntuación) y la media aritmética. El promedio de estas distancias da una
medida racional de la dispersión de los datos.

* DESVIACIÓN ESTÁNDAR: Una medida de variabilidad más adecuada es la desviación


estándar, que se simboliza con s para una muestra, y con 􀁭 para una población.

* VARIANZA (s2): Si eleva al cuadrado cada una de la s desviaciones respecto de la media


aritmética, sume y divida entre (n 􀀼 1), y obtiene la llamada varianza.

Discusión: 
Dudas, desacuerdos, discusiones
Asignatura Datos del estudiante Fecha
Apellidos: Grondona Fuentes
PROBABILIDAD Y
06/06/2022
ESTADISTICA
Nombre: Jesus Eduardo

También podría gustarte