Está en la página 1de 7

PROYECTO DE PROBABILIDAD Y ESTADISTICA

PROBABILITY AND STATISTICS PROJECT


Edwin Josue Astudillo Delgado1, Byron Israel Chucaralao Minchala2, Brayan Guillermo Prado
Bermeo3, Cristopher William Izquierdo Verdugo4

Resumen Abstract

El siguiente informe relata acerca de un proyecto The following report relates about a project of
de probabilidad y estadística de los estudiantes de probability and statistics of the students of the
la Universidad Politécnica Salesiana el cual Salesian Polytechnic University which consists of
consiste en analizar 2 variables en función del analyzing 2 variables as a function of time and
tiempo y determinar una probabilidad conjunta así determining a joint probability as well as the
como la covarianza y la correlación que existe entre covariance and the correlation that exists between
ellos, los datos a investigar fueron acerca de 200 them, the data to investigate were about 200 values of
valores de una variable X en el dominio del tiempo a variable X in the time domain and in the same way
y de igual manera una variable Y en el dominio del a variable Y in the time domain, these data were
tiempo, estos datos fueron tomados de una taken from an iPhone health application and from a
aplicación de salud de IPhone y de una página de website dedicated to the measurement and prediction
internet que se dedica a la medición y predicción de of the temperature respectively.
la temperatura respectivamente. Then, based on this, what is sought in the following
Entonces en base a ello lo que se busca en el report is to analyze the previously established
siguiente informe es analizar los parámetros parameters, their graphs and obtain conclusions about
preestablecidos anteriormente, sus gráficas y this project that in the future will be very useful when
obtener conclusiones acerca de este proyecto que a working in the industry or companies when we need
futuro nos será gran utilidad al momento de trabajar this tool as important as probability and statistics are.
en la industria o empresas cuando necesitemos de
esta herramienta tan importante como lo es la
probabilidad y estadística.

Palabras Clave: Probabilidad conjunta, Estadística, Keywords: Joint probability, Statistics, Variables,
Variables, Covarianza, Correlación Covariance, Correlation
1. Introducción resumir, representar y analizar datos con el objeto
Podemos decir que la estadística es la rama de la de extraer conclusiones que permita tomar
matemática que se ocupa de recopilar, coordinar, decisiones. La estadística trata de interpretar los
datos de las observaciones de un fenómeno que
1 Estudiante de ingeniería Mecatrónica de la Universidad Politécnica Salesiana eastudillod@est.ups.edu.ec
2 Estudiante de ingeniería Mecatrónica de la Universidad Politécnica Salesiana bchucaralao@est.ups.edu.ec
3 Estudiante de ingeniería Mecatrónica de la Universidad Politécnica Salesiana bpradob@est.ups.edu.ec
4 Estudiante de ingeniería Mecatrónica de la Universidad Politécnica Salesiana cizquierdo2@est.ups.edu.ec
1
se produce en los numerosos elementos de un probabilidad conjunta es la probabilidad de que
conjunto, de modo de dar una expresión correcta suceda X, tal que sucedió Y y viceversa. [2]
de dicho fenómeno. Desde antigüedad los
pueblos hicieron uso de la estadística También analizaremos la correlación que es la
rudimentaria, en todos ellos se hicieron censos de forma numérica en la que la estadística ha podido
población, de propiedades, inventarios de bienes, evaluar la relación de dos o más variables, es
controles de nacimientos, de defunciones, etc. decir, mide la dependencia de una variable con
De ahí el nombre de estadística, que proviene de respecto de otra variable independiente. [3]
la palabra “Estado”. Recién a fin del siglo XVII
se organizó la estadística como una rama de la Como lo mencionado anteriormente también se
matemática aplicada y alcanzada su verdadero analizará lo que es la covarianza que en
desarrollo en el siglo siguiente cuando se une al probabilidad y estadística, la covarianza es un
cálculo de probabilidad que le sirve de base y valor que indica el grado de variación conjunta de
permite su aplicación en estudios demográficos, dos variables aleatorias respecto a sus medias. Es
como en economía, en biología, en astronomía, el dato básico para determinar si existe una
meteorología, etc. dependencia entre ambas variables y además es el
dato necesario para estimar otros parámetros
Las probabilidades constituyen una rama de las básicos, como el coeficiente de correlación lineal
matemáticas que se ocupa de medir o determinar o la recta de regresión. [4]
cuantitativamente la posibilidad de que un suceso
o experimento produzca un determinado
resultado. La probabilidad está basada en el 2. Materiales y Métodos
estudio de la combinatoria y es fundamento Los métodos utilizados para la medición de las
necesario de la estadística. variables del siguiente informe son:
Los problemas más sencillos estudian la
probabilidad de un suceso favorable en un  Acceso a la App de Salud de IPhone (X)
experimento o acontecimiento con un número  Acceso a la página Accuweather.com (Y)
finito de resultados, todos ellos con igual
probabilidad de ocurrir. Si un experimento tiene n 2.1 Datos de X
posibles resultados, y f de ellos se consideran Para los datos tomados en de la variable X nos
favorables, la probabilidad de un suceso ayudamos en la App de Salud de iPhone.
favorable es f/n. [1] La aplicación Salud se centra en cuatro
categorías: Actividad, Sueño, Conciencia Plena y
Analizaremos los datos de 200 muestras que son Nutrición. Cada una juega un papel esencial en la
de una aplicación de iPhone de salud que mide la aplicación y en tu bienestar. También sugiere las
distancia recorrida y el número de pasos por día y mejores aplicaciones de cada categoría y te
también de una página de internet que nos muestra la actividad diaria en la vista hoy.
muestra la temperatura máxima en ese día,
Tomaremos estos datos como las variables X y Y
respectivamente.

En el siguiente informe se analizará también la


probabilidad conjunta que es la probabilidad de
ocurrencia de 2 o más eventos, en el informe se
toma en cuenta las variables X y Y, entonces por
consiguiente se puede decir que, por ejemplo, la

2
numero de pasos por día dándonos la siguiente
grafica.

Fig.2. Grafica de líneas Días vs Pasos.

2.1.2. Histograma de X
En el siguiente grafico analizamos la frecuencia
dada por el histograma vs. los pasos

Fig.1. App de Salud en iPhone con los datos de (X)

Como adicional la App también tiene varias


herramientas que influyen en nuestra salud y nos
puede ayudar a llevar un correcto seguimiento de
la misma. Entre las demás herramientas de la app
tenemos: corazón/frecuencia cardiaca, medidas
corporales, salud reproductiva, resultados y signos
vitales. Fig.3. Histograma de X
Se puede encontrar una mayor información en el
link: https://www.apple.com/la/ios/health/ [5]
2.2 Datos de Y
De esta manera tomando los valores de 200 días Para los datos tomados de la variable Y tomamos
logramos obtener los 200 datos en cuestión en cuenta la página Accuweather.com
Es una compañía estadounidense que presta
servicios comerciales de pronóstico del tiempo en
2.1.1. Grafica de X todo el mundo.
En la siguiente grafica analizamos los días que
vendría a ser nuestra función del tiempo contra el

3
Fue fundada en 1962 por Joel N. Myers, un
estudiante de la Universidad Estatal de Pensilvania 2.2.1. Grafica de Y
que en ese momento trabajaba en una licenciatura La siguiente grafica contra de una comparación de
en meteorología. Su primer cliente fue una días que está en función del tiempo contra la
compañía de gas en Pensilvania. Mientras temperatura máxima.
manejaba su empresa, Myers se convirtió en
miembro de la Facultad de Meteorología de su
universidad. La compañía adoptó el nombre de
AccuWeather en 1971.

Fig.4. Grafica de líneas Días vs Temperatura máxima.

2.2.2. Histograma de Y
En el siguiente grafico analizamos la frecuencia
dada por el histograma vs. el clima.

Fig. 4. Datos de temperatura de Accuweather.com (Y)

Lo que nos hizo escoger a Accuweather sobre otras


plataformas de predicción de temperatura es
debido a las habilidades expertas de los
meteorólogos más importantes del mundo junto
con la base de datos más robusta de modelos de
pronóstico, el motor de pronóstico mundial más
avanzado, patentes patentadas y resultados de
validación completos para cada ubicación en la
Tierra complementando esto con la obtención de
datos en tiempo real. [6]
Fig.5. Histograma de Y
Para encontrar una mayor información de esta
plataforma se encuentra en la página web de:
https://corporate.accuweather.com/accuweather- 3. Resultados y Discusión
advantage Una vez obtenidos los datos, gráficos y los
histogramas de las variables X y X procedimos a
realizar una relación de probabilidad conjunta, de

4
igual manera analizamos la correlación y la
covarianza que existe entre estos.

3.1 Probabilidad conjunta


Tabulamos los datos para encontrar los valores de
la probabilidad conjunta de X y Y.

Tabla 1: Tabulación de puntos ubicados en los rangos de


Temperatura máxima en función del número de pasos.

Fig. 6 Histograma en 3 dimensiones de probabilidad conjunta

Graficamos nuestro diagrama de puntos para


obtener los valores de la probabilidad conjunta.
Debido a la extensión del diagrama de puntos
anexamos su grafica al final del informe para una
mejor visualización del mismo.

Tabla 2: Probabilidad conjunta de los pasos en función de la


Temperatura máxima f(x,y). Fig. 7 Histograma en 3D de probabilidad conjunta en
diferente perspectiva

3.2 Calculo de la covarianza


La covarianza es un valor que indica el grado de
variación conjunta de dos variables aleatorias
respecto a sus medias. Es el dato básico para
determinar si existe una dependencia entre ambas
Una vez graficado el diagrama de puntos podemos variables y además es el dato necesario para
encontrar su probabilidad conjunta f(x,y). estimar otros parámetros básicos, como el
coeficiente de correlación lineal o la recta de
3.1.1 Histograma 3D regresión.
Una vez hallada la probabilidad conjunta se Para calcular la covarianza se tiene la siguiente
procede a realizar un histograma de este para poder formula:
observar su comportamiento de una mejor manera 1
σ xy= ∑ ( x i−x́ )( y i− ý )(1)
n i

Tabla 3: Media de Número de días, pasos y Temperatura


máxima para cálculo de covarianza.

5
Una vez obtenida la media y asignada el nombre Tabla 7: Resultados de Correlación de las variables
de las variables Números de días, Pasos y
Temperatura máxima a X, Y y Z; continuamos
calculando la sumatoria de la ecuación de
covarianza para luego dividirla para el número
total de la muestra. Para apreciar mejor los
cálculos que implican la fórmula de la covarianza
se los puede encontrar en la sección anexos al final
del documento.

Tabla 4: Valores de la covarianza obtenidos entre las Tabla 8: Comparación de los coeficientes con la correlación
diferentes variables aleatorias. que presentan las variables analizadas.

3.3 Calculo de la correlación


La correlación que es la forma numérica en la que
la estadística ha podido evaluar la relación de dos o
más variables, es decir, mide la dependencia de
una variable con respecto de otra variable
independiente. Una vez obtenida nuestra correlación entre las
Para calcular la correlación de estas variables variables YZ nos da como resultado una
aleatorias ocupamos la fórmula de la correlación correlación nula porque en base a los valores de
de Pearson. nuestra tabla de comparación de los coeficientes de
correlación están entre los rangos de ±0.0 - ±0.09.
σ Xy
ρ xy = (2)
σx∙σy
4. Análisis de Resultados
La fórmula de correlación implica la covarianza y En base a los cálculos realizados y los resultados
la desviación estándar de las variables aleatorias es obtenidos, gracias a la teoría de probabilidad y
por eso que debemos también calcular la estadística estudiada en esta materia, logramos
desviación estándar de cada variable. obtener la probabilidad conjunta, la covarianza y
la correlación de las variables YZ, mismas que
Tabla 5: Valores obtenidos de la desviación estándar de las presenta una correlación nula, es decir, que el
variables especificadas anteriormente.
clima no es un factor que va a tener influencia al
momento de recorrer distancias (pasos) por
ejemplo; nosotros tenemos planificadas nuestras
actividades para un día en específico, y el hecho
de que ese día tenga temperaturas muy bajas o
muy altas, no es un factor el cual vaya hacer
Luego de obtener todos los parámetros necesarios retrasar o adelantar nuestras actividades, todo lo
para calcular la correlación procedemos a mostrar contrario vamos a tener que realizarlas de una
los resultados y los analizamos. manera u otra en un periodo de tiempo
establecido
6
Para finalizar al obtener alrededor de los 203
datos ya estamos en capacidad de obtener las
gráficas de puntos, histogramas en 2 y 3
dimensiones, también obtener probabilidades
conjuntas, correlaciones y covarianzas entre otras
de la gran diversidad que existe para calcular
probabilidades.

Referencias

[1] C-Reinoso45. (2013). Resumen


probabilidad. Julio/2018, de Slideshare.com

[2] Karen Ariadna Navarro Ambrioso. (2013).


Probabilidad conjunta. Julio/2018, de
Blogger.com

[3] Oxford Dictionary of Statistics, Oxford


University Press, 2002, p. 104.

[4] Donald E. Knuth (1998). The Art of


Computer Programming, volume 2:
Seminumerical Algorithms, 3rd edn., p. 232.
Boston: Addison-Wesley.

[5] Apple Inc.. (2015). Health. Julio/2018, de


Apple.com Sitio web:
https://www.apple.com/la/ios/health/

[6] Wikipedia. (2016). Accuweather.


Julio/2018, de Wikipedia.com

También podría gustarte