Está en la página 1de 17

1

Análisis estadístico descriptivo "variables


de la competencia decathlón"

Autores:

Melany Rios Sierra melany.rios@udea.edu.co

Ana María Arango Vélez Ana.arangov@udea.edu.co

Simón Silva Arbeláez simon.silva1@udea.edu.co

Fundamentos de estadística

Docente: Luz Estela Del socorro Sánchez

Universidad de Antioquia.

2022-1
2

Introducción

El presente trabajo va referido al tema de la Estadística, que se puede definir es la


ciencia cuyo objetivo es reunir una información para facilitar al hombre el estudio
de datos masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias
al análisis de estos datos unos significados precisos o unas previsiones para el futuro.
El presente trabajo va referido al tema de la Estadística, que se puede definir es la
ciencia cuyo objetivo es reunir una información para facilitar al hombre el estudio
de datos masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias
al análisis de estos datos unos significados precisos o unas previsiones para el futuro.
El presente trabajo va referido al tema de la Estadística, que se puede definir es la
ciencia cuyo objetivo es reunir una información para facilitar al hombre el estudio
de datos masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias
al análisis de estos datos unos significados precisos o unas previsiones para el futuro.
El presente trabajo va referido al tema de la Estadística, que se puede definir es la
ciencia cuyo objetivo es reunir una información para facilitar al hombre el estudio
de datos masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias
al análisis de estos datos unos significados precisos o unas previsiones para el futuro.
El presente trabajo va referido al tema de la Estadística, que se puede definir es la ciencia cuyo
objetivo es reunir una información para facilitar al hombre el estudio de datos masivos de
individuos, grupos, series de hechos, etc. Y deducir de ello gracias al análisis de estos datos unos
significados precisos o unas previsiones para el futuro.
En el entorno del mercado actual, la competitividad y la rapidez de maniobra de una empresa son
imprescindibles para su éxito. Para conseguirlo existe cada vez una mayor demanda de datos y,
por tanto, más necesidad de gestionarlos. Esta demanda siempre ha estado patente en empresas y
sociedades, pero en estos años se ha disparado debido al acceso multitudinario a las redes
integradas en Internet y a la aparición de los dispositivos móviles que también requieren esa
información.
Toda esta ambición propia del ser humano ha llevado al estudio de formas matemáticas
que permitan la comprensión de cualquier conjunto de datos planteado de una manera
más sencilla. Aunque el problema principal de dichas metodologías residía en que para
cuando empezaron a elaborarse, con la intención de estudiar bancos de datos mayores, la
tecnología del momento no era capaz de abarcar tanto. De modo que se hacía imposible su
implementación de manera computacional, repercutiendo en la necesidad de avanzar desde un
punto de vista tecnológico para así poder continuar investigando sobre el estudio de datos.

También se refiere a la importancia, métodos e importancia de la estadística ya que está


relacionada con el estudio de proceso cuyo resultado es más o menos imprescindible y con la
finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales
observaciones.
La Estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presentar y
analizar datos, así como de sacar conclusiones válidas y tomar decisiones con base en este
análisis, así también realizar predicciones a cerca del conjunto del cual se han seleccionado
3

dichos datos. El empleo cuidadoso de los métodos estadísticos permite obtener información
precisa de los datos.

Objetivos

 Comprender la importancia del estudio de la estadística, para lo cual es necesario un


recorrido por sus conceptos, métodos e importancias.

 Conocer sobre el tema con el cual se trabajará a lo largo del ciclo.

 Aplicar apropiadamente los métodos estadísticos en la recolección de la información y


procesos matemáticos básicos en cálculos estadísticos.

 Adquirir los conocimientos y habilidades sobre el tema, ser capaz de reconocer los
elementos habituales de la estadística.

 Aplicar los fundamentos básicos para realizar un buen trabajo descriptivo.

Materiales y métodos

Descripción de la base de datos


Desde un punto de vista social, la Estadística es un área que con el paso del tiempo ha ido
tomando cada vez más presencia, llegando a poder encontrarla en multitud de ámbitos, desde
estudios financieros hasta investigaciones de laboratorio. Considerando dentro de la Estadística
lo que se conoce como el estudio y análisis de datos, desde sus inicios este ha ido cobrando
también cada vez más importancia desencadenando un aumento de los conjuntos de datos que se
querían estudiar. Es decir, de pasar a estudiar lo que ocurriría en el caso de dos o tres variables se
ha querido llevar a cantidades mucho mayores, ya sea por entender las diferentes relaciones que
pueda haber dentro de un conjunto de variables o por el simple hecho de indagar y seguir
avanzando científicamente.
4

Descripción de las variables de la base de datos:

Salto alto
El salto alto es una prueba de atletismo donde el objetivo es sobrepasar una barra horizontal
llamada listón, la cual tiene dos soportes verticales ubicados a 4 metros de distancia, en el primer
salto el decide a que altura poner el listón, posteriormente tiene tres oportunidades para superar
esta altura, si lo hace puede subir el listón de 3 centímetros en adelante, es muy común subir el
listón de 3 a 6 centímetros, y realizar tres saltos mas para superar esta altura.
400m
Es una competencia de atletismo donde la meta sera correr 400 metros lo mas rápido posible, los
corredores están ubicados de maneras tan precisas que ninguno correrá ni un centímetro mas que
el otro, eso hace la competencia muy justa y totalmente imparcial.

110m hurdle
Es una competencia de atletismo donde se corren 110 metros con vallas como obstáculos, se
quiere llegar a la meta lo mas rápido posible, superando todas y cada una de las vallas, esta
disponible en la categoría masculina, ya que en la femenina se cuenta con 100 metros vallas.
Decastar
Es una competición anual de atletismo que tiene lugar en Talence, en el departamento de
Gironda en Francia es organizado por World Athletics, es uno de los encuentros de atletismo que
componen el World Athletics Challenge y combina varios eventos, los atletas masculinos y
femeninos compiten en decatlón o heptatlón, respectivamente, y los puntos obtenidos en
Décastar cuentan para el total anual de la competencia principal.
Olympicg
Los Juegos Olímpicos modernos son el principal evento deportivo internacional con
competiciones deportivas de verano e invierno en las que miles de atletas de todo el planeta
participan en una variedad de competiciones. Los Juegos Olímpicos se consideran la
competición deportiva más importante del mundo con más de 200 naciones participantes y se
realizan cada 4 años.
Definiciones

Moda: En la estadística, la moda es el valor que aparece con mayor frecuencia en un conjunto de
datos. Esto va en forma de una columna cuando encontremos dos modas, es decir, dos datos que
tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que
encontramos tres modas. En el caso de la distribución uniforme discreta, cuando todos los datos
tienen una misma frecuencia, se puede definir las modas como indicado, pero estos lores no
tienen utilidad. Por eso algunos matemáticos califican esta distribución como «sin moda».
5

Media: La media aritmética es un concepto matemático usado en estadística. También llamada


promedio o simplemente media, se obtiene con la suma de un conjunto de valores dividida entre
el número total de sumandos.
Mediana: Representa el valor de la variable de posición central en un conjunto de datos
ordenados. Se le denota mediana.
Coheficiente de curtuosis: Un coeficiente de apuntamiento o de curtosis es el cuarto momento
con respecto a la media estandarizado que se define como:
β2=μ4σ4
donde μ4 es el 4º momento centrado o con respecto a la media y σ es la desviación estándar.

Cuartiles: Los cuartiles son cuantiles que se multiplican por un cuarto de un conjunto de datos.
Aparecen citados en la literatura filosófica por primera vez en 1879 por Donald McAlister en el
artículo The Law of the Geometric Mean[1] y fueron posteriormente desarrolladas por su
mentor, Francis Galton en su publicación Natural Inheritance. Se atribuye a Galton la creación de
los términos decil, cuartil y percentil en el artículo honorífico escrito en el centenario de su
muerte.
Varianza: La Varianza es una medida de dispersión que se utiliza para representar la
variabilidad de un conjunto de datos respecto de la media aritmética de los mismo. Así, se
calcula como la suma de los residuos elevados al cuadrado y divididos entre el total de
observaciones. No obstante, se trata de una medida que también puede calcularse como la
desviación típica al cuadrado.
Rango intercualtil: En estadística descriptiva, se le llama rango intercuartílico o rango
intercuartil, a la diferencia entre el tercer y el primer cuartil de una distribución. Es una medida
de la dispersión estadística.
A diferencia del rango, se trata de un estadístico robusto.
Desviación: En matemáticas y estadística, la desviación es una medida de la diferencia entre el
valor observado de una variable y algún otro valor, a menudo la media de esa variable. El signo
de la desviación informa del sentido de esa diferencia (la desviación es positiva cuando el valor
observado excede el valor de referencia). La magnitud del valor indica el tamaño de la
diferencia.
Coeficiente de variación: Se utiliza para comparar la dispersión (variación) de conjuntos de
datos de medidas diferentes o con medias aritméticas diferentes.

Las formulas que utilizamos fueron

data("decathlon") Para descargar los datos de la base de datos decathlon


6

datos<-decathlon[,c(4,5,6,13)] Seleccionar los datos a utilizar


names(datos) Nombrar los datos que ya seleccionamos en el paso anterior
attach(datos)Para poder acceder a las variables directamente usamos
str(datos) Para estructurar los datos
dim(datos) Para estructurar los datos
summary(Datos) Resumen de estadistica descriptiva de los datos
resumen_estadistico<-basicStats(Datos[,-4])
tablafq<-table(Competition) para realizar la tabla de frecuencias absolutas
propredon<-round((prop.table(tablafq)*100),2) Taabla de frecuencias relativas con el porcentaje
y dos decimales
mfv(`110m.hurdle`) Hallar la moda
mean(`110m.hurdle`) Hallar media
stem(High.jump) gráfica tallo y hojas
par(mfcol=c(2,2)) gráfica de disperción
hist(High.jump, col = "red") gráfico de histograma
qqnorm(High.jump)gráfica qqnorm de discperción
boxplot(High.jump,horizontal = TRUE,col="yellow")
boxplot(High.jump~Competition,ylab=" Salto alto",
horizontal = TRUE) gráfica de cajas y bigotes
cov(decathlon[,1:4]) hallar la covarianza
cor(decathlon[,1:4]) Hallar la corrección
pairs(datos) Hacer diagrama

Descripción de los análisis

En este análisis queremos describir las tendencias claves en los datos existentes y observar las
situaciones que conduzcan a nuevos hechos. Este método se basa en una o varias preguntas de
investigación y no tiene una hipótesis. Además, incluye la recopilación de datos relacionados,
posteriormente, los organiza, tabula y describe el resultado.
7

Un análisis básico descriptivo implica el calcular las medidas simples de composición y


distribución de variables. Dependiendo del tipo de datos, pueden ser proporciones, tasas, razones
o promedios. 
Además, cuando sea necesario, como en el caso de las encuestas por muestreo, pueden utilizarse
medidas de asociación entre variables para decidir si las diferencias observadas entre mujeres y
hombres son estadísticamente significativas o no. 
El análisis descriptivo proporciona una base de conocimiento que puede ser una base para
realizar posteriormente un análisis cuantitativo. Si se interpreta de forma correcta, los datos
pueden ofrecer perspectivas útiles que lleven a la creación de una hipótesis.  
El análisis descriptivo es un método de análisis estadístico que antecede a los estudios
cuantitativos. Cuando el investigador logra observar el comportamiento de un sujeto sin influir
e identificar sus limitaciones, esta herramienta se vuelve invaluable.
8

Rango 0.12 1.37 0.77


intercuartil
Desviación 0.08894 1.15350 0.471789
estandar
Coheficiente de 4.51472 2.3248 3.23013
variación
9
10

Gráficos de salto alto

Tallos y hojas
11

Análisis de variable salto alto.


En el diagrama de dispersión se muestra los valores correspondientes al número de datos, estos
se ubican como puntos de un plano cartesiano, en este se puede observar relaciones entre varios
datos y así nos muestra la frecuencia de los valores del gráfico, los datos se agrupan en intervalos
de igual amplitud que no se sobreponen, contrarios a el gráfico de barras ya que la altura muestra
la frecuencia de los valores.En este diagrama de dispersión de la variable “salto alto”se ve
claramente un patrón, donde se insinúa una linea positiva (hacia arriba y a la derecha), así que
podemos afirmar con total seguridad que el la variable va en crecimiento y con un
comportamiento muy estable.
En el diagrama de cajas y bigotes se muestra en su gráfico un resumen del total de datos, en el
cual se puede presencial e identificar los valores atípicos y comparar distribuciones de los datos,
se muestra una manera conveniente de mostrar visualmente los grupos de datos numéricos
atreves de los cuartiles, las líneas que se extienden paralelas a las cajas y se muestra la
variabilidad fuera de los cuartiles superior e inferior, osea que a veces cuando una de las “cajas”
se ve mas angosta que la otra, hay mayor concentración de datos en esta, y cuando los “bigotes”
son muy largos, hay valores muy apartados de la mayoría. En este caso podemos ver mayor
concentración en el primer cuartil, en segundo lugar, gracias a la gráfica podemos ver que en el 3
cuartil, la hay datos mas alejados y dispersos, también sin duda hay valores muy altos que hacen
el bigote derecho sea mucho más largo que el izquierdo.
En el diagrama de cajas y bigotes separado por las variables categóricas podemos ver algo muy
interesante, en la competencia Olimpic, el primer cuartil tiene una gran densidad, mientras en la
otra caja, hay un gran espacio, que simula distancia entre los números, pero en el relacionado con
la competencia Decastar podemos ver unas cajas casi simétricas, lo que nos habla de una
distribución normal.
Este histograma nos muestra la frecuencia de los valores, los datos se agrupan en intervalos de
igual amplitud que se sobreponen para crear una barra parecida al diagrama de barras, pero sin
espacio alguno entre las demás barras, teniendo en cuenta esto vemos que la frecuencia de 1.95 a
2.15 es la misma, si tenemos una amplitud del intervalo de 0.05, y su moda (recordemos que es
el dato mas repetitivo) esta en el intervalo 1.90 a 1.95 con 12 repeticiones.
En el diagrama de tallos y hojas se muestran los datos numéricos en categorías basadas en un
valor posicional, este es un gráfico podemos observar mucha más información que se presentan
en todo los datos se muestra la organización de los datos numéricos en categorías podemos
observar que en dos categorías se encuentra la misma cantidad de valores, acá podemos ver que
el dato que mas se repite tiene como dos primeras cifras 19, osea que su tallo es 19, y con el tallo
21, solo tenemos una repetición con la hoja 5, que juntos indican el número 215.
12

Gráficos de 400m

Tallos y hojas: 400m


13

Análisis de variable 400m


En esta clase numérica de 400m, podemos observar que se presentan una densidad de datos muy
notoria en algunas de una de sus categorías, las otras muestran una asimetría correspondiente a la
de mayor densidad, también podemos observar que hay valores atípicos que no están muy
cercanos a la media. (a la izquierda y derecha se encuentran estos datos).
Lo descrito revela la necesidad de promover cambios en la concepción de la preparación
específica de los vallistas, teniendo en cuenta el contenido de la tercera de las posibilidades
rítmicas y las particularidades de cada atleta, de modo tal que puedan correr con mayor
eficiencia; para ello el entrenamiento debe dirigirse en función del aprovechamiento de las
potencialidades individuales, para, de esta forma, erradicar las debilidades que surjan durante la
preparación.
El ritmo de carrera constituye uno de los aspectos fundamentales en el proceso de entrenamiento
de la carrera 400 metros con vallas, tradicionalmente la enseñanza del mismo parte de dos
direcciones fundamentales, la primera de ellas las carreras de distancias cortas con vallas, pues
éstas garantizan el desarrollo de habilidades técnicas en la carrera y el pase de las vallas en los
atletas, en tanto la segunda, se relaciona con los 400 metros planos por constituir la base
principal para conocer el rendimiento en los 400 metros con vallas a partir del tiempo de
diferencia que realice el vallista.
 Para dotar a los vallistas de un óptimo ritmo de carrera en la distancia competitiva es necesario
posean una adecuada estructura técnica de carrera y características anatómicas, fisiológicas y
antropométricas que les permitan vencer la distancia sin grandes pérdidas de velocidad. Existen
guías que correlacionan la estatura con la longitud de los pasos de los atletas, aún éstas se
consideran insuficientes para el trabajo de los profesores deportivos debido que la práctica ha
demostrado muchos vallistas hoy día, en múltiples ocasiones, rompen estos esquemas y alcanzan
resultados que no se relacionan con los datos contenidos en dichas guías.
En este sentido una de las variables poco tratadas en el entrenamiento del ritmo de carrera en la
distancia estudiada resulta el antropométrico, específicamente la relación que se establece entre
la estatura- longitud de los pasos- longitud de miembros inferiores, el cual a criterio del autor de
la investigación confiere una mayor objetividad para la selección de los atletas y posteriormente
para la determinación del contenido de entrenamiento referido al ritmo de carrera.

El análisis de los elementos que caracterizan el entrenamiento del ritmo de carrera en la especia-
lidad 400 metros con vallas, permitió concretar las dimensiones determinantes que contribuyen a
individualizar el proceso, racionalizándose así el tiempo disponible para la formación de los va-
llistas y condicionando el incremento gradual de sus rendimientos deportivos.

El análisis teórico sobre la temática reveló deficiencias y limitaciones en la concepción del entre-
namiento dirigido al ritmo de carrera, premisas tenidas en cuenta para la concreción teórica que
sustentan el ordenamiento metodológico con carácter sistémico e integral del proceso, en el com-
ponente estudiado, desde el enfoque con que se aborda en la investigación.
14

Gráficos 110m hurdle

Tallos y hojas

Análisis de variable 110m Huddle


15

Esta categoría nos muestra que los datos tienen una densidad muy parecida, en dos categorías
nos muestra que tienen la misma densidad de información. En 4 categorías 3 de ellas tienen la
misma densidad lo cual nos hace ver que los datos no están tan dispersos, una categoría muestra
su dato atípico el cual se muestra un poco lejana de la muestra. Pero en si la información que se
posee muestra una densidad más a la derecha de la gráfica.
 El análisis de la técnica en la carrera de atletismo con vallas requiere el estudio de la evolución
de la misma en las carreras de las vallas cortas, 100 y 110 metros, las cuales han servido de guía
para marcar las diferentes pautas, naturalmente con pequeñas modificaciones, debido a su altura,
la menor agresividad de la pierna de ataque, menor inclinación del tronco, más abandono en la
fase de vuelo, equivalente a una mayor economía del movimiento con menor amplitud e
intensidad.
Los autores citados coinciden en que la táctica es un proceso en el cual se logra, el
aprovechamiento de los restantes componentes de la preparación del deportista en función de
solucionar de forma efectiva y racional las diversas situaciones que se manifiestan en el
escenario de competencia, siempre que la misma haya sido entrenada, simulando las
particularidades reales de la competencia y la posible incidencia de los factores externos que
puedan afectar el resultado deportivo.
 Las características distintivas de esta especialidad predisponen al dominio de las habilidades
técnicas en los diferentes momentos de la carrera, a partir de las potencialidades que posea el
atleta desde el punto de vista físico, psicológico e intelectual, de manera que éste logre la
sincronización de dichos componentes en el transcurso de la distancia, lo que redundará en la
elección de una táctica deportiva efectiva y óptima, a partir de la diversidad de variantes que
domine el vallista.
    Al respecto Utkin (1988) plantea: la búsqueda de una variante óptima de la totalidad posible
de la táctica se denomina optimización; para ello los momentos que requiere optimizarla están
representados en criterios que son utilizados para estimar distintas alternativas tácticas y la
selección de la mejor entre ellas como pueden ser velocidad, precisión y calidad de estética, entre
los más significativos y; factores como propiedades internas y externas al deportista que puedan
afectarlo como el aspecto morfofuncional.
    Por lo anterior, una táctica es efectiva cuando es individualmente óptima, es decir, que
objetiva y funcionalmente se ajuste a las particularidades inherentes a cada atleta; de esta forma,
es necesario el conocimiento de las características del individuo para incidir positivamente en la
educación de la variante táctica más adecuada para enfrentar la competencia.
 Los criterios de los autores citados coinciden al referirse al ritmo, a la relación existente entre
las fases que conforman una acción determinada en correspondencia con el tiempo y el espacio;
indicadores éstos que se ajustan a las características específicas de la carrera 110 metros huddle
con vallas.

Variable categórica
16

Tabla de frecuencia

tabla porcentual de frecuencia

Análisis:
En estos gráficos podemos observar tablas de frecuencias, que indican el numero de repeticiones
que se dieron en las categorías ya especificadas, por ejemplo, en la primera tabla de frecuencia,
vemos 13 competidores en la competencia Decastar y 28 en la Olimpic, el la segunda tabla de
porcentajes hacemos honor a el porcentaje de personas en la base de datos que asistieron a una u
otra competencia, por ejemplo, el 31,7% asistió a la Decastar y el 68.29 asistió a Olimpic.
En el gráfico de barras podemos evidenciar de manera representativa lo que vemos con números
en la tabla de frecuencias, osea que en la base de datos hay 13 competidores en la competencia
Decastar y 28 de la Olimpic.
Conclusión
Podemos conocer que las gráficas tienen dos formas de comportamiento, las cuales se pueden
identificar como dispersas y estables, en estas se pueden analizar relaciones entre varios datos,
esto genera mucha información al grupo poblacional que va dirigido, los datos se agrupan en
intervalos de igual densidad, en estos diagramas se puede observar un patrón donde se insinúa
mucha información presentada, el gráfico muestra un resumen del total de los datos que se
tienen, en estos se pueden observar valores atípicos y comparar distribuciones de la información.
A partir de esto se muestra una variabilidad en los datos que se tienen y se puede denotar que en
algunos casos se presenten una mayor concentración de información en los primeros cuartiles. La
frecuencia que poseen muchos de los datos hacen que sus categorías no se sobrepongan sobre
otras y pueda tener su valor posicional.

REFERENCIAS
https://www.efdeportes.com/efd161/ritmo-de-carrera-en-400-metros-con-vallas.htm
17

http://concurso.cnice.mec.es/cnice2005/50_educacion_atletismo/curso/archivos/
descripcion_100vallas.htm
https://www.questionpro.com/blog/es/analisis-descriptivo/#:~:text=El%20an%C3%A1lisis
%20descriptivo%2C%20como%20su,y%20no%20tiene%20una%20hip%C3%B3tesis.

También podría gustarte