Está en la página 1de 7

Estadística aplicada clases

1. 1. ESTADÍSTICA APLICADA AL DEPORTE Liliana Jiménez Hernández


Estadística, Mg. en Epidemiología Correo: liliana.jimenez@endeporte.edu.co
2. 2. Guía de Curso Descripción: Área curricular: Ciencias biológicas, naturales y
exactas Créditos: 4 Trabajo presencial (h): 96 Trabajo independiente (h): 96
Duración total (h): 192 Objetivo General: Aplicar los métodos para recoger,
organizar, resumir y analizar datos de características antropométricas,
funcionales y motoras, así como sacar conclusiones válidas y tomar decisiones
razonables basadas en tales análisis. Estrategias metodológicas •Ejercicios en
clase •Talleres •Excel •Trabajo

3. 3. TEMA 1 Definiciones básicas


4. 4. Definición importantes Estadística Es la ciencia que desarrolla y aplica
métodos eficientes de recolección, procesamiento, análisis e interpretación de
datos. Surge como herramienta para reducir los efectos de incertidumbre
inherentes a los procesos en donde predominan los efectos del azar.  Conteo de
Poblaciones, Riquezas y Recursos Naturales. Antes de Cristo – XVII. 
Cuantificación de probabilidades de éxito en los juegos de Azar. Siglo XVIII. 
Optimización de la Producción Agrícola. Siglo XIX.  Herramienta de apoyo en
el desarrollo científico y tecnológico en todas las áreas del conocimiento.
5. 5. Tipos de estadística 1. ESTADISTICA DESCRIPTIVA: Métodos para
organizar, resumir y presentar datos de manera informativa. Su fin es
únicamente exploratorio y se limita a describir lo observado en una población o
muestra. El estudio de la estadística se divide en dos categorías: 2.
ESTADISTICA INFERENCIAL: Proceso inductivo que permite inferir a toda la
población características observadas en un muestra TEORIA DE LA
PROBABILIDAD Deducción de Leyes
6.
7. 6. Estadística y su problema Básico   P 2   p S X ˆ 2 Población (N) Muestra
(n) Muestreo Aleatorio Parámetro EstimadorInferencia ˆ

8. 7. POBLACIÓN: Conjunto de Elementos de interés en una investigación. 1. El


numero de elementos pueden ser finitos o infinitos 2.No debe asociarse
exclusivamente con población humana MUESTRA: Subconjuntos de elementos
obtenidos desde la población de interés UNIDAD MUESTRAL: Elemento sobre
el cual se accede a los elementos de la muestra.

9.
10. 8. Tipos de variables y escalas de medición Se consideran generalmente cuatro
escalas de medición: 1. Escala Nominal: No puede establecer un orden jerárquico
entre las opciones de respuesta Color de Ojos ( Verde, Azul, Gris, Negro, Café). 2.
Escala Ordinal: Existe un ordenamiento natural de las opciones de respuesta
Calificación de un servicio (Excelente, Bueno, Regular, Malo) 3. Escala de
Intervalo: El valor 0 es un valor arbitrario, no implica la no presencia de una
característica Temperatura = 0º C → ¿No hay temperatura? 4. Escala de Razón:
El valor 0 refleja ausencia de la característica. Altura = 0 mts
V.CualitativasV.Cuantitativas 3. Discretos: Conjunto numerable. Entre dos
valores consecutivos no toma puntos medios. Numero de estudiantes en el salón
(1,2,3,4,…) 4. Continuos: Conjunto numérico continuo Talla (168 – 169, 168,2,
168,5, 168,7, …)

11. 9. 1. Calidad de un programa de entrenamiento. Opciones de respuesta:  Muy


malo  Malo  Regular  Bueno  Muy Bueno Cualitativa Ordinal
12. 10. 2. Deporte que puede elegir para ingresar a la END Opciones de respuesta: 
Fútbol  Baloncesto  Natación  Pesas  Voleibol Cualitativa Nominal
13. 11. 3. Tiempo en recorrer 300 metros  Tengo opciones de respuesta?  Cual es
la escala de medición? Cuantitativa Continuo

14. 12. 4. Numero de personas matriculadas en primer semestre en Profesional en


Deporte  Tengo opciones de respuesta?  Cual es la escala de medición?
Cuantitativa Discreto

15. 13. Clasifique las siguientes variables según el tipo de variable y el nivel de
medición: 1. Numero de goles marcados en un partido 2. Longitud en cms de
miembros superiores 3. Peso (kg.) de los deportistas 4. Lateralidad del futbolista
5. Tiempo en recorrer 200 mts. 6. Nivel de stress de una competencia 7. Estilos de
natación 8. Tipos de saque en Voleibol Responda: Cual es la diferencia entre
Censo y muestreo?
16. 14. La investigación y el modelo estadístico Concepto Equivocado Datos
Estadística Información Cual fue la Población? Que variables se midieron?
Escala de Medición? Instrumento de Medición? Tipo de Muestreo? Decisiones
Cual es la validez de la Información???

17. 15. Validez de la investigación Grado de valor que se confiere a la Información


18. 16. a. Validez externa  ¿ La medición puede extrapolarse... ?  “Depende en
gran medida de la conformación de la Muestra” Grado en que la medición puede
generalizarse a otras situaciones no medidas – Mecanismos de generación de
datos.

19. 17. Ejemplo 1: La Escuela Nacional del Deporte ha diseñado un estudio para
valorar el estado de nutrición en los niños de la ciudad de Cali y el nivel de
actividad física que desarrollan diariamente, para ello ha venido visitando
diferentes instituciones educativas valorando estas dos condiciones en sus niños.
Asuma que la validez interna de los datos está garantizada. Cual es su opinión al
respecto? Es claro, el problema es de representatividad. ¿ Que es
representatividad? ¿De que depende la representatividad?
20. 18. ¿El tamaño de la muestra, crece proporcionalmente con el tamaño de la
población, cuando se quiere realizar una estimación de la población? En
ocasiones se piensa que una muestra debe contener el 10% o hasta el 30% de la
población, lo cual es FALSO Paradoja del tamaño de muestra
21. 19. Olla para la sopa a diario Olla para la sopa con invitados Cuchara para catar
la sopa a diario Cuchara para catar la sopa con invitados “El tamaño de muestra
no es proporcional al tamaño de la población” Paradoja del tamaño de muestra
22. 20. Grado en que la medición refleja la situación que se pretende medir ¿ La
Medición está bien tomada... ? ¿ El instrumento de Medición es Adecuado... ? ¿
La Medición es Confiable, Repetible... ? b. Validez del Constructo
23. 21. b. Validez del Constructo
24. 22. Ejemplo 1: Un entrenador físico se encuentra interesado en medir el nivel de
flexibilidad de un grupo de deportistas. Para ello hace uso de 5 ejercicios
diferentes, a cada uno de los deportistas le pide que seleccione 2 de los test para
ser evaluado. Ejemplo 2: Se intenta medir la distancia entre dos objetos a través
de un instrumento cuyo diseño consta de un resorte sobre el cual se han marcado
unidades de distancia (cms). ¿Los datos que surjan de estos instrumentos de
medición son confiables?
25. 23. 1. Concepción de la Idea de Investigación 2. Planteamiento del Problema 3.
Construcción de un Marco Teórico 4. Definir el Tipo de Investigación 5.
Establecer Hipótesis 6. Determinar la población objeto de estudio y la estrategia
de muestreo 7. Planeación y Recolección de Datos 8. Análisis de Datos 9.
Presentar Resultados “La estadística juega un papel esencial en este proceso”
ESTADISTICA CONCEPTO IDEAL ……
26. 24. TEMA 2: Tablas de distribución de frecuencia y representación gráfica de los
datos
27. 25. Distribución de frecuencias ◦ La distribución de frecuencia es un método
utilizado para organizar y resumir datos. Bajo este método los datos que
componen una serie se clasifican y ordenan, indicándose el número de veces que
se repite. ◦ Permiten manejar gran cantidad de información en espacios pequeños
de dos formas: 1. Tablas de Frecuencias: Generan mayor información, pero
requieren de mayor esfuerzo del lector 2. Gráficos de Representación: Se
sacrifica información con el animo de que esta llegue de forma efectiva al lector.
28. 26. Variables Cualitativas Suponga que un estudio quiere valorar la realidad
actual respecto al consumo de cigarrillos en jóvenes con edades comprendidas
entre los 15 y 20 años. Para ello ha tomado una muestra aleatoria de 40 jóvenes a
los cuales les indaga acerca de su consumo de cigarrillos, los resultados son lo
siguientes:
{Si;Si;Si;NO;NO;NO;Si;Si;NO;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;NO;Si;Si;
Si;NO;NO;NO;Si;NO;Si;NO;NO;NO;Si;Si;NO;Si;NO} Datos brutos o series
simples
29. 27. 1. Se establece cuales son las categorías de la variable 2. Se cuenta cuantas
veces esta cada categoría 3. La suma de estas frecuencias debe coincidir con el
tamaño de la muestra o población 4. Se calcula la frecuencia relativa o
porcentaje (hi=fi/n) xi fi hi Fuma 26 65 No fuma 14 35 Total 40 100 Tablas para
datos cualitativos Interpretación
30. 28. Elaboración de una tabla de distribución de frecuencias  n = Tamaño de la
muestra y N = Tamaño de la población  xi= Identificación de cada valor
observado  fi = Frecuencias absolutas: Numero de veces que se repite  hi =
Frecuencia relativa: Valor porcentual  hi=fi/n  Fi = Frecuencia absoluta
acumulada.  Hi = Frecuencia relativa acumulada
31. 29. Gráficos para variables cualitativas  Gráficos de Pastel (Pocas categorías de
respuesta con alguna de ellas dominante)  Gráficos de Barra (El número de
categorías no importa) Consumo de Cigarrillos en Jovenes entre los 15 y 20 años
en la Ciudad de Cali No Fuma; 35% Fuma; 65% Consumo de Cigarrillos en
Jovenes entre los 15 y 20 años en la Ciudad de Cali 65% 35% 0% 10% 20% 30%
40% 50% 60% 70% Fuma No Fuma %
32. 30. Ejercicios: Tablas y gráficos para datos cualitativos  Genero de los
estudiantes de Estadística Aplicada: Femenino, Masculino, Masculino,
Masculino, Masculino, Masculino, Masculino, Masculino, Masculino,
Masculino, Masculino, Masculino, Masculino, Femenino, Masculino, Masculino,
Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Femenino,
Femenino, Femenino, Masculino, Masculino, Masculino, Masculino, Masculino.
33. 31. Ejercicio 2:  Deporte seleccionado al ingresar a la END: Natación,
Natación, Natación, Natación, Natación, Natación, Atletismo, Atletismo,
Atletismo, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol,
Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol,
Futbol, Voleibol, Voleibol, Voleibol, Voleibol, Baloncesto, Baloncesto,
Baloncesto, Baloncesto, Baloncesto, Baloncesto, Baloncesto,
34. 32. Ejercicio 3: ◦ Encuesta realizada a deportistas en competencia para
determinar el nivel de stress obteniendo los siguientes resultados (1-5): 3, 3, 5, 2,
4, 5, 3, 3, 4, 4, 2, 5, 3, 4, 3, 3, 3, 2, 3, 4
35. 33. Tabla de frecuencia para variables Cuantitativas Ejemplo: Numero de
abdominales de un grupo de mujeres de la tercera edad Serie simple: {15, 16, 19,
18, 16, 17, 15, 18, 18, 17, 20, 16, 17, 18, 17, 19, 20, 21, 16, 17} Xi Valor observado
Conteo ni (Frecuencia Absoluta) 15 / / 2 16 / / / / 4 17 / / / / / 5 18 / / / / 4 19 / / 2 20
/ / 2 21 / 1 Total 20
36. 34. Elaboración de tabla de datos cuantitativos discretos 1. Se ordenan los datos
de menor a mayor 2. Se establece cuales son las categorías de la variable 3. Se
cuenta cuantas veces esta cada categoría (fi). La suma de estas frecuencias debe
ser n. 4. Se calcula Fi, sumando los fi de la categoría actual y las anteriores. 5. Se
calcula la frecuencia relativa o porcentaje (hi=fi/n) 6. Se calcula Hi, sumando los
hi de la categoría actual y las anteriores.
37. 35. Tabla para datos cuantitativos discretos TABLA DE FRECUENCIA DEL
NUMERO DE ABDOMINALES DEL GRUPO EVALUADO Xi Valor observado
fi (Frecuenci a Absoluta) hi (Frecuencia Relativa) Fi (Frecuencia Absoluta
Acumulada) Hi (Frecuencia Relativa Acumulada) 15 2 0.1 2 0.1 16 4 0.2 6 0.3 17
5 0.25 11 0.55 18 4 0.2 15 0.75 19 2 0.1 17 0.85 20 2 0.1 19 0.95 21 1 0.05 20 1.00
Total 20 1.0 Interpretación
38. 36. Diagrama de Barras En el Eje horizontal se representan los valores que
asume la variable y en el eje horizontal su frecuencia absoluta o relativa Puede
ser la frecuencia absoluta o relativa (%) Por ser una variable discreta las barras
no deben juntarse Gráficos para variables cuantitativas de datos discretos
39. 37. Que hacer cuando la variable es continua o cuando el rango de variación de
la variable discreta es moderadamente amplio? Solución Realizar Agrupaciones
Ejemplo: Tiempos de atención (en minutos) de pacientes en el servicio medico de
la END 13.1, 7.1, 14.8, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8, 22.3, 14.5, 17.1,
14.9, 12.0, 14.0, 18.4, 10.2, 15.8, 16.5, 15.0, 17.6, 4.2, 13.4, 21.2, 14.7, 13.8, 21.0,
14.3, 11.1, 18.9, 8.3, 16.6, 11.2, 20.2, 14.4, 13.5, 18.2, 12.4, 17.0, 26.7, 15.5, 22.0,
12.9, 17.9, 7.4, 18.0, 19.8, 16.0, 21.2.
40. 38. Tablas de distribución de frecuencias para datos agrupados Tabla de
frecuencia de tiempos de atención de pacientes en el servicio medico de la END
Intervalos de Clase Xi ni (Frecuenc ia Absoluta) hi (Frecuencia Relativa) Ni
(Frecuencia Absoluta Acumulada) Hi (Frecuencia Relativa Acumulada) 4.2 –
7.94 6.075 4 0.08 4 0.08 7.95 – 11.69 9.825 5 0.10 9 0.18 11.7 – 15.44 13.575 16
0.32 25 0.50 15.45 – 19.19 17.325 16 0.32 41 0.82 19.2 – 22.94 21.075 8 0.16 49
0.98 22.95 – 26.69 24.825 1 0.02 50 1.00 50 1.00
41. 39. Como se elabora:  Para establecer las categorías se aplican las siguientes
formulas (Regla de Sturges): 1. R= Rango= Valor máximo – Valor mínimo 2.
NC= Numero de categorías= 1+(3,33*log(n)) 3. A= Amplitud de las categorías=
R/NC 4. Prueba= (A*NC)+Vmin
42. 40. Ejemplo:  A un grupo de niños que pertenecen a un club deportivo de
baloncesto, se les aplico el test de 600 metros con el propósito de establecer la
resistencia de ellas. Se obtuvieron los siguientes resultados:  Construya una
tabla de distribución de frecuencia y gráfica de estos datos 2,3 2,3 2,4 2,4 2,5 2,6
3,1 3,2 3,2 3,2 3,3 3,3 3,4 3,4 3,5 3,5 3,5 3,6 3,6 4,1 4,2 4,4 5,1 5,1
43. 41. Pasos: 1. Ordeno los datos de menor a mayor 2. Busco el valor mínimo,
máximo y número de datos 3. Aplico las formulas 4. Realizo la prueba para
determinar si la amplitud hallada sirve (el resultado debe superar el valor
máximo) o debo aumentarla 5. Construyo la tabla
44. 42.  Valor máximo= 5,1  Valor mínimo= 2,3  Número de datos= 24  Rango=
Vmax – Vmin= 5,1 - 2,3= 2,8  NC= 1+ (3,33*log(24)= 5,6 ~ 6  A= R/NC= 2,8/6
= 0,467 ~ 0,5  Prueba= (0,5*6)+2,3 =5,3 2,3 2,3 2,4 2,4 2,5 2,6 3,1 3,2 3,2 3,2 3,3
3,3 3,4 3,4 3,5 3,5 3,5 3,6 3,6 4,1 4,2 4,4 5,1 5,1 Como es superior a 5,1 puedo
construir la tabla con: Número de categorías = 6 Amplitud = 0,5
45. 43. N° Límite inferior Límite superior Frecuencia 1 2 3,2 3 3,3 3,7 4 3,8 4,2 5 4,3
4,7 6 4,8 5,2 5,3 2,3 2,3 2,4 2,4 2,5 2,6 3,1 3,2 3,2 3,2 3,3 3,3 3,4 3,4 3,5 3,5 3,5 3,6
3,6 4,1 4,2 4,4 5,1 5,1 NC= 6 A= 0,5 2,3 Valor mínimo 2,8Valor anterior+ A 2,7
Li+1-0,1
46. 44. N° Límite inferior Límite superior Frecuencia Porcentaje 1 2,3 2,7 2 2,8 3,2 4
16,7 3 3,3 3,7 9 37,5 4 3,8 4,2 2 8,3 5 4,3 4,7 1 4,2 6 4,8 5,2 2 8,3 5,3 100 2,3 2,3
2,4 2,4 2,5 2,6 3,1 3,2 3,2 3,2 3,3 3,3 3,4 3,4 3,5 3,5 3,5 3,6 3,6 4,1 4,2 4,4 5,1 5,1 6
[2,3-2,7]={2,3 2,3 2,4 2,4 2,5 2,6} =6 24 Suma de toda la columna. Debe coincidir
con n 25 hi= fi/n= 6/24*100=25
47. 45. N° Límite inferior Límite superio r Frecuenci a (F) Porcentaj e (H) Frecuenci
a acumulad a (F) Porcentaj e acumulad o (H) 1 2,3 2,7 6 25 6 25 2 2,8 3,2 4 16,7
10 41,7 3 3,3 3,7 9 37,5 19 79,2 4 3,8 4,2 2 8,3 21 87,5 5 4,3 4,7 1 4,2 22 91,7 6 4,8
5,2 2 8,3 24 100 5,3 24 100 Interpretaciones:
48. 46. Gráficos para datos cuantitativos agrupados Histograma de Frecuencias
(Variable agrupada) Las clases se indican en el eje horizontal y su frecuencias
(relativas o absolutas) sobre el eje vertical La barras se juntan por continuidad de
la variable
49. 47.  Polígono de frecuencias (Es la unión de los puntos medios del histograma)
 Ojiva (Frecuencias absolutas o relativas acumuladas en una variable continua)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 6.08 9.83 13.58 17.33 21.08 24.83 Porcentaje
Tiempo en minutos (Marca de clase) 0 2 4 6 8 10 12 14 16 18 6.08 9.83 13.58
17.33 21.08 24.83 Numerodepersonas(fi) Tiempo en minutos (Marca de clase)
50. 48. Otros gráficos útiles Cartogramas: Datos asociados a una ubicación
geográfica 18 1920 2 8 10 16 15 14 21 7 11 5 4 6 12 1 9 3 13 17 22 SANTIAGO
DECALI < 1 1 < 41 41 < 61 61 < 81 81 < 101 101 < 201 Norte 18 1920 2 8 10 16
15 14 21 7 11 5 4 6 12 1 9 3 13 17 22 SANTIAGO DECALI < 1 1 < 41 41 < 61 61
< 81 81 < 101 101 < 201 Norte 2002 2007 Fuente: Análisis Espacial de los
Homicidios en la Ciudad de Cali. Cisalva. Trabajo de Grado en Estadística
51. 49. Mediciones Indexadas en el Tiempo (Datos Longitudinales)             
 120 110 105 85 87 102 99 103 100 104 105 76 74 72 1994 1995 1996 1997 1998
1999 2000 2001 2002 2003 2004 2005 2006 2007 0 50 100 150 Tasas
Fuente:.Comite de v igilancia de mortalidad por causa externa N = 10955 Tasas
de Homicidio en la Ciudad de Cali Grafico de Linea: Evolución de la
característica en el tiempo • Líneas (Aplicado cuando tengo datos medidos en el
tiempo)
52. 50. TEMA 3: Estadísticos descriptivos: Medidas de tendencia central, posición y
dispersión.
53. 51. Medidas de tendencia central “Calculo numérico capaz de resumir en un
valor rasgos importantes en el comportamiento de un conjunto de datos, tal como
su centramiento. De tal manera que con base en ellos sea posible ejecutar
acciones o tomar decisiones” Cualitativas Cuantitativas Nominal Ordinal
Discreta y continua Moda Moda Moda Mediana Mediana Promedio (media)
54. 52. Medidas de tendencia central Moda: Dato de mayor frecuencia en los
resultados observados Mediana: Dato que supera al 50% de los datos Media:
Valor central del conjunto de datos Media = Suma de todos los datos Número de
datos Mediana = n + 1 2
55. 53. Datos: 2, 4, 7, 7, 10 Ejemplo Moda: Dato de mayor frecuencia en los
resultados observados = 7 Media: Valor central del conjunto de datos Media =
Suma de todos los datos Número de datos 30 5 = = 6 Mediana: Dato que supera al
50% de los datos Mediana = n + 1 2 = 5 + 1 2 = 6 2 = 3 Dato 3 = 7 Mediana = 7
56. 54. INDICADORES DE POSICIÓN Permiten hacerse una idea acerca de la
forma de la distribución una variable y su dispersión. En ocasiones sirven como
criterio de selección.  Estatura para la edad  Peso para la edad  Peso para la
talla  IMC  Circunferencia de brazo  Pliegue subescapular  Pliegue del
tríceps  Perímetro del bíceps  Perímetro cefálico  Las medidas de posición
nutricionales usadas en Deporte:
57. 55. Medidas de Posición Cuartiles: Dividen la distribución en cuatro partes
porcentualmente iguales, Q1 (25%), Q2 (50%), Q3 (75%) Percentiles: Dividen la
distribución en 100 partes porcentualmente iguales, P1, P2, P3,………., P100
Deciles: Dividen la distribución en 10 partes porcentualmente iguales, d1, d2,
d3,…..d9, d10. Rango Intercuartilico: Se define como la diferencia entre el 3er y
1er cuartil R IQ = Q3 – Q1 Contiene al 50% de las Observaciones
58. 56. >85 Sobrepes o >97 Obesidad <5 Bajo peso 97 95 90 85 75 50 25 10 5 3 El
IMC no es útil en deportistas y en menores de 2 años, en este último se
recomienda usar talla/edad
59. 57. 70 75 80 85 90 95 100 105 110 115 120 125 130 135 140 145 150 155 160 165
170 175 180 185 190 195 200 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Estatura(cm) Edad(años) Estatura-por-Edad Percentiles Data From Designed by
Ernest M. Post, MD. Completado por  Para el Deportivo Cali el dato ideal es
tener jugadores por encima del P70 en velocidad, resistencia, fuerza y
antropometría (excepto el peso e IMC alrededor de 50)  Si el área de brazo esta
por debajo del P15 esta en riesgo de desnutrición
60. 58. INDICADORES DE DISPERSION Pregunta: Un Guía turístico le dice a
usted que cierto río tiene una profundidad promedio de 1.40 mts, con está
información ¿cruzaría usted el río?  Los Indicadores de Tendencias central no
trabajan solos, deben apoyarse con alguna medida de dispersión  Un Índice de
dispersión pequeño, indica baja variabilidad, por ende el valor de tendencia
central será mas confiable.  Un índice de dispersión grande, indica gran
variabilidad, esto implica que el Indicador de tendencia central sea poco
confiable  Por que se estudia la dispersión?
61. 59. 1 )( 1 2 2     n Xx S n i i 15 38   5.9 2 SS  5.9 08.3 *100% S CV
x  100*)6/08.3( 100*51.0 %51 Varianza: Desviación Estándar: Coeficiente
de Variación: Medidas de Dispersión Datos: 2, 4, 7, 7, 10