Está en la página 1de 24

TEMA 2. Estadística Descriptiva

Nota para el profesor: se sugiere que los temas contengan: (Contenido, objetos y materiales multimedia, actividades y por último, algún examen o quiz)

Introducción al tema

TEMA 2. Estadística Descriptiva Nota para el profesor: se sugiere que los temas contengan: (Contenido, objetos

CONTENIDO:

 

En este tema se estudia el problema de cómo describir los datos de manera que se puedan interpretar ya sea a través de estadísticos, gráficos o tablas. La mayor parte de la información estadística en artículos de divulgación (periódicos y revistas) consiste en datos que se presentan en una forma fácil de comprender al lector.

No usa

 

Usa

   

Fecha de entrega:

Nota para el profesor: llenar el recuadro con la Introducción al tema.

  • 1.1 Tipos de variables

CONTENIDO:

Una variable es una función que asocia a cada elemento de la población la medición de una característica, particularmente de la característica que se desea observar. Las variables son características o propiedades de sujetos u objetos que pueden tomar diferentes valores. Es importante seleccionar las variables relevantes del fenómeno que se estudia. Reconocer el papel que juega cada variable en la investigación. Decidir qué escala de medición conviene para registrar la variable.

Cualitativas o categóricas

Si sus valores no se pueden asociar naturalmente a un número (no se pueden hacer operaciones

algebraicas con ellos) es decir, que indican categorías o son etiquetas alfanuméricas o "nombres". Nominales: Si sus valores no se pueden ordenar y además son mutuamente excluyentes entre sí, por ejemplo: sexo, grupo sanguíneo, religión, nacionalidad, fumar (Si, No) Ordinales: Si sus valores se pueden ordenar, por ejemplo: mejoría a un tratamiento, grado de satisfacción del turista, intensidad del dolor.

Cuantitativas o numéricas Si sus valores son numéricos ( tiene sentido hacer operaciones algebraicas con ellos) Discretas: Si toma valores enteros, por ejemplo: número de hijos, número de cigarros, edad,

escolaridad, número de visitantes internacionales. Continuas: Si entre dos valores existen posibles infinitos valores intermedios, por ejemplo: la altura, ingreso familiar, dosis de medicamento administrativo, ingresos por divisas internacionales.

Una variable categórica incluye cuantitativos.

datos categóricos y

una variable cuantitativa comprende datos

El análisis estadístico apropiado para una variable en particular depende de que ésta sea categórica o cuantitativa. Si la variable es cualitativa o categórica, el análisis estadístico es muy limitado. Los datos categóricos se resumen mediante el conteo del número de observaciones de cada categoría o por medio del cálculo de la proporción de las observaciones en cada categoría. Es posible asignar

“etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos, por

ejemplo:

Género ( Cualitativa: Códicos arbitrarios) 1: Hombre 2: Mujer Raza ( Cualitativa: Códigos arbitrarios) 1: Blanca 2: Negra Felicidad Ordinal: Respetar un orden al codificar. 1: Muy feliz 2: Bastante feliz 3: No demasiado feliz

Esta asignación de valores númericos a variables categóricas es muy cuestionable debido a la subjetividad que lleva implícita. Sin embargo en la actualidad se hacen grandes esfuerzos por realizar imputaciones de este tipo a fin de poder interpretar de mejor manera la realidad económica. Por ejemplo la variable categórica de satisfacción del turista contiene una amplia subjetividad de respuesta para cada turista, por lo que se ha sugerido que sea expresada en escalas de Likert. Otro ejemplo consiste en asignar variables dummy a categorías que impliquen dos resultados (sí y no) las cuales son muy utilizadas en econometría y otras áreas científicas.

En contraste, las variables cuantitativas sí producen resultados aritméticos y con ellos es posible aplicar las técnicas y herramientas estadísticas.

De acuerdo con el papel que pueda desempeñar una variable también se puede clasificar como dependiente e independiente:

Independiente

Se reconoce como la causa. Es aquella que es controlada en forma sistemática por el investigador o analista. Se le llama así

debido a que sus niveles son controlados sin importar los cambios en las demás variables.

Dependiente

Se reconoce como el efecto. Es la variable medida por un investigador para determinar el efecto de la variable independiente. Se le llama así pues se supone que su comportamiento dependerá del efecto que ejerza en ella la variable independiente.

Observaciones:

Dependiente Se reconoce como el efecto. Es la variable medida por un investigador para determinar el
Dependiente Se reconoce como el efecto. Es la variable medida por un investigador para determinar el

1.1 Actividad

Escriba un ejemplo de cuatro tipos de variables que describan al sector turístico. Ejemplifica dos variables dependientes que sean efecto de una variable independiente.

CONTENIDO:
CONTENIDO:
CONTENIDO: Grupal Comunicación (blog, foro, wiki, diario, chat, aula virtual, grupos de trabajo) SafeAssigment Tipo de
Grupal Comunicación (blog, foro, wiki, diario, chat, aula virtual, grupos de trabajo) SafeAssigment Tipo de actividad:
Grupal
Comunicación (blog, foro, wiki,
diario, chat, aula virtual, grupos de
trabajo)
SafeAssigment
Tipo de actividad:
Individual
Herramienta de Bb:
Actividad o
¿Cuándo lo entrego?
Recomendaciones: Para identificar variables dependientes e independientes piensa en un problema del
sector turístico.
¿Qué debo hacer? Identificar variables cualitativas y cuantitativas del sector turístico de tu país.
¿Cómo lo entrego? En una hoja en Word presenta los ejemplos.

Archivo adjunto (opcional)

Nombre de archivo:
Nombre de archivo:

Nota para el profesor: llenar el recuadro por cada actividad planeada para el tema. Es importante cuestionarse sobre la función pedagógica de cada herramienta, sus lineamientos, retroalimentación y calificación

Observaciones:

Nota para el profesor: llenar el recuadro por cada actividad planeada para el tema. Es importante
Nota para el profesor: llenar el recuadro por cada actividad planeada para el tema. Es importante

1.2 Recolección, representación y conjunto de datos.

CONTENIDO:

Todo estudio estadístico debe estar referido a un conjunto o colección de personas y/o cosas. Este conjunto lo denominamos población. Las personas o cosas que forman parte de la población se denominan elementos; a cada elemento se le puede designar una variable que contiene datos.

Estos datos pueden ser clasificados en cualitativos y cuantitativos y se organizan bajo el siguiente algoritmo:

  • 1. Recolección, organización y síntesis de los datos: recolección de datos referidos a la situación

que se desea investigar. Estos datos brindan información sobre las características de los individuos pertenecientes a la población objeto de estudio.

  • 2. Tabulación y agrupamiento de datos: los datos recopilados son convenientemente

ordenados, clasificados y tabulados, es decir, dispuestos en tablas que facilitan la lectura.

  • 3. Representación gráfica: los gráficos permiten una interpretación simple y rápida de los

hechos y además, pueden conducir a la elección de los métodos más adecuados para el análisis

de los datos.

  • 4. Medición de datos (obtención de medidas, coeficientes, estadísticos).

El primer paso en el análisis de datos, una vez introducidos los mismos, es realizar un análisis descriptivo de la muestra. Este análisis permite controlar la presencia de posibles errores en la fase de introducción de los datos, es decir, detectaremos con él valores fuera de rango (por ejemplo, un peso de 700kg o una edad de 200 años son claramente datos extraños), o la presencia de valores perdidos. Este análisis inicial también proporciona una idea de la forma que tienen los datos: su posible distribución de probabilidad con sus parámetros de centralización; media, mediana y moda; así como sus parámetros de dispersión; varianza, desviación típica, etc.

La recolección de datos se puede realizar a través de fuentes primarias (de campo) o bien de fuentes secundarias.

Fuentes primarias:

Para lograr el acopio de información, la encuesta suele ser una alternativa. Se basa en la realización de ciertas preguntas encaminadas a obtener determinados datos. La encuesta es una técnica generalizada a partir de un número representativo de entrevistas y cuestionarios por lo que requiere una muestra de las personas a entrevistar. El instrumento que se utiliza por lo general es un cuestionario. El cuestionario es una serie de preguntas y respuestas dirigidas a obtener información precisa en torno a una variable específica que posean los elementos.

Las preguntas pueden ser:

Preguntas cerradas: que consiste en proporcionar al sujeto observado una serie de opciones para que escoja una como respuesta. Ventaja: Pueden ser procesadas más fácilmente y su codificación se facilita Desventaja: Si están mal diseñadas las opciones, el sujeto encuestado no encontrará la opción que él desearía y la información se viciaría.

Es importante realizar un estudio piloto y así obtener las posibles opciones para las respuestas

manera Preguntas abiertas: que consisten en dejar totalmente libre al sujeto observado para expresarse, según convenga. Ventaja: Proporciona una mayor riqueza en las respuestas; mas, por lo mismo, puede llegar a complicar el proceso de tratamiento y codificación de la información. Una posible manera de manipular las preguntas abiertas es llevando a cabo un proceso de categorización, el cual consiste en estudiar el total de respuestas abiertas obtenidas y clasificarlas en categorías de tal forma que respuestas semejantes entre sí queden en la misma categoría.

una

de

más

confiable.

Fuentes secundarias:

Son documentos que compilan la información obtenida en las fuentes primarias. Existen diversos organismos que generan información y la publican en documentos estadísticos. En el caso del turismo algunas de las fuentes importantes para las estadísticas son:

Organismos nacionales:

Instituto Nacional de Estadística y Geografía (INEGI) La Secretaría de Turismo (Sector) El Banco de Méixco (Banxico). Organismo internacionales:

Organización Mundial de Turismo. Eurostat (Principal organismo oficial productor de estadísticas en Europa).

Observaciones: ) 1.3 Instrumentos y técnicas del análisis descriptivo CONTENIDO: Las técnicas descriptivas utilizan los datos

Observaciones:

)

Observaciones: ) 1.3 Instrumentos y técnicas del análisis descriptivo CONTENIDO: Las técnicas descriptivas utilizan los datos
Observaciones: ) 1.3 Instrumentos y técnicas del análisis descriptivo CONTENIDO: Las técnicas descriptivas utilizan los datos

1.3 Instrumentos y técnicas del análisis descriptivo

CONTENIDO:

Las técnicas descriptivas utilizan los datos observados para realizar un resumen de la información que contienen. Este resumen puede ser exploratorio en una primera fase y luego descriptivo en la segunda fase. Estas dos fases preparan la información para las técnicas inferenciales y construcción de modelos.

 

En el análisis exploratorio se parte de un desconocimiento total y se pretende obtener una primera información: qué tipo de variables son las de interés, cuáles son sus rangos de valores, como obtener la información, como es la población, etc.

En el análisis descriptivo ya se cuenta con la información procedente de los datos y se resume en forma gráfica y analítica.

No son excluyentes ambas fases y en la mayoría de los casos se realizan de forma simultánea en un proceso cíclico de una a otra utilizando técnicas sencillas. Dependiendo del tipo de información que tengamos aplicaremos unas técnicas u otras.

Técnicas gráficas: Su fin es representar de forma gráfica la información contenida en los datos de cada variable.

Técnicas analíticas: Su fin es resumir en forma de "parámetros o estadísticos" los valores de toda la información que presentan las variables contenida en los datos.

Una clasificación adicional de las técnicas consiste en unidimensionales y multidimensionales. Las primeras describen la información variable por variable y las multidimensionales utilizan la información de varias variables a la vez. Análogamente las gráficas dependen del tipo de variable y de una u otra técnica.

Dentro de las técnicas multidimensionales para dos variables caben destacar:

  • Análisis de Correlación. Se utiliza para analizar la asociación entre variables cuantitativas.

  • Medidas de Asociación. Se utilizan para analizar la asociación entre variables cualitativas. Podemos distinguir diferentes coeficientes teniendo en cuenta grandes muestras o pequeñas muestras.

Para poder representar los datos existen las siguientes escalas de medición Escalas nominales:

Representa el nivel mínimo de medición Se utiliza con frecuencia para variables de naturaleza cualitativa Ejemplos: color de los ojos, marcas de zapatos deportivos, raza, nacionalidad, tipos de fruta, días de la semana, creencia religiosa, La medición con una escala nominal equivale a clasificar los objetos en categorías mutuamente excluyentes. La equivalencia es una propiedad fundamental de las escalas nominales: todos los miembros de una clase dada son iguales desde el punto de vista de la variable de clasificación. El conteo es la principal operación que se realiza. Estas frecuencias nos permiten comparar el número de elementos dentro de cada categoría. Escalas ordinales:

Este nivel es relativamente bajo hablando de la propiedad de magnitud. Ordenamos los objetos medidos según si poseen más, menos o la misma cantidad de la variable medida. Permite saber si A > B, A = B o A < B. Ejemplos: saber si un individuo es migrante nacional o internacional. Escalas de intervalos Representa un nivel superior de medición. Posee las propiedades de la escala ordinal y tiene intervalos iguales entre las unidades adyacentes. El cero de la escala no indica ausencia de atributo o característica, es arbitrario, relativo o inventado. Escalas de razón o proporción Tiene todas las características de las de intervalo, pero posee un cero absoluto por lo que se pueden usar proporciones. El cero sugiere la ausencia de atributo o característica.

A continuación se desarrollan algunas de las técnicas del análisis descriptivo.

I.

Tablas

Permiten el ordenamiento eficiente de los datos. Pueden contener intervalos o puntuaciones. La información que se puede presentar en una tabla puede ser la evolución de un fenómeno en el tiempo o bien la comparación de datos en un tiempo de terminado.

II.

Tablas de distribución de frecuencias

Es una técnica estadística para organizar datos en clases y cada una se les aplica la frecuencia correspondiente. Sirve para visualizar y organizar los datos. Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos números se denominan frecuencias.

La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la variable X i , se representa por n i . La frecuencia relativa: La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. Se denota por f i .

II. Tablas de distribución de frecuencias Es una técnica estadística para organizar datos en clases y

Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en términos de tantos por ciento o porcentajes , por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por p i.

II. Tablas de distribución de frecuencias Es una técnica estadística para organizar datos en clases y

La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y se representa por N i . En la frecuencia relativa acumulada, al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por F i .

II. Tablas de distribución de frecuencias Es una técnica estadística para organizar datos en clases y

Ejemplo:

Sean 20 alumnos de una clase de estad´sitica con las siguientes edades de cada uno: 32, 33, 30, 25, 25, 30, 48, 28, 24, 29, 45, 25, 28, 22, 34, 35, 35, 22, 23 y 34; su tabla de frecuencias correspondiente se construye de la siguiente forma:

Asumimos que el tamaña de la muestra N=20.

Tabla de frecuencias de las edades de los alumnos de la clase de estadística

X

i

n i

f i

P i

N i

F i

   
  • 2 2/20=.10

  • 22 .10*100=10%

2

2/20=.10

   
  • 1 1/20=.05

  • 23 .05*100=5%

2+1=3

3/20=.15

   
  • 1 1/20=.05

  • 24 .05*100=5%

3+1=4

4/20=.20

   
  • 3 3/20=.15

  • 25 .15*100=15%

4+3=7

7/20=.35

   
  • 2 2/20=.10

  • 28 .10*100=10%

7+2=9

9/20=.45

   
  • 1 1/20=.05

  • 29 .05*100=5%

9+1=10

10/20=.50

   
  • 2 2/20=.10

  • 30 .10*100=10%

10+2=12

12/20=.60

   
  • 1 1/20=.05

  • 32 .05*100=5%

12+1=13

13/20=.65

   
  • 1 1/20=.05

  • 33 .05*100=5%

13+1=14

14/20=.70

   
  • 2 2/20=.10

  • 34 .10*100=10%

14+2=16

16/20=.80

   
  • 2 2/20=.10

  • 35 .10*100=10%

16+2=18

18/20=.90

   
  • 1 1/20=.05

  • 45 .05*100=5%

18+1=19

19/20=.95

   
  • 1 1/20=.05

  • 48 .05*100=5%

19+1=20

20/20=1.00

Ejemplo 2:

Realice una tabla de frecuencias para una muestra de 200 personas (N=200) cuyos

ingresos van de 0 a más de 9,000 pesos.

Cuando se trata de una variable continua con un número de datos muy grande, es aconsejable agrupar los datos en clases. Los valores de la variable estadística se deben agrupar en intervalos de clase contiguos y elegidos convenientemente para no perder información. No existe un criterio claro de cuál debe ser el número de intervalos que debemos escoger, Norcliffe (1977) establece que el número de clases debe ser, aproximadamente igual a la raíz cuadrada positiva del número de datos. Normalmente, el número de intervalos de clase se suele fijar entre 5 y 15 y de tal manera que en cada clase se tengan, al menos, 5 observaciones. De todas formas el investigador conoce las condiciones especificas del problema estadístico objeto de estudio (se tomarán tantos intervalos como sean necesarios para cubrir todo el recorrido de la variable).

Tabla de frecuencias de los ingresos de una muestra de 200 personas

X

i

n i

f i

P i

N i

F i

0-1500

100

 
  • 0.50 50%

100

0.50

1501-3000

 
  • 40 20%

  • 0.20 140

 

0.70

3001-5000

 
  • 30 15%

  • 0.15 170

 

0.85

5001-9000

 
  • 20 10%

  • 0.10 190

 

0.95

9000 o más

 
  • 10 5%

  • 0.05 200

 

1.00

III.

Gráficas

El aspecto gráfico se revisa de forma más detallada en el subtema 1.4

Tabla de frecuencias de los ingresos de una muestra de 200 personas X i n i

1.2 Actividad

)

Con los siguientes datos calcula la frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa acumulada:

Intervalos

n i

f i

P i

N i

F i

55-59

10

       

60-64

28

       

65-69

50

       

70-74

35

       

75-79

26

       

80-84

14

       

Total

N=163

       
CONTENIDO:
CONTENIDO:

Tipo de actividad:

Individual

 

Grupal

 
 

Actividad o

 

Comunicación (blog, foro, wiki,

 

Herramienta de Bb:

SafeAssigment

diario, chat, aula virtual, grupos de trabajo)

¿Qué debo hacer? Hacer los cálculos en el interior de los recuadros.

Recomendaciones: Verifica las ecuaciones y aplica los cálculos del ejemplo 1.

¿Cómo lo entrego? En una hoja de excel y envíala por correo.

¿Cuándo lo entrego?

Archivo adjunto (opcional)

Nombre de archivo:

¿Qué debo hacer? Hacer los cálculos en el interior de los recuadros. Recomendaciones: Verifica las ecuaciones

1.4 Representación gráfica

CONTENIDO:

Es la representación gráfica de los datos de una muestra. Tiene dos ejes X, Y. Los datos de la escala suelen ponerse en X y algunas de sus cualidades, como la frecuencia, en Y. Es muy importante elegir las unidades adecuadas para los ejes.

Histograma

Es una representación grafica de una distribución de frecuencias por medio de rectángulos. Consiste en una escala horizontal para valores de los datos que se están representando y una escala vertical con las frecuencias de dichos datos. El histograma es especialmente útil cuando se tiene un amplio número de datos que es preciso organizar.

  • Histograma de frecuencia absoluta.

  • Histograma de frecuencia relativa.

  • Histograma de frecuencia relativa porcentual.

  • Histograma de frecuencia relativa acumulada.

Ejemplo:

CONTENIDO: Es la representación gráfica de los datos de una muestra. Tiene dos ejes X, Y.

Polígono de Frecuencia:

Es una representación grafica de la distribución de frecuencia que resulta esencialmente equivalente al histograma y se obtiene uniendo mediante segmentos, los centros de las bases superiores de los rectángulos del histograma. Por ejemplo:

Polígono de Frecuencia: Es una representación grafica de la distribución de frecuencia que resulta esencialmente equivalente

Ojiva:

Una gráfica de distribución de frecuencias acumuladas es llamada una ojiva. Es una grafica similar al polígono de frecuencias, pero esta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que estas, existen las ojivas mayor que y menor que. Se

trazan los límites reales superiores contra las frecuencias acumuladas. Por ejemplo:

Polígono de Frecuencia: Es una representación grafica de la distribución de frecuencia que resulta esencialmente equivalente

Ojiva Porcentual ó Polígono de frecuencias relativas acumuladas

Se trazan los límites reales superiores contra las frecuencias relativas acumuladas.

Ojiva Porcentual ó Polígono de frecuencias relativas acumuladas Se trazan los límites reales superiores contra las

Diagrama Circular o pastel:

Es un grafico en el que cada valor o modalidad se le asigna un sector circular de área proporcional a la

frecuencia que representan. Cada sector circular equivale al porcentaje correspondiente al dato o grupo que representa. La unión de los sectores circulares forma el círculo y la suma de sus porcentajes es 100.

Existe un responsable del Programa de Pueblos Mágicos pero realiza algunas funciones. Existe un responsable del
Existe un responsable del Programa
de Pueblos Mágicos pero realiza
algunas funciones.
Existe un responsable del Programa
de Pueblos Mágicos pero no realiza
funciones.
No se reconoce un responsable del
Programa de Pueblos Mágicos.
11%
29%
49%
11%
Existe un responsable del Programa
de Pueblos Mágicos y realiza todas
las funciones.

Gráfico de Barras:

Se pueden utilizar para comparar dos grupos y se utilizan con promedios o bien con valores absolutos.

Hombres Mujeres Opinión Inglés 7.5 7.0 6.5 6.0 5.5
Hombres
Mujeres
Opinión
Inglés
7.5
7.0
6.5
6.0
5.5

Gráfico de líneas:

Por lo general se utilizan para ver la evolución temporal de las puntuaciones de uno o de varios grupos

Año 2000 2002 1994 1990 1996 1998 1992 1800 1600 1400 1200 1000 800 600 400
Año
2000
2002
1994
1990
1996
1998
1992
1800
1600
1400
1200
1000
800
600
400

Observaciones:

Gráfico de Barras: Se pueden utilizar para comparar dos grupos y se utilizan con promedios o
Gráfico de Barras: Se pueden utilizar para comparar dos grupos y se utilizan con promedios o

1.3 Actividad

Con los resultados de frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa acumulada, que estimaste en la Actividad 1.2, realiza las siguientes gráficas:

CONTENIDO:
CONTENIDO:
CONTENIDO: Comunicación (blog, foro, wiki, diario, chat, aula virtual, grupos de trabajo) Grupal ¿Cuándo lo entrego?
Comunicación (blog, foro, wiki, diario, chat, aula virtual, grupos de trabajo) Grupal ¿Cuándo lo entrego? SafeAssigment
Comunicación (blog, foro, wiki,
diario, chat, aula virtual, grupos de
trabajo)
Grupal
¿Cuándo lo entrego?
SafeAssigment
Actividad o
Herramienta de Bb:
Individual
Tipo de actividad:
¿Qué debo hacer? Caputra los datos en un a hoja de excel y gráfica.
Recomendaciones: Si conoces algún otro paquete estadístico que te sea más amigable, utilízalo.
¿Cómo lo entrego? En un archivo en excel y utiliza una hoja para cada gráfica.

Archivo adjunto (opcional)

Nombre de archivo:
Nombre de archivo:

Observaciones:

Con los resultados de frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa acumulada, que estimaste en
Con los resultados de frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa acumulada, que estimaste en

1.5 Medidas de tendencia central, de dispersión, correlación

CONTENIDO:

A menudo es necesario resumir los datos por medio de un número único. Las medidas estadísticas que describen el centro o punto medio de los datos se conocen como medidas de localización o de tendencia central.

Media: También llamado promedio o esperanza matemática, es un numero calculado a partir de los valores
Media:
También llamado promedio o esperanza matemática, es un numero calculado a partir de los valores de
un conjunto de elementos x 1 , x 2 ,…, x n , dividido entre el número total de elmentos. Si los datos son para
x
una muestrala media se denota por
; si son para una población, se denota por la letra griega .
n
x
x 
i  1
n
Ejemplo: Durante los 12 meses del año 2010, un hotel boutique recibió el siguiente número de grupos
en sus habitaciones: 4, 3, 5, 5, 9, 8, 9, 6, 3, 5, 8 y 7; obtenga la media:
4
  5
3
 
5
9
 
8
9
6
 
3
5
 
8
7
72
x 
 6
12
12
Si estos grupos constituyen una muestra (n) podemos estimar que el promedio de los hoteles boutique
(por ejemplo digamos que la población total (N) de hoteles boutique es de 3 en todo un destino
turístico), podemos estimar que el número de grupos m que visitan un hotel boutique es de 6 grupos
mensuales.
Para diferenciar entre las descripciones de poblaciones y las descripciones de muestras nos podemos
referir a la descripción de una población como un parámetro y a una descripción de una muestra como
un valor estadístico.
Media ponderada:
Cuando calculamos un promedio, se puede cometer un error al considerar que no todas las cantidades
tienen la mis importancia en relación con el fenómeno que se describe.
n
w * x
w x
*
w
*
x
............
w x
x 
1
1
2
2
n
n
i  1
w
n
w  w
.......
w
1
2
n
w
i  1
Ejemplo:
Supongamos que el porcentaje de tiempos compartidos en tres ciudades de California en 2011 es de:
Los Ángeles 40.3, Sacramento 56.4 y San José 62.1. La media de estos tres porcentajes sería 52.9. Sin
embargo las tres cifras no tienen la misma importancia porque existen considerables diferencias en el
tamaño de las tres ciudades.
(1135*40.3) 1135
(113*56.4)
(210*62.1)
65,154.7
xw 
113
210
1458
Del cual resulta 44.7 que es mucho menor al promedio de 52.9.
Mediana: La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada
Mediana:
La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente
o decreciente, el valor que divide en dos partes la muestra.
n 1
La mediana es el valor del
2
ésimo elemento.
Ejemplo:
Obtenga la mediana de grupos de visita al hotel boutique del ejemplo anterior.
Primero se ordenan los valores
3
3
4
5
5
5
6
7
8
8
9
9
Entonces puesto que n es par entonces se obtiene el promedio de los dos elementos centrales
5+6/2=5.5; por lo tanto la mediana es 5.5.
La media es sensible a la presencia de datos extremos. La mediana es muy útil cuando la distribución de
la variable es poco simétrica.

Moda:

La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única

medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima.

Ejemplo:

En nuestro ejemplo del hotel boutique el dato que se repite con mayor frecuencia es el 5, por lo tanto la moda es 5.

Moda: La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que

Después de haber analizado las medidas de tendencia central ahora veremos las medidas de dispersión de los datos:

Rango:

Es la medida de dispersión que indica la distancia entre el valor mayor y menor en un grupo de datos

Se denota como r.

Realmente no es una medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de calcular.

r Valor mayor Valor menor

Ejemplo:

En cada uno de los siguientes conjuntos de datos:

Conjunto A: 5, 20, 20, 20, 20, 20, 20, 20 Conjunto B: 5, 5, 5, 5, 20, 20, 20, 20 Conjunto C: 5, 7, 9, 12, 15, 17, 19, 20 El rango es de 20-5= 15, pero en cada caso la dispersión es por completo distinta.

Curtosis:

Es una medida de la forma. Así, las medidas de curtosis tratan de estudiar la proporción de la varianza

que se explica por la combinación de datos extremos respecto a la media en contraposición con datos poco alejados de la misma. Una mayor curtosis implica una mayor concentración de datos muy cerca de la media de la distribución coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la misma. Esto explica una forma de la distribución de frecuencias con colas muy elevadas y un con un centro muy apuntado.

La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana.

• Platicúrtica : Curtosis < 0 Mesocúrtica: Curtosis = 0 Leptocúrtica: Curtosis > 0 • •
Platicúrtica : Curtosis < 0
Mesocúrtica: Curtosis = 0
Leptocúrtica: Curtosis > 0

La varianza y la desviación estándar.

Si un conjunto de datos x 1 , x 2 , x 3 ,…. y x n , que constituye una muestra n, tiene la media

  • x , las diferencias

x

1

x , x x

2

,

x x

3

…y

x x

n

se conocen como las desviaciones de la media y esto sugiere que

podríamos usar un promedio (específicamente su media) como una medida de la variación de la muestra. Sin embargo, esto no resultaría a menos que todas las x’s, ya que algunas de las desviaciones

serán positivas y otras negativas por lo que la suma de las desviaciones

n

i 1

( x

  • i x )

siempre será cero.

Por lo que se define una medida de variación en términos de los valores absolutos de las desviaciones

 n ( x  x ) 2 de la media. La alternativa consiste en elevar
n
( x  x )
2
de la media. La alternativa consiste en elevar al cuadrado las desviaciones de la media,
i
i
 1
para eliminar los efectos negativos .
Entonces si promediamos las desviaciones cuadráticas de la media y obtenemos la raíz cuadrada de ese
resultado (para compensar el hecho de que las desviaciones se elevan al cuadrado) tenemos:
n
( x  x )
n  1
2
i
2
s 
i
 1
Observes que está dividido entre n-1, en lugar de n, que sería el promedio, esto se debe a que este
estadístico es muestral, pero si obtenemos las desviaciones cuadráticas de la media respecto a la
población se divide entre N.
n
(
x
 x
)
2
i
2
 
i
 1
N
Esta es la llamada desviación estándar ya sea muestral o poblacional. El cuadrado de la desviación
estándar se le llama varianza. La varianza cuantifica la dispersión de los datos con respecto a la media.
Se obtiene como la media de las desviaciones cuadráticas de cada dato con respecto a la media.
n
( x x )
2
i
s 
2
i
 1
n  1
Ejemplo:
En seis domingos consecutivos, un operador de hoteles recibió 9, 7, 11, 10, 13 y 7 llamadas de
reservación. Calcule la varianza y la desviación estándar.
Primero se calcula la media:
9
 
7
11
10  13  7
57
x 
 9.5
6
6
Y posteriormente se obtiene la desviación de la media elevada al cuadrado y su sumatoria para obtener
el promedio con n-1.
x
(x  x)
(x  x) 2
9
(9-9.5)
= -0.5
0.25
7
(7-9.5)
= -2.5
6.25
11
(11-9.5) = 1.5
2.25
10 (10-9.5) = 0.5 0.25 13 (13-9.5) = 3.5  12.25 7 (7-9.5) 0.0  =
10
(10-9.5) = 0.5
0.25
13
(13-9.5) = 3.5

12.25
7
(7-9.5)
0.0

= -2.5
6.25
27.50
Entonces dividiendo entre 6-1=5, obtenemos la varianza:
27.5
s 
2
 5.5
5
y sacando la raíz cuadrada tenemos:
s 
5.5  2.3
Correlación:
La correlación estadística determina la relación o dependencia que existe entre las dos variables que
intervienen en una distribución bidimensional. Es decir, determinar si los cambios en una de las
variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están
correlacionadas o que hay relación entre ellas.
La fórmula dela correlación es la siguiente:
S
2
r 
xy
S
 S
xx
yy
Donde:
1
S
x
2
(
x
)
2
xx
n
1
S
y
2
(
y
)
2
yy
n
S
1
xy
(
 
x
)(
y )
xy
n
Ejemplo:
Las siguientes son las calificaciones que 12 estudiantes de turismo obtuvieron en los exámenes finales
en matemáticas y en alimentos y bebidas; ¿habrá alguna relación entre ambas materias?. Calcule el
coeficiente de correlación.
Matemáticas Alimentos y bebidas 51 74 68 70 72 88 97 93 55 67 73 73
Matemáticas
Alimentos y bebidas
51
74
68
70
72
88
97
93
55
67
73
73
95
99
74
73
20
33
91
91
74
80
80
x
86
 850
x
2
 65230
y
 927
Calculando primero las sumas necesarias (S) obtenemos
y
,
,
,
2
 74883
xy  69453.
, y
Entonces substituyendo estos valores junto con n=12, en las
fórmulas S xx , S yy y S xy encontramos que:
1
S 
65230
(850)
2
5021.67
xx
12
1
S
74883
(927)
2
3272.25
yy
12
1
S
 69453
(850)(927)
3790.5
xy
12
3790.5
r 
 .935
(5021.67)(3272.25)
El coeficiente de correlación tiene un rango de -1 a 1 pasando por cero e indica el grado de relación de
las variables. En el ejemplo, el coeficiente de correlación de .935 indica que la relación entre que un
alumno apruebe matemáticas y alimentos y bebidas es muy alta y positiva.
Matemáticas Alimentos y bebidas 51 74 68 70 72 88 97 93 55 67 73 73

1.4 Actividad

Con los datos de la tabla siguiente calcula: La media, la mediana, la moda, el rango, la varianza y la desviación estándar.

Las calificaciones finales en Matemáticas de 80 estudiantes figura en la tabla adjunta
Las calificaciones finales en Matemáticas de 80 estudiantes figura en la tabla adjunta
Las calificaciones finales en Matemáticas de 80 estudiantes figura en la tabla adjunta

Las calificaciones finales en Matemáticas de 80 estudiantes figura en la tabla adjunta

       
                     
 

68

 
  • 84 75

 
  • 82 68

 
  • 90 62

88

 
  • 76 93

 

73

 
  • 79 88

 
  • 73 60

 
  • 93 71

59

 
  • 85 75

 

61

 
  • 65 75

 
  • 87 74

 
  • 62 95

78

 
  • 63 72

 

66

 
  • 78 82

 
  • 75 94

 
  • 77 69

74

 
  • 68 60

 

96

 
  • 78 89

 
  • 61 75

 
  • 95 60

79

 
  • 83 71

 

79

 
  • 62 67

 
  • 97 78

 
  • 85 76

65

 
  • 71 75

 

65

 
  • 80 73

 
  • 57 88

 
  • 78 62

76

 
  • 53 74

 

86

 
  • 67 73

 
  • 81 72

 
  • 63 76

75

 
  • 85 77

CONTENIDO:
CONTENIDO:
CONTENIDO: Grupal Comunicación (blog, foro, wiki, diario, chat, aula virtual, grupos de trabajo) Herramienta de Bb:
Grupal Comunicación (blog, foro, wiki, diario, chat, aula virtual, grupos de trabajo) Herramienta de Bb: Tipo
Grupal
Comunicación (blog, foro, wiki,
diario, chat, aula virtual, grupos de
trabajo)
Herramienta de Bb:
Tipo de actividad:
Individual
Actividad o
SafeAssigment
¿Cuándo lo entrego?
¿Qué debo hacer? Utiliza las fórmulas de cada una de las medidas de tendencia central y de dispersión
y aplicalas con los datos proporcionados.
Recomendaciones: Utiliza el paquete estadístico de excel y si conoces algún otro paquete estadístico
que te sea más amigable, utilízalo.
¿Cómo lo entrego? En un archivo en excel.

Archivo adjunto (opcional)

Nombre de archivo:
Nombre de archivo:
Con los datos de la tabla siguiente calcula: La media, la mediana, la moda, el rango,

Conclusión del tema

CONTENIDO:

La estadística descriptiva permite conocer el comportamiento de los datos de una variable. Para ello se utilizan diversas técnicas gráficas y de tablas para poder representar su variabilidad. El concepto de

variabilidad está instalado en el centro de la estadística como disciplina, ya que a través de sus herramientas podemos cuantificar, entender, y explicar las diferentes fuentes de variabilidad en el problema que nos hemos propuesto estudiar. Es por ello que las medidas de tendencia central y de dispersión son indispensables para medir la variabilidad de los datos de una variable. Nada que no tenga variabilidad podría ser de interés en este contexto, ya que el estudiar un solo objeto o un solo individuo sería suficiente para dar respuesta a todas nuestras preguntas.

Observaciones:

variabilidad está instalado en el centro de la estadística como disciplina, ya que a través de
variabilidad está instalado en el centro de la estadística como disciplina, ya que a través de

Bibliografía recomendada para el tema

CONTENIDO:

Ibarra, Mario. (1998). Estadística para la Administración Turística. México: Editorial Diana.

Freunn, John y Simon, Gary. (1994). Estadística Elemental. México: Prentice Hall Hispanoamaericana, S.A.

Observaciones:

variabilidad está instalado en el centro de la estadística como disciplina, ya que a través de