Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Objetivo Otorgar al Docente Autor una plantilla que especifique los espacios para
completar los apartados, secciones y subsecciones del material didáctico.
REGISTRO DE PRODUCCIÓN
ASIGNATURA Estadística
V01 23-11- Docente Autor Luis Fonseca Entrega de primer avance de Unidad 1 a
2017 Diseñador Instruccional.
En esta plantilla usted deberá completar la información de cada apartado, sección y subsección que
constituirá el material didáctico propiamente tal, en función de lo detallado en el Documento 02 -
Instructivo de elaboración de material didáctico.
Antes de entregar esta plantilla completa, se solicita aplicar el Documento 04 - Check list de
entregables del Docente Autor, actualizar los datos en el Registro de Producción de la página
anterior y cambiar la versión del documento.
Atte.
"Las cosas complejas y estadísticamente improbables, son por naturaleza más difíciles de
explicar que las cosas simples y estadísticamente probables."
Richard Dawkins, Científico Inglés, (1941)
Apartado I. Introducción
1. Qué aprenderé
A partir de Recolección
la
de
Cualitativos
Para obtener información Datos
Cuantitativos
Orden
Población
de una
A través de Tablas de Datos
Variables
Representación
Una rama de la
Estadística es Análisis
matemática que
de Tendencia Central
Estudia simultáneamente
Medidas Posición
Dispersión
Dos o más Variables
Estudia el Azar
realizando
aplicando
Inferencias
Teoría de Probabilidades
Regresión
Correlación
Estadística
Descriptiva
trabaja a partir de
F. Absoluta Barras
Muestra
F. Relativa Circular
Puntos
Población Variables
Cualitativa Cuantitativa
Medidas
2.1 Asignatura
La estadística es una ciencia que te permitirá en muchos casos determinar, explicar y entender
fenómenos científicos y sociales que ocurren en tu entorno, desde identificar los tipos de gastos
que tengo en el mes, hasta estudios avanzados en otras asignaturas, o tareas que tendrás en
diferentes futuros empleos, o incluso en una junta de amigos el fin de semana, es decir llevare
registros de los gastos, la cantidad de participantes y me permitirá adelantarme a otros sucesos
cotidianos de la vida donde ya tengo la información necesaria para enfrentarlos. Commented [C1]: En los comentarios enviados el 23/11se
sugirió lo siguiente: Explica cómo sirven los conocimientos de
estadística en futuros empleos o una junta de amigos, en términos
De este modo, al desarrollar esta asignatura lograrás obtener las herramientas y habilidades prácticos y cotidianos.
Área Personal y Social: Nadie te calificara o evaluara por dicho proceso, pero la
información y la aplicación de la estadística en ésta área, quizás es la más importante, ya
que es la que usamos a diario y permanentemente, estas sacando conclusiones y
evidenciando tu información a tu familia y amigos. Por ejemplo, cada mes que recibes tu Commented [C3]: En los comentarios enviados el 23/11 se
remuneración, conoces tu presupuesto, sabes cuanto puedes gastar, sabes que sugirió lo siguiente: Coloca un ejemplo.
2.2 Unidad
Con el desarrollo de la primera unidad, podrás aplicar diferentes técnicas de recolección de datos,
para luego ordenarlos, analizarlos y entregar conclusiones a partir de información de diversos
grupos o poblaciones de estudio. Todo lo anterior puede ser útil en investigaciones de otras
asignaturas, como así también materia de análisis en tu proceso de titulación.
Finalmente, esta unidad te permitirá entender y reconocer variables y datos que influyen en
procesos normales de tu vida cotidiana, como por ejemplo: gastos, alimentación, salud, hobbies
y proyectos personales o familiares.
Es por ello, que en el transcurso de la asignatura deberás realizar una investigación que involucre
todos los pasos de la estadística descriptiva, bidimensional y probabilidades. La investigación
deberá respetar los otros desafíos de cada unidad y deberá ser terminada y presentada al finalizar
la asignatura.
Como desafío te proponemos que, revisando los datos ya existentes, puedan entregar como
conclusión, cuáles son los números para ganarse el Kino o el Loto. Para ello, deberán revisar las
estadísticas de los sorteos anteriores y analizar los números de aquellos sorteos en un plazo de
tiempo definido individualmente, poniendo en juego las probabilidades, dando a conocer una
propuesta que permita ganarse el premio millonario en el futuro.
Es quizás algo que muchos sueñan, pero gracias a la estadística podríamos acortar camino y
ganarle a la suerte.
5. Cuál es el desafío de esta unidad Commented [C5]: En los comentarios enviados el 23/11 se
indicó lo siguiente: Redefinir el desafío de la unidad según el
desafío de la asignatura; seguir las indicaciones del instructivo para
La estadística descriptiva tiene como objetivo recopilar, organizar, procesar, analizar e interpretar la redacción.
datos con el fin de deducir las características de una población objetivo.
En relación con el desafío de la asignatura, resulta muy atractivo poder ganarse el ansiado premio
millonario, que sin duda puede cambiar tus vidas. En esta primera unidad, deberás obtener desde
fuentes primarias (páginas web o agencias de lotería) los resultados de los sorteos y elaborar una
tabla de frecuencia, para dar cuenta de los números con mayor cantidad de repeticiones.
Consideren cantidad de pares, impares, cantidad de números primos, la suma total de los
números, el número que tiene mayor frecuencia, menor frecuencia, etc.
Los datos tabulados en las tablas deberán ser presentados en un gráfico, considerando las
variables en cuestión, utilizando software adecuado para ello.
Finalmente, deberás calcular medidas de tendencia central (moda, mediana y media) de los datos
obtenidos, asi como también la desviación estándar para validar los datos.
Para muchas personas la estadística es una de las ramas matemática más desconocida como
ciencia académica, ya que su comprensión se precisa en el ámbito de la educación superior. En
esa etapa la población correspondiente a ese nivel educacional, la reconocen como una ciencia
que nos acompaña diariamente, sin necesidad muchas veces de tener estudios especializados en
el área.
Te queremos proponer que, con el transcurso de la asignatura, vayas entendiendo los procesos
estadísticos, los cuales recogen técnicas y conocimientos desde fuentes actualizadas y vigentes
con una visión contextualizada a las herramientas tecnológicas que hoy tenemos a mano y la
demanda de especialización en diversas áreas económicas. De este mismo modo, te queremos
invitar a conectar los nuevos aprendizajes adquiridos con los que ya conoces y sin querer has
necesitado en otras actividades de tu pasado.
La primera parte de esta asignatura te ayudará a plantear una investigación, reconociendo las
poblaciones, los datos, las variables, las técnicas de recolección y muestreo de información, el
orden y clasificación de la información, para dar a conocer e informar el comportamiento de los Commented [C6]: ¿Dar a conocer qué?
datos, mediante el análisis estadígrafos.
Suena un poco alejado todo aquello mencionado anteriormente, pero en algún momento hemos
necesitado de estos conceptos en actividades cotidianas desde la enseñanza primaria y
secundaria, inclusive en tareas y objetivos de la vida diaria, como, por ejemplo: comparar precios,
sacar promedio en las calificaciones, presupuesto financiero, gastos, rendimiento del
combustible, ranking musical, cotizaciones, la cantidad de likes por fotos en Facebook o YouTube,
entre otras.
En la segunda parte se presenta una rama más técnica que busca validar los datos considerando
más de una variable, y como incide una variable sobre otra, con regresiones y correlaciones de
autores validados por la ciencia estadística. Un área de la estadística un poco más alejado de la
realidad y la cotidianidad, pero a grandes rasgos, tiene la esencia de la comparación de diferentes
elementos en la ayuda para la toma de decisiones.
Finalmente, en la tercera unidad podrás poner conocer estadística basada en las probabilidades,
la cual está directamente relacionada con el análisis del azar y condiciones con experimentos
controlados. Al terminar esta unidad, estarás más cerca de ganar el Kino, el loto, o generar más
ganancias en mis apuestas en el casino.
Sin duda, ya te podrás haber dado cuenta que esta asignatura, tiene mucha conexión con diversas
actividades de la vida cotidiana, de las cuales siguen vigentes en tu vida, apoyando la toma de
decisiones o la facilidad que ofrece la información para obtener conclusiones favorables e
intencionadas en función de los datos.
2. Desarrollo
1. Concepto de Estadística.
La estadística es una ciencia quizás tan antigua como la escritura. Ha acompañado a diferentes
civilizaciones en procesos de gobierno, el comercio, las actividades agrícolas, la medicina, la
ingeniería, entre otros consumidores fieles de la estadística. A pesar de lo largo de su historia los
científicos y matemáticos no tienen una definición clara del origen de la estadística.
Con el paso de los siglos llegamos a la actualidad a varias definiciones, de las cuales se rescata y
podemos definir estadística como un conjunto de métodos para planear estudios y experimentos,
obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones
basadas en los datos. (TRIOLA, 2009)
información estadística acerca de los nacimientos y los decesos. Al trabajo de Graunt siguieron
estudios de tasas de mortalidad y de enfermedad, tamaño de poblaciones, ingresos y tasas de
desempleo. Los hogares, gobiernos y negocios se apoyan bastante en datos estadísticos para
dirigir sus acciones.
Ejemplo: se compilan datos cuidadosamente y con regularidad para establecer las tasas de
desempleo, las tasas de inflación, los índices del consumidor y las tasas de nacimiento y muerte,
y los líderes empresariales utilizan los datos resultantes para tomar decisiones que afectan las
futuras contrataciones, los niveles de producción y la expansión hacia nuevos mercados. (TRIOLA,
2009)
Por el contrario, existen otras mediciones estadísticas de carácter exclusivamente político. La CEP,
Adimark, Cadem, Cerc-Mori, son herramientas que permiten jugar con la realidad política,
levantando datos periódicamente en función de atacar a un sector y ocultar algunas veces
información para favorecer a otro sector político. Durante las últimas elecciones presidenciales
de nuestro país, se puso en manifiesto el juego estratégico del rol importante que juegan las
encuestas y sus sistemas predictivos, para condicionar la realidad del pueblo. Commented [C7]: ¿Esto tiene algún sustento o es una opinión?
Durante el desarrollo no se pueden incluir opiniones, sólo se
pueden incluir opiniones en las conclusiones.
Definiciones:
Censo: recolección de datos de cada elemento de una población.
Datos: son las informaciones o números recolectados que describen alguna
característica.
2.1. Población.
Ejemplo: algunos ejemplos de población son los habitantes de Chile en el año 2017; las personas
menores de edad en el año 2015; los estudiantes del Instituto Profesional La Araucana; las
reacciones de un nuevo medicamento; las diferencias entre los tratamientos de diferentes
formulaciones de insecticidas; entre otros.
Ejemplo:
Una vez identificada la población, debemos conocer al individuo que representa la muestra, que
es una parte generalmente pequeña, que se toma del conjunto total para analizarla y hacer
estudios que le permitan al investigador inferir o estimar las características de un problema.
2.1.1. Muestreo.
Los métodos estadísticos se rigen por los datos, y estos datos los obtenemos de la muestra
poblacional a través de un muestreo. Por lo regular obtenemos datos de dos fuentes distintas:
los estudios observacionales y los experimentos.
Definiciones:
Estudio observacional: estudio donde observamos y medimos características específicas,
aunque no intentamos manipular a los sujetos que estamos estudiando.
Experimento: Situación donde aplicamos algún tratamiento y luego procedemos a
observar sus efectos sobre los sujetos.
Sin tener conocimiento de cómo poder agrupar los datos, estaríamos cayendo en uno de los
errores básicos, que nos llevarían a agrupar datos inútiles que no servirían para ningún tipo de
estudio.
a) Muestreo aleatorio simple: (Fig. 3) todos los individuos tienen la misma probabilidad de
ser elegidos, Se selecciona una muestra de tamaño de n sujetos de manera que cada posible
muestra del mismo tamaño n tenga la misma posibilidad de ser elegida. Este procedimiento,
atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos
manejando es muy grande.
la muestra. Se selecciona un punto de partida (i), después se selecciona cada k-ésimo (por
ejemplo, cada quinto) elemento en la población.
b) Muestreo por conveniencia: (Fig. 8) consiste en elegir a los individuos que convienen al
investigador para la muestra. Esta conveniencia se produce porque al investigador le resulta
más cómodo examinar a estos sujetos, ya sea por cercanía geográfica, por ser sus amigos,
familiares etc.
c) Muestreo de bola de nieve: (Fig. 9) Se realiza sobre poblaciones donde no se conoce a sus
individuos o es muy dificultoso acceder a ellos. Se llama muestreo de bola de nieve porque
cada sujeto estudiado propone a otros, produciendo un efecto acumulativo parecido a una
bola de nieve.
La muestra debe ser representativa y lo más real a la población. Es similar a cuando necesitas un
examen médico y te piden una muestra de sangre y no el total de sangre que hay en tu cuerpo
para detectar alguna anomalía. En la estadística se mantiene este mismo principio, es decir, me
basta solo con una parte de la población para determinar conclusiones con los resultados
posteriores de los datos recogidos y así generalizar.
Ideológicamente se tiende a pensar que para que una muestra sea representativa de la población,
debe ser muy amplia, y eso no es así. Todo depende del total de la población y el grado de
confiabilidad que yo le dé a mi investigación. Se utiliza normalmente una confiabilidad de un 95%,
teniendo en cuenta un margen de error en los datos que se recogen.
Para determinar el tamaño de la muestra, es decir el número de individuos que debo tomar para
mi investigación, debes aplicar la siguiente formula:
𝑍 2 •𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑎𝑥 2 •𝑁
Formula: 𝑛 = (𝑒 2 •(𝑁−1))+𝑍2 •𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑎𝑥 2
n = tamaño de la muestra.
Z = Nivel de confianza, el cual puede ser:
90% = 1,645
95% = 1,96
97,5% = 2,24
99%= 2,576
Ejemplo: Los alumnos de la Universidad Tu Sueño acusan varios problemas de gestión, y el rector
preocupado de la situación levanta una encuesta institucional para identificar la raíz del
problema. El total de alumnos de la universidad es de 5.200. ¿Cuántos alumnos debo tomar como
muestra, con un nivel de confianza del 95% y un margen de error del 2%?
4.994,08
𝑛= = 1.642,78 ≈ 1.643
3,04
Para cada investigación o estudio de un fenómeno, debemos partir en conocer las técnicas y
consigo los instrumentos que me permitan recoger de manera más optima mis datos
investigativos. La recogida de datos debe suponer los siguientes puntos.
Definición: en las encuestas se obtienen los datos de los individuos previamente seleccionados,
a través de un formato escrito, tipo cuestionario, el cual puede ser desarrollado mediante llamado
telefónico, correo electrónico, en forma presencial y en una página web.
Definición: la observación es el proceso más complejo, pero a la vez más valioso a la hora de
obtener datos. Es complejo por la duración del proceso y a la vez la crítica a la falta de objetividad
del observador. Quizás algún observador no encuentre relevante algún aspecto que otro
observador si determine que sea necesario.
Cada técnica utilizada demanda un instrumento distinto, el cual puede enmarcarse en dos grupos:
Cuestionario.
Escalas.
a) Los cuestionarios, suponen una estructura de preguntas previamente planificadas y no
extensas, para que sea claro y sencillo responder.
Preguntas Cerradas: Son aquellas en que el encuestado tiene dos o más opciones de
respuestas previamente definidas. Pueden ser DICOTÓMICAS, es decir solo puede
responder SI o NO y las de selección múltiple, las que comúnmente se aplican en escalas
de tipo Lickert, las cuales se presentan en opciones (Muy de acuerdo, De Acuerdo,
Medianamente de acuerdo, En desacuerdo, Muy en desacuerdo)
Preguntas abiertas: Se presentan en manera muy sencilla y que sea comprensible por el
encuestado. ¿Qué opina usted…? ¿Qué cree usted…?
variable, debes tener en cuenta la población, la muestra, medio que lo harás y la técnica de
muestreo más adecuada.
El concepto de variable se denomina así, ya que siempre hay características que “varían” entre
uno y otro individuo de la población. Una variable debe cumplir con la condición de que debe ser
medible y observable en el tiempo, para así dejar registro de ello en el estudio o experimento.
Definición: las variables cualitativas son todas aquellas que expresan cualidades o características,
que excluyen la presencia de números, como el color de piel, comida favorita, lugar de vacaciones,
nacionalidad, etc.
Definición: las variables cuantitativas son todas aquellas variables que se pueden expresar en
números, como la edad, la talla, el número de hermanos, las calificaciones, la cantidad de goles,
el número de accidentes en una empresa, etc.
Las variables se clasifican según el tipo de dato que yo obtendré a la hora de realizar la recogida
de información de la muestra de la población.
3.1.1. Variables cualitativas: son aquellas variables que solo tienen atributos o características.
a) Variable cualitativa nominal: son aquellas variables que no expresan cantidad, pero
están ordenadas o jerarquizadas en un grupo.
b) Variable cualitativa ordinal: son aquellas variables que, si bien no expresan cantidad,
el común de la gente tiene a confundirse con la expresión numérica ordinal. Commented [C8]: Define “ordinal”.
Identifican una posición y ubicación absoluta con respecto a otro punto, es decir un
orden.
Definición: Ordinal: Nivel de medición de datos; caracteriza datos que podrían estar acomodados
en orden, pero las diferencias entre los valores de los datos no pueden determinarse o bien
carecen de sentido.
3.1.2. Variables cuantitativas: son aquellas variables cuyos atributos son expresados en números
o cantidades decimales.
Ejemplo: el número de hijos (0, 1, 2, 3…). ninguna persona puede tener un hijo y
medio.
3.2. Variables según su relación: Las variables se agrupan de acuerdo con el impacto que ejerza
una sobre la otra, de igual manera del grado de dependencia que se tenga para que esa relación
exista y se pueda explicar determinado suceso. Con ello, podemos controlar diversas situaciones
y fenómenos, los cuales algunos son más fáciles de atacar, ya que en los fenómenos sociales se
hace muy dificultoso hacerlo porque las personas están en constante cambio.
4. Gráficos Estadísticos.
Una herramienta poderosa a la hora de dar a conocer los resultados de los datos y precisar en
ese sentido que los datos no son respuestas a tu investigación, solo es la materia prima del
proceso, es que tiene una gran prevalencia los organizadores visuales de información, más
conocidos como gráficos estadísticos.
Se destacan por su versatilidad y forma atractiva de presentar mucha información en una sola
imagen. La eficacia de la gráfica de Florence Nightingale ilustra muy bien el siguiente punto
importante: una gráfica no es, en sí misma, un resultado final, es una herramienta para describir,
explorar y comparar datos. (TRIOLA, 2009)
4.1. Histograma: es una gráfica de barras en donde la escala horizontal representa clases de
valores de datos y la escala vertical representa frecuencias. Las alturas de las barras corresponden
a los valores de frecuencia, en tanto que las barras se dibujan de manera adyacente (sin espacios
entre ellas). (TRIOLA, 2009)
En la figura 10, puedes observar un histograma que muestra las calificaciones de un examen,
éstas están agrupadas en criterios fijos según la cantidad de cada uno. Es sencillo comparar cada
una de las clases y logra evidenciarse la distribución de los datos de mejor forma. El histograma
no es adecuado para determinar si hay cambios a lo largo del tiempo.
4.2. Polígono de frecuencias: este grafico utiliza segmentos lineales conectados a puntos que se
localizan directamente por encima de los valores de las marcas de clase. Las alturas de los puntos
corresponden a las frecuencias de clase, en tanto que los segmentos lineales se extienden hacia
la derecha y la izquierda, de manera que la gráfica inicia y termina sobre el eje horizontal.
4.3. Ojiva: una ojiva es una gráfica lineal que representa frecuencias acumuladas, de la misma
forma que la distribución de frecuencias acumulativas es una lista de éstas. Las ojivas son útiles
para determinar el número de valores que se encuentran por debajo de un valor particular.
En la figura 12, se muestra la ojiva representativa de las edades de las personas que entran en un
parque de entretenciones durante un tiempo prolongado. Se observa una tendencia acumulada
de forma creciente, la cual puedes ver el comportamiento en relación con los otros rangos de
edades y sacar conclusiones.
4.4. Gráfico de tallo y hoja: representa datos que separan cada valor en dos partes: el tallo, que
es el dígito ubicado en el extremo izquierdo, y la hoja, el dígito del extremo derecho. Puede existir
la comparación de máximo dos series. Cada hoja representa el dato de cada individuo, siendo
poco recomendable para datos muy grandes o continuos.
La figura 13 muestra un gráfico de tallo y hoja que representa los promedios finales de alumnos
de un curso.
4.5. Gráfico de dispersión: es una gráfica de datos apareados (x, y), con un eje x horizontal y un
eje y vertical. Los datos se emparejan de tal forma que cada valor de un conjunto de datos
corresponde a un valor de un segundo conjunto de datos. Los gráficos de dispersión son útiles
para determinar el grado de relación que tengan dos variables.
Mas adelante en la unidad 2 aprenderás a trabajar con la relación y correlación de las variables.
Link: para aprender a construir gráficos utilizando Excel puedes ingresar al siguiente link
https://goo.gl/eFKGGi
5. Tablas de frecuencia.
Una vez recogido los datos, es necesario ordenar la información en tablas de frecuencia. Si bien
es cierto, este tipo de herramienta la podemos encontrar a partir de hojas de cálculo de Excel o
generadas por software estadístico, como el potente SPSS. De todas maneras, es preciso que
conozcas las tablas de frecuencia.
En esta sección podrás conocer las tablas de frecuencias, las cuales agrupan los datos en
categorías recíprocamente inamovibles que revelan el número de elementos en cada categoría;
esto genera un valor adicional a la agrupación de datos. Las tablas de frecuencias presentan las
observaciones catalogadas de modo que se logre ver el número real en cada clase.
Las tablas de frecuencia se componen de los siguientes elementos, los cuales dependiendo de la
literatura cambian de siglas en las letras, pero el concepto sigue siendo universalmente el mismo:
A continuación, conocerás como se construye una tabla de frecuencia, con algunas indicaciones.
Variable
fi Fi hi hi% Hi Hi%
(X)
n1 n1 n1 n1
X1 n1 Fi1 = n1 ●100 Hi1 = ●100
N N N N
n2 n2 n1 n2 n1 n2
X2 n2 Fi2 = n1 + n2 ●100 Hi2 = + ●100 + ●100
N N N N N N
n3 n3 n2 n3 n2 n3
X3 n3 Fi3 = n2 + n3 ●100 Hi3 = + ●100 + ●100
N N N N N N
n… n… n… n … n… n…
X… n… Fi… = n… + n… ●100 Hi… = + ●100 + ●100
N N N N N N
∑ hi
∑ fi = N ∑ Fi = N ∑ hi% = 100 ∑ Hi = 1 ∑ Hi% = 100
=1
Ejemplo: la siguiente tabla de frecuencia (Tabla 2), muestra los pesos en kilogramos de 25
estudiantes de la carrera XX del Instituto Profesional Tu Futuro. Los resultados se muestran y
ordenan a continuación en la tabla 2.1:
53 55 58 57 55
59 56 53 54 58
57 59 55 57 59
54 59 54 57 55
59 57 55 58 58
Tabla 2. Pesos en kilogramos de 25 alumnos
Variable
fi Fi hi hi% Hi Hi%
Peso (kg)
53 2 2 2/25= 0,08 0,08 ● 100= 8% 0,08 8%
54 3 5 3/25= 0,12 0,12● 100= 12% 0,2 20%
55 4 9 4/25= 0,16 0,16 ● 100= 16% 0,36 36%
56 1 10 1/25= 0,04 0,04 ● 100= 4% 0,4 40%
57 5 15 0,2 20% 0,6 60%
58 4 19 0,16 16% 0,76 76%
59 6 25 0,24 24% 1 100%
N= 25 1 100%
Tabla 2.1: Ejemplo de tabla de frecuencias.
A diferencia de las tablas de datos no agrupados, las tablas de datos agrupados se utilizan cuando
la muestra de datos es más extensa en cuanto a cantidad de elementos y la distancia entre el
valor mínimo y el valor máximo. Es por ello que la tabla de frecuencia de datos agrupados
conjunta los valores en intervalos, de tal forma que la muestra se compacte a la hora de ordenar
los datos y trabajemos con una cantidad razonable de variables.
A continuación podrás ver como se construye una tabla de frecuencia para datos agrupados, con
algunas indicaciones:
Marca
Variable
de fi Fi hi hi% Hi Hi%
(X)
Clase
X1 + X 2 n1 n1 n1 n1
X1 − X 2 n1 Fi1 = n1 ●100 Hi1 = ●100
2 N N N N
n1
X2 + X3 Fi2 = n1 n2 n2 Hi2 ●100
●100 n1 n2 N
X2 − X3 n2 + n2 N = + n2
2 N N N + ●100
N
n2
X3 + X4 Fi3 = n2 n3 n3 Hi3 ●100
●100 n 2 n3 N
X3 − X4 n3 + n3 N = + n3
2 N N N + ●100
N
n…
Xn + Xm Fi… = n… n… n… n… n… ●100
●100 N
X… n… + n… N
Hi… =
N
+
N n…
2 N + ●100
N
∑ fi
∑ Fi = N ∑ hi = 1 ∑ hi% = 100 ∑ Hi = 1 ∑ Hi% = 100
=N
Observa otro ejemplo de la tabla de frecuencias con datos agrupados, la cual está resuelta:
6 4 2 8 18 16 10 6 7 5 12 8 9
12 17 11 9 16 19 18 18 16 14 12 7 10
3 11 7 12 5 9 11 15 9 4 1 6 11
7 8 10 15 3 2 13 9 11 17 13 12 8
Tabla 4: Números de nacimientos semanales.
La marca de clases (MC) es muy relevante, ya que con ese valor trabajaras más adelante. Se
calcula sacando la media entre la suma de los dos límites del intervalo.
𝒍𝒊𝒎𝒎𝒂𝒙 + 𝒍𝒊𝒎𝒎𝒊𝒏
Fórmula: Marca de Clases: MC =
𝟐
A partir de los datos obtenidos y ordenados en las tablas de frecuencias, los estadígrafos cumplen
una función representativa de lo típico, o en lenguaje menos tecnicista: el promedio.
Para entender mejor este concepto, los dividiremos en tablas de datos no agrupados y datos
agrupados.
∑ 𝒙•𝒇𝒊
̅=
Fórmula: Media Aritmética 𝒙
𝑵
Variable
fi Fi hi Hi hi% Hi%
(X)
53 2 2 0,08 0,08 8% 8%
Tomando la fórmula de la media aritmética con los datos de la tabla 2.1, sería:
53•2+54•3+55•4+56•1+57•5+58•4+59•6
̅=
𝒙
25
106 + 162 + 220 + 56 + 285 + 232 + 354 1.415
̅=
𝒙
25
=
25
= 56,6
En conclusión, la media aritmética o promedio es de 57 kilos.
La moda para datos no agrupados se calcula tomando en cuenta la variable o serie que tenga
mayor cantidad de frecuencia absoluta. A esto se llama clase modal. Un conjunto de datos puede
tener más de una clase modal, siendo bimodal.
Variable
fi Fi hi Hi hi% Hi%
(X)
53 2 2 0,08 0,08 8% 8%
54 3 5 0,12 0,2 12% 20%
55 4 9 0,16 0,36 16% 36%
56 1 10 0,04 0,4 4% 40%
57 5 15 0,2 0,6 20% 60%
58 4 19 0,16 0,76 16% 76%
59 6 25 0,24 1 24% 100%
N 25 1 100%
Tabla 2.1.Ejemplo de Tabla de frecuencias.
En conclusión la moda es 59 kilos, ya que es la clase con más frecuencia absoluta (fi=6).
La mediana corresponde al punto medio entre el total de los datos ordenados de menor a mayor.
Si N es par, se debe sacar la media entre los datos centrales; y si N es impar, el dato será el central.
Variable
fi Fi hi Hi hi% Hi%
(X)
53 2 2 0,08 0,08 8% 8%
54 3 5 0,12 0,2 12% 20%
55 4 9 0,16 0,36 16% 36%
56 1 10 0,04 0,4 4% 40%
57 5 15 0,2 0,6 20% 60%
58 4 19 0,16 0,76 16% 76%
59 6 25 0,24 1 24% 100%
N 25 1 100%
Tabla 2.1. Ejemplo de Tabla de frecuencias.
𝑵+𝟏
Formula: Cuando N es impar Me =
𝟐
𝑵 𝑵
𝟐
+ 𝟐 +𝟏
Formula: Cuando N es par Me =
𝟐
En este caso, como N = 25, la mediana según fórmula para datos impares es el dato 13, es decir
la mediana es 57 kilos.
Corresponde a la sumatoria de los productos entre las marcas de clase y las frecuencias absolutas
de cada intervalo, dividido por el total de los datos.
∑ 𝐌𝐜•𝐟
̅
Formula: Media Aritmética 𝒙 =
𝐍
3830
𝑥̅ = = 76,6 ptos. (77 ptos.)
50
6.2.2. Mediana:
La mediana corresponde al valor central correspondiente al intervalo medial. Para ello, debemos
reconocer el intervalo medial en las frecuencias acumuladas.
𝑛
( −𝐹𝑖−1 )
Formula: Mediana 𝑀𝑒 = 𝐿𝑖 + 2
●𝑎
𝑓𝑖
Li es el límite inferior del intervalo mediano.
Fi-1 es la frecuencia acumulada hasta antes del intervalo mediano.
fi es la frecuencia absoluta del intervalo mediano.
a es la Amplitud del intervalo.
(25 − 18) • 5
𝑀𝑒 = 75 +
12
7•5
𝑀𝑒 = 75 +
12
35
𝑀𝑒 = 75 +
12
̅
𝑀𝑒 = 75 + 2,916
𝑀𝑒 = 77,9 ≈ 78
6.2.3. Moda
La moda es el valor intermedio inserto en la clase modal, es decir, el intervalo que tenga mayor
frecuencia absoluta (frecuencia modal).
Li= Límite inferior del intervalo modal.
(𝒇𝒊−𝒇𝒊−𝟏 )•𝑨 fi = frecuencia absoluta del intervalo modal.
Formula: Moda 𝑴𝒐 = 𝑳𝒊 +
(𝒇𝒊−𝒇𝒊−𝟏 )+(𝒇𝒊−𝒇𝒊+𝟏 ) fi-1 = frecuencia absoluta del intervalo modal
anterior.
fi+1 = frecuencia absoluta del intervalo modal
posterior.
a = amplitud del intervalo.
Ejemplo: Considerando la información de la tabla 5, tenemos que:
(16 − 12) • 5
𝑀𝑜 = 80 +
(16 − 12) + (16 − 4)
(4) • 5
𝑀𝑜 = 80 +
(4) + (12)
20
𝑀𝑜 = 80 +
16
𝑀𝑜 = 80 + 1,25
𝑀𝑜 = 81,25 ≈ 81
En conclusión, la moda es 81 puntos.
7. Medidas de posición
Es necesario conocer también la posición que tiene un dato con respecto al conjunto total de
datos. Estas cantidades llamadas cuantiles, expresadas a partir de un 100% y con los datos
correctamente ordenados de menor a mayor, se dividen en 4 grupos principales: cuartiles,
quintiles, deciles y percentiles.
𝑘•𝑁
−𝐹𝑖−1
(4,5,10,100)
Formula: 𝐶, 𝑄, 𝐷, 𝑃 = 𝐿𝑖 + 𝑓𝑖
•𝑎
7.1 Cuartiles.
Los cuartiles corresponden a la división del total de los datos en 4 partes, las cuales solo se
distinguen 3 posiciones: cuartil 1: 25%, cuartil 2: 50%, cuartil 3: 75%.
Intervalos fi Fa
7.2 Quintiles.
Los quintiles corresponden a la división del total de los datos en 5 partes, las cuales solo se
distinguen 4 posiciones: quintil 1: 20%, quintil 2: 40%, quintil 3: 60% y quintil 4: 80%.
Intervalos fi Fa
7.3 Deciles.
Los deciles corresponden a la división del total de los datos en 10 partes, las cuales solo se
distinguen 9 posiciones: decil 1: 10%, decil 2: 20%, decil 3: 30%, decil 4: 40%, decil 5: 50%, decil
6: 60%, decil 7: 70%, decil 8: 80% y decil 9: 90%.
Dato Útil: hay posiciones que tienen el mismo valor y no es necesario calcular dos veces. El cuartil
2 es igual al decil 5 y la mediana. El quintil 1 es equivalente al decil 2, el quintil 2 es equivalente
al decil 4, quintil 3 es equivalente al decil 6 y el quintil 4 es equivalente al decil 8.
Intervalos fi Fa
7.4. Percentiles.
Los percentiles son puntos que corresponden a la división del conjunto de los datos en 100 partes,
de las cuales podemos identificar desde el percentil 1 hasta el 99. Cada percentil corresponde al
mismo porcentaje. Por ejemplo, el percentil 5, equivale al 5%.
Intervalos fi Fa
8. Medidas de dispersión
Las medidas de dispersión muestran como varían los datos con respecto al promedio o media
aritmética. El objetivo es dar cuenta de que tan distante se encuentre la medida de la media, y es
una útil respuesta de análisis para ver patrones de comportamientos iguales o distantes del grupo
en general. Entre más dispersos los datos son más variados, entre más aglomerados, más
uniforme serán los datos.
Las sumas en valor absoluto de las diferencias entre las desviaciones y la media de cada intervalo,
se denomina desviación media.
Ejemplo: a partir de la tabla de frecuencias de datos agrupados (Tabla 6), la cual muestra la
cantidad de consumo en m3 en durante un año en 50 casas, se calculará la desviación media:
Para calcular la desviación media, tenemos que primero tener la media aritmética:
1504,5
x̅ = = 30,09
50
Con este dato podemos sacar la diferencia del valor absoluto entre cada marca de clases y la
media, para finalmente obtener:
540,96
𝐷𝑥̅ = = 10,8192
50
8.2. Varianza.
La varianza se simboliza con σ2, y se calcula tomando la sumatoria de los productos entre la marca
de clases al cuadrado y cada frecuencia absoluta, con la diferencia del promedio al cuadrado.
Al calcular, me permite conocer que tan distante están los datos con respecto a la media. A mayor
valor, más distante y viceversa.
∑ Mc2 •𝑓𝑖
Formula: 𝜎 2 = − 𝑥̅ 2
𝑁
Ejemplo: A partir de la tabla de frecuencias de datos agrupados (Tabla 6), la cual muestra la
cantidad de consumo en m3 en durante un año en 50 casas, se calculara la varianza:
Intervalo Mc fi Mc • fi 𝐌𝐜𝟐 • 𝐟𝐢
10 + 16
[10 – 16[ = 13 9 13 • 9 = 117 132 • 9 = 1521
2
[16 – 23[ 19,5 10 195 3.802,5
[23 – 30[ 26,5 3 79,5 2.106,75
[30 – 37[ 33,5 12 402 13.467
[37 – 44[ 40,5 7 283,5 11.481,75
[44 – 51[ 47,5 9 427,5 20.306,25
N 50 1.504,5 52.685,25
Tabla 6. Ejemplo de tabla de datos para datos agrupados.
Para calcular la varianza, tenemos que primero tener la media aritmética, algo super importante,
ya que, si no existiera media, tampoco habría varianza.
1504,5
x̅ = = 30,09
50
Con este dato podemos sacar el valor al cuadrado de cada marca de clases multiplicado por fi:
52.685,25
𝜎2 = − 30,092 = 148,2969
50
8.3 Desviación Estándar.
∑ Mc2 •𝑓𝑖
Formula: 𝜎 = √ − 𝑥̅ 2
𝑁
Ejemplo: a partir de la tabla de frecuencias de datos agrupados (Tabla 6), la cual muestra la
cantidad de consumo en m3 en durante un año en 50 casas, se calculará la desviación estándar:
Intervalo Mc fi Mc • fi 𝐌𝐜𝟐 • 𝐟𝐢
10 + 16
[10 – 16[ = 13 9 13 • 9 = 117 132 • 9 = 1521
2
[16 – 23[ 19,5 10 195 3.802,5
[23 – 30[ 26,5 3 79,5 2.106,75
[30 – 37[ 33,5 12 402 13.467
[37 – 44[ 40,5 7 283,5 11.481,75
[44 – 51[ 47,5 9 427,5 20.306,25
N 50 1.504,5 52.685,25
Tabla 6. Ejemplo de tabla de datos para datos agrupados.
1504,5
x̅ = = 30,09
50
Aplicamos la formula y la raíz cuadrada a la varianza:
52.685,25
𝜎=√ − 30,092 = 12,17
50
3. Cierre
La primera unidad, nos presenta una parte muy importante a la hora de realizar un trabajo
estadístico. Es la base de cualquier método estadístico, desde la investigación, hasta la realización
de experimentos sociales.
Constantemente, tal como sucede con la matemática, podemos utilizar la estadística en el día a
día, sin entender quizás lo complejo, pero a la vez, útil que puede llegar a ser. Gracias a ella, los
países mantienen políticas de gobierno en función de los datos recogidos en los censos
nacionales, el poder legislativo, puede incluir nuevas leyes a partir de la estadística, el comercio
regula sus precios, las empresas sus metas y proyecciones de producción, el suplemento
deportivo del fin de semana, etc.
Tal como, tiene sus ventajas, también posee sus desventajas, las cuales, provienen de sesgos
personales que pueden interferir en los resultados de las investigaciones. Una persona que
quisiera investigar acerca de la frecuencia de personas que le gustan los productos del mar a una
zona costera para abrir un nuevo restaurante, será quizás innecesario, ya que se supone que la
mayoría de las personas, manifestaran un claro sesgo al gusto de los productos del mar o una
encuesta de una persona en un parque de diversiones, acerca del gusto o preferencias por otro
centro de entretención.
Estos dos ejemplos, son una clara forma de entender lo complicado que es trabajar en
experimentos con personas, ya que la persona por esencia “cambia”. Lo que un día le gusta,
quizás al otro no tanto. Otro punto importante, es el rechazo que se puede obtener de las
personas al negarse de responder una encuesta o entrevista, ya que pueden sentirse amenazados
de invadir su privacidad. Es claro, que un desarrollo estadístico es necesario muchas veces, pero
otras solo imperan el autoconvencimiento o para beneficio propio con preguntas predispuestas
o errores en las cantidades elegidas para el estudio.
Finalmente, si hay que reconocer que la estadística, es una potente herramienta, que permite la
toma de decisiones, siempre y cuando no cae en los efectos maliciosos de la estadística. Desde
los tiempos de las primeras civilizaciones que ayudan y van de la mano de la sociedad y desde
ahora, podrás tener a tus manos un recurso, que te permitirá conocer información en tu plano,
académico, personal y profesional.
4. Enlace
Por otro lado, la unidad 1 es esencial para el trabajo de la unidad 2. El saber ocupar las tablas de
frecuencia y las medidas de tendencia central, el saber representar la información en gráficos y
tablas.
La estadística descriptiva es una de las ramas de la estadística, la cual también puede ser
inferencial. La estadística descriptiva, muestra e identifica comportamientos de acuerdo con los
datos. Estos datos, son la base necesaria para cualquier trabajo estadístico.
Las variables cualitativas, entregan mucha información, pero también requiere de más demanda
de la organización de la información, ya que es muy variada y debe realizarse muy
cuidadosamente. Las variables cuantitativas, se limitan a entregan datos numéricos, los cuales
son más rápidos y certeros a la hora de poder trabajar con ellos.
Con esto, podemos realizar nuestra recogida de información, a través de diferentes técnicas e
instrumentos, como lo son las encuestas y las entrevistas. Normalmente, hoy en día las
instituciones realizan escalas tipo Likert para recoger información.
Una vez recogida, puedo ordenar mis datos con la ayuda de software, como lo son Excel, creando
bases de datos, las cuales se tabularán por medio de tablas de frecuencias para datos. Si son
muchos datos, es necesario, implementar tablas de datos agrupados. Una vez construidas las
tablas puedo sacar información por medio de sus frecuencias absolutas, acumuladas y relativas,
las cuales permiten una mayor comprensión de los datos.
Finalmente, la información que puedo obtener a través de los estadígrafos de tendencia central,
los de posición y dispersión, me permiten tener un panorama de mi investigación estadística. Ahí
recién puedo sacar conclusiones más reales y sin perjuicio de errores. El promedio, siendo uno
de los mas ocupados, en conjunto con los de desviación estándar, llegan a validar el proceso, de
acuerdo con el comportamiento de los datos. Sera necesario también, poder graficar toda esta
información en gráficos, que, dependiendo el tipo de dato, se seleccionara el más adecuado.
2. Conceptos clave
Amplitud: La diferencia entre dos límites de clase inferiores consecutivos en una distribución de
frecuencias.
Bimodal: Que tiene dos modas.
Censo: Recolección de datos de cada elemento de una población.
Cuartiles: Los tres valores que dividen datos de orden en cuatro grupos, con aproximadamente
el 25% de los puntajes en cada grupo.
Ejercicios.
a) Al salir del estadio “El Centenario” de Montevideo, donde la “Roja” perdió por 0 a 4 ante la
selección de fútbol de Uruguay, se entrevistó a 51 de los 3.258 hinchas chilenos que
acompañaron a su equipo nacional. La mayoría de los entrevistados no echó la culpa al
entrenador sino a los jugadores mismos que mostraron un pobre rendimiento futbolístico.
b) Después de haber rendido la prueba PSU se interrogó a 517 futuros estudiantes de la ciudad
sobre sus pretensiones de una carrera universitaria. Los encuestados representan a los 14.483
alumnos de nuestra ciudad.
Error:
Error:
En una farmacia, se realizó un registro acerca de las edades de los clientes durante una
hora. Las edades registradas fueron las siguientes.
29 37 47 35 48 36 48 27 41 44
50 51 23 49 48 37 50 51 52 36
38 50 48 38 45 53 39 63 40 43
42 59 62 64 65 69 60 71 54 55
57 39 61 55 35 48 40 47 30 45
TABLA DE FRECUENCIAS
N° Intervalos de clase Mc fi Fi hi Hi
2. Aprendizaje colaborativo
Diseño de investigación.
Pauta de Evaluación.
Apartado V. Cierre
1. Cómo solucioné el desafío
Del mismo modo, cuando se te planteó el desafío, surgieron muchas interrogantes las cuales, es
preciso que las vayas respondiendo antes de pasar a la siguiente unidad. Piensa en las siguientes
preguntas y determina que es lo falta:
¿Determinaste la pregunta de investigación? O en palabras más simples ¿Sabes lo que vas a
investigar?
¿Cuál es tu población?
¿Cuál es tu muestra y su tamaño?
¿De qué tipo es mi variable: cualitativa o cuantitativa?
¿Qué hare para recoger los datos: entrevista, encuesta, etc.?
¿Ordené mis datos en tablas de frecuencia?
¿Calculé las medidas de tendencia central: media, moda y mediana?
¿Calculé las medidas de dispersión para validar mis datos?
¿Qué gráficos ocupare para representar mi información?
¿Cuál es mi conclusión acerca del estudio?
Si cada una de estas preguntas ya tienen respuesta positiva, puedes seguir con tu desafío.
2. Qué aprendí
A. Talla de zapatos.
B. Número de vehículos en una ciudad.
C. Promedio de notas.
D. Puesto obtenido en una carrera.
A. 9,3
B. 75
C. 93
D. 756
4. Al tener un rango de 64, ¿Qué cantidad de intervalos con amplitudes exactas NO puedo
tener?
A. 4
B. 8
C. 12
D. 16
Retroalimentación: Al dividir el rango por la cantidad de intervalos que yo deseo trabajar, seria
ideal obtener amplitudes exactas para establecer los intervalos de una manera más fácil,
pensando en que todos los datos no son continuos. Asi, 64 dividido 12, es 5,333333…., es decir,
un numero inexacto.
A. 5
B. 41,5
C. 83
D. 1.716
A. 7
B. 8
C. 9
D. 10
A. 0,07
B. 0,38
C. 0,30
D. 0,40
Retroalimentación: El cociente entre la frecuencia absoluta del tercer intervalo y el total de los
datos nos da la frecuencia relativa.
A. [39 – 43]
B. [44 – 48]
C. [49 – 53]
D. [54 – 58]
A. [39 – 43]
B. [44 – 48]
C. [49 – 53]
D. [54 – 58]
A. 41
B. 43
C. 45
D. 47
Para buscar información fidedigna y con resultados de buena calidad, debes tener mucho cuidado
con los resultados que te arrojan los buscadores, como Google por ejemplo. Fíjate siempre quien
es el autor, si no tiene autor, lo más probable es que estés frente al delito del plagio. Seguido de
esto, identifica, si lo publicado corresponde a un libro, revista, investigación, o tesis. Así podrás
estar frente a escritos validados y originales.
Cada vez que los selecciones en tu investigación, debes señalar mediante una referencia o cita
bibliográfica, mencionando el autor y el año de la publicación.
Finalmente, ten cuidado con el copy paste, ya que muchas veces se comete el error de no leer y
chequear que lo que está escrito, tiene errores de ortografía o redacción. Lo mejor, es leer y
escribir tus propias ideas.
Bibliografía
Best, J. (2009). La distorsión en la percepción pública de los problemas sociales y políticos.
Santiago: Editorial Cuatro Vientos.
Ebrary. (Diciembre de 2017). Ebrary. Obtenido de E-libro:
http://site.ebrary.com/lib/araucanasp/home.action
Guerra, B., & Caridad, W. (1987). Estadística. La Habana: Editorial Félix Varela.
TRIOLA, M. F. (2009). Estadística. Décima edición. Mexico: PEARSON EDUCACIÓN.
Fuente: www.vagandoenlanet.com/wp-content/uploads/2013/12/Cyanide-and-Happiness-
Gr%C3%A1fico.png
Fuente: https://goo.gl/images/aY3Vgs
- Bibliografía utilizada
- Webgrafía utilizada
Ebrary. (Diciembre de 2017). Ebrary. Obtenido de E-libro:
http://site.ebrary.com/lib/araucanasp/home.action
- Fuentes de imágenes
Fuentes propias.