Investigación Probabilidad y Estadisticas YJP

UNIVERSIDAD TECNOLÓGICA DE TABASCO.
DIVISIÓN DE TECNOLOGÍA DE LA INFORMACIÓN Y COMUNICACIÓN

TSU EN DESARROLLO Y GESTION DE SOFTWARE.
NOMBRE DEL ALUMNO:
Yarey del Carmen Jiménez Palacios
GRADO Y GRUPO:
3 “A” Matutino
MATERIA:
PIVA 2
PROFESOR:
Roberto Fernández Ulin.
PARRILLA, CENTRO, TABASCO DE SEPTIEMBRE DEL

2023
índice
Introducción................................................................................................................................. 4
Introducción a la estadística ........................................................................................................ 5
Estadística descriptiva ............................................................................................................. 6
Estadística inferencial .............................................................................................................. 7
Variable estadística ................................................................................................................. 8
Datos cualitativos..................................................................................................................... 9
Datos cuantitativos ................................................................................................................ 10
Cuantitativos discretos ........................................................................................................... 11
Cuantitativos continuos .......................................................................................................... 12
Población finita ...................................................................................................................... 13
Población Infinita ................................................................................................................... 13
Muestra clasificar datos cualitativos y cuantitativos ............................................................... 14
Población, muestra y muestreo ................................................................................................. 15
Muestreo probabilístico .......................................................................................................... 15
a). Muestreo probabilístico aleatorio simple........................................................................ 15
b) Muestreo probabilístico sistemático................................................................................ 16
c) Muestreo probabilístico estratificado .............................................................................. 17
d) Muestreo probabilístico conglomerado ........................................................................... 18
Muestro no probabilístico ....................................................................................................... 19
Distribución de frecuencias y su representación gráfica ............................................................ 20
Clase ......................................................................................................................................... 21
Frecuencias............................................................................................................................... 22
Histograma ................................................................................................................................ 25
Polígono de frecuencias ........................................................................................................ 26
Ojiva ...................................................................................................................................... 27
Pareto .................................................................................................................................... 28
Pastel .................................................................................................................................... 29
Barras .................................................................................................................................... 30
Tallo y Hoja............................................................................................................................ 31
Construcción de tablas de distribución y gráficas con empleo de software ............................ 32
Medidas de tendencia central, localización y dispersión ............................................................ 33
Tendencia central .................................................................................................................. 33
Media ..................................................................................................................................... 33
Mediana ................................................................................................................................. 34
Moda ..................................................................................................................................... 35
Localización ........................................................................................................................... 36
Cuartiles ................................................................................................................................ 37
Deciles ................................................................................................................................... 37
Percentiles ............................................................................................................................. 37
Dispersión ................................................................................................................................. 38
Medidas de dispersión ........................................................................................................... 38
Rango .................................................................................................................................... 38
Desviación estándar .............................................................................................................. 38
Varianza ................................................................................................................................ 39
Desviación media .................................................................................................................. 40
Conclusión ................................................................................................................................ 41
Introducción
La estadística es una poderosa herramienta que nos permite dar sentido y significado a
los datos que nos rodean en un mundo cada vez más orientado hacia la recopilación
masiva de información. Ya sea en la toma de decisiones empresariales, la investigación
científica, la planificación gubernamental o la comprensión de patrones sociales, la
estadística se ha convertido en un pilar fundamental en nuestra búsqueda de
conocimiento y comprensión.
Esta investigación tiene como objetivo sumergirse en el fascinante mundo de la

estadística, desglosando conceptos fundamentales, fórmulas esenciales y procesos de
cálculo clave que permiten a los estadísticos y analistas extraer información valiosa a
partir de datos crudos. A lo largo de esta investigación, exploraremos en profundidad
cada uno de los temas mencionados, proporcionando definiciones detalladas, ejemplos
ilustrativos y una visión clara de cómo estos elementos se relacionan para dar forma a
nuestra comprensión del mundo mediante la estadística.
Comenzaremos con una introducción a la estadística, donde definiremos conceptos

esenciales como la estadística descriptiva e inferencial, explorando cómo estas ramas se
aplican en diversos campos y cómo nos ayudan a entender mejor la información que nos
rodea. Luego, nos adentraremos en los conceptos de población, muestra y muestreo,
comprendiendo la importancia de seleccionar muestras representativas y las diferentes
técnicas que podemos emplear para lograrlo.
Continuaremos nuestra exploración adentrándonos en la distribución de frecuencias y su

representación gráfica, descubriendo cómo organizar y visualizar datos de manera
efectiva. Conoceremos la diferencia entre datos agrupados y no agrupados y
aprenderemos a construir tablas y gráficos que revelen patrones y tendencias ocultas.
En la segunda mitad de nuestra investigación, nos sumergiremos en las medidas de

tendencia central, localización y dispersión. Descubriremos cómo estas medidas nos
ayudan a comprender la "historia" que los datos nos cuentan, desde encontrar el valor
promedio hasta identificar la dispersión y los valores atípicos.
Por último, exploraremos cómo la tecnología y el software estadístico facilitan el cálculo

y análisis de estos conceptos, permitiendo a los profesionales y estudiantes de
estadística realizar análisis de datos de manera más eficiente y precisa.
Introducción a la estadística
La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis

de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre
fenómenos observados.
La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar

información para luego analizarla y extraer de ella conclusiones relevantes. Se puede
decir que es la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión
de los hechos a partir de la información disponible.
El origen de la palabra estadística se suele atribuir al economista Gottfried Achenwall

(prusiano, 1719-1772) que entendía la estadística como “ciencia de las cosas que
pertenecen al Estado”.
Conviene saber que la estadística NO es una rama de las matemáticas. Utiliza

herramientas de las matemáticas del mismo modo que lo hace la física, la ingeniería o la
economía, pero eso no las hace ser parte de las matemáticas. Es cierto que tienen una
relación estrecha, pero la estadística y las matemáticas son disciplinas diferentes.
La estadística es la ciencia de los datos, se ocupa de su recolección, organización,

estructuración, análisis y presentación. Dichos datos se refieren a un fenómeno variable
e incierto, por ejemplo, el resultado de lanzar una moneda. Su aplicación busca inferir los
principios que dirigen esos fenómenos, además, permite hacer predicciones y una toma
de decisiones más informada.
La estadística se utiliza en investigaciones médicas para comprobar la eficacia de un

medicamento, en la economía para saber cuáles productos son los más consumidos, en
la educación para conocer cuántas personas están estudiando en tu país. En fin, en
diferentes campos y situaciones en las que es necesario interpretar grandes cantidades
de información.
La estadística es una ciencia formal, con un conocimiento propio, dinámico y en continuo

desarrollo obtenido a través del método científico formal. En ocasiones, las ciencias
fácticas necesitan utilizar técnicas estadísticas durante su proceso de investigación
factual, con el fin de obtener nuevos conocimientos basados en la experimentación y en
la observación. En estos casos, la aplicación de la estadística permite el análisis de datos
provenientes de una muestra representativa, que busca explicar las correlaciones y
dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o
condicional.
Estadística descriptiva
La estadística descriptiva es una disciplina que se encarga de recoger, almacenar,

ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de
datos.
La estadística descriptiva es, junto con la inferencia estadística o estadística inferencial,

una de las dos grandes ramas de la estadística. Su propio nombre lo indica, trata de
describir algo. Pero no describirlo de cualquiera forma, sino de manera cuantitativa.
Pensemos en el peso de una caja de verduras, en la altura de una persona o en la
cantidad de dinero que gana una empresa. De estas variables podríamos decir muchas
cosas. Por ejemplo, podríamos indicar que esta o aquella caja de tomates pesan mucho
o pesan menos que otras. Siguiendo con otro ejemplo, podríamos decir que el ingreso de
una empresa varía mucho a lo largo del tiempo o que una persona tiene una altura
promedio.
Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy variable o
poco variable necesitamos variables de medidas. Esto es, necesitamos cuantificarlas,
ofrecer un número. Con esto en mente, podríamos utilizar los gramos o los kilogramos
como unidad de medida para saber el peso de tantas cajas de tomates como
consideremos. Una vez pesemos treinta cajas, sabremos cuales pesan más, cuales
pesan menos, que cuantía es la que más se repite o si existe mucha disparidad entre los
pesos de las diferentes cajas.
Con esta idea nace la estadística descriptiva, con la de recoger datos, almacenarlos,
realizar tablas o incluso gráficos que nos ofrezcan información sobre un determinado
asunto. Adicionalmente, nos ofrecen medidas que resumen la información de una gran
cantidad de datos.
La estadística descriptiva es la rama de la Estadística que se ocupa de recopilar y

organizar la información acerca del comportamiento de sistemas con muchos elementos,
conocidos genéricamente con el nombre de población. Para ello se vale de técnicas
numéricas y gráficas, mediante las cuales presenta información, sin hacer predicciones
ni inferencias acerca de la población de donde proviene.
Siempre que se necesite recopilar, organizar y presentar datos, la estadística descriptiva

es esencial en áreas de la ciencia que trabajan con muchos elementos y cantidades, así
como en gran parte de las actividades humanas: economía, política, salud, deporte y
más.
Estadística inferencial
La inferencia estadística es el conjunto de métodos que permiten inducir, a través de una

muestra estadística, el comportamiento de una determinada población. La inferencia
estadística, estudia entonces como, a través de la aplicación de dichos métodos sobre
los datos de una muestra, se pueden extraer conclusiones sobre los parámetros de la
población de datos. De la misma manera estudia también el grado de fiabilidad de los
resultados extraídos del estudio.
Teniendo claro a lo que nos referimos con el concepto de inferir, una de las dudas
fundamentales recae en el hecho de elegir una muestra en lugar de una población.
Normalmente, en estadística, se trabaja con muestras debido a la gran cantidad de datos

que tiene una población. Por ejemplo, si queremos sacar conclusiones, esto es, inferir,
los resultados de las elecciones generales, es imposible preguntar a toda la población del
país. Para solventar ese problema se escoge una muestra variada y representativa.
Gracias a la cual se puedan extraer una estimación del resultado final. Escoger una
muestra adecuada corre a cargo de las distintas técnicas de muestreo.
La estadística inferencial, también conocida como inductiva, es aquella estadística que

realiza predicciones, proyecciones y juicios valorativos respecto a un gran conjunto de
informaciones, basándose en datos reunidos a partir de una serie de informaciones más
pequeña.
Variable estadística
Cuando hablamos de variable estadística estamos hablando de una cualidad que,

generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180
centímetros. La variable estadística es la altura y está medida en centímetros.
También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de
22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría medido
en dólares. Ambas variables son del tipo cuantitativo (se expresan con un número)
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se
pueden (en principio) expresar en forma de número. Así, otra variable que podríamos
encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes
y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa.
Es decir, no se expresa con número.
Tipos de variables estadísticas
Variable cuantitativa: Son variables que se expresan numéricamente.

Variable continua: Toman un valor infinito de valores entre un intervalo de datos. El
tiempo que tarda un corredor en completar los 100 metros lisos.
Variable discreta: Toman un valor finito de valores entre un intervalo de datos. Número
de helados vendidos.
Variable cualitativa: Son variables que se
expresan, por norma general, en palabras.
Variable ordinal: Expresa diferentes niveles y
orden.
Variable nominal: Expresa un nombre
claramente diferenciado. Por ejemplo, el color de
ojos puede ser azul, negro, castaño, verde, etc.
Datos cualitativos
En estadística, los datos cualitativos son un tipo de datos que representan cualidades o
características. Es decir, los datos cualitativos no son cuantitativos (o numéricos), sino
que solo pueden tomar el valor de una cualidad o una característica. Por ejemplo, el
género de un grupo de personas son datos cualitativos porque solo pueden ser palabras
(hombre o mujer), pero no tienen valores numéricos.
Datos que no se expresan en forma de valores numéricos, sino mediante palabras o

imágenes, tales como los que Se obtienen en una sesión de observación de aula o en
una entrevista. Normalmente, en toda investigación de enseñanza o aprendizaje de una
segunda lengua se incluyen datos no solo cualitativos, sino también cuantitativos, ya que
los primeros resultan difíciles de manejar a nivel estadístico. En muchos casos, los datos
recogidos de forma cualitativa pueden transformarse en datos cuantitativos, es decir, se
convierten en números que representan una cantidad o una posición en una jerarquía.
Los datos cualitativos provienen típicamente de trabajos de campo, y se recopilan por

medio de tres tipos de actividades: entrevistas, observación directa (por ejemplo, una
sesión de observación de aula) y revisiones de documentos escritos, tales como diarios
o informes.
Características de los datos cualitativos:

• En los estudios que siguen este método la hipótesis puede generarse antes,
durante o al concluir la investigación.
• No se utilizan procedimientos estandarizados de recolección de datos. Los datos
consisten en las emociones, puntos de vista, significados y experiencias de los
participantes acerca del fenómeno que es objeto de investigación.
• Dicha recolección se basa en la obtención de perspectivas y puntos de vista de
los participantes (sus experiencias, emociones, significados, prioridades, y otros
aspectos sobre todo subjetivos).
• El problema de investigación que sirve de punto de partida es menos específico y
definido que el que requiere la investigación cuantitativa. En un estudio cualitativo,
la formulación del problema puede cambiar o definirse más en la medida en que
avanza la investigación.
• Es holístico, puesto que toma en cuenta la totalidad del fenómeno sin reducirlo a
sus partes.
• Se propone reconstruir la realidad del fenómeno tal como la perciben los
participantes en el estudio y el investigador.
• No busca confirmar o descartar una hipótesis, sino comprender e interpretar el
fenómeno sometido a investigación.
Datos cuantitativos
En estadística, los datos cuantitativos son datos numéricos. Es decir, los datos
cuantitativos son un tipo de datos que están formados únicamente por números.
Por ejemplo, la estatura de un grupo de personas son datos cuantitativos porque todos
los valores son números (1,75 m, 1,63 m, 1,89 m…).
Los datos cuantitativos también se llaman datos numéricos, ya que todos sus valores son
números.
os datos cuantitativos consisten en cualquier información cuantificable que pueda
utilizarse para realizar cálculos matemáticos y análisis estadísticos, de forma que puedan
tomarse decisiones en la vida real basadas en estas derivaciones matemáticas.
Todo lo que se puede medir y contar, decimos que se puede cuantificar. El concepto
“datos cuantitativos” hace referencia precisamente a eso, a la información tangible, la que
es obtenida mediante algún método de investigación.
La manera de cuantificar los datos obtenidos en nuestro estudio nos dará la pauta de
hacia qué rumbo dirigirse, de ahí la importancia de su correcto análisis para poder
demostrar si estamos en lo correcto o no, en la hipótesis planteada.
Se denomina investigación cuantitativa aquella que genera datos numéricos o

estadísticos para cuantificar opiniones, comportamientos o cualquier variable que se haya
definido para ser objeto de estudio.
En la actualidad las encuestas online son la mejor solución para la obtención de datos
cuantitativos, ya que así puedes llegar a más personas en menos tiempo y además,
asegurar resultados más honestos para un posterior análisis.
Cuantitativos discretos
Una variable discreta es aquella que puede asumir un número contable de valores.
Mientras que una variable continua es aquella que puede asumir un número incontable
de valores. Tanto las variables discretas, como las continuas, son variables estadísticas
cuantitativas.
Ejemplos de variables cuantitativas discretas:
• El número de hijos de una familia.

• La cantidad de dedos que tienes en la mano.
• El número de faltas en un partido de fútbol.
• Número de personas que llegan a un consultorio en una hora.
• El número de árboles que hay en un parque.
• El número de canales de televisión que tienes en casa.
• Número de animales en una granja.
• Cantidad de empleados que trabajan en una tienda.
• Número de libros vendidos cada mes en Amazon.
• Número de clientes que visitan un supermercado por día.
Los datos discretos son aquellos que sólo pueden tomar valores determinados. Se trata
de datos que se pueden contar y que tienen un número limitado de valores. Suelen
presentarse en forma de números enteros.
Estos valores deben encajar en determinadas categorías y no pueden dividirse en partes

más pequeñas
Que son datos que no se pueden dividir; es distinto y solo puede ocurrir en ciertos valores.
Por ejemplo, los instrumentos y los cupcakes son datos discretos en este escenario
porque Madison no puede comprar la mitad de un instrumento ni vender la mitad de un
cup cake. El valor de los cupcakes y los instrumentos son valores distintos.
Cuantitativos continuos
Los datos continuos son datos que se pueden dividir infinitamente; no tiene ninguna
distinción de valor. La cantidad de tiempo que se tarda en vender los cupcakes es un
ejemplo de datos continuos. Puede recordar esto recordando que el tiempo en sí es
continuo y sin fin. Además, puede dividir el tiempo infinitamente. Hay siglos, décadas,
años, meses, semanas, días, horas, minutos, segundos, milisegundos, microsegundos,
nanosegundos, etc.
Este tipo de datos cuantitativos se refiere al flujo constante de valores posibles de la

variable. Estos datos no se restringen a valores enteros (aunque normalmente son
reducidos a valores enteros por aproximación). Los datos cuantitativos continuos se
miden en lugar de contarse. Además, tienen entre sus características que pueden
dividirse.
Ejemplos:
Medir la altura de una persona. Puedes medir la altura en metros, centímetros y hasta
dar una medida en milímetros, es decir, los datos son continuos.
Edad (puedes definir una edad en años, meses y hasta días)
Para facilitar el análisis de datos cuantitativos, en ocasiones algunos expertos en
investigación deciden, ya sea por iniciativa o por convención, agrupar los datos en
categorías según sus valores, por lo que podrán ser encontrados dentro de ciertos
rangos, o bajo un umbral determinado.
Sin embargo, las distintas clases de variables continúan su

proceso de especificación, puesto que dentro de la clase de
Variable Cuantitativa se distinguen las de tipo Continuas, las
cuales se definen como aquellas entidades o variables que
toman valores numéricos correspondientes a un valor fijo,
perteneciente a un intervalo determinado, el cual además se
encuentra siempre entre dos valores visibles, entre los cuales
siempre se encuentra un posible tercer valor intermedio, cuya
magnitud casi siempre toma la Variable Cuantitativa Continua.
Población finita
Una población finita en estadística se refiere a un conjunto de elementos o individuos que

comparten una característica específica y limitada en un determinado contexto. A
diferencia de una población infinita, una población finita se compone de un número
definido y concreto de elementos. La importancia de considerar una población finita en la
estadística radica en que permite obtener resultados más precisos y representativos sin
necesidad de hacer inferencias o generalizaciones sobre una población mucho mayor.
Al utilizar una población finita en estudios y análisis estadísticos, se obtienen

estimaciones más precisas de los parámetros y se reducen los errores y sesgos en los
resultados. Esto es especialmente relevante en investigaciones y encuestas realizadas
en un contexto específico, donde se desea obtener una imagen clara y realista de la
situación que se está estudiando. Además, al trabajar con una población finita, es posible
calcular con mayor exactitud los intervalos de confianza y realizar inferencias más sólidas
sobre la población en general.
Características clave de una población finita:
1. Tamaño definido: Una población finita tiene un número determinado de

elementos. Esto facilita el cálculo de estadísticas y medidas descriptivas, ya que
no es necesario realizar estimaciones o inferencias.
2. Homogeneidad: En una población finita, los elementos tienden a ser más
similares entre sí que en una población infinita. Esto se debe a que la diversidad
de una población finita es limitada, lo que puede afectar el análisis de datos al ser
menos representativa de la realidad.
3. Fácil acceso a los datos: Al tratarse de una población completamente conocida,
es más fácil recopilar datos de cada elemento. Esto puede ser de gran utilidad
para realizar análisis más precisos y evitar el sesgo debido a la falta de
información.
Población Infinita
Población Infinita: imposible de medir. Es infinita ya que incluye un gran conjunto de

medidas y observaciones. Suele tener más de 100.000 individuos y suele haber un mayor
margen de confianza y error de muestreo al tener que extrapolar los resultados del
estudio obtenido a la muestra de la población total.
En general, para escoger una población, se seleccionan a los sujetos siguiendo
determinados criterios (social, económico, por hábitos de consumo…), procurando que
la muestra sea representativa.
Muestra clasificar datos cualitativos y cuantitativos
Datos cualitativos: Pues bien, estos datos son los relativos a las "cualidades", este tipo
de información relacionada con los adjetivos. Por ejemplo, si te pidieran que describieras
tu más reciente experiencia de compra en un importante punto de venta, es posible utilizar
los términos rápido, práctico, agradable, caro o inútil. Todos estos son ejemplos de la
información cualitativa.
Datos cuantitativos: Aquí todo se trata de números. Imagínate a la información

cuantitativa como referente de una determinada "cantidad". Por ejemplo, tu altura, cuánto
pesas, o el tiempo que te lleva ir de un lugar a otro.
Población, muestra y muestreo
a) Población. Es el conjunto de personas u objetos de los que se desea conocer algo
en una investigación.
b) Muestra. Es un subconjunto o parte del universo o población en que se llevará a cabo
la investigación. Hay procedimientos para obtener la cantidad de los componentes de la
muestra como fórmulas, lógica y otros que se verá más adelante. La muestra es una parte
representativa de la población.
c) Muestreo. Es el método utilizado para seleccionar a los componentes de la muestra
del total de la población. "Consiste en un conjunto de reglas, procedimientos y criterios
mediante los cuales se selecciona un conjunto de elementos de una población que
representan lo que sucede en toda esa población”. (MATA et al, 1997:19)
Censo: Decimos que realizamos un censo cuando se observan todos los
elementos de la población estadística.
Parámetro: Característica de una población, resumida para su estudio. Se
considera como un valor verdadero de la característica estudiada.
Tipos de muestreo
Se dividen en dos grupos, el probabilístico y el no probabilístico.
Muestreo probabilístico
Es el método más recomendable si se está haciendo una investigación cuantitativa
porque todos los componentes de la población tienen la misma posibilidad de ser
seleccionados para la muestra. Se divide en:
a). Muestreo probabilístico aleatorio simple

Este método es uno de los más sencillos de aplicar, se caracteriza porque cada unidad
que compone la población tiene la misma posibilidad de ser seleccionado.
1. Identificar y definir la población.

2. Realizar el listado de cada una de las unidades de la población.
3. Proceder a calcular la muestra.
4. Asignar un número a cada uno de los componentes de la población anotando en
una ficha, cartón o bolillo; luego colóquelos en una bolsa o cajón.
5. Extraiga una por una las unidades correspondientes de acuerdo a la cantidad total
del tamaño de la muestra. Cada ficha, cartón o bolillo extraído será componente
de la muestra.
6. Siga con el mismo procedimiento hasta completar la cantidad que se seleccionó
en la muestra.
b) Muestreo probabilístico sistemático
Este procedimiento se realiza a través del cálculo del intervalo que regirá la selección de
los componentes de la muestra
Este tipo de muestreo se utiliza cuando el tamaño de la población es grande y la tabla de

números aleatorios no es suficiente para contar esa población. También es usado en
poblaciones pequeñas donde la selección sistemática facilita la identificación de los
componentes de la muestra. El procedimiento es el siguiente:
1. Identifique y defina la población.

2. Realice el cálculo de la muestra
3. Asegúrese de que cada uno de los componentes de la población esté enumerada.
4. Proceda al cálculo del intervalo numérico que servirá de base para la selección de
la muestra. Este se calcula dividiendo (N/m) el total de la población (N) por la
muestra (m).
5. Este tipo de muestreo es menos costoso y requiere de menos tiempo que los otros.
Por ejemplo, si la población son 500 personas(N), la muestra 100(m): N/m realizamos la
división reemplazando la fórmula 500/100 es igual a 5; este número será el intervalo para
la selección de cada unidad muestral.
Tabla de números aleatorios

c) Muestreo probabilístico estratificado
Este tipo de muestreo se caracteriza por la división de la población en subgrupos o

estratos debido a que las variables que deben someterse a estudio en la población
presentan cierta variabilidad o distribución conocida que es necesario tomar en cuenta
para extraer la muestra. Por ejemplo, si se desea tomar una muestra de una población
que gusta de las novelas mexicanas donde el 15 % representa a los varones, el 85%
representa a las mujeres, se mantendrá la proporción, por cada 15 varones, se incluirán
85 mujeres.
Es proceso que se sigue es el siguiente:
1. Identifique y defina la población.

2. Calcule la muestra.
3. Determine los subgrupos o estratos en que se dividirá la población, según la
variable que se está estudiando.
4. Asegúrese de contar con las listas de los componentes de cada estrato
identificado.
5. Calcule el porcentaje de la muestra de la población. Si se toma el ejemplo anterior,
usado en el sistemático, la población (500) será el 100% la muestra (100)
calculando por la regla de tres representará el 20%.
6. Una vez que se calculó el porcentaje de la muestra, se calcula proporcionalmente
el mismo porcentaje en números de cada estrato identificado, es decir, si el primer
estrato tiene 180 personas, el 20% será 36 personas. De las 180 que compone el
estrato se seleccionará 36 empleando cualquier procedimiento descrito en el
aleatorio y el sistemático. El mismo procedimiento se realizará con los demás
estratos.
d) Muestreo probabilístico conglomerado
Este tipo de muestreo se usa en particular cuando no se dispone de una lista detallada y
enumerada de cada una de las unidades que conforman la población y resulta muy
complejo elaborarla. Se denomina conglomerado porque la población es agrupada en
conjuntos, manzanos, bloques, áreas, zonas, etc. No es lo mismo que el estratificado
porque en este procedimiento se agrupa según las variables a estudiar y se puede
identificar exactamente a la población.
El muestreo conglomerado es conocido también por racimos. El procedimiento es el

siguiente:
1. El proceso se inicia definiendo los conglomerados que componen la población Ej.

Manzanos.
2. Se selecciona los subconjuntos a estudiar y se realizan listados de los
componentes del conglomerado. Ej. Número de casas por manzano
3. Se procede a calcular la muestra de las casas.
4. Se procede a identificar a los componentes de la muestra que será tomada en
cuenta para el estudio, es decir, si el estudio son personas de 15 a 25 años, se
procede a identificar cuantas personas existirán entre esas edades en cada casa
seleccionada.
5. Se procede con la recolección de datos hasta completar la muestra.
Muestro no probabilístico
En este tipo de muestreo, todas las unidades que componen la población no tienen la
misma posibilidad de ser seleccionada "también es conocido como muestreo por
conveniencia, no es aleatorio, razón por la que se desconoce la probabilidad de selección
de cada unidad o elemento de la población". (PINEDA et al 1994: 119) Se dividen en tres
grupos:
a) Intencional o deliberado. El investigador decide según los objetivos, los elementos

que integrarán la muestra, considerando aquellas unidades supuestamente típicas de la
población que se desea conocer. El investigador decide qué unidades integrarán la
muestra de acuerdo a su percepción. Ejemplo, encuestar a estudiantes que ven un
determinado programa televisivo y acudir a un grupo claramente identificado con esta
serie o programa de televisión.
b) Accidentales o por comodidad. El investigador acomoda su investigación de

acuerdo a los criterios que tiene para su investigación, es decir, si su objeto de estudio
son niños que ven un determinado programa infantil de televisión, el investigador en lugar
de elegir una zona de estudio elige un espacio donde se reúnan los niños, ejemplo, un
jardín de infantes, un parque infantil, una escuela, etc.
c) Por cuota. Consiste en que el investigador selecciona la muestra considerando

algunos fenómenos o variables a estudiar como sexo, raza, religión, áreas de trabajo,
etc. El paso inicial consiste en determinar la cantidad o cuota de sujetos de estudio a
incluirse y que poseen las características indicadas. Por ejemplo, en una encuesta a
jóvenes que ven un determinado programa de televisión, el encuestador procederá al
llenado de las boletas hasta cumplir la cuota asignada, no importa la zona ni la forma de
selección de las personas lo importante es cumplir con la cuota asignada.
Distribución de frecuencias y su representación gráfica
datos agrupados
En estadística, los datos agrupados son aquellos datos que se agrupan en intervalos. Es
decir, los datos agrupados son datos que se juntan en intervalos para poder estudiarlos
de manera conjunta.
En definitiva, en estadística la agrupación de datos sirve para analizar conjuntamente

varios datos, de manera que los datos agrupados en un intervalo se tratan como un solo
dato. Además, agrupar los datos es muy útil cuando la muestra es muy grande.
Ejemplo de datos agrupados:
Datos no agrupados
Los datos no agrupados son aquellos que no han recibido ningún tratamiento o
clasificación luego de ser recolectados. Es decir, no se ha separado a los datos por
grupos bajo ningún criterio.
En simple, los datos no agrupados son los que se presentan tal cual han sido recogidos,
mostrándose el listado de la información obtenida.
Ejemplo de datos no agrupados:

Clase
En estadística, una clase es una agrupación de valores. Es decir, una clase es un
conjunto de valores de una muestra.
Por ejemplo, el intervalo [30,35) es una clase en la que se agrupan todos los valores
desde el 30 (incluido) hasta el 35 (no incluido). Por lo tanto, en estadística las clases son
los grupos en los que se divide un conjunto de datos.
Características de una clase

En estadística, una clase tiene principalmente tres características: los límites de la clase,
la amplitud de la clase y la marca de la clase. A continuación se explica cada una de ellas.
Límites de la clase
Los límites de la clase son los valores que delimitan el grupo, es decir, son el valor mínimo
y el valor máximo que forman el intervalo de la clase. Por lo tanto, cualquier clase posee
un límite inferior y un límite superior. Por ejemplo, la clase [40,50) tiene como límite inferior
y límite superior 40 y 50 respectivamente.
En general, el límite inferior se incluye en la clase, mientras que el límite superior no
pertenece a la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior y el límite inferior de la
clase. Así que la amplitud de una clase se calcula restando el límite superior menos el
límite inferior.
Marca de la clase
La marca de la clase es el punto medio del los límites de la clase. De modo que para
sacar la marca de clase se deben sumar sus dos límites y luego dividir entre dos.
Por ejemplo, la marca del intervalo de clase [40,50) es 45, pues es el punto que está
entremedio de sus dos límites.
La marca de clase se suele representar mediante el símbolo Ci o Xi.

Frecuencias
En estadística, los diferentes tipos de frecuencias son los siguientes:
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un valor en un conjunto de
datos. Es decir, la frecuencia absoluta es la cantidad de veces que se repite un resultado.
Por ejemplo, si en una encuesta se pregunta a varios individuos cuál es su color favorito
y cuatro personas han contestado el color verde, significa que la frecuencia absoluta del
color verde es 4.
Por lo tanto, la suma de las frecuencias absolutas de todos los valores es igual al número
total de datos de la muestra estadística.
Frecuencia relativa
La frecuencia relativa es una medida que indica el número de veces que aparece un valor
en una muestra de datos en forma de proporción o porcentaje. En concreto, la frecuencia
relativa es igual a la frecuencia absoluta dividido por el número total de datos.
.La frecuencia relativa es igual a la frecuencia absoluta partido por el número total de
datos, por lo tanto, para calcular la frecuencia relativa primero se debe hallar la frecuencia
absoluta y luego dividir entre el número total de observaciones.
Así pues, la fórmula de la frecuencia relativa es la siguiente:
Donde:
h:_es la frecuencia relativa.
F: es la frecuencia absoluta.
N: es el número total de datos.

Frecuencia relativa acumulada
la frecuencia relativa acumulada es la suma acumulativa de las frecuencias relativas. Es

decir, la frecuencia relativa acumulada de un valor es igual a la frecuencia relativa de
dicho valor más las frecuencias relativas de todos los valores menores que él.
Para calcular la frecuencia relativa acumulada se deben seguir los siguientes

pasos:
1.Construir una tabla de frecuencias con todos los valores diferentes de la muestra
estadística.
2.Calcular la frecuencia absoluta de cada valor.
3.A partir de las frecuencias absolutas, determinar la frecuencia relativa de cada valor.
Hallar la frecuencia relativa acumulada de cada valor, que se calcula sumando la
frecuencia relativa del propio valor más las frecuencias relativas de todos los valores
menores.
Frecuencia porcentual
En estadística, la frecuencia porcentual es una medida que indica el porcentaje de veces

que aparece un valor en una muestra respecto el número total de datos. Por lo tanto, la
frecuencia porcentual es igual a la frecuencia relativa multiplicada por 100.
Por ejemplo, si en una muestra de 50 datos un valor está repetido 10 veces, la frecuencia
porcentual de dicho valor es del 20% (10/50=0,2→20%).
Para calcular la frecuencia porcentual:
Construir una tabla de frecuencias con todos los valores diferentes de la muestra
estadística.
1. Hallar la frecuencia absoluta de cada valor.
2.A partir de las frecuencias absolutas, determinar la frecuencia relativa de cada valor.
3.Determinar la frecuencia porcentual de cada valor, que se calcula multiplicando las

frecuencias relativas por 100.
Histograma
Un histograma es tipo de diagrama estadístico en el que se representa un conjunto de
datos estadísticos mediante barras rectangulares, de manera que cada barra del
histograma es proporcional a su frecuencia correspondiente.
Los histogramas sirven para representar gráficamente variables continuas, como por
ejemplo el peso de una muestra estadística. Además, un histograma permite visualizar
rápidamente la forma que tiene una distribución.
Los pasos para hacer un histograma son:
1.Dividir el eje horizontal del histograma en intervalos según la serie de datos.
2.Representar los valores de las frecuencias de los intervalos en el eje vertical del
histograma.
3.Para cada intervalo, dibujar una barra rectangular con una altura equivalente a la
frecuencia del intervalo. Ten en cuenta que las barras de dos intervalos consecutivos
deben tocarse.
Para representar un histograma debemos seguir los pasos explicados arriba. Es decir,
primero dividimos el eje horizontal en partes equivalentes a los intervalos de los datos,
luego graduamos la escala del eje vertical y, finalmente, representamos cada intervalo
mediante una columna de altura igual a su frecuencia absoluta.
Polígono de frecuencias
Un polígono de frecuencias es un tipo de gráfico estadístico en el que se representa el
conjunto de datos mediante puntos y se unen con líneas.
En estadística, el polígono de frecuencias normalmente sirve para representar una serie

temporal. Ya que este tipo de diagramas son muy útiles para analizar la evolución de
los datos.
Los pasos para hacer un polígono de frecuencias son los siguientes:
1.Dibujar el eje horizontal y el eje vertical del polígono de frecuencias y hacer la escala
para luego poder representar los datos en el gráfico.
2.Representar las parejas de datos como puntos en la gráfica.
3.Unir los puntos consecutivos del gráfico mediante una línea.

Ojiva
En estadística, la ojiva es la gráfica acumulativa de una serie de datos. Es decir, la ojiva

es un gráfico que muestra la frecuencia acumulada asociada a un conjunto de datos.
Por lo tanto, la ojiva sirve para saber el número de datos que se encuentran por debajo
de un valor determinado
Vista la definición de ojiva en estadística, vamos a ver cómo se hace este tipo de
diagrama.
1.Calcular las frecuencias absolutas acumuladas del conjunto de datos.
2.Representar el eje horizontal y el eje vertical del gráfico. En general, el eje horizontal
corresponde a los límites de los intervalos y el eje vertical a las frecuencias acumuladas.
3.Representar las frecuencias absolutas acumuladas como puntos en la gráfica.
4.Unir los puntos consecutivos del gráfico mediante una línea para formar la ojiva.
Pareto
Un diagrama de Pareto es un ejemplo especial de diagrama de barras. En el diagrama
de Pareto las barras se ordenan por conteos de frecuencia, del más alto al más bajo.
Estos diagramas se usan a menudo para identificar áreas en las que centrarse primero
en mejora de procesos.
Los diagramas de Pareto reflejan los conteos ordenados de frecuencia de valores de los
distintos niveles de una variable categórica o nominal. Estos diagramas se basan en la
regla del 80/20. Esta regla sostiene que aproximadamente el 80 % de los problemas se
derivan del 20 % de las causas. Esta regla también se conoce como del «puñado esencial
y la multitud trivial». De nuevo, la idea es que podemos centrarnos en unas pocas causas
fundamentales en la raíz de los problemas e ignorar muchas otras triviales. La figura 1 es
un ejemplo de diagrama de Pareto.
Pastel
Una gráfica de pastel o gráfica circular es un tipo de representación para el análisis de datos
estadísticos. Tiene la forma de un disco dividido en sectores, cuyas áreas son proporcionales a
los porcentajes de los distintos componentes de la población estadística.
Cada valor del carácter estudiado corresponde a un sector. Las medidas de los ángulos de los
sectores son proporcionales a los números representados (o a las frecuencias asociadas). La
representación de números negativos es imposible con este tipo de diagrama.
El nombre de esta gráfica se lo da su aspecto: Un pastel circular que ha sido cortado en varias
rebanadas.
Los gráficos circulares son una buena forma de mostrar gráficamente una distribución de
frecuencias. En un gráfico circular, la frecuencia o el porcentaje se representa tanto visual como
numéricamente, por lo que suele ser rápida de entender para los lectores.
Usa una gráfica de pastel o circular si tu audiencia tiene una idea general de la relación de las
partes y el todo de los datos y no es tan importante comparar los tamaños de las rebanadas.
También puedes usar una gráfica circular para transmitir que un segmento del total es
relativamente pequeño o grande
Barras
Un diagrama de barras es un tipo de gráfico estadístico que se utiliza para representar

gráficamente variables discretas.
En un diagrama de barras se representa en el eje X cada valor de la variable de estudio,

y para cada uno se dibuja una barra rectangular con una altura proporcional a su
frecuencia.
Para hacer un diagrama de barras se deben seguir los siguientes pasos:
1.Poner en el eje X del diagrama de barras los valores de la variable.
2.Colocar en el eje Y del gráfico de barras la frecuencia de cada valor estadístico
3.Representar en cada valor del eje X una barra vertical con una altura de su
frecuencia.
Ten en cuenta que las barras deben tener todas el mismo ancho y el mismo espacio de
separación entre ellas.
Tallo y Hoja
El diagrama de tallo y hoja es un tipo de diagrama estadístico en el que se representa un

conjunto de datos cuantitativos.
En un diagrama de tallo y hoja cada dato está separado por la hoja, que es su último
dígito, y el tallo, que son las cifras restantes. De modo que en un diagrama de tallo y hoja
se pone cada hoja en la línea de su tallo correspondiente.
Para hacer un diagrama de tallo y hoja se deben seguir los siguientes pasos:
1.Ordenar los datos de menor a mayor
2.Si es necesario, redondear los números hasta que tengan el número de cifras
deseadas
.
3.Decidir en qué cifra se hará el corte entre el tallo y la hoja, es decir, determinar
cuántas cifras serán las hojas. Normalmente, se hace que la hoja sea solamente el
último dígito de cada dato.
4.Representar cada dato en el diagrama de tallo y hoja. Los tallos se colocan en la

columna de la izquierda en orden ascendente, mientras que las hojas se ponen en la
columna de la derecha a la altura de su tallo correspondiente y también en orden
ascendente.
Construcción de tablas de distribución y gráficas con empleo de software
Distribución de frecuencias Las distribuciones de frecuencias son tablas en que se
dispone las modalidades de la variable por filas. En las columnas se dispone el número
de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en
frecuencias es facilitar la obtención de la información que contienen los datos. La
inspección de los datos originales no permite responder fácilmente a cuestiones como
cuál es la actitud mayoritaria del grupo, y resulta bastante más difícil determinar la
magnitud de la diferencia de actitud entre hombres y mujeres. Podemos hacernos mejor
idea si disponemos en una tabla los valores de la variable acompañados del número de
veces (la frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).
La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria
de los individuos del grupo estudiado es indiferente.
La interpretación de los datos ha sido facilitada porque se ha reducido el número de

números a examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la
variable y 5 frecuencias).
Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el
número de ocurrencias dividido por el total de datos, y se simbolizan “fr” o “p i “),
frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de los
valores iguales o inferiores al de referencia, y se simbolizan “f a ” o “n a “. No obstante la
frecuencia acumulada también es definida incluyendo al valor de referencia), frecuencias
acumuladas relativas (la frecuencia acumulada relativa es el total de frecuencias relativas
de los valores iguales o inferiores al de referencia, y se simbolizan “f r ” o “p a “)
Medidas de tendencia central, localización y dispersión
Tendencia central
Las medidas de tendencia central, o medidas de centralización, son métricas estadísticas

que indican el valor central de una distribución. Es decir, las medidas de tendencia central
sirven para encontrar un valor representativo del centro de un conjunto de datos.
Las medidas de tendencia central son:
Media
es el promedio de todos los datos de la muestra. Para calcular la media se deben sumar
todos los valores y luego dividir entre el número total de datos. Por lo tanto, la fórmula de
la media es la siguiente:
El símbolo de la media es una ralla horizontal encima de la letra x (\overline{x}).Aunque

también se puede diferenciar entre la media muestral y la media poblacional con el
símbolo de la media: la media de una muestra se expresa con el símbolo \overline{x},
mientras que la media de una población se utiliza la letra griega \mu.
La media también se conoce como media aritmética o promedio. Además, la media de
una distribución estadística es equivalente a su esperanza matemática.
Ejemplo:
Un alumno ha sacado las siguientes notas en un curso escolar: en matemáticas un 9, en
lengua un 7, en historia un 6, en economía un 8 y en ciencia un 7,5. ¿Cuál es la media
de todas sus notas?
Para hallar la media aritmética tenemos que sumar todas las notas y luego dividir entre
el número total de asignaturas del curso, que es 5. Por lo tanto, aplicamos la fórmula de
la media aritmética:
Mediana
es el valor del medio de todos los datos ordenados de menor a mayor. La mediana es el
valor del medio de todos los datos ordenados de menor a mayor. Es decir, la mediana
divide todo el conjunto de datos ordenados en dos partes iguales.
El cálculo de la mediana depende de si el número total de datos es par o impar:
Si el número total de datos es impar, la mediana será el valor que está justo en el medio
de los datos. Es decir, el valor que está en la posición (n+1)/2 de los datos ordenados.
Si el número total de datos es par, la mediana será la media de los dos datos que están
en el centro. Esto es, la media aritmética de los valores que están en la posiciones n/2 y
n/2+1 de los datos ordenados
Ejemplo de la mediana
Calcula la mediana de los siguientes datos:

3, 4, 1, 6, 7, 4, 8, 2, 8, 4, 5
Lo primero que debemos hacer antes de realizar ningún cálculo es ordenar los datos, por
lo que ponemos los números de menor a mayor.
1\2\3\4\4\4\5\6\7\8\8
En este caso tenemos 11 observaciones, así que el número total de datos es impar. Por
lo tanto, aplicamos la siguiente fórmula para calcular la posición de la mediana:
De manera que la mediana será aquel dato que está en la sexta posición, que en este
caso corresponde al valor 4
Moda
es el valor que más se repite del conjunto de datos. En estadística, la moda es el valor
del conjunto de datos que tiene una mayor frecuencia absoluta, es decir, la moda es el
valor que más se repite de un conjunto de datos.
Por lo tanto, para calcular la moda de un conjunto de datos estadísticos basta con
contar el número de veces que aparece cada dato en la muestra, y el dato más repetido
será la moda.
Se pueden distinguir tres tipos de modas según el número de valores que están más
repetidos:
Moda unimodal: solo hay un valor con el máximo número de repeticiones. Por ejemplo,
[1, 4, 2, 4, 5, 3].
Moda bimodal: el máximo número de repeticiones se produce en dos valores diferentes

y ambos valores se repiten el mismo número de veces. Por ejemplo, [2, 6, 7, 2, 3, 6, 9].
Moda multimodal: tres o más valores tienen el mismo número máximo de repeticiones.
Por ejemplo, [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1].
Ejemplo de la moda:
¿Cuál es la moda del siguiente conjunto de datos?
5\4\9\7\2\3\9\6\5\2\5
Los números están desordenados, así que primero que haremos será ordenarlos. Este
paso no es obligatorio, pero te ayudará a encontrar la moda más fácilmente.
2\2\3\4\5\5\5\6\7\9\9
Los números 2 y 9 aparecen dos veces, pero el número 5 está repetido tres veces. Por
lo tanto, la moda de la serie de datos es el número 5.
Mo=5
Localización
Los Cuantiles (cuartiles, deciles, percentiles) son medidas de localización, su

función es informar del valor de la variable que ocupará la posición (en tanto por
cien) que nos interese respecto de todo el conjunto de variables.
Podemos decir que los Cuantiles son unas medidas de posición que dividen a la
distribución en un cierto número de partes de manera que en cada una de ellas
hay el mismo de valores de la variable.
Las más importantes son:
CUARTILES, dividen a la distribución en cuatro partes iguales (tres divisiones).

Q1, Q2,Q3, correspondientes a 25%, 50%,75%.
DECILES, dividen a la distribución en 10 partes iguales (9 divisiones). D1,...,D9,
correspondientes a 10%,,90%
PERCENTILES, cuando dividen a la distribución en 100 partes (99 divisiones).
P1, ...,P99, correspondientes a 1%,...,99%.
Existe un valor en cual coinciden los cuartiles, los deciles y percentiles es cuando
son iguales a la Mediana y así veremos:
Cuartiles
Cuartiles: Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3:

El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel valor de la variable que supera 25% de las observaciones
y es superado por el 75% de las observaciones
El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es

el menor valor que es mayor que la mitad de los datos, es decir el 50% de las
observaciones son mayores que la mediana y el 50% son menores.
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de
los datos, es decir aquel valor de la variable que supera al 75% y es superado
por el 25% de las observaciones.
Deciles
Deciles: Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de
datos ordenados en diez partes iguales, son también un caso particular de los percentiles,
ya que podemos definir Decil como “percentil cuyo valor que indica su proporción es un
múltiplo de diez. Percentil 10 es el primer decil, percentil 20 el segundo decil, etc”.
El primer decil D1: indica que sólo existe un 10% de probabilidad de que el valor de la
variable esté por debajo de esa cifra.
Quinto decil D5 o denominado también “Caso Base”: indica que existe igualmente un 50%
de probabilidad de que el valor esté por encima como por debajo de esa cifra. Representa
la Mediana de la distribución.
Percentiles
Los percentiles son, tal vez, las medidas más utilizadas
para propósitos de ubicación o clasificación de las personas cuando atienden
características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados
en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en
cien partes iguales el conjunto de datos ordenados. Sencillamente Percentil es el
valor del recorrido de una variable, bajo el cual se encuentra una proporción
determinada de la población.
percentil:
Dispersión
Medidas de dispersión
Son aquellas que permiten retratar la distancia de los valores de la variable a un

cierto valor central, o que permiten identificar la concentración de los datos en
un cierto sector del recorrido de la variable. Estudian la distribución de los
valores de la serie, analizando si estos se encuentran más o menos
concentrados, o más o menos dispersos.
Rango
Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor
más elevado y el valor más bajo.
El rango indica la longitud del intervalo en el que se hallan todos los datos de la
distribución. El rango es una medida de dispersión importante, aunque insuficiente para
valorar convenientemente la variabilidad de los datos.
Ejemplo.
Calcular el rango de las siguientes edades (en años) de alumnos del grupo 470-A de la
prepa 8 de la UNAM que son de excelencia académica: y . 18
Solución.
El valor mínimo es 14 años y el valor máximo es 18, por lo tanto:
Desviación estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos con respecto a la media. Mientras mayor sea la desviación
estándar, mayor será la dispersión de los datos. Se denota por medio de s.
Una desviación estándar grande indica que los puntos están lejos de la media, y una
desviación pequeña indica que los datos están agrupados cerca de la media.
La fórmula para calcular la desviación estándar es:

Varianza
Está considerada, junto con la desviación estándar, el mejor indicador de la variabilidad

global de la distribución. Mide la dispersión de los datos respecto a la media aritmética,
de hecho, suministra el valor medio del cuadrado de las desviaciones de los valores
respecto de la media:
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la

media aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y por tanto,
menor representatividad tendrá la media aritmética. La varianza se expresa en las
mismas unidades que la variable analizada, pero elevadas al cuadrado.
Se denota por n y su expresión es:
Ejemplo.
Las edades de los pacientes de un doctor en un día fueron las siguientes:

y 39 obtener la varianza de las edades e interpretarla:
Solución.
Calculando la media aritmética:
Este valor se interpreta como que la media de las diferencias cuadráticas de los
siete datos con respecto a su media aritmética es alta, esto significa que las edades son
muy dispersas.
Desviación media
La desviación media es una medida que se utiliza para entender qué tanto se alejan los datos
de un conjunto promedio.
Es una medida que nos ayuda a entender cuánto varían los datos de un conjunto promedio. Si
la desviación es grande, significa que los datos están muy dispersos o variados, mientras que si
es pequeña, significa que los datos están muy cercanos entre sí.
Conclusión
La estadística es una disciplina matemática que desempeña un papel fundamental en la
comprensión y el análisis de datos en una amplia variedad de campos, desde la
investigación científica hasta la toma de decisiones empresariales y la planificación
gubernamental. A lo largo de esta investigación, hemos explorado en detalle los
conceptos, fórmulas y procesos de cálculo que constituyen los cimientos de esta ciencia.
Inicio la investigación con una sólida comprensión de la distinción entre la estadística

descriptiva y la inferencial, lo que nos permite comprender cómo se aplican estos
principios en diversas situaciones. Esto nos condujo al estudio de elementos clave como
población, muestra y muestreo, resaltando la importancia de seleccionar muestras
representativas para obtener conclusiones precisas.
Una vez que comprendimos cómo recopilar datos adecuadamente, avanzamos hacia la
creación de distribuciones de frecuencias y su representación gráfica. Aprendimos a
organizar datos en clases, calcular límites de clase, amplitudes y marcas de clase, y cómo
calcular las frecuencias absolutas, relativas, relativas porcentuales y acumuladas para
obtener una visión completa de la distribución de datos.
Exploramos las medidas de tendencia central, localización y dispersión, que nos permiten
comprender mejor la tendencia central de los datos, su dispersión y su posición relativa.
Estas medidas, como la media, la mediana y la desviación estándar, se han revelado
como herramientas esenciales para analizar y resumir datos de manera significativa.
Por último, enfatizamos la importancia de la tecnología y el software estadístico en la

simplificación de los cálculos y análisis. Estos recursos nos brindan la capacidad de
aplicar estos conceptos de manera eficiente en el mundo real.
Estos conocimientos no solo son valiosos para los estadísticos y analistas de datos, sino
que también son esenciales para cualquier persona que desee tomar decisiones
informadas basadas en la información cuantitativa. La estadística nos brinda las
herramientas necesarias para explorar y entender el mundo que nos rodea, y su
aplicación se extiende a prácticamente todos los campos de la vida moderna.
Esperamos que esta investigación haya servido como una guía exhaustiva y práctica para
aquellos que buscan comprender y aplicar los principios estadísticos en sus respectivos
campos y proyectos, y que inspire una mayor exploración y aplicación
de esta poderosa disciplina.
Fuentes bibliográficas
Ortega, C. (2023, April 8). Desviación media: Qué es, fórmula y cómo calcularla.
QuestionPro. https://www.questionpro.com/blog/es/desviacion-media/
Estadística, P. y. (2022, May 27). Medidas de tendencia central. Probabilidad y

Estadística. https://www.probabilidadyestadistica.net/medidas-de-tendencia-central/
Estadística, P. y. (2022b, June 6). Diagrama de Pareto. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/diagrama-de-pareto/
Ortega, C. (2023, April 8). Desviación media: Qué es, fórmula y cómo calcularla.
QuestionPro. https://www.questionpro.com/blog/es/desviacion-media/
Localización: cuartiles, deciles y percentiles - Google Search. (n.d.). Com.Mx. Retrieved

September 28, 2023, from
https://www.google.com.mx/search?q=+Localizaci%C3%B3n%3A+cuartiles%2C+decile
s+y+percentiles+&sca_esv=569245889&source=hp&ei=C-IVZbC9B6PDkPIPsc-
w4Ak&iflsig=AO6bgOgAAAAAZRXwGya8gmmYW65s9biAaHHXhQnx6WDQ&ved=0ah
UKEwjw7pjDks6BAxWjIUQIHbEnDJwQ4dUDCAo&uact=5&oq=+Localizaci%C3%B3n%
3A+cuartiles%2C+deciles+y+percentiles+&gs_lp=Egdnd3Mtd2l6IjEgTG9jYWxpemFjac
OzbjogY3VhcnRpbGVzLCBkZWNpbGVzIHkgcGVyY2VudGlsZXMgMgYQABgWGB4yB
hAAGBYYHkj9cVDjEljnbHAFeACQAQCYAYQCoAGNBKoBBTAuMi4xuAEDyAEA-AEB-
AECqAIKwgIaEAAYigUY5QIY5QIY6gIYtAIYigMYtwMY1APCAgcQABiKBRhDwgILEC4Y
gAQYsQMYgwHCAggQABiABBixA8ICCxAAGIoFGLEDGIMBwgIFEC4YgATCAgsQLhiD
ARixAxiKBcICCxAAGIAEGLEDGIMB&sclient=gws-wiz
Estadística, P. y. (2022a, May 27). Medidas de tendencia central. Probabilidad y

Estadística. https://www.probabilidadyestadistica.net/medidas-de-tendencia-central/
Estadística básica: ¿Qué es una tabla de frecuencias? (n.d.). Gcfglobal.org. Retrieved

September 28, 2023, from https://edu.gcfglobal.org/es/estadistica-basica/que-es-una-
tabla-de-frecuencias/1/
Cómo construir una tabla de distribución de frecuencias. (2015, February 10).

MateMovil; Matemóvil. https://matemovil.com/como-construir-una-tabla-de-distribucion-
de-frecuencias/
Estadística, P. y. (2022b, May 31). ▷ ¿Qué es un diagrama de tallo y hoja? (ejemplos).

Probabilidad y Estadística. https://www.probabilidadyestadistica.net/diagrama-de-tallo-y-
hoja/
Estadística, P. Y. (2022). Diagrama de Barras. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/diagrama-de-barras/
Ortega, C. (2022, 19 abril). Gráfica de pastel: qué es, características y cuándo utilizarla.
https://tudashboard.com/grafica-de-pastel/
Estadística, P. Y. (2022b). Gráfico estadístico. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/grafico-estadistico/
Estadística, P. Y. (2022b). Polígono de frecuencias. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/poligono-de-frecuencias/
Estadística, P. Y. (2022c). Histograma. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/histograma/
Estadística, P. Y. (2022d). Frecuencia porcentual. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/frecuencia-porcentual/
Estadística, P. Y. (2022c). Frecuencia relativa. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/frecuencia-relativa/
Estadística, P. Y. (2023). Frecuencia absoluta. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/frecuencia-absoluta/
Estadística, P. Y. (2022d). Tipos de frecuencias. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/tipos-de-frecuencias/
Estadística, P. Y. (2022f). Clase (estadística). Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/clase-estadistica/
Westreicher, G. (2022). Datos no agrupados. Economipedia.

https://economipedia.com/definiciones/datos-no-agrupados.html
Santoja, M. R. P. A. M. M. J. M. (s. f.). Tipos de datos | Estadística.

http://descargas.pntic.mec.es/cedec/mat3_2/contenidos/M3_U10/tipos_de_datos.html#:
~:text=Las%20variables%20estad%C3%ADsticas%20pueden%20ser,cuyo%20resultad
o%20es%20un%20n%C3%BAmero.
Ortega, C. (2023). Muestreo no probabilístico: definición, tipos y ejemplos. QuestionPro.

https://www.questionpro.com/blog/es/muestreo-no-probabilistico/
López, P. L. (s. f.). POBLACIÓN MUESTRA y MUESTREO.

http://www.scielo.org.bo/scielo.php?script=sci_arttext&pid=S1815-02762004000100012
Probabilístico estratificado - Bing. (s. f.). Bing.

https://www.bing.com/images/search?q=probabil%c3%adstico+estratificado&FORM=HD
RSC3
Datos cualitativos y cuantitativos | QuestionPro. (s. f.).

https://www.questionpro.com/es/cualitativa-vs-cuantitativa.html
Definiciones de población finita e infinita | Monografías plus. (s. f.).
https://www.monografias.com/docs/Definiciones-De-Poblaci%C3%B3n-Finita-E-Infinita-
PK9KSGPCDUNZ
López, J. F. (2022). Variable estadística. Economipedia.

https://economipedia.com/definiciones/variable-estadistica.html
Dmg. (2022). Ejemplos de población finita. Ejemplos.cc.

https://www.ejemplos.cc/poblacion-finita/
Antes de continuar. (s. f.).

https://www.google.com.mx/search?q=ejemplo+de+medir+la+estatura+estadistica&tbm
=isch&ved=2ahUKEwj0w43bssyBAxUNwMkDHdTSDAQQ2-
cCegQIABAA&oq=ejemplo+de+medir+la+estatura+estadistica&gs_lcp=CgNpbWcQA1C
ZB1jdK2DeMmgAcAB4AIAB9QGIAd0QkgEGMC4xMC4zmAEAoAEBqgELZ3dzLXdpei1
pbWfAAQE&sclient=img&ei=W_cUZbSqLI2Ap84P1KWzIA&bih=619&biw=1349&hl=es
Datos cuantitativos | QuestionPro. (s. f.). https://www.questionpro.com/es/datos-

cuantitativos.html#:~:text=Datos%20cuantitativos%20discretos%3A,o%20mascotas%20
en%20su%20familia.
Antes de continuar. (s. f.-b).

https://www.google.com.mx/search?q=datos+cuantitativos+discretos&tbm=isch&chips=
q:datos+cuantitativos+discretos,g_1:grafico:rNfmzPKUL94%3D&hl=es&sa=X&ved=2ah
UKEwj-ldH1scyBAxUmGN4AHRZeCrsQ4lYoBHoECAEQOg&biw=1349&bih=619
Jorge, & Jorge. (2022). Variables discretas y continuas, ejemplos y ejercicios |

Matemóvil. MateMovil. https://matemovil.com/variables-discretas-y-continuas-ejemplos-
y-ejercicios/
Zapata, F. (2022). Estadística descriptiva: historia, características, ejemplos, conceptos.

Lifeder. https://www.lifeder.com/estadistica-descriptiva/
Estadística básica: ¿Qué es la estadística? (s. f.). GCFGlobal.org.

https://edu.gcfglobal.org/es/estadistica-basica/que-es-la-estadistica/1/
Estadística, P. Y. (2022f). Datos cualitativos. Probabilidad y Estadística.

https://www.probabilidadyestadistica.net/datos-cualitativos/#google_vignette
Libretexts. (2022). 1: Introducción a la estadística. LibreTexts Español.

https://espanol.libretexts.org/Estadisticas/Estadisticas_Introductorias/Libro%3A_Estad%
C3%ADsticas_Introductorias_(Shafer_y_Zhang)/01%3A_Introducci%C3%B3n_a_la_Est
ad%C3%ADstica

Investigación Probabilidad y Estadisticas YJP

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Investigación Probabilidad y Estadisticas YJP

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD TECNOLÓGICA DE TABASCO.

DIVISIÓN DE TECNOLOGÍA DE LA INFORMACIÓN Y COMUNICACIÓN

NOMBRE DEL ALUMNO:

Yarey del Carmen Jiménez Palacios

PARRILLA, CENTRO, TABASCO DE SEPTIEMBRE DEL

Esta investigación tiene como objetivo sumergirse en el fascinante mundo de la

Comenzaremos con una introducción a la estadística, donde definiremos conceptos

Continuaremos nuestra exploración adentrándonos en la distribución de frecuencias y su

En la segunda mitad de nuestra investigación, nos sumergiremos en las medidas de

Por último, exploraremos cómo la tecnología y el software estadístico facilitan el cálculo

La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis

La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar

El origen de la palabra estadística se suele atribuir al economista Gottfried Achenwall

Conviene saber que la estadística NO es una rama de las matemáticas. Utiliza

La estadística es la ciencia de los datos, se ocupa de su recolección, organización,

La estadística se utiliza en investigaciones médicas para comprobar la eficacia de un

La estadística es una ciencia formal, con un conocimiento propio, dinámico y en continuo

La estadística descriptiva es una disciplina que se encarga de recoger, almacenar,

La estadística descriptiva es, junto con la inferencia estadística o estadística inferencial,

La estadística descriptiva es la rama de la Estadística que se ocupa de recopilar y

Siempre que se necesite recopilar, organizar y presentar datos, la estadística descriptiva

La inferencia estadística es el conjunto de métodos que permiten inducir, a través de una

Normalmente, en estadística, se trabaja con muestras debido a la gran cantidad de datos

La estadística inferencial, también conocida como inductiva, es aquella estadística que

Cuando hablamos de variable estadística estamos hablando de una cualidad que,

Tipos de variables estadísticas

Variable cuantitativa: Son variables que se expresan numéricamente.

Datos que no se expresan en forma de valores numéricos, sino mediante palabras o

Los datos cualitativos provienen típicamente de trabajos de campo, y se recopilan por

Características de los datos cualitativos:

Se denomina investigación cuantitativa aquella que genera datos numéricos o

Ejemplos de variables cuantitativas discretas:

• El número de hijos de una familia.

Estos valores deben encajar en determinadas categorías y no pueden dividirse en partes

Este tipo de datos cuantitativos se refiere al flujo constante de valores posibles de la

Sin embargo, las distintas clases de variables continúan su

Una población finita en estadística se refiere a un conjunto de elementos o individuos que

Al utilizar una población finita en estudios y análisis estadísticos, se obtienen

Características clave de una población finita:

1. Tamaño definido: Una población finita tiene un número determinado de

Población Infinita: imposible de medir. Es infinita ya que incluye un gran conjunto de

Datos cuantitativos: Aquí todo se trata de números. Imagínate a la información

a). Muestreo probabilístico aleatorio simple

1. Identificar y definir la población.

Este tipo de muestreo se utiliza cuando el tamaño de la población es grande y la tabla de

1. Identifique y defina la población.

Tabla de números aleatorios

Este tipo de muestreo se caracteriza por la división de la población en subgrupos o

Es proceso que se sigue es el siguiente:

1. Identifique y defina la población.

El muestreo conglomerado es conocido también por racimos. El procedimiento es el

1. El proceso se inicia definiendo los conglomerados que componen la población Ej.

a) Intencional o deliberado. El investigador decide según los objetivos, los elementos

b) Accidentales o por comodidad. El investigador acomoda su investigación de

c) Por cuota. Consiste en que el investigador selecciona la muestra considerando

En definitiva, en estadística la agrupación de datos sirve para analizar conjuntamente

Ejemplo de datos agrupados:

Ejemplo de datos no agrupados:

Características de una clase

La marca de clase se suele representar mediante el símbolo Ci o Xi.

Así pues, la fórmula de la frecuencia relativa es la siguiente:

h:_es la frecuencia relativa.

N: es el número total de datos.

la frecuencia relativa acumulada es la suma acumulativa de las frecuencias relativas. Es