Está en la página 1de 41

CONTENIDO

Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales

Presentación .................................................... ……………………………………………………….3

1. Nociones y conceptos básicos de estadística y probabilidad ................................................... 4


1.1 Introducción a la estadística……………………………………………………………………4
1.2 Introducción a la probabilidad ……………………………..…………………………………..9

2. ¿Qué significan las medidas de tendencia central y de dispersión?.........................….…….…10

3. Técnicas de conteo y agrupación en clases para la determinación de probabilidades…….…12

3.1 Variables…………………………………………………………………………………….…..12
3.2 Muestreo………………………………………………………………..………………….……16
3.3 Ordenamiento de datos y análisis de información………………………………………….18

4. Probabilidad………………………………………………………………………………………….…26

4.1 ¿Qué significa cada enfoque de probabilidad?...............................................................26

4.2 Usos de la probabilidad y estadística en situaciones dadas………………………….…..29

4.3 Nociones de incertidumbre, azar y aleatoriedad……………………………………….…..30

4.4 Tipos de eventos en el estudio de la probabilidad………………………………………….30

4.5 Riesgo…………………………………………………………………………………………...32

4.5.1 ¿Qué papel juega la probabilidad y estadística en el estudio del riesgo?.......33

4.5.2 Distribuciones de probabilidad y variables aleatorias…………………………..34

Cierre ....................................................................................................................................... 41

Referencias por unidad ............................................................................................................ 42

1
Guía de navegación

En este documento encontrarás gran cantidad de información, lo cual demanda generar estrategias de
aprendizaje, para analizarla y que te apropies de los conocimientos haciéndolos útiles para tu entorno.
Por ello, te proporcionamos la siguiente guía de navegación para darle un mejor uso al contenido, con la
presentación de los siguientes iconos que te permitirán relacionar cada uno de estos elementos.

Con este icono identificarás algún Tip de aprendizaje, es decir,


sugerencias de cómo poder reforzar tu aprendizaje a partir de algunas
actividades propuestas.

Cuando encuentres este icono, distinguirás los ¿Sabías qué?, mediante


datos curiosos que te permitirán conocer información adicional sobre el
contenido revisado.

Mediante esta imagen encontrarás Vocabulario, que puede ir desde


palabras nuevas y definiciones hasta datos biográficos de personajes
importantes que te ayudarán a responder algunas actividades o tareas.

Cuando veas este icono, será momento de conocer algo más Acerca de lo
que estás leyendo en ese momento, es decir, de profundizar sobre el
contenido de tu lectura.

Para cuando quieres conocer más información sobre el contenido que


estés leyendo, en recursos de internet, donde se aborda más a
profundidad lo revisado, encontrarás este símbolo Para saber más.

Para encontrar algunos ejemplos contextualizados, reflexiones o


preguntas detonadoras sobre el contenido que estás revisando, podrás
reconocer este símbolo, con el cual descubrirás
Mi mundo y yo.

2
UNIDAD I. LA ESTADÍSTICA DESCRIPTIVA Y LOS FENÓMENOS
NATURALES Y PROCESOS SOCIALES
Presentación

En esta unidad revisarás todo lo relacionado a los principios básicos de estadística y probabilidad, y a
partir de ello desarrollarás las competencias necesarias que plantea el perfil de egreso en la Educación
Media Superior, es decir, para que logres aplicar de manera efectiva tus conocimientos, habilidades y
actitudes en situaciones o problemas concretos.

Propósito formativo
Analizar fenómenos naturales y procesos sociales de tu entorno mediante el uso de conceptos básicos
de la probabilidad y estadística (tipos de eventos, variables, muestreo, gráficas) para reconocer los
diferentes tipos de distribución de la información y explicar el comportamiento de dichos fenómenos y
procesos en un determinado contexto, en un ambiente de respeto y tolerancia.

Aprendizajes esperados
• Argumentar la posibilidad de ocurrencia de algunos fenómenos naturales y procesos sociales de
tu entorno, mediante el uso de los tipos de distribución de probabilidad.
• Interpretar tablas y gráficas que representen la información de los hechos o fenómenos naturales
y procesos sociales vinculados dentro de tu contexto.
• Interpretar y explicar el funcionamiento de fenómenos naturales y procesos sociales dentro de tu
contexto local y regional a través de modelos de estadística descriptiva.
• Analizar y sintetizar las observaciones estadísticas para llegar a conclusiones lógicas.
• Determinar y analiza los tipos de variables en la interpretación y explicación de fenómenos
naturales y procesos sociales.
• Identificar fenómenos naturales y procesos sociales de tu contexto con el uso de técnicas de
muestreo para la obtención de datos que permitan interpretar y explicar dichos fenómenos que
ocurren en tu entorno.
• Reconocer el aula como una comunidad de aprendizaje en la que cada alumno aporta
conocimiento.
Punto de partida
Te has detenido a preguntarte…
¿Qué es la estadística y la probabilidad?
¿En qué situaciones se puede hacer uso de ellas?
¿Qué tan relacionadas están con los juegos de azar?
En esta unidad podrás ir respondiendo estas preguntas, ¡Adelante!

3
1. Nociones y conceptos básicos de estadística y probabilidad

1.1 Introducción a la estadística


Muchas disciplinas, a través de la demostración y comprobación de distintos
procesos humanos y naturales, han logrado avances enormes gracias a la
estadística. Si observas con atención en periódicos, revistas, libros o artículos
científicos, los datos estadísticos están en prácticamente todas las áreas: en
medicina para la generación de nuevos medicamentos; en la meteorología, en
los pronósticos de huracanes y nevadas; en psicología a través de pruebas que
miden rasgos de las personas; en deportes para calcular el desempeño de los
participantes; y así en otras áreas.
Pero ¿cómo nació?, fue a partir de una actividad de los gobiernos y
su objetivo básico consistía en contar la cantidad de personas que
estaban en su territorio. Dicha actividad fue practicada por la
primera dinastía de faraones egipcios 3,000 años a.C. En China, el
emperador Yao usó la estadística para calcular el tamaño de sus La estadística es la ciencia
actividades agrícolas y de comercio hacia el año 2,238 a.C . En referente a la recolección,
análisis e interpretación de
Grecia, 1,200 años a.C., la estadística fue utilizada para conocer la datos, que busca explicar
cantidad de nacimientos, muertes y contabilizar a los hombres con condiciones regulares en
fenómenos de tipo aleatorio.
derecho a voto. En América, alrededor de 1,116 años a.C. , el rey Xolótl
ordenó contar a todos los súbditos que pagaban tributo, entre
muchos otros casos.

En este módulo, nos centraremos en tres principales figuras: John Graunt,


Adolphe Quetelet y Émile Durkheim.

Graunt (1620-1674, Londres) es considerado el primer demógrafo. Su obra


Natural and Political Observations Made upon the Bills of Mortality de
1622 es un ejercicio de cuantificación de nacimientos y decesos. Su
objetivo fue calcular la propagación de la peste bubónica en Inglaterra, a
partir de su estudio logró explicar su expansión, pero no el problema a
gran escala ya que su método era muy limitado.

Adolphe Quetelet (1796-1874, Bélgica) fue el primer matemático que


aplicó las bases de la estadística a procesos sociales. Su obra L'homme et le développement de ses
facultés, ou Essai de physique sociale, publicada en 1896, construye una explicación sobre las sociedades

4
y cómo distinguirlas cuantificando la altura, el peso, la longevidad o cantidad de años de vida de las
personas. También argumentó que la cantidad de suicidios y la duración de los matrimonios podían ser
exponentes de los “errores” en los que incurre una sociedad determinada al no aplicar el castigo
adecuado a los delitos, así como procurar la preservación de la familia. Con el tiempo su método tuvo
mayor aplicación y avanzó en explicaciones certeras (Revista Índice, 2006).

Pero fue Émile Durkheim (1858-1917, Francia) quien aplicó de forma rigurosa los principios de la
estadística en la explicación de procesos sociales como el suicidio. En su obra Las reglas del método
sociológico, editada en 1895, señaló que los hechos sociales pueden
ser tratados como objetos; es decir, la cuantificación de procesos
sociales ayuda al científico social a eliminar prejuicios y permite
encontrar lo que está detrás de situaciones denominadas “normales”
y “anormales”. Para Durkheim, el trasfondo de los procesos sociales
puede ser demostrado en términos estadísticos, en un contexto
histórico específico en el que acontece el proceso en cuestión. Así, el
observador puede conocer y medir los elementos que determinan
diferentes procesos contextuales y cuantitativos de lo que analiza
(Durkhiem, 1979). Asimismo, en esea publicación, demostró que el
principal grupo que decide suicidarse era el de los varones; de
acuerdo con la cuantificación que realizó de las morgues en Francia,
la religión y la edad son características asociadas al suicidio. Los
hombres adultos mayores de 25 años católicos tenían mayor
cantidad de muertes por suicidio.

Con el paso del tiempo, la estadística ha consolidado ciertos principios que le permiten llegar a
conclusiones cada vez más acertadas, parte de ello se debe a su rigor en la manera en que recaba y
procesa la información. Sus principios básicos son: el análisis y conocimiento del contexto de los datos,
la fuente de los datos, el método de muestreo y la significancia estadística y práctica.

A continuación, revisaremos de qué se tratan.

- El principio de contexto y fuente están relacionados, ya que ambos tienen el objetivo de conocer
y analizar dónde, cuándo y quién nos proporciona la información numérica recabada.

5
Tip de aprendizaje

Revisa los siguientes ejemplos:

• Los estudiantes mexicanos de licenciatura suben un kilogramo de peso corporal


durante sus primeros tres meses de clases.
• Un estudio clínico realizado en el año 2004 para 200 personas en la Universidad de
Chicago, EE.UU., buscó la relación entre sobrepeso y estrés. En el estudio se afirmaba
que situaciones como los divorcios y las malas relaciones interpersonales en la escuela
o el trabajo incrementan 10% los niveles de cortisol en el cuerpo, lo cual deriva en
desajustes del metabolismo (Bienestar 180, 2016).

Responde la siguiente pregunta:

¿Cuál de ellos da cuenta de utilizar la estadística de manera adecuada para obtener sus
resultados?

- El segundo principio es el muestreo, se refiere a los procedimientos utilizados para recopilar


datos del evento que se quiera investigar, no es una actividad sencilla ya que el rigor es una condición
indispensable tanto para los procedimientos utilizados como para realizar cualquier afirmación
estadística. Por ejemplo, hay estudios estadísticos apoyados en una muestra de respuesta voluntaria y
otros en una muestra de respuesta aleatoria o al azar. En una muestra de respuesta voluntaria, las
personas deciden participar en la encuesta o estudio, esto genera un sesgo o distorsión en los resultados.
Por otro lado, una muestra aleatoria, implica que las personas encuestadas tienen la misma probabilidad
de ser elegidas. Entonces, en una muestra de respuesta voluntaria la persona sabe previamente que será
encuestada, lo que produce una alteración en las respuestas.
En una muestra aleatoria la persona no sabe que será
encuestada, es tomada por sorpresa, este procedimiento ¿Sabías qué?
ayuda a disminuir las distorsiones en las respuestas.
La ética en estudios estadísticos implica
Los métodos de muestreo son actualmente determinantes el consentimiento de las personas
encuestadas, al informar la finalidad de la
para darle credibilidad a distintos estudios de tipo social,
investigación, además los datos son
porque si se basan en información solicitada a personas, confidenciales y el bienestar de las
deben seguir ciertos criterios de ética (Triola, 2013, pág. 6), los personas encuestadas está sobre los
beneficios que la investigación genere.
cuales son:

6
1. Todos los sujetos de un estudio deben dar su consentimiento y ser informados de la finalidad de
la encuesta y del uso de su información.
2. Todos los datos de los individuos serán confidenciales; ningún estudio puede hacer pública la
información privada.
3. El bienestar de los sujetos siempre debe estar por encima de los beneficios que el estudio brinda
a la sociedad.

Tip de aprendizaje

Revisa los siguientes ejemplos:

A. La empresa operadora del tren suburbano Buenavista-Cuautitlán afirma que 90%


de sus usuarios están satisfechos con el precio que pagan al usar el tren en relación
con el tiempo que ahorran de viaje. El estudio fue realizado a través de internet y se
contó con la participación de 1,000 personas (Barrera, 2016).
B. Un investigador social demostró que 60% de los usuarios del tren suburbano
Buenavista-Cuautitlán están inconformes con el precio que pagan usando este
transporte. La afirmación está apoyada en una encuesta de 1,000 personas usuarias,
realizada en las siete estaciones de dicho transporte.

Responde las siguientes preguntas:

• ¿Cuál de las anteriores afirmaciones utiliza la muestra aleatoria?


• ¿Qué investigación utiliza la muestra de respuesta voluntaria?

- El último principio hace referencia a los tipos de significancia en los estudios estadísticos, es decir,
un estudio con significancia estadística es el que demuestra, mediante una serie de pruebas y
procedimientos matemáticos, que un estudio tiene efectos importantes que se deben considerar en la
toma de decisiones, mientras que la significancia práctica consiste en reconocer que una investigación
apoyada en el análisis estadístico tiene efectos importantes en la vida cotidiana.
Por ejemplo: La dieta del doctor Atkins (Adelgazar rápido, 2016), la cual prescribe dejar de comer harinas
y carbohidratos para bajar de peso, fue puesta a prueba por la investigación de Michael L. Dasinger
(Dasinger et al., 2003). El autor concluyó que las 40 personas que aceptaron tomar registros diarios de su
peso durante un año, siguiendo la dieta de Atkins, lograron perder 950 gramos de peso. Sin embargo,
aunque los procedimientos matemáticos indican que dichos gramos tienen significancia estadística, no
establece una significancia práctica, porque perder menos de un kilo en un año con esa dieta, no
funciona para las personas estudiadas y ese peso pudo haberse perdido con otra dieta.

7
Tip de aprendizaje

Busca en internet un caso similar al ejemplo anterior, donde la dieta logre tener significancia
práctica y significancia estadística.

En resumen, los principios de la estadística son:

• Tener siempre presente el contexto de los datos presentados en un estudio.


• Observar cuál es la fuente o autor del estudio.
• Entender y analizar el objetivo del estudio estadístico.
• Identificar la técnica de recolección de datos o el proceso de muestreo.
• Considerar si las conclusiones propuestas logran la significancia estadística y significancia
práctica.
• Observar si el estudio cumple con los criterios de ética.

Por lo tanto, la estadística es una herramienta científica que permite demostrar el efecto de procesos
naturales y sociales. Los datos estadísticos no son verdaderos ni válidos por sí mismos. Los números no
mienten, pero pueden ayudar a engañar si omiten y ocultan los principios antes mencionados.

1.2 Introducción a la probabilidad


Hasta el momento, la historia ha revelado que dicha teoría matemática, tiene su origen en el año 1650,
aproximadamente, al intentar resolver un problema de apuestas de dados entre dos personas.
El problema fue que uno de los jugadores, Antonio de
Gombaud o también llamado el caballero de Méré, planteó la
situación a Blaise Pascal de la siguiente manera: cada jugador
escoge un número distinto, del 1 al 6, y apuestan a que el
La probabilidad es la parte de
número escogido aparecerá en tres ocasiones antes que el
las matemáticas encargada de
número del jugador contrario al realizar lanzamientos de un estudiar los eventos aleatorios,
es decir, permite cuantificar la
dado de manera consecutiva. Después, hay que suponer que el
oportunidad u ocurrencia de
número de uno de los jugadores ha aparecido dos veces y el dichos eventos.
número del otro, sólo una vez, ¿cómo dividirse el dinero
apostado si el juego se suspende?

8
En cualquier evento aleatorio relacionado tanto con los fenómenos naturales como en los procesos
sociales, siempre existe la incertidumbre de lo que ocurrirá, como en los juegos de azar, por ello ha sido
importante encontrar una forma de lograr cuantificar la oportunidad de que suceda un evento aleatorio
y por ello se creó la probabilidad, misma que asigna a la posibilidad de que ocurra un evento aleatorio
en un valor numérico entre 0 y 1 (o entre 0 y 100 si se habla de porcentajes); es decir, si el valor asociado
a la ocurrencia de cierto evento es 1, quiere decir que es totalmente seguro que ocurra o que su
probabilidad de ocurrencia sea de 100%. Si el valor es 0, indica que es imposible su realización, es decir,
tiene el 0% de probabilidad de ocurrencia. Si la probabilidad de ocurrencia fuera 1/6, podríamos decir
que existe 16.6% de probabilidad de que ocurra.

2. ¿Qué significan las medidas de tendencia central y de dispersión?

En esta unidad, hablaremos sobre las características generales de las medidas de tendencia central y
más adelante se retomarán con mayor detalle; por ahora es importante tener presente que son medidas
estadísticas que, generalmente, se ubican en la parte central de un conjunto de datos y resumen en un
solo valor a un conjunto de valores. Pretenden resumir la información obtenida de la muestra para tener
mejor conocimiento de la población, en las cuales ahondaremos más adelante.

Las medidas de tendencia central más utilizadas son:

- Media, es la suma de un conjunto de datos dividida por el número total de dichos datos; por ejemplo:
cuatro niños decidieron comprar un balón y cada uno dio las siguientes cantidades: $45, $20, $20,
$30. ¿Cuánto dinero debió poner cada uno para que hubieran dado la misma cantidad?
Debieron dar $28.75, este valor representa la media o el promedio.
- Mediana, corresponde al valor que deja el mismo número de valores antes y después de él, en un
conjunto de datos; por ejemplo:
En un salón de clases, los estudiantes obtuvieron las siguientes calificaciones:
{5, 4, 8, 10, 9, 1, 2}

Hay que ordenar las calificaciones, en este caso, de menor a mayor y tenemos:

{1, 2, 4, 5, 8, 9, 10}
El 5 corresponde a la media porque es el valor central en el conjunto de datos.
- Moda, indica el valor que se repite más veces en el conjunto de datos. En caso de existir dos valores
que se repitan el mismo número de veces, habría dos modas; por ejemplo:
Un grupo de amigos va al cine el siguiente número de veces:
{2, 0, 2, 3, 1, 1, 2, 3, 1, 1, 3}

9
La moda es 1, la mayoría del grupo de amigos va una vez al cine durante el mes. Por otro lado, también
contamos con las medidas de dispersión, las cuales sirven para medir el grado de variabilidad de cierta
cantidad de datos respecto a la media. Dicho en otros términos, las medidas de dispersión pretenden
evaluar en qué medida los datos difieren entre sí; a mayor valor de la medida de dispersión, podemos
decir que hay más variabilidad.

- Varianza, su función es detectar las variaciones de cada valor en un conjunto de datos, respecto
a su media; sin embargo, eleva el valor al cuadrado para amplificar las diferencias entre los
datos obtenidos. Se representa por la letra griega:
𝜎 #
Ejemplo:

Vamos a suponer que el gerente de una empresa de alimentos desea saber qué tanto varían los pesos
de los empaques de uno de sus productos (en gramos), por lo que opta por seleccionar de manera
aleatoria cinco unidades de estos para pesarlos. Los productos tienen los siguientes pesos: {490, 500, 510,
515, 520} gramos, respectivamente.
Por lo que su media es:
'()*+))*+,)*+,+*+#) #+-+
𝑋% = +
= + = 507

La varianza sería:

(490 − 507)# + (500 − 507)# + (510 − 507)# + (515 − 507)# + (520 − 507)#
𝜎# =
(5 − 1)

(−17)# + (−7)# + (3)# + (8)# + (13)# 289 + 49 + 9 + 64 + 169 580


𝜎# = = = = 145
4 4 4

- La desviación estándar, en cambio, es un valor numérico que representa el promedio de


diferencia que hay entre el conjunto de datos y la media. Únicamente debemos calcular la raíz
cuadrada de la varianza.

10
Retomando los datos del ejemplo anterior, la desviación estándar sería:

𝜎 = √145 = 12.04 ≅ 12

La conclusión a la que llegaríamos es que el peso promedio de los


empaques es de 507 gramos, con una tendencia a variar por debajo Una variable es cualquier
o por encima de dicho peso en 12 gramos. Esta información le característica cuyo valor
puede cambiar al ser medida
permitirá al gerente determinar cuánto es el promedio de pérdidas
en diferente tiempo y espacio
causado por el exceso de peso en los empaques y le da y es expresado en forma
cualitativa o cuantitativa.
las bases para tomar las medidas necesarias para mejorar el proceso
de empacado.

De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos
entregando información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma
en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos
que se encuentran agrupados y si los datos no están en una tabla hablaremos de datos no agrupados.

En conclusión, al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la


información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la
distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

Entonces, para que una calificación tenga significado hay que contar con elementos de referencia
generalmente relacionados con ciertos criterios estadísticos. Las medidas de tendencia central (media,
mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen
en una prueba u otro tipo de casos que veremos más adelante.

Para saber más…

Si quieres realizar algunos ejercicios sobre las medidas de tendencia


central te sugerimos consultar el siguiente enlace:

https://es.khanacademy.org/math/probability/data-distributions-
a1/summarizing-center-distributions/e/mean_median_and_mode*

*Khan Academy, “Media, mediana y moda”, [en línea],


https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-center-
distributions/e/mean_median_and_mode (consultado el 11 de julio de 2019).

11
3. Técnicas de conteo y agrupación en clases para la determinación de probabilidades

3.1 Variables
Para comprender la manera en que se agrupan los datos cuando se determinan probabilidades, es
importante que sepamos el tipo de datos con el que trabajaremos ya que los fenómenos naturales y
procesos sociales cuentan con características específicas que pueden ser estudiadas.

En los fenómenos naturales, por ejemplo, si consideramos la llegada de huracanes a México, podríamos
medir la erosión hídrica o la frecuencia de aparición durante determinado periodo de tiempo,.En los
procesos sociales, por ejemplo, podemos considerar el analfabetismo o podríamos medir la cantidad por
entidad federativa, por edad o por sexo. Este tipo de características podemos llamarlas variables. Dado
que estos eventos son aleatorios, cambian dependiendo del momento en que se miden; la
cantidad de huracanes, así como de personas en condiciones de analfabetismo cambian
dependiendo del tiempo y espacio en el que se observen.
Para lograr estudiar la variabilidad de dichas medidas,
Una variable dependiente es aquella
existen distintos métodos estadísticos, herramientas y cuyos valores dependen de los que
técnicas que permiten predecir el comportamiento de tome la otra variable; en una función se
suele representar por y; por lo tanto, se
dichos eventos y para ello, es importante distinguir entre
encuentra en el eje de las ordenadas.
los distintos tipos de variables.

La estadística utiliza datos cuantitativos para desarrollar sus formas de medición y cálculo. Sin embargo,
en la vida cotidiana no están a nuestra disposición todos los datos numéricos de los problemas y objetos
de investigación; por ejemplo, no existen datos precisos de la cantidad de smartphones que tienen las
personas que viven en la Ciudad de México, no hay datos exactos de las personas que
separan la basura en orgánica e inorgánica en el Estado de México, entre otros ejemplos.
En muchos casos es necesario que el investigador genere su
propia información según el objeto de estudio y los objetivos
Una variable independiente es
que se proponga, por supuesto, es posible consultar los datos
aquella cuyo valor no depende
de ninguna otra variable y es del Instituto Nacional de Estadística y Geografía (INEGI) u otras
representado en una función fuentes confiables, pero no siempre responderán a los intereses
por x, encontrándose así en el específicos de cada investigación. Además de lo anterior, si ya
eje de las abscisas, pues tiene
cambios en diferentes casos. se tiene la información necesaria para realizar un análisis
estadístico, es necesario revisar que responda a los objetivos y a
las definiciones deseadas.

12
Por ello, en estadística, las variables y las formas en las que pueden ser recuperadas y analizadas deben
pasar por una primera fase de definición; es decir, el investigador debe conocer si sus variables son
cuantitativas o cualitativas; así como es indispensable conocer si las variables principales son continuas
o discretas. Asimismo, es necesario establecer cuál es la variable dependiente (VD) y cuáles serán las
variables independientes (VI).

Las variables, por su grado de asociación, pueden ser divididas en dependientes e independientes. Las
primeras son las que se desean probar si tienen cambio o no y las VI son las que se modifican en
diferentes casos. Por ejemplo, al establecer la relación entre la efectividad de titulación y las tareas no
entregadas a tiempo por semana, edad y género. O bien, al establecer la relación entre cometer una
infracción de tránsito, tomando en cuenta las variables de edad, género y años de conductor. Como
muestra la tabla, regularmente la VD es representada con la letra “Y” y las variables independientes con
la letra “X”.

Variables
Dependiente Independiente
Y= Efectividad en el logro X1= Tareas no entregadas a tiempo por semana
de titulación de alumnos
X2= Edad
de preparatoria

X= Género
Y = Incidencia en X1= Edad
infracciones de tránsito X2= Género
X3= Años de conductor

Como podemos observar, las VD son los eventos que deseamos poner a prueba. Las independientes
cambiarán según las características de cada persona.

Después de establecer las variables independientes es indispensable observar la forma que tienen. En
estadística es un procedimiento común indicar si las variables consisten en elementos cuantitativos o no
cuantitativos, como se ejemplifica en la siguiente figura.

13
Discretas

Variables cuantitativas

Continuas

Tipos de variables

Nominales

Variables cualitativas

Ordinales

El estudio de las variables demuestra la importancia que genera su relación en la aplicación de


problemáticas tanto naturales como sociales. Dichas variables se clasifican en:

Cuantitativa, es la que se expresa mediante un número, por tanto, se pueden realizar operaciones
aritméticas con ella. Podemos distinguir dos tipos:

- Discreta, es aquella que sólo puede tomar un número finito de valores entre dos valores
cualesquiera de una característica; por ejemplo, el número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
- Continua es aquella que puede tomar un número infinito de valores entre dos valores
cualesquiera de una característica; por ejemplo, la altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

Cualitativas, se refiere a las características o cualidades que no pueden ser medidas con números.
Podemos distinguir dos tipos:

- Nominal, presenta modalidades no numéricas que no admiten un criterio de orden; por ejemplo:
el estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
- Ordinal, presenta modalidades no numéricas, en las que existe un orden; por ejemplo: la nota en
un examen: aprobado, notable o sobresaliente.

14
Ejemplos de variables

Variable cuantitativa Edades en años de personas encuestadas.

Variable cuantitativa discreta Número de hijos en una familia.

Variable cuantitativa continua El peso de una persona.

Variable cualitativa Municipio de residencia.

Variable cualitativa nominal Colonia de residencia (no hay un orden específico).

Variable cualitativa ordinal Último grado de estudios concluido: primaria, secundaria,


etcétera (tiene un orden específico).

Variable cualitativa Variable discreta Variable continua


Género Edad en años cumplidos Grado escolar en años de estudio
Mujer 25 años 12.5 años de estudio
Hombre 18 años 10.5 años de estudio

3.2 Muestreo
La estadística puede dar explicaciones generales para una población
específica o bien, explicaciones generalizables; es decir, una muestra El muestreo es un
cuyos resultados es posible hacerlos extensibles a la población total conjunto de técnicas
diseñadas con la finalidad
que nos interesa. Estas dos situaciones son las más problemáticas en
de determinar qué parte
la vida real, porque no siempre es posible tener los datos de toda una de la población debe
población; por supuesto, el hacerlo depende del tamaño de la examinarse.

población a la cual deseamos analizar.


La estadística asume que todo análisis realizado surge de una población¸ la cual se compone del
conjunto de todos los elementos, individuos o eventos específicos. Es común encontrar que
los censos contienen el total de información de una población específica, como sucede con
la información disponible en INEGI. Un censo, es decir, la
Una población está compuesta extracción de información de toda la población es costoso y
por el conjunto total de todos los
requiere de muchos recursos en tiempo, personas y otros
elementos, individuos o eventos
específicos. insumos; sin embargo, hay poblaciones de menor tamaño,
como un lote de objetos o el total de mercancías que produce

15
una empresa en, por ejemplo, una semana. Por supuesto no es el total de lo que produce una empresa
en el total de años que lleva en operación, pero sí es una población del total de mercancías elaboradas
en un periodo de tiempo específico y que tiene características únicas.

La muestra es una parte del total de la población que nos interesa


Una muestra es la
analizar con la estadística. Por lo tanto, el muestreo es el proceso por el colección de mediciones
cual se reúne información de una población. La información recopilada seleccionadas de una
población de interés.
por medio del muestreo se llama muestra.

Los métodos de muestreo se refieren a diferentes formas de recolectar información para generar una
muestra. En general, hay dos grandes grupos: el muestreo aleatorio y el muestreo sistemático. Ambos
métodos de tienen sus ventajas y limitaciones. Por otra parte, ninguno de los métodos es descartable; en
todo caso, eso depende de los recursos y de los objetivos que sean buscados por el investigador. La
diferencia entre ambos métodos de muestreo depende del contexto y los rasgos de la población que se
estudiará.

Tipo de Característica Ejemplo


muestreo

Cada uno de los datos tiene la


Seleccionar 250 tornillos del lote de 5,000 tornillos
misma probabilidad de ser
Aleatorio producido en la última semana de la empresa
incluido (se requiere saber el
Tornillos México.
número total de la población).

Seleccionar una persona del género femenino,


La selección de los datos lleva
después de contar tres personas de ese sexo. Aplicar
un protocolo o reglas de
la encuesta sobre el uso de zapatos de tacón en la
Sistemático procedimiento (no se requiere
Plaza Comercial más cercana a tu casa.
saber el número total de la
Desconocemos la población total de usuarias de
población).
zapatos de tacón de dicho lugar y momento.

Como observamos en la tabla, el muestreo aleatorio tiene mejores posibilidades para generalizar los
datos. Si 200 tornillos tienen fallas visibles en su acabado, se puede indicar que la población total de los
5,000 tornillos tiene fallas. En el caso de la encuesta sobre el uso de zapatos de tacón, los resultados de
la muestra son específicos para las personas encuestadas y no son generalizables. Sin embargo, puede
decirse que las mujeres encuestadas en ese tiempo y espacio tienen ciertos rasgos específicos,
particularmente para las personas que contestaron el cuestionario. No se pueden extender esos datos a
todas las mujeres que acuden a las plazas comerciales.

16
3.3 Ordenamiento de datos y análisis de información

Una vez aclarados los tipos de variables, podemos iniciar con el ordenamiento de datos, donde el primer
paso implica reconocer el tipo de variables. Posteriormente, el investigador procede a iniciar el análisis
de variables por separado o bien todas al mismo tiempo. Eso dependerá de la cantidad de información
con la que se trabaje y de los objetivos que tenga la investigación, con apoyo de procedimientos
estadísticos.

El ordenamiento de datos consiste en realizar estos pasos:

a) Determinar las variables dependientes e independientes.


b) Establecer y ordenar jerárquicamente las variables discretas y continuas.
c) Indicar cuántas y cuáles son las variables cualitativas que se van a utilizar.

El ordenamiento de los datos es indispensable para poder darle un tratamiento estadístico consistente
a los datos que son de utilidad para conocer fenómenos naturales y sociales.

Por medio de los métodos como el muestreo, un investigador puede obtener una gran cantidad de datos
en relación al fenómeno que esté estudiando; sin embargo, los datos por sí solos no proporcionan
información sobre el fenómeno, por lo que es necesario pasarlos por un proceso que los sintetice o
resuma de manera que sea más sencillo interpretarlos, entenderlos y usarlos. Las tablas de distribución
de frecuencias son la herramienta para organizar y tratar los datos de manera que permitan observar la
forma de su distribución, en ellas, los valores de la variable, es decir, los datos (𝑥@ ) son organizados de
manera ascendente o descendente junto con las frecuencias (𝑓@ ) de cada dato. O sea, el número de veces
que el dato es observado dentro de una tabla. La tabla puede ser para datos no agrupados, así como para
datos agrupados o de intervalos de clase.

En el caso de que los datos se apropien de un número


pequeño de valores o si la variable es discreta. Por ejemplo,
cuando se toman sólo números enteros, es posible acomodar El ordenamiento de datos
los datos en una columna y sus frecuencias respectivas en la implica la jerarquización y la
organización de los datos de
segunda, ya que la longitud de la tabla no será demasiado
forma que puedan ser analizados
grande. Sin embargo, para un mejor estudio de los datos es eficientemente.
conveniente considerar diferentes tipos de frecuencias, como
son las siguientes:

17
Frecuencia absoluta (𝑓@ ). Es el número de veces que aparece un determinado dato 𝑥@ en el estudio. La
suma de las frecuencias absolutas siempre es igual al número total de datos que se estén considerando.
Usualmente el número total se representa por la letra 𝑁 mayúscula y el número total de variables a
considerar se denota por 𝑛 minúscula. Entonces:

𝑓, + 𝑓# + ⋯ + 𝑓E = 𝑁

Frecuencia relativa (𝑓𝑟@ ). En este tipo de frecuencia se hace la proporción de la frecuencia absoluta y el
número total de datos. La suma de las frecuencias relativas es igual a 1.

𝑓@
𝑓𝑟@ =
𝑁

Frecuencia acumulada (𝑓𝑎@ ). Es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado. Por ejemplo, si hay 8 datos ordenados de menor a mayor, 𝑥, , 𝑥# , … , 𝑥J y se
quiere saber el valor de la frecuencia acumulada del dato 5, la operación sería: 𝑓𝑎+ = 𝑓, + 𝑓# + 𝑓- + 𝑓' + 𝑓+

Frecuencia relativa acumulada (𝑓𝑟𝑎@ ). Es el cociente entre la frecuencia acumulada de un determinado


valor y el número total de datos.

𝑓𝑎@
𝑓𝑟𝑎@ =
𝑁

Nota: En algunas ocasiones las frecuencias relativas y las relativas acumuladas se presentan en
porcentajes, para lo cual basta con multiplicar esas cantidades por 100%.

Para mostrar la construcción de la tabla de distribuciones de frecuencias de datos no agrupados se


considerará el siguiente ejemplo:

En un salón al que asisten 30 alumnos se les preguntó cuántos vasos de refresco consumieron en la
semana anterior a la aplicación del cuestionario. Las respuestas obtenidas de los alumnos fueron las
siguientes:

{5, 6, 3, 1, 0, 4, 3, 1, 5, 5, 3, 2, 1, 2, 3, 2, 3, 4, 4, 1, 4, 1, 1, 3, 3, 1, 0, 0, 0, 2}

El primer paso para el tratamiento de los datos es agruparlos en orden ascendente, como se hizo a
continuación:

{0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6}

18
De esta manera, la tabulación de distribución es más sencilla, puesto que es fácil contabilizar cuántas
veces se repite cada valor. La siguiente tabla incluye los diferentes tipos de frecuencia, a la vez que se
expone la forma de calcularlas:

No. de vasos Frecuencia Frecuencia Frecuencia Frecuencia relativa


consumidos absoluta (𝒇𝒊 ) relativa (𝒇𝒓𝒊 ) acumulada (𝒇𝒂𝒊 ) acumulada (𝒇𝒓𝒂𝒊 )

0 4 4/30 = 0.13 4 4/30 = 0.13

1 7 7/30 = 0.23 4 + 7 = 11 11/30 = 0.37

2 4 4/30 = 0.13 11 + 4 = 15 15/30 = 0.50

3 7 7/30 = 0.23 15 + 7 = 22 22/30 = 0.73

4 4 4/30 = 0.13 22 + 4 = 26 26/30 = 0.87

5 3 3/30 = 0.10 26 + 3 = 29 26/30 = 0.97

6 1 1/30 = 0.03 29 + 1 = 30 30/30 = 1.00

Total 30 1.00 30

Nota: si realizamos la operación en las frecuencias relativas es posible que la suma no sea exactamente
1, esto se debe al error que se causa por redondear el resultado de la división. Usualmente éste es un
resultado aproximado y se ajusta según sea necesario.

Una vez teniendo la tabla de distribuciones de frecuencias es natural preguntarse acerca de la utilidad
de ésta, pues en ella es muy sencillo identificar información sobre el conjunto de los datos. Pero, ¿qué
tipo de información? Por ejemplo, de la tabla anterior se pueden desprender, entre otras, las siguientes
afirmaciones:

1. Dado que la cantidad de alumnos que tomó 5 o más vasos de refresco es de 4 y se tienen 30
datos, se puede decir que la mayoría consumió menos de 5 vasos de refresco. El porcentaje de
alumnos que tomó menos de 5 vasos de refresco es de 87%.
2. El porcentaje de alumnos que tomó 5 vasos de refresco es de 29%.
3. Ningún alumno tomó más de 6 vasos de refresco en la semana.

Como puedes notar la información es presentada de manera más entendible si se realiza una tabla. En
realidad, a lo que se dio importancia fue a dicha respuesta no a quién pertenecía. Para esta tabla la
variable no era el niño, sino la cantidad de vasos que tomaba, y de ésta se extrajo la información.

19
Dado que la cantidad de variables es pequeña, se pudo registrar cada una de ellas. Existen casos en que
esto resulta inapropiado para trabajar, aunque no hay una regla precisa de cuándo considerar todas las
variables o cuándo agruparlas. Se recomienda que si el número total de datos 𝑁 es mayor de 50 o si el
recorrido de la serie de datos es mayor de 20, entonces se use el esquema agrupado de datos. En la
siguiente sección se estudia la distribución con datos agrupados.

En este caso la tabulación de los datos está ordenada en clases y aparece la frecuencia de cada una; es
decir, los datos originales de varios valores cercanos en el conjunto se combinan para formar lo que se
llama intervalo de clase. Por ejemplo, en lugar de tomar la edad exacta de personas, pueden tomarse
intervalos de edad: de 0 a 5 años, de 6 a 10, entre otros.

Es más conveniente usar la distribución agrupada cuando las variables tomen valores continuos; es decir,
la variable puede tomar cualquier valor entre dos números dados al realizar un experimento. Por ejemplo,
cuando se están considerando mediciones de longitud de algunos objetos, esta magnitud puede variar
sólo milímetros entre los objetos y no tendría caso tabular los que tienen exactamente la misma medida.
Es más útil saber cuántos objetos tienen una longitud que oscila en un cierto tamaño, como puede ser
entre 1 y 3 centímetros.

Para realizar la organización en clases se necesita un arreglo determinado de las observaciones, y para
lograrlo se requiere seleccionar los intervalos de clase. Esta selección depende de los datos o del
fenómeno a estudiar; sin embargo, el método más usual para el tratamiento de la información puede
contener los siguientes puntos:

1. Ordenar los datos de menor a mayor para su clasificación.


2. Determinar la magnitud de la variación de los datos o el rango (𝑅), es decir, la longitud del
intervalo (𝐼) en el que están contenidos todos los datos:

𝑅 = 𝑥RáT − 𝑥RíE ; 𝐼 = [𝑥RíE , 𝑥RáT ]

Donde 𝑥RíE , 𝑥RáT son los datos de menor y mayor valor numérico respectivamente.

3. El siguiente punto útil es definir la cantidad de clases, el número de clases (𝑁𝑐) debe tener un
tamaño razonable para poder interpretar la información en la tabla. Existen varios métodos para
determinar este número:
a. Método de raíz, consiste en sacar la raíz cuadrada del número de datos (𝑛) que se tengan
y redondearlo hasta el siguiente entero en caso de que no sea exacta: 𝑁𝑐 = √𝑛.

20
b. Método de Sturges, consiste en la elaboración de la siguiente operación matemática para
obtener el número de clases: 𝑁𝑐 = 1 + 3.3(𝑙𝑜𝑔,) 𝑛 ). Se requiere de la operación de 𝑙𝑜𝑔,) 𝑛 ,
el cual es el logaritmo en base 10 del número de datos. Para realizar la operación puedes
hacer uso de una calculadora científica o visitar el enlace
http://www.wolframalpha.com/input/?i=log10(); la operación es sencilla y sólo se escribe
dentro del paréntesis el valor del número que quieres calcular. La página arroja el
resultado (además proporciona información adicional que requiere de más estudio sobre
los temas siguientes para entenderlo mejor).

4. Una vez que se sabe cuántas clases hay, es necesario determinar el tamaño que tendrá cada clase,
denominado amplitud de clase (𝐴𝑐), de manera que todos los datos que se tengan pertenezcan
a alguna de ellas. Para esto se realiza la operación:

𝑅
𝐴𝑐 =
𝑁𝑐

5. Definir los límites superior (𝐿𝑠) e inferior (𝐿𝑖) de cada clase para que sean claras al momento de
poner los datos.
6. Para evitar ambigüedades en el reparto de los datos se consideran los límites reales de clase como
sigue:
Límite real inferior (𝐿𝑟𝑖) = 𝐿𝑖 − 0.5
Límite real superior (𝐿𝑟𝑠) = 𝐿𝑠 + 0.5
7. Las frecuencias en cada clase, las frecuencias relativas, las frecuencias acumuladas y las
frecuencias relativas acumuladas de cada clase se determinan igual que los datos no agrupados.
8. Se determina la marca de clase (𝑚@ ) como el punto medio de la amplitud de clase:

𝐿𝑖 + 𝐿𝑠
𝑚@ =
2

21
Para mostrar la forma de organizar los datos por medio de clases, consideraremos el siguiente ejemplo:

En un hospital son registradas las personas que ingresaron diariamente a visitar a alguno de los pacientes.
El registro fue realizado por 40 días y se obtuvieron los siguientes datos:

{30, 35, 15, 21, 18, 32, 39, 20, 19, 20, 20, 34, 13, 13, 20, 35, 30, 17, 30, 31, 10, 32, 22, 14, 30, 36, 23, 14, 20, 34, 20,
28, 20, 16, 31, 38, 22, 12, 28, 13}

Para realizar la tabla de frecuencias y analizar esta información, es necesario organizar los datos en orden
ascendente:

{10, 12, 13, 13, 13, 14, 14, 15, 16, 17, 18, 19, 20, 20, 20, 20, 20, 20, 20, 21, 22, 22, 23, 28, 28, 30, 30, 30, 30, 31, 31, 32,
32, 34, 34, 35, 35, 36, 38, 39}

Los datos toman demasiados valores, algunos de los cuales sólo aparecen una vez. Esta observación
implica que una tabla de datos no agrupados puede no ser apropiada para seguir con la organización de
datos, por lo tanto, hay que considerar usar los intervalos de clase y sus respectivas frecuencias. Para ello,
se encuentran los valores necesarios:

Rango: 𝑅 = 𝑥RáT − 𝑥RíE = 39 − 10

Número de clases: 𝑁𝑐 = √40 ≈ 6.32 ≈ 6

w #(
Amplitud de clase: 𝐴𝑐 = xy = z
≈ 4.8 ≈ 5

Acoplando toda la información en la tabla, el resultado es el siguiente:

Clase Límites Límites Frecuencia Frecuencia Marca Frecuencia Frecuencia


de clase reales de relativa de clase acumulada relativa
clase acumulada
Núm.
𝐿𝑖 𝐿𝑠 𝐿𝑟𝑖 𝐿𝑟𝑠 𝑓@ 𝑓𝑟@ 𝑚@ 𝑓𝑎@ 𝑓𝑟𝑎@

1 10 14 9.5 14.5 7 0.175 12 7 0.175


2 15 19 14.5 19.5 5 0.125 17 12 0.3
3 20 24 19.5 24.5 11 0.275 22 23 0.575
4 25 29 24.5 29.5 2 0.05 27 25 0.625
5 30 34 29.5 34.5 10 0.25 32 35 0.875
6 35 39 34.5 39.5 5 0.125 37 40 1

22
Tip de aprendizaje

A partir de la tabla anterior, responde las siguientes preguntas:

¿Qué afirmaciones podrías hacer con respecto a la cantidad de personas que visitaban a los
pacientes del hospital?, ¿para qué podría ser de utilidad esta información?

Si bien las tablas de distribuciones ya son una forma más clara de organizar los datos que se tienen,
también es importante presentar la información de manera más visual, esto es por medio de gráficas
que revisaremos más adelante.

Por medio de los métodos como el muestreo, un investigador puede obtener una gran cantidad de datos
en relación al fenómeno que esté estudiando. Sin embargo, los datos por sí solos no proporcionan
información sobre el fenómeno, por lo que es necesario pasarlos por un proceso que los sintetice o
resuma de manera que sea más sencillo interpretarlos, entenderlos y usarlos.

Existen desde tablas y gráficas sencillas que permiten presentar e interpretar la información como en los
siguientes ejemplos:

Dos estudiantes realizaron un experimento que consistió en lanzar un dado. El primer estudiante
se dispuso a lanzar un dado 600 veces y registrar las apariciones de los dados en la siguiente tabla
de frecuencias.

Números 1 2 3 4 5 6

Frecuencia 97 99 98 92 96 118

El otro estudiante lanzó simultáneamente dos dados 600 veces y sumo los números obtenidos.
En este caso su espacio muestral es: {2,3,4,5,6,7,8,9,10,11,12}. Los resultados que obtuvo fueron los
siguientes:

Suma 2 3 4 5 6 7 8 9 10 11 12

Frecuencia 14 31 40 68 101 113 88 62 53 14 16

23
Para poder analizar mejor sus resultados, construyeron las gráficas de barras con las frecuencias
correspondientes:

Lanzamientos del estudiante 1.

Lanzamientos del estudiante 2.

Como vemos, las gráficas son muy diferentes. En una de ellas aparece casi el mismo número de veces en
todos los eventos; y en la otra, hay ciertos valores que aparecen con más frecuencia que otros. Esto se
debe a la probabilidad que cada evento tiene. En estadística, la probabilidad teórica, para una variable
aleatoria discreta, se determina dividiendo la cantidad de resultados favorables del evento x entre la
cantidad de resultados totales. La probabilidad de tal evento se denota P(x).

24
La presentación anterior nos permite observar la frecuencia de ciertos fenómenos aleatorios, pero
también existen las tablas de distribución de frecuencias que son la herramienta para organizar y tratar
los datos que permiten observar la forma de su distribución, en ellas, los valores de la variable, es decir,
los datos (𝑥@ ) son organizados de manera ascendente o descendente junto con las frecuencias (𝑓@ ) de
cada dato. Es decir, el número de veces que el dato es observado dentro de una tabla. La tabla puede ser
para datos no agrupados, así como para datos agrupados o de intervalos de clase.

¡Ya lo tienes!

4. Probabilidad

En nuestras conversaciones cotidianas, el término probabilidad es


El enfoque clásico
una medida sobre la creencia de que un evento futuro pueda
consiste en aceptar que
ocurrir. Aceptamos esto como una interpretación significativa y todos los eventos tienen
práctica de probabilidad, pero buscamos un concepto más claro de la misma probabilidad
de ocurrir.
su contexto, de cómo se mide y de cómo ayuda a tomar decisiones.

4.1 ¿Qué significa cada enfoque de probabilidad?

Uno de los procedimientos para asignar una probabilidad a un evento aleatorio es considerar a ésta como
la razón entre el número de casos (sucesos) favorables y el número total de casos (sucesos posibles). Si
nombramos “A” a un evento aleatorio, la probabilidad del evento aleatorio “P (A)” se obtiene como esta
razón, donde “k” es el número de casos favorables que caracterizan el evento y “n” es el número de casos
posibles que caracterizan el fenómeno bajo estudio, a esto le llamaremos enfoque clásico. Es válida si
no existen evidencias que lleven a pensar que algunos eventos aleatorios relacionados con el fenómeno
en cuestión, puedan tener mayores oportunidades o posibilidades de ocurrencia sobre los demás.

Puede usarse en ejemplos como el siguiente: determinar la probabilidad de que exactamente dos de los
tres nacimientos registrados en un hospital sean varones.

25
Para resolverlo, primero es necesario identificar correctamente el espacio muestral.

Espacio muestral. Nacimientos registrados durante el primer turno de un hospital


Primer nacimiento Segundo nacimiento Tercer nacimiento
Niño Niño Niño
Niño Niño Niña
Niño Niña Niño
Niño Niña Niña
Niña Niño Niño
Niña Niño Niña
Niña Niña Niño
Niña Niña Niña

El espacio muestral consta de ocho diferentes combinaciones y sólo tres responden exactamente a la
probabilidad buscada: dos, de los tres nacimientos registrados, sean varones. Por lo tanto, usando el
método clásico, queda de la siguiente forma.

-
P (2 varones en 3 nacimientos) = = 0.37
J

En el enfoque empírico se realizan registros, los cuales se presuponen


como correctos para calcular la probabilidad de que suceda un
El enfoque empírico
evento específico en el futuro. Para realizar el cálculo de la
consiste en calcular la
probabilidad se utiliza el método de frecuencias relativas y funciona probabilidad de que
en ejemplos como el siguiente: Hace un año EE.UU. registró un total suceda un evento,
teniendo registros
de 135,670,000 autos (según la Statiscal Abstract of the United States),
previos.
de estos sólo 6,511,100 tuvieron accidentes, ¿cuál es la probabilidad de
que un auto tenga un accidente?

La solución por medio del método de frecuencias relativas es: la probabilidad de que un auto tenga un
accidente es igual al número de automóviles accidentados entre el número total de accidentes.

{ú|}~• €} •‚ƒ•|󅆇}ˆ •‰‰†€}{ƒ•€•ˆ z,+,,,,))


P (accidente) = = = 0.480
{ú|}~• ƒ•ƒ•‡ €} •‚ƒ•|󅆇}ˆ ,-+,zŠ),))

26
El enfoque subjetivo consiste en observar los resultados de eventos
pasados y agregar elementos del contexto que puedan afectar el
El enfoque subjetivo
resultado que es analizado, pero sin usar procedimientos matemáticos.
consiste en proponer
Puede ser utilizado en ejemplos como el siguiente: ¿cuál es la una probabilidad sin
probabilidad de quedar atrapado en un elevador? En estos casos no hay usar procedimientos
matemáticos.
datos previos, tampoco es posible calcular un espacio muestral, así que,
se recurre a la experiencia propia y nos percatamos de que nunca
hemos quedado atrapados en un elevador. Sólo sabemos de algunos comentarios de personas, por lo
tanto, estimamos que hay una probabilidad de 1 en 10,000; es decir, existe un 0.0001 de quedar atrapado
en un elevador. La probabilidad sólo es estimada con base en datos de nuestra experiencia.

Mi mundo y yo

Recuerda que la probabilidad es diferente a la posibilidad. Lo probable puede ser calculado


por medio de los métodos de frecuencia relativa o con el método clásico. Lo posible, es una
estimación subjetiva y no cuenta con ningún apoyo en datos. No los uses como sinónimos.

4.2 Usos de la probabilidad y estadística en situaciones dadas

En la vida cotidiana, la probabilidad y la estadística tienen múltiples usos e implicaciones, dentro del
campo de las ciencias biológicas, cuando se hacen predicciones sobre la población mundial o en una
región dada para el año 2050, por ejemplo, o sobre la posibilidad de extinción de las ballenas. Se están
usado estudios probabilísticos de modelos de crecimiento de poblaciones, de igual forma que cuando
se hacen estimaciones de la extensión de una enfermedad o de la esperanza de vida de un individuo.

En la agricultura se utilizan estos modelos para prever el efecto del uso de fertilizantes o pesticidas,
evaluar el rendimiento de una cosecha o las consecuencias de la extensión de una epidemia, nube tóxica,
etcétera.

En el ámbito de la psicofisiología, observamos el efecto del azar sobre el coeficiente intelectual, así como
en los tipos diferentes de caracteres o capacidades de los individuos.

El mundo físico nos hallamos inmersos en situaciones cambiantes; por ejemplo, los fenómenos
meteorológicos, la duración, intensidad, extensión de las lluvias, tormentas o granizos; las temperaturas
máximas y mínimas, la intensidad y dirección del viento son variables aleatorias.

27
En el Gobierno, a cualquier nivel, local, nacional o de organismos internacionales, se necesitan tomar
múltiples decisiones que dependen de fenómenos inciertos y sobre los cuales se necesita información,
por este motivo, la administración precisa de la elaboración de censos y encuestas. Desde los resultados
electorales hasta los censos de población hay muchas estadísticas cuyos resultados afectan las
decisiones de gobierno y todas estas estadísticas se refieren a distintas variables, entre las más
importantes citaremos: el índice de precios al consumo, las tasas de población activa, emigración e
inmigración, estadísticas demográficas, producción de los distintos bienes, comercio, etc., de las que
diariamente escuchamos sus valores en las noticias.

4.3 Nociones de incertidumbre, azar y aleatoriedad

El azar está presente en la vida cotidiana en muchos contextos en los que aparecen nociones de
incertidumbre, riesgo y probabilidad; como ejemplo de esto, tenemos el pronóstico del tiempo, realizar
inversiones monetarias, esperar un diagnóstico médico y nosotros podemos tomar decisiones, emitir
juicios y realizar predicciones de todo ello.

En la vida cotidiana, encontramos muchas situaciones que nos remiten a juegos,


canciones, cuentos, notas de revista, etc. que hacen alusión al azar. Si buscamos la
palabra aleatorio, encontramos que la Real Academia de la Lengua Española dice:
perteneciente o relativo al azar, y si buscamos azar, nos refiere a juegos de dados,
donde se observa un claro evento aleatorio en que una característica es el carácter
imprevisible del resultado.

Por otro lado, seguramente hemos escuchado la frase “atente a las consecuencias”, cuyo significado se
refiere a la incertidumbre cuando no sabemos qué pasará en determinada situación de la cual tenemos
un poco de información; nos detenemos a pensar, informarnos, actuar y todo ello deja como resultado –
saber a qué atenerse– o certidumbre.

Lo importante, y que veremos más adelante, es que recordemos la definición


de probabilidad, puesto que al pensar en ella tenemos que remitirnos a la
incertidumbre, ya que la probabilidad siempre conlleva incertidumbre y tiene
distintos métodos para poder estudiarse.

28
4.4 Tipos de eventos en el estudio de la probabilidad

Existen dos maneras de clasificar los sucesos que analiza un investigador: eventos determinísticos y
eventos aleatorios. Los eventos determinísticos consisten en sucesos predecibles con total precisión; por
ejemplo, es posible predecir que al reunir 5 manzanas con 4 naranjas se obtendrá una cantidad de 9
unidades. Los eventos determinísticos dejan poco que discutir en cuanto a lo que va suceder.

¿Cuántos enteros se formarán al sumar 34+68?, ¿es un resultado que ofrece incertidumbre?; es decir,
¿puede existir un resultado entre 1 y 100? Al sumar tres cuartos más seis octavos se obtiene un resultado
de doce octavos, lo que permite formar un entero y dos cuartos:

3 6 6 + 6 12 2
+ = = =1
4 8 8 8 4

Los eventos determinísticos no pueden variar si lo hace una persona


u otra, y si lo hace en un lugar u otro. Es decir, no cambian los Los eventos
resultados si lo realiza una persona el 1o. de enero de 2016 y si otra determinísticos no varían
si lo hacen diferentes
persona lo realiza el 1o. de marzo del mismo año, o si lo hace en China
personas en diferentes
o en México, la suma de tres cuartos más seis octavos seguirá siendo momentos o lugares.
un entero y dos cuartos.

Ahora bien, para la probabilidad son de especial interés los eventos


Los eventos aleatorios aleatorios, mismos que se basan en sucesos donde se puede estimar su
consisten en sucesos resultado, sin saber con precisión el mismo, por ejemplo, ¿lloverá hoy?,
donde se puede calcular
el resultado, sin saberlo ¿los autos color rojo chocan con mayor frecuencia? En ambos ejemplos,
con precisión. los resultados son inciertos, se puede indicar qué sucederá o no, sin
saber con exactitud cuándo y cómo.

Para ese tipo de eventos, las matemáticas y la estadística han desarrollado un cúmulo de teorías y
procedimientos con los cuales puede calcularse la probabilidad de que suceda o no el evento indicado.

La primera forma para organizar el análisis de eventos aleatorios consiste en separarlos en tres formas:
evento, evento simple y espacio muestral.

29
Un evento es cualquier conjunto de resultados. Un evento simple es un resultado que no puede
desglosarse en eventos simples. El espacio muestral está compuesto por todos los eventos posibles, es
decir, son todos los resultados que ya no pueden desglosarse más.

Por ejemplo: ¿cuál es el espacio muestral de lanzar un dado?

{1, 2, 3, 4, 5, 6}

¿Cuál es el espacio muestral de lanzar una moneda?

{Cara, Cruz}

Sencillo, ¿verdad?

4.5 Riesgo

4.5.1 ¿Qué papel juega la probabilidad y estadística en el estudio del riesgo?

El término riesgo se utiliza en general para situaciones que involucran incertidumbre, en el sentido de
que el rango de posibles resultados para una determinada acción es en cierta medida significativo; el
hecho de que ocurra un suceso puede cambiar la probabilidad de los demás.

La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B, se denomina probabilidad


condicionada, y se define de la siguiente forma:

𝑃(𝐴 ∩ 𝐵)
𝑝 (𝐴|𝐵 ) =
𝑃 (𝐵)

Veamos esto con un ejemplo:

Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta el chocolate. ¿Cuál es
la probabilidad de que a un amigo que le guste el chocolate y también la fresa?

Solución:
Vamos a trabajar con 2 eventos: que a un amigo le guste la fresa y que a un amigo le guste el chocolate.
• Evento A: que a un amigo le guste la fresa: 𝑃 (𝐴) = ?
• Evento B: que a un amigo le guste el chocolate: 𝑃 (𝐵) = 60%.
• Evento A y B: que a un amigo le guste la fresa y el chocolate: 𝑃 (𝐴 ∩ 𝐵)= 25%.

30
Ahora calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta el chocolate.
𝑃 (𝐴 ∩ 𝐵)
𝑃 (𝐴| 𝐵) =
𝑃 (𝐵)

25
𝑃 (𝐴| 𝐵) = = 0.4167 = 41.67%
60

La probabilidad de que a un amigo le guste la fresa dado que le gusta el chocolate es del 41.67%.

Para saber más…

Si quieres practicar la probabilidad condicional, te sugerimos consultar el siguiente enlace:

https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadI
nferencia/Probabilidad/5_1ConceptoProbabilidadCondicionada.html*

*Proyecto Descartes, “Concepto de probabilidad condicionada”, [en línea],


https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadInferencia/Probabil
idad/5_1ConceptoProbabilidadCondicionada.html (consultado el 11 de julio de 2019).

4.5.2 Distribuciones de probabilidad y variables aleatorias

Como vimos con anterioridad, la probabilidad está presente en los fenómenos sociales y procesos
sociales y también cuenta con un tratamiento específico de la información. Ya sabemos que la
probabilidad es el cálculo de que un evento futuro suceda o no. Comúnmente la probabilidad es
expresada con un número decimal entre cero y uno, en el caso de los extremos, lo cual mide la ocurrencia
de un resultado o evento. Si el número es cercano a cero, el resultado no es fácil de obtener y, al contrario,
los resultados con probabilidad cercana a uno son casi seguros de obtener.

Para manejar mejor los términos en la probabilidad conviene considerar las siguientes definiciones:

• Experimento: consiste en observar los resultados en condiciones determinadas por el


investigador. Por ejemplo: lanzar una moneda al aire, escoger una carta de una baraja completa,
entre otros.
• Evento: son los resultados del experimento. Puede ser simple si sólo tiene una característica o
conjunto con dos o más. Por ejemplo, obtener cara al lanzar una moneda es un evento simple y
lanzar un dado y obtener un número par menor a cinco, es un evento compuesto.
• Espacio muestral: es el conjunto de todos los posibles eventos que pueden ocurrir.

31
Al repetir varias veces un experimento es posible contabilizar las ocurrencias de cada uno de los eventos
en el espacio muestral y tabular las frecuencias, así como graficar.

De manera concreta, una variable aleatoria es una función que va de los eventos en el espacio muestral
a los números reales. Usualmente, son representadas con letras mayúsculas 𝑋 o 𝑌 y también es común
que una variable aleatoria tenga un significado de algún tipo, tal como físico o geométrico. Observa que,
aunque se llame variable aleatoria en realidad es una función; sin embargo, es el nombre que se
considera convencionalmente apropiado, pero siempre es conveniente tener clara su naturaleza.

Si la variable aleatoria toma un número finito o numerable de valores es llamada discreta y si toma una
cantidad infinita no numerable de valores es continua, como se vio en la Unidad 1.

Como puedes ver, las gráficas son muy diferentes. En una de ellas aparece casi el mismo número de veces
en todos los eventos; y en la otra, hay ciertos valores que aparecen con más frecuencia que otros. Esto se
debe a la probabilidad que cada evento tiene. En estadística, la probabilidad teórica, para una variable
aleatoria discreta se determina al dividir la cantidad de resultados favorables del evento 𝑥 entre la
cantidad de resultados totales. La probabilidad de tal evento se denota 𝑃(𝑥).

Dicho lo anterior y teniendo los conceptos básicos ahondaremos en el significado y utilidad de


distribución de probabilidad.

Distribución de probabilidad

Es la asignación de probabilidades a los valores de la variable aleatoria, denotado por 𝑃(𝑥@ ), y que
cumplen con:

a) 0 ≤ 𝑃(𝑥@ ) ≤ 1
b) ∑E@”, 𝑃(𝑥@ ) = 1

Donde 𝑥@ es el valor de la variable aleatoria 𝑋 y 𝑃(𝑥@ ) es la probabilidad que se le asocia.

Para poder estudiar mejor tanto las variables aleatorias como las distribuciones de probabilidad son
necesarias algunas definiciones que se presentan a continuación:

Esperanza o valor esperado es el valor promedio que se obtendría si el experimento se repitiera una
cantidad infinita de veces. Para calcularlo podemos expresarlo de la siguiente forma: {𝑥, , 𝑥# , … , 𝑥E }. Es el
conjunto de los valores que toma la variable aleatoria 𝑋, con su respectiva probabilidad 𝑃(𝑥@ ), entonces
el valor esperado de 𝑋 es:

𝐸[𝑋] = 𝑃(𝑥, )𝑥, + 𝑃(𝑥# )𝑥# + ⋯ + 𝑃(𝑥E )𝑥E

32
Varianza de un conjunto de datos {𝑥, , 𝑥# , … 𝑥E } es el promedio de los cuadrados de las diferencias entre
la media aritmética y cada uno de los datos, es decir:

(𝑥, − 𝑥̅ )# + ⋯ + (𝑥E − 𝑥̅ )#
𝜎=
𝑛

Desviación estándar es la raíz cuadrada de la varianza y se denota por 𝜎 = √𝑣.

La importancia de conocer estos valores es que pueden establecerse como los datos que distan de la
media a partir de la desviación estándar. Esta propiedad se enuncia en el teorema de Chebyshev:

Teorema de Chebyshev se usa para cualquier conjunto finito de números y para cualquier número real
ℎ > 1, se tiene la fracción:

1
1−
ℎ#

De estos números, la desviación estándar dista de la media a lo más ℎ veces.

Con este teorema se puede asegurar, por ejemplo, que para un conjunto finito de datos al menos 75%
de ellos distan de la media a lo más dos veces la desviación estándar. Pues:

1 3
1− #
= = 0.75
2 4

En los siguientes temas se profundizará más en el estudio de la probabilidad y su utilidad en los


resultados de un evento. Un ejemplo podría ser el de los beisbolistas. Cuando un jugador de béisbol toma
su turno para batear y su récord de jonrón es alto, se puede hacer un cálculo de probabilidad y formarse
una idea si podrá anotar uno más en su carrera.

Distribución binomial

Es la distribución de probabilidad de la variable aleatoria, la cual es el


número de éxitos al repetir 𝑛 veces un experimento con dos resultados Encontramos
distribución binomial si
posibles, con probabilidad 𝑝 de obtener éxito en cada experimento. Para
el evento o experimento
este caso, los valores de la esperanza, varianza y desviación estándar son: tiene dos resultados: si o
no, sano o enfermo,
𝐸[𝑋] = 𝑛𝑝, 𝑣[𝑋] = 𝑛𝑝(1 − 𝑝), 𝜎 = œ𝑛𝑝(1 − 𝑝) éxito o fracaso, etcétera.

33
Para explicar mejor este tipo de distribución, se muestra el siguiente ejemplo:

Se considera la variable aleatoria 𝑋. Lo que hace esta variable es asignar el número de águilas
obtenidas luego de lanzar una moneda 5 veces (el evento tiene dos resultados posibles: águila o
sol). Para este experimento, el espacio muestral son todos los grupos de 5 ceros y unos, donde el
1 representa águila y 0 el sol. Por ejemplo, un evento posible es (0,1,0,1,1) y, entonces, la variable
aleatoria es 𝑋(0,1,0,1,1) = 3. La probabilidad de cada evento es:

𝑛
𝑃(𝑋 = 𝑘) = ž Ÿ 𝑝 (1 − 𝑝)E¡ , 𝑘 = 0, 1, 2, … , 𝑛
𝑘

En este experimento se tiene que 𝒑𝒌 (𝟏 − 𝒑)𝒏¡𝒌 𝒏


𝒌 ž Ÿ 𝑷(𝑿 = 𝒌)
𝒌
hay ¢+ £1 eventos en el espacio
1 ) 1 + 1 +
0 ª « ª « =ª « 1 0.0313
muestral, con 𝑘 unos, todos esos 2 2 2
elementos tienen la misma 1 , 1 ' 1 +
1 ª « ª « =ª « 5 0.15625
probabilidad 𝑝 (1 − 𝑝)E¡ . 2 2 2
1 # 1 - 1 +
2 ª « ª « =ª « 10 0.3125
Para trabajar mejor los datos se 2 2 2
construye la tabla de distribución 1 - 1 # 1 +
3 ª « ª « =ª « 10 0.3125
de probabilidades de 𝑋 como 2 2 2
1 ' 1 , 1 +
sigue: 4 ª « ª « =ª « 5 0.15625
2 2 2
1 + 1 ) 1 +
5 ª « ª « =ª « 1 0.03125
2 2 2
El histograma es el siguiente:

VARIABLE ALEATORIA X
0.3125 0.3125

0.15625 0.15625

0.03125 0.03125

0 1 2 3 4 5

34
,
En cada lanzamiento de la moneda la probabilidad de obtener águila es 𝑝 = #, entonces el valor esperado,

la varianza y la desviación estándar son:

5 1 1
𝐸[𝑋] = 𝑛𝑝 = = 2.5, 𝑣[𝑋] = 𝑛𝑝(1 − 𝑝) = 5 ª « ª « = 1.25, 𝜎 = √1.25 = 1.1180
2 2 2

Según el teorema de Chebyshev es posible afirmar que la probabilidad de obtener un valor entre 0.264 y
4.736 es de al menos 75%. De acuerdo a la tabla, los valores entre 0.264 y 4.736 son 1,2,3,4 y la suma de las
probabilidades para obtener esos números es:

0.15625 + 0.3125 + 0.3125 + 0.15625 = 0.9375

Se puede ver que la probabilidad que resulta es mucho más de lo que estima el teorema de Chebyshev.
Esto se debe frecuentemente a que la distribución tiene una tendencia central.

Distribución de Poisson

Es de las distribuciones más comunes en la vida real. Y es usada para representar el número de eventos
de poca frecuencia que ocurren en el tiempo o en el espacio. Para este tipo de distribución es necesario
saber el número promedio de eventos que ocurren en un intervalo de tiempo o espacio, como:

• Cantidad de productos elaborados por día en una fábrica.


• Accidentes que ocurren en una ciudad por semana.
• Número de manchas por metro cuadrado de tela, entre otros.

¬ -® ¯°
La distribución de Poisson es una función de probabilidad descrita de la siguiente forma 𝑃(𝑥) = ,
T!

donde 𝑃(𝑥) es la probabilidad de 𝑥 apariciones y 𝜆 es el número promedio de eventos que ocurren por
periodo de tiempo o unidad de espacio. La manera de representar la distribución de Poisson es la misma
que la binomial, por medio de una gráfica de barras donde la altura de las columnas representa la
probabilidad asociada a cada valor de 𝑋. Para este caso puede ser simétrica o presentar sesgo; es decir,
cargarse más hacia un lado u otro, lo cual depende de λ.

Para explicar un poco más el desarrollo de una distribución de Poisson considera el siguiente ejemplo:

En la Liga Mexicana de Futbol, hasta la Jornada 15, el equipo que encabezaba la tabla de posiciones era
el Monterrey. En los primeros 15 partidos que disputó logró anotar 34 goles. Se pueden plantear las
siguientes preguntas para hacer una investigación: ¿Qué probabilidad hay de anotar 3 goles más? ¿Cuál
sería la probabilidad de que en su próximo partido el equipo logre anotar a lo más 2 goles?

35
En este caso puede darse el valor de goles por cada partido. En promedio se anotaron 2.27 goles por cada
90 minutos de juego. Entonces, 𝜆 = 2.27. La variable aleatoria 𝑋 es el número de goles anotados por
partido. De manera que la probabilidad de anotar 3 goles es:

𝑒 (¡#.#Š) 2.27-
𝑃(𝑋 = 3) = = 0.201409
3!

Para saber la probabilidad de anotar como máximo dos goles se deben considerar las probabilidades de
cada uno de los eventos y sumarlas, es decir:

𝑒 (¡#.#Š) 2.27) 𝑒 (¡#.#Š) 2.27, 𝑒 (¡#.#Š) 2.27#


𝑃(𝑋 ≤ 2) = + + = 0.604009
0! 1! 2!

Encontramos distribución de Poisson en eventos independientes que ocurren a una velocidad


constante en el tiempo, en la presencia de viento o granizo, cuando ocurren accidentes, etcétera.

Los resultados anteriores dicen que existe una probabilidad de un 20% de que el equipo anote 3 goles.
Sin embargo, hay 60% de posibilidades de que anote 0, 1 o 2 goles en su siguiente partido.

En el caso de una distribución de Poisson, tanto la media como la varianza coinciden con el valor de 𝜆.

Tip de aprendizaje

Los puntos, goles o canastas en un encuentro deportivo son un buen ejemplo de un fenómeno al
que puede ajustarse una distribución de probabilidad de Poisson. Estudia los resultados de tu
equipo favorito (o el equipo que elijas) de cualquier deporte y analiza la probabilidad de obtener
varios resultados en su siguiente juego. Puedes mejorar el intervalo de tiempo si cuentas con la
información, por ejemplo, de canastas en básquetbol por cada cuarto o carreras por entrada en
béisbol, con lo que puedes calcular la probabilidad de anotaciones en el próximo intervalo de
tiempo.

36
Distribución normal

Ésta es una de las distribuciones más usadas cuando se trata del estudio con características cuantitativas
de poblaciones de individuos, como edades, peso, estaturas, entre otras. En principio, este tipo de
distribución es usada para variables aleatorias continuas. Es sencillo considerar variables discretas como
continuas, como son la altura o el peso de las personas. Cuando se tiene una distribución continua cada
elemento tiene la misma probabilidad de ocurrencia 0, por lo que al trabajar este tipo de variables se
debe determinar la probabilidad de que se tome un valor dentro de un cierto intervalo. La distribución
normal tiene una gráfica en forma de campana, conocida como campana de Gauss o simplemente
gaussiana, en honor a Carl Friedrich Gauss, quien hizo muchos estudios al respecto. La función que define
la distribución normal es:

1 , T¡¶ ¸
ž Ÿ
𝑓(𝑥) = 𝑒 ¡# ·
𝜎√2𝜋

Donde 𝜇 es la media y 𝜎 la desviación estándar, la más común es cuando 𝜇 = 0 y 𝜎 = 1, conocida como


distribución normal estándar. La gráfica es de la forma:

0.4

0.3

0.2

0.1

4 2 2 4

Una distribución normal se encuentra en las características de una población:


edad, altura, peso, etcétera.

37
Para determinar la propiedad de caer en un intervalo es necesario obtener el área bajo la gráfica de la
función en el intervalo que se necesita. Basados en la misma regla de las distribuciones de probabilidad
se debe cumplir que la probabilidad del espacio muestral Ω debe ser 𝑃(Ω) = 1, entonces el área bajo la
función debe ser 1. Si se construye una función que describa variables aleatorias no negativas y cuya área
bajo la gráfica sea 1 se denominan funciones de densidad de probabilidad.

Para trabajar de manera práctica conviene Distancia de la media Porcentaje de datos (%)
recordar la siguiente tabla para la distribución
𝒅𝒊𝒔𝒕 ≤ 𝝈 68
de los datos:
𝒅𝒊𝒔𝒕 ≤ 𝟐𝝈 95

𝒅𝒊𝒔𝒕 ≤ 𝟑𝝈 99.7

De acuerdo con las propiedades de la distribución normal, 68% de los datos distan de la media a lo más
en una desviación estándar; 95% están cerca de la media en, a lo más dos desviaciones estándar; y la
mayoría de todos los datos, en 99.7%, distan a lo más en 3 desviaciones estándar de la media. Con esta
información se pueden hacer afirmaciones respecto del comportamiento de los datos, como en el
siguiente ejemplo:

38
Se ha observado que la distribución de las calificaciones en una escuela tiene un comportamiento
aproximadamente normal. Si el promedio de calificación es de 6.5 y la desviación estándar es de 1.3,
entonces es posible afirmar que aproximadamente:

• El 68% de los aspirantes sacan entre 5.2 y 7.8.


• El 95% sacan entre 3.9 y 9.1.
• Y prácticamente todos, es decir 99.7%, obtienen una calificación entre 2.6 y 10.

Cierre

En esta primera unidad aprendimos un poco de historia acerca de la estadística y la probabilidad, así
como algunos ejemplos de casos en los que podemos ver su aplicación; asimismo, hablamos sobre la
manera en que los investigadores buscan muestras de la población de interés para recabar opiniones o
datos específicos que después son reportados a nivel nacional como los censos y que se apoyan de las
medidas de tendencia central para realizar análisis y tomar decisiones.

39
Referencias por unidad

- Batanero, Carmen, “Razonamiento probabilístico en la vida cotidiana: Un desafío educativo”,


Universidad de Granada, España [en línea]
https://www.ugr.es/~batanero/pages/ARTICULOS/ConferenciaThales2006.pdf (consultado el 11 de
julio de 2019).
- Dasinger, Michael L. et al., “Comparison of the Atkis, Ornish, Weight Watchers and Zone Diets for
Weight Loss and Heart Disease Risk Reduction”, Journal of American Medical Association, [en línea],
2003, pp. 43-53, http://users.stat.ufl.edu/~winner/consult/diet.pdf (consultado el 11 de julio de 2019).

- Durkheim, Émile, Las reglas del método sociológico, Buenos Aires, Pléyade, 1979.
- Gutiérrez, Segundo, Probabilidad, posibilidad, verdad e incertidumbre, Estadística española, [en
línea], 1984, pp. 5-22,
http://estadisticamigable.blogspot.com/2009/11/probabilidad-posibilidad-verdad-e.html

- Hernández, Roberto et al., Metodología de la investigación, México, Mc Graw Hill, 1984.

- Quevedo, Fernando, “Medidas de tendencia central y dispersión”, Estadística Aplicada a la


Investigación en Salud. Medwave, año 11, núm. 3, [en línea],
https://www.medwave.cl/medios/medwave/marzo2011/1/medwave.2011.03.4934.pdf

- SAGE, Glossary of the Social and Behavioral Sciences, Nueva York, SAGE Publications, 2009.

- Triola, Mario F., Estadística, México, Pearson Educación, 2013.


- Kuhn, Thomas, La estructura de las revoluciones científicas, México, Fondo de Cultura Económica,
1971.

40

También podría gustarte