Está en la página 1de 53

Mdulo 17.

Estadstica en fenmenos naturales y procesos sociales


Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

ndice

Presentacin

Unidad I. La estadstica descriptiva, los fenmenos naturales y procesos

1. Conocer los principios bsicos de la estadstica

2. Caractersticas de los fenmenos naturales y proceso sociales

3. Tipos de eventos: determinsticos y aleatorios

4. Fenmenos naturales y procesos sociales vinculados que pueden ser analizados


utilizando la estadstica

5. Tipos de variables: continuas y discretas, dependientes e independientes,


cuantitativas y cualitativas

6. Muestreo: poblacin, muestra, tcnicas de muestreo

7. Ordenamiento de datos

8. Organizacin de informacin
8.1 Tablas de distribucin de frecuencias
8.2 Tablas de distribucin de frecuencias para datos no agrupados
8.3 Tablas de distribucin de frecuencias de clase o de datos agrupados

9. Construccin de grficas

10. Distribucin de probabilidad en los fenmenos naturales y procesos sociales

11. Distribucin de probabilidad

12. Distribucin binomial

13. Distribucin de Poisson

14. Distribucin normal

15. Conocer los tipos de hiptesis a probar en diversas investigaciones cientficas y


descartar las que no lo son

Cierre

Fuentes

1/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Presentacin
Propsito:

Analizar fenmenos y procesos sociales de su entorno mediante el uso de


conceptos bsicos de la probabilidad y estadstica (tipos de eventos, variables,
muestreo, grficas) para reconocer los diferentes tipos de distribucin de la
informacin y explicar el comportamiento de dichos fenmenos y proceso en un
determinado contexto, en un ambiente de respeto y tolerancia.

Indicadores de desempeo:

Clasifica un conjunto de fenmenos naturales y procesos sociales de acuerdo


a sus caractersticas especficas, con la finalidad de reconocer los de mayor
incidencia en su contexto.

Identifica los fenmenos naturales y procesos sociales en determinsticos y


aleatorios de acuerdo a su naturaleza de ocurrencia para reconocer aquellos
que puede analizar y predecir con elementos estadsticos.

Determina y analiza los tipos de variables en la interpretacin y explicacin de


fenmenos naturales y procesos sociales.

Identifica y sita fenmenos naturales y procesos sociales de su contexto


que pueden ser objeto de estudio estadstico y aquellos que no pueden ser
estudiados a travs de este mtodo.

Identifica fenmenos naturales y procesos sociales de su contexto y utiliza


tcnicas de muestreo para la obtencin de datos que permitan interpretar y
explicar dichos fenmenos que ocurren en su entorno.

Identifica y explica los diversos tipos de distribucin de probabilidad a travs de


grficas.

Punto de partida

En mdulos anteriores estudiaste el uso de las matemticas y la estadstica


en el conocimiento y la interpretacin de fenmenos naturales y sociales.
Especficamente, el Mdulo 13, Variacin de procesos sociales, abord modelos

2/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

matemticos para comprender las variaciones de los fenmenos sociales. En


esta ocasin, retomars a la estadstica como una herramienta del conocimiento
cientfico. Si bien en la historia de la humanidad, ste se ha aplicado de diferentes
formas, en nuestra era, se sustenta en la posibilidad de demostrar y comprobar la
interpretacin que se tiene de un fenmeno, mediante el uso de la matemtica, la
cual permite formular un pensamiento slido, consistente y verificable. Es decir, la
comprobacin ha requerido del desarrollo de la estadstica con el fin de recabar,
ordenar y sistematizar los datos obtenidos de la realidad.

Revisa el tema con atencin, ya que puede ser de gran utilidad en la vida prctica.
Vivimos en una era en la que se hacen campaas de publicidad con el argumento
de su verificacin cientfica. Sin embargo, al concluir este mdulo podrs constatar
que existe muchas falsedad en esos mensajes publicitarios.

UNIDAD I. LA ESTADSTICA DESCRIPTIVA, LOS FENMENOS


NATURALES Y PROCESOS

1. Conocer los principios bsicos de la estadstica


La ciencia social logra avances gracias a diferentes formas de medicin
y demostracin de procesos humanos y naturales. Ninguna ciencia acta
independiente de las dems, aunque, probablemente, la estadstica es la
ciencia utilizada con mayor amplitud. Si observas, los datos estadsticos estn en
prcticamente todas las reas del conocimiento: en medicina para la generacin de
nuevos medicamentos; en la demografa o estudio social de la poblacin humana;
en psicologa en pruebas psicomtricas; en deportes para calcular el desempeo
de los participantes; entre muchos otros. Pero a pesar de lo anterior qu es la
estadstica?, quin la invent? y cmo funciona?

La estadstica naci como una actividad de


los gobiernos y su objetivo bsico consista La estadstica fue originalmente
en contar la cantidad de personas que una actividad de los gobiernos y su
estaban en su territorio, dicha actividad objetivo bsico consista en contar
fue practicada por la primera dinasta de la cantidad de personas en su
Faraones egipcios hace 3,000 aos antes territorio.
de Cristo. En China el emperador Yao us

3/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

la estadstica para calcular el tamao de sus actividades agrcolas y de comercio


2,238 aos antes de Cristo. En Grecia, 1,200 aos antes de Cristo, la estadstica fue
utilizada para conocer la cantidad de nacimientos, muertes y contabilizar a los
hombres con derecho a voto. En Amrica, alrededor de 1,116 aos antes de Cristo, el
rey Xoltl del imperio Chichimeca orden contar a todos los sbditos que pagaban
tributo (Wikipedia, 2016), entre muchos otros casos.

Los iniciadores de la estadstica son muchos, pero en


este mdulo se centrar en tres principales: John Graunt,
Adolphe Quetelet y Emile Durkheim. Graunt (1620-1674,
Londres) es considerado el primer demgrafo. Su obra
Natural and Political Observations Made upon the Bills
of Mortality de 1622 es un ejercicio de cuantificacin
de nacimientos y decesos. Su objetivo fue calcular la
propagacin de la peste bubnica en Inglaterra. Logr explicar dicha expansin de
la enfermedad, pero su mtodo era muy limitado porque no logr explicar en gran
escala el problema de la peste bubnica (Wikipedia, 2016).

Adolphe Quetelet (1796-1874, Blgica) fue el primer


matemtico que aplic las bases de la estadstica a
procesos sociales. Su obra Lhomme et le dveloppement
de ses facults ou Essai de physique sociale, publicada
en 1896, construye una explicacin sobre las sociedades
y cmo distinguirlas cuantificando la altura, el peso, la
longevidad o cantidad de aos de vida de las personas.
Tambin argument que la cantidad de suicidios y la duracin de los matrimonios
podan ser exponentes de los errores en los que incurre una sociedad determinada
al no aplicar el castigo adecuado a los delitos as como procurar la preservacin
de la familia. Con el tiempo su mtodo tuvo mayor aplicacin y avanz en
explicaciones certeras (Revista ndice, 2006).

Pero fue mile Durkheim (1858-1917, Francia) quien


aplic de forma rigurosa los principios de la estadstica
en la explicacin de procesos sociales como el suicidio.
En su obra Las reglas del mtodo sociolgico, editada
en 1895, seal que los hechos sociales pueden ser
tratados como objetos; en otras palabras, la cuantificacin
de procesos sociales ayuda al cientfico social a quitar
los prejuicios y permite encontrar lo que est detrs de aparentes situaciones

4/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

denominadas normales y anormales. Para Durkheim, el trasfondo de los procesos


sociales puede ser demostrado en trminos estadsticos en un contexto histrico
especfico en el que acontece el proceso en cuestin. As, el observador puede
conocer y medir los elementos que determinan diferentes procesos contextuales y
cuantitativos de lo que analiza (Durkhiem, 1979).

Un ejemplo del uso de la estadstica en estos temas, es donde Durkheim demuestra


que el principal grupo que decide por el suicidio es el de los varones. Segn la
cuantificacin que realiz, retomando datos de las morgues en Francia, la religin y
la edad eran caractersticas asociadas al suicidio. Los hombres adultos mayores de
25 aos catlicos tenan mayor cantidad de muertes por suicidio.

John Graunt Adolfe Quetelet mile Durheim

Los autores que comenzaron a usar las matemticas y la estadstica en la


explicacin de procesos sociales, tuvieron inters por la poca histrica y la
sociedad en la que vivieron. La aplicacin y difusin de la estadstica se convirti
en una herramienta para demostrar clara y objetivamente el curso de las
enfermedades, la razn de que las personas se suicidaran, las diferencias que
conducen a que una sociedad sea ms avanzada que otra, entre muchas otras
cuestiones.

Cules son los principios bsicos de la estadstica?

Los principios o las bases del pensamiento La estadstica fue originalmente


estadstico son el anlisis y conocimiento una actividad de los gobiernos y su
del contexto de los datos, la fuente de objetivo bsico consista en contar
los datos, el mtodo de muestreo y las la cantidad de personas en su
consecuencias prcticas. territorio.

5/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

El contexto y la fuente de informacin consisten en conocer y analizar el objetivo de


los datos recopilados: dnde y cundo es recabada la informacin numrica.

Actividad
Revisa los dos ejemplos siguientes:

A. Los estudiantes mexicanos de licenciatura suben un kilogramo de


peso corporal durante sus primeros tres meses de clases.

B. Un estudio clnico realizado en el ao 2004 para 200 personas en


la Universidad de Chicago, EEUU, busc la relacin entre sobrepeso
y estrs. En el estudio se afirmaba que situaciones como los divorcios
y las malas relaciones interpersonales en la escuela o el trabajo
incrementan 10% los niveles de cortisol en el cuerpo, lo cual deriva en
desajustes del metabolismo (Bienestar 180, 2016).

El ejemplo A es muy general y no precisa


quin hace la afirmacin ni indica el El contexto y la fuente
objetivo. El ejemplo B contiene la fuente, consisten en conocer y analizar el
el objetivo y explica la relacin entre objetivo de los datos recopilados,
sobrepeso y estrs. Por lo tanto, el objetivo as como el lugar y tiempo de la
y la fuente de los datos son informacin informacin.
importante que asegura, se trata de un
estudio estadstico.

El mtodo de muestreo hace referencia a los procedimientos


utilizados para recopilar datos del estudio en cuestin. Es
necesario mencionar que no es una actividad sencilla. El
rigor en la recopilacin es una condicin indispensable
para sostener la confianza con la que puede aceptarse,
por lo que no se debe olvidar que es una condicin en
cualquier afirmacin estadstica. Por ejemplo, hay estudios
estadsticos apoyados en una muestra de respuesta voluntaria y de muestra de
respuesta aleatoria o al azar. En una muestra de respuesta voluntaria, las personas
deciden participar en la encuesta o el estudio, esto genera un sesgo o distorsin
en los resultados. Por otro lado una muestra aleatoria, implica que las personas

6/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

encuestadas tienen la misma probabilidad de ser elegidas. Entonces en una


muestra de respuesta voluntaria la persona sabe previamente que ser encuestada,
esto produce una alteracin en las respuestas. En una muestra aleatoria, la persona
no sabe que ser encuestada, es tomada por sorpresa, este procedimiento ayuda a
disminuir las distorsiones en las respuestas.

Actividad
Lee con atencin los dos casos siguientes de muestreo.

C. La empresa operadora del tren suburbano Buenavista-Cuautitln


afirma que 90% de sus usuarios estn satisfechos con el precio que
pagan al usar el tren en relacin con el tiempo que ahorran de viaje.
El estudio fue realizado por medio de Internet y se cont con la
participacin de 1,000 personas (Barrera, 2016).

D. Un investigador social demostr que 60% de los usuarios del tren


suburbano Buenavista-Cuautitln estn inconformes con el precio
que pagan usando este transporte. La afirmacin est apoyada en una
encuesta de 1,000 personas usuarias, realizada en las siete estaciones
de dicho transporte.

Cul de las anteriores afirmaciones utiliza la muestra aleatoria?, Qu investigacin


utiliza la muestra de respuesta voluntaria? El caso C es una muestra voluntaria en
la cual las personas usuarias de Internet consultan la pgina del tren suburbano
y son invitadas a participar en una encuesta. En el caso D es aleatoria porque el
investigador intercepta a los usuarios en las estaciones del tren sin saber que
participarn en una encuesta. Cada afirmacin est apoyada en diferentes mtodos
de muestreo, sin importar cul de los estudios es verdadero, la muestra genera
diferentes afirmaciones, por lo tanto pueden defender ideas contrapuestas de un
mismo proceso social.

Muestra de respuesta voluntaria: las personas


deciden participar y saben que sern encuestadas
previamente.

Muestra aleatoria o al azar: las personas tienen la


misma probabilidad de ser elegidas para la aplicacin de
encuestas, y no saben que sern encuestadas hasta que
son interceptadas por los investigadores.

7/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Es importante sealar que los


mtodos de muestreo son tica en estudios estadsticos:
actualmente determinantes para la implica el consentimiento de las
validez de estudios sociales. Esto personas encuestadas al informar la
es as porque todo estudio social finalidad de la investigacin, los datos
apoyado en informacin solicitada a son confidenciales, el bienestar de las
personas debe seguir criterios de tica personas encuestadas est sobre los
para investigaciones sociales (Triola, beneficios que la investigacin genere.
2013, p. 6) los cuales consisten en:

1. Todos los sujetos de un estudio deben dar su consentimiento y ser informados


de la finalidad de la encuesta y del uso de su informacin.

2. Todos los datos de los individuos sern confidenciales; ningn estudio puede
hacer pblica la informacin privada.

3. El bienestar de los sujetos siempre debe estar por encima de los beneficios que
el estudio brinda a la sociedad.

Todo estudio estadstico buscar ser claro y tener afirmaciones comprensibles,


cuando menos en sus conclusiones, para personas sin conocimiento de
estadstica; de lo contrario, el estudio slo sera entendido por un sector muy
reducido de personas. Por ltimo, los estudios estadsticos deben ser valorados
en su significancia estadstica y prctica, ambas son parte de las consecuencias
aplicables.

Significancia estadstica: demuestra, con base


en un anlisis matemtico que un estudio estadstico es
relevante y tiene efectos importantes a considerar.
27% 15%
Significancia prctica: consiste en reconocer que 58%
una investigacin apoyada en el anlisis estadstico tiene
efectos importantes en la vida cotidiana.

8/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Un estudio con significancia estadstica es el que demuestra, con base en un


anlisis matemtico, que un estudio estadstico tiene un efecto importante que se
debe considerar. La significancia prctica, por su parte, consiste en reconocer que
una investigacin apoyada en el anlisis estadstico tiene efectos importantes en la
vida cotidiana. Por ejemplo:

E. La dieta del doctor Atkins (Adelgazar rpido, 2016), la cual prescribe dejar de comer
harinas y carbohidratos para bajar de peso, fue puesta a prueba por la investigacin
de Michael L. Dasinger (Dasinger et. al., 2003). El autor concluy que las 40 personas
que aceptaron tomar registros diarios de su peso durante un ao, siguiendo la dieta
de Atkins, lograron perder 950 gramos de peso, cantidad que es estadsticamente
significativa, no establece una significancia prctica, en trminos estadsticos,
porque perder menos de un kilo en un ao con esa dieta indica que no funciona
para las personas estudiadas.

Actividad
Busca en Internet un caso similar al inciso E, donde la dieta logre
tener significancia prctica y significacin estadstica.

En resumen, los principios de la estadstica son:

Tener siempre presente el contexto de los datos pesentados en un estudio.

Observar cul es la fuente o autor del estudio.

Entender y analizar el objetivo del estudio estadstico.

Identificar la tcnica de recoleccin de datos o el proceso de muestreo.

Considerar si las conclusiones propuestas logran la significancia estadstica y


significancia prctica.

Observar si el estudio cumple con los criterios de tica.

Por lo tanto, la estadstica es una herramienta cientfica que permite demostrar el


efecto de procesos naturales y sociales. Los datos estadsticos no son verdad ni
vlidos por s mismos. Los nmeros no mienten, pero pueden ayudar a engaar si
omiten y ocultan los principios antes mencionados.

9/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

2. Caractersticas de los fenmenos naturales y procesos sociales


Lee con atencin el siguiente segmento de un artculo de revista:

Sin confianza en la polica (Castillo, 2016)

El 70.3% de los adolescentes no se siente seguro en las calles, el


19.5% dice haber sufrido violencia y el 17.4% (83,392) participado en actos
violentos, segn los resultados de la Consulta Infantil y Juvenil 2015
realizada por el Instituto Nacional Electoral (INE).
En la consulta participaron 2 millones 916,686 nias, nios y adolescentes
de los 6 hasta los 17 aos.
19,079 adolescentes entre 14 y 17 aos revela que han sido obligados
a formar parte de un grupo de delincuentes.
Si se habla de confianza, 21.7% dice confiar en la polica, el 25.2% en el
ejrcito, el 4.9% en los partidos polticos y el 5.2% en los gobernantes. El
factor confianza se centra en la familia con un 95.9% y en las amistades
con un 70.3%
Slo el 35% de los adolescentes encuestados pedira ayuda a un polica
en una situacin de peligro y el 5% a una institucin de gobierno.

Fuente: http://www.animalpolitico.com/2016/03/la-corrupcion-el-otro-castigo-para-los-
jovenes-infractores/

10/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

El argumento propuesto por Alejandra Castillo en su nota periodstica puede ser


analizado con los puntos del Tema 1, es decir, puede generar preguntas como:
Tienen validez los datos que presenta?, indica cmo realiz el muestreo?, qu
significancia estadstica y prctica tienen los datos presentados?

ste es un ejemplo que aborda un tema delicado, es decir los jvenes y la relacin
con su entorno social. Quiz su muestra y la presentacin del anlisis dejen muchas
dudas, pero permiten imaginar el tamao del problema que describe.

As una pregunta para la reflexin: Es adecuado explicar el comportamiento de la


juventud y su relacin con la delincuencia como lo propone la autora? Y t, cmo
lo estudiaras?

Con base en el trabajo que se realizar en este mdulo, es posible analizar las
caractersticas de los fenmenos naturales y los procesos sociales. Para conocer
las bases tericas que permiten explicar los fenmenos naturales y sociales
es necesario entender algunos temas de filosofa de la ciencia y los principios
relevantes del positivismo. Con esos puntos tendrs un marco terico slido para
explicar por qu los fenmenos naturales y sociales pueden ser estudiados por
medio de la estadstica.

En el Tema 1, autores como Quetelet y Durkheim traducen los procesos sociales


a nmeros. Mediante ese recurso cuantitativo buscan limpiar de prejuicios
los eventos que eligieron en un tema de investigacin. Ambos autores estn
firmemente apoyados en la propuesta del positivismo.

El positivismo es una forma de trabajo cientfico


que acepta los siguientes principios o reglas del
pensamiento cientfico: la medicin, el empirismo
y la verificabilidad. La de un fenmeno
implica el vnculo entre conceptos abstractos con
indicadores empricos (Hernndez Sampieri et. al., 2014).
El empirismo consiste en una forma de hacer
ciencia, la cual acepta nicamente la validez de
eventos captados mediante los sentidos como el
tacto, la vista, el olfato, el odo.

11/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

En otras palabras, un evento es vlido si es posible tocarlo, verlo y escucharlo; es


decir, condiciones que hacen posible notar el tamao del fenmeno elegido para
conocerlo por medio de su estudio. Finalmente, el positivismo se fundamenta en el
principio de verificabilidad. Esta regla de pensamiento indica que los fenmenos
captados con los sentidos y con capacidad para ser medidos, pueden ser
comprobados en todos los casos.

Se explicarn estos principios mediante ejemplos:

En un parque se observa que las ardillas


El positivismo es una forma
adultas son de color rojo o negro, y se
de trabajo cientfico que acepta
cuentan 200 de un total de 500 que habitan
los siguientes principios o reglas
en ese lugar. Entonces con esos hechos se
de pensamiento cientfico: la
est en condiciones de indicar lo siguiente:
medicin, el empirismo y la
Todas las ardillas adultas son de color rojo
verificabilidad.
o negro.

En un segundo ejemplo, segn los datos de CONAGUA, en el ao 2015 las lluvias


ms intensas acontecieron, en gran parte del territorio nacional, en mayo. Por lo
tanto, se puede concluir lo siguiente: Todos los aos, en el mes de mayo tienen
lugar los mayores ndices de lluvias a nivel nacional.

Con base en tu experiencia: son vlidos los ejemplos anteriores?,


son certeras las afirmaciones? Si observas, no todos los eventos
naturales suceden exactamente en las mismas fechas; y en el
caso de las ardillas adultas, al consultar la biologa conoceremos
que exiten distintos tipos de ardillas, por ejemplo, en Exeter,
Canad son albinas (adultas). Por su parte, en el estudio de Castillo no se puede
afirmar que todos los jvenes entre 14 y 17 aos son obligados a formar parte de
grupos delictivos.

Al considerar los puntos anteriores, hay caractersticas de los


fenmenos naturales los fenmenos naturales y de los procesos
sociales que son susceptibles de ser expresados en trminos
medibles, empricos y verificables por otros investigadores en otros
lugares. No hay leyes universales o infalibles que indiquen que lo medido a travs
de estadsticas sea igual en todos los casos. Sin embargo, la estadstica trabaja con
datos numricos y, por medio de ellos, es posible indicar los rasgos singulares de una
poblacin y, de este modo, obtener informacin con la cual se pueden hacer clculos.

12/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Los fenmenos naturales y los procesos sociales tiene


las siguientes cualidades: son expresables en trminos
medibles, empricos y pueden ser verificados por otros
investigadores en otros lugares.

En sntesis, todos los fenmenos naturales y los procesos sociales pueden ser
expresados en trminos medibles y empricos, adems cuentan con capacidad para
ser verificados. En los siguientes temas se presentarn las formas en que puede ser
evaluada la calidad de los datos generados en explicaciones estadsticas.

13/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

3. Tipos de eventos: Determinsticos y Aleatorios

Existen dos maneras de clasificar los sucesos que analiza un investigador


en estadstica: eventos determinsticos y eventos aleatorios. Los eventos
determinsticos consisten en sucesos predecibles con total precisin (Rojas Portilla
et. al., 2009). Por ejemplo, es posible predecir que al reunir 5 manzanas con 4
naranjas se obtendr una cantidad de 9 unidades. Los eventos determinsticos dejan
poco que discutir en cuanto a lo que va suceder.

3 6
Otro ejemplo. Cuntos enteros se formarn al sumar 4 + 8 ? Es un resultado que
ofrece incertidumbre? Es decir: Puede existir un resultado entre 1 y 100? Al sumar
tres cuartos ms seis octavos se obtiene un resultado de doce octavos, lo que
permite formar un entero y dos cuartos:

Los eventos determinsticos no pueden variar


si lo hace una persona u otra, y si lo hace en un Los eventos
lugar u otro. Es decir, no cambian los resultados determinsticos varan si
si lo realiza una persona el 1 de enero de 2016 lo hacen diferentes personas
y si otra persona lo realiza el 1 de marzo del en diferentes momentos o
mismo ao, o si lo hace en China o en Mxico, la lugares.
suma de tres cuartos ms seis octavos seguir
siendo un entero y dos cuartos:

14/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Ahora bien, los eventos aleatorios se basan


en sucesos donde se puede estimar su
Eventos aleatorios: consisten resultado, sin saber con precisin el mismo.
en sucesos donde se puede Por ejemplo: Llover hoy?, Los autos color
calcular el resultado, sin saberlo rojo chocan con mayor frecuencia? En los
con precisin. ejemplos anteriores los resultados son
inciertos. Se puede indicar que sucedar o no,
sin saber con exactitud cundo y cmo.

Para ese tipo de eventos, las matemticas y la estadstica han


desarrollado un cmulo de teoras y procedimientos con los
cuales puede calcularse la probabilidad de que suceda o no
el evento indicado. La primera forma para organizar el anlisis
de eventos aleatorios consiste en separarlos en tres formas:
evento, evento simple y espacio muestral (Triola, 2013).

Un evento es cualquier conjunto de resultados. Un evento simple es un resultado


que no puede desglosarse en eventos simples. El espacio muestral est compuesto
por todos los eventos posibles, es decir, son todos los resultados que ya no pueden
desglosarse ms.

Por ejemplo: Cul es el espacio muestral de tres nacimientos registrados en un


hospital durante el primer turno del da? El espacio muestral queda de la siguiente
forma:

Espacio muestral
Caso analizado Ejemplo de evento
completo

Evento simple. Que el primer


Nacimientos nacimiento sea nia (f)
registrados en un [fff, ffm, fmf, fmm, mff,
hospital durante el Evento simple. Que el mfm, mmf, mmm]
primer turno segundo nacimiento sea
nio (m)

15/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Como puedes observar, los eventos simples son aleatorios: no se sabe exactamente
si en el primer nacimiento ser nio o nia, descartando que se conozcan los
anlisis previos neo-natales. Ahora bien, con los eventos aleatorios puede calcularse
la probabilidad de que suceda un evento especfico. Para ello hay tres mtodos que
se emplean en estadstica para realizar dicho clculo:

Mtodo de frecuencias relativas. Consiste en calcular la


probabilidad de que suceda un evento, teniendo registros previos.
Este mtodo asume que tales registros son correctos y calcula la
probabilidad de que suceda en el futuro un evento especfico.

Mtodo clsico. Consiste en aceptar que todos los eventos tienen


la misma probabilidad de ocurrir.

Mtodo de probabilidad subjetiva. Consiste en observar los


resultados de eventos pasados y agregar elementos del contexto
que puedan afectar el resultado que es analizado, adems de que
propone una probabilidad sin usar procedimientos matemticos.

Mtodo de frecuencias relativas. Consiste en calcular la probabilidad de


que suceda un evento, teniendo registros previos.

Mtodo clsico. Todos los eventos tienen la misma probabilidad de ocurrir.

Mtodo de probabilidad subjetiva. Observa los resultados de eventos


pasados y agrega elementos del contexto que pueden afectar el resultado, el
cual es analizado, adems no usa procedimientos matemticos.

En el primer caso, el mtodo de frecuencias relativas sirve en ejemplos como el


siguiente: En un ao reciente en EEUU, de un total de 135,670,000 de autos
registrados (segn la Statiscal Abstract of the United States) slo tuvieron
accidentes 6,511,100 Cul es la probabilidad de que un auto tenga un accidente?
La solucin por medio del mtodo de frecuencias relativas es: la probabilidad de
que un auto tenga un accidente es igual al nmero de automviles accidentados
entre el nmero total de accidentes.

16/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

6,511,100 0.047
135,670,000

El mtodo clsico puede usarse en ejemplos como el siguiente: Determina la


probabilidad de que exactamente dos de los tres nacimientos registrados en el
hospital de la Tabla 1. Tipos de eventos sean varones.

Para resolverlo, primero es necesario identificar correctamente el espacio muestral.

Espacio muestral
Nacimientos registrados durante el primer turno de un hospital

Primer nacimiento Segundo nacimiento Tercer nacimiento

Nio Nio Nio


Nio Nio Nia
Nio Nia Nio
Nio Nia Nia
Nia Nio Nio
Nia Nio Nia
Nia Nia Nio
Nia Nia Nia

El espacio muestral consta de ocho diferentes combinaciones y slo tres responden


exactamente a la probabilidad buscada: dos, de los tres nacimientos registrados,
sean varones. Por lo tanto, usando el mtodo clsico, queda de la siguiente forma:

Por ltimo, el mtodo subjetivo puede ser utilizado en ejemplos como el siguiente:
Cul es la probabilidad de quedar atrapado en un elevador? En estos casos no
hay datos previos, tampoco es posible calcular un espacio muestral, por lo tanto se

17/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

recurre a la experiencia propia y nos percatamos de que nunca hemos quedado


atrapados en un elevador. Slo sabemos de algunos comentarios de personas, por
lo tanto estimamos que hay una probabilidad de 1 en 10,000; es decir, existe un
0.0001 de quedar atrapado en un elevador. La probabilidad slo es estimada con
base en datos de nuestra experiencia.

Finalmente, cabe sealar que la probabilidad es diferente a la posibilidad. Lo


probable puede ser calculado por medio de los mtodos de frecuencia relativa
o con el mtodo clsico. La posible, es una estimacin subjetiva y no cuenta con
ningn apoyo en datos. No los uses como sinnimos.

4. Fenmenos naturales y procesos sociales vinculados que


pueden ser analizados utilizando la estadstica

Con el estudio de los temas previos, se


La expresin numrica de
aprecia que la estadstica es una herramienta
los fenmenos naturales cientfica que puede calcular y explicar los
y de los procesos sociales eventos expresados en trminos cuantitativos.
permite analizarlos con
En este sentido, hay una gran cantidad de
herramientas matemticas y
fenmenos naturales y procesos sociales que
estadsticas.
pueden ser estudiados con la estadstica.

Retomando un tema actual, cules son los fenmenos naturales y los procesos
sociales vinculados que generan el cambio climtico? Existen al menos dos lneas
de anlisis que responden a esa pregunta: a) las actividades humanas generan
cambios en el ambiente natural del planeta y b) el planeta evoluciona y las acciones
humanas tiene poco o nulo efecto sobre dicha transformacin.

Para la finalidad de este tema se asume la respuesta a), las actividades humanas
generan cambios en el ambiente natural del planeta. En este caso, uno de los temas
centrales es la contaminacin de los ecosistemas por la expulsin de dixido de
carbono a la atmsfera.

18/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

La respuesta ms aceptada actualmente es


que las altas concentraciones de dixido de
carbono producido por las ciudades acelera
el cambio climtico en la atmsfera del
planeta. Como lo indica la revista Ecojoven
(Ecojoven, 2016), el dixido de carbono es
producido por las sociedades humanas,
el cual ha aumentado de manera ms acelerada desde la Revolucin Industrial
del siglo XIX. Desde otra perspectiva, segn Mario F. Triola (Triola, 2013, p. 727) las
concentraciones de dixido de carbono han aumentado notablemente desde el
ao de 1880 hasta el 2000, situacin que puede ser demostrada numricamente
por medio del registro de la cantidad de dicho gas en la atmsfera y el incremento
de actividades humanas como el transporte motorizado de combustin interna, el
creciente uso de combustibles fsiles como el petrleo, el consumo de energa
elctrica en la ciudades y la produccin industrial.

Concentraciones de dixido de 1880 a 2000


(Triola, 2013)

Partes de dixido de
Ao
carbono por milln
1880 290.7
1890 293.7
1900 295.6
1910 299.4
1920 301.4
1930 305.9
1940 307.4
1950 311.3
1960 316.9
1970 325.7
1980 338.7
1990 354.2
2000 369.5

19/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Si investigas lo que acontece en Mxico entre 1970 y 1990, periodo en que la


cantidad de dixido de carbono aument en 30 millones de toneladas, podrs
constatar lo siguiente: En 1970 Mxico tuvo 1,233,824 autos particulares y para 1990
lleg a 6,349,025 autos (Navarro, 2012). Asimismo, el consumo de energa elctrica
en casas habitadas durante 1970 fue del 16.6% y para 1990 lleg a 22.2% del total
producido en Mxico. El consumo de energa elctrica del sector industrial en 1970
fue del 54.7 y para 1990 lleg a 57.2% del total de energa producido en Mxico
(Cmara de Diputados, 2001).

Por lo tanto, con los datos sealados, se puede resumir que las actividades
humanas tienen efecto en la cantidad de dixido de carbono lanzado a la atmsfera.
Particularmente las dos dcadas que van de 1970 a 1990 muestran que la cantidad
de autos particulares creci en Mxico cinco veces y el consumo de energa
elctrica lo hizo en 6%. Por lo tanto, si se analizan estadsticamente la cantidad
de autos que circulan actualmente en la Ciudad de Mxico o bien se cuantifica
la cantidad de horas que estn encendidos los aparatos electrodomsticos en
cada hogar y se asocia con el tipo de actividad que tenemos, trabajo, estudio,
cocina, entre otros, se puede calcular el impacto de las actividades humanas en el
incremento de dixido de carbono en la atmsfera.

Finalmente, la expresin numrica de los fenmenos naturales y los procesos


sociales permite analizarlos con herramientas matemticas y estadsticas. Con dicho
proceso de anlisis puede mostrarse la asociacin de las actividades humanas y los
fenmenos naturales que acontecen en nuestro planeta.

5. Tipos de variables continuas y discretas, dependientes e


independientes, cuantitativas y cualitativas

La estadstica utiliza datos cuantitativos para desarrollar sus formas de medicin


y clculo. Sin embargo, en la vida cotidiana no estn a nuestra disposicin todos
los datos numricos de los problemas y objetos de investigacin. Por ejemplo, no
existen datos precisos de la cantidad de smartphones que tienen las personas que
viven en la Ciudad de Mxico. No hay datos exactos de las personas que separan la
basura en orgnica e inorgnica en el Estado de Mxico, entre muchos otros puntos.

20/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

En muchos casos es necesario que el investigador genere su propia informacin


segn el objeto de estudio y los objetivos que se proponga. Por supuesto, es
posible consultar los datos de INEGI, pero no siempre respondern a los intereses
especficos de cada investigacin.

Adems de lo anterior, si ya se tiene la


informacin necesaria para realizar un
Trmino o variable: concepto
anlisis estadstico, es necesario revisar que
susceptible de medir y de ser
responda a los objetivos y a las definiciones
expresado de forma cuantitativa.
deseadas. Por ello, en estadstica, las
variables y las formas en las que pueden
ser recuperadas y analizadas deben pasar por una primera fase de definicin; es
decir, el investigador debe conocer si sus variables son cuantitativas o cualitativas;
as como es indispensable conocer si las variables principales son continuas o
discretas. Adems, es necesario establecer cul es la variable dependiente y
cules sern las variables independientes. Por ello, este tema procede a indicar los
rasgos de cada una de las variables mencionadas.

21/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

En primer lugar, un trmino o variable es un concepto susceptible de ser medido


y expresado de forma cuantitativa. Es importante asegurarse de que las variables
son medibles y observables. Regularmente, al iniciar una investigacin, algunas
personas cometen el error de introducir variables que no son posibles medir o
bien se proponen variables como mal gobierno, mal comportamiento, actividad
inhumana, entre otros, que no han indagado previamente. Como se hace en
algunos estudios, en los cuales se expresan mediciones de actividades como
la corrupcin, la indisciplina y la violencia. Por lo tanto, en estadstica siempre se
debe estar seguro de que las variables sean expresadas en nmeros, segn las
definiciones tericas revisadas previamente. Por ejemplo:

Como puedes notar, las variables de


todos los ejemplos anteriores cambian o
Variables independientes:
tienen variacin. Si el procedimiento de
tienen cambios en diferentes
construccin no es X, y se cambia por el
casos.
procedimiento Y, entonces su efectividad
ser otro, por ejemplo, de 60%. Lo
importante es reconocer que las variables tienen cambios medibles en diferentes
casos y en diferentes contextos.

Las variables pueden ser divididas en


Variables dependientes: dependientes e independientes. Las
variables de las que se desea primeras son las que se desean probar,
saber si tienen cambios en relacin si tienen cambio o no. Las variables
con las variables independientes. independientes son las que tienen
cambios en diferentes casos. Por ejemplo,

22/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

al establecer la relacin entre la efectividad de titulacin y las tareas no entregadas


a tiempo por semana, la edad y el gnero. O bien, al establecer la relacin entre
cometer una infraccin de trnsito, tomando en cuenta las variables de edad,
gnero y aos de conductor. Como muestra la tabla, regularmente la variable
dependiente es representada con la letra Y y las variables independientes con la
letra X.

Como puedes observar, las variables dependientes Y son los eventos que
deseamos poner a prueba. Las variables independientes X cambiarn segn
respondan las personas a las cuales aplicamos un cuestionario.

Despus de establecer las variables independientes es indispensable observar la


forma que tienen. En estadstica es un procedimiento comn indicar si las variables
consisten en elementos cuantitativos o no cuantitativos, razn por la que las
primeras son llamadas variables cuantitativas y las segundas variables cualitativas.

23/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Las  son datos numricos que expresan el concepto que se


desea mostrar por medio de un anlisis estadstico. Este tipo de variables estn
subdivididas en dos niveles de medicin: las primeras son las variables discretas,
las cuales pueden ser contadas en nmero enteros. Las variables continuas son
datos numricos expresados en fracciones. Las variables cualitativas representan
categoras o atributos, y consisten en nombres o etiquetas. A su vez estn
subdivididas en dos niveles de medicin: nominales y ordinales. Las primeras son
variables cualitativas que no tiene un orden especfico. Las variables cualitativas
ordinales s tienen un orden especfico. Por ejemplo:

6. Muestreo: Poblacin, muestra, tcnicas de muestreo


La estadstica puede generar explicaciones
generales para una poblacin especfica o bien
explicaciones generalizables; es decir, una
muestra cuyos resultados es posible hacerlos
extensibles a la poblacin total que nos interesa.
Estas dos situaciones son las ms problemticas
en la vida real, porque no siempre es posible tener
los datos de toda una poblacin; por supuesto, el
hacerlo depende del tamao de la poblacin a la
cual deseamos analizar.
Poblacin: compuesta
por el conjunto total de todos
La estadstica tiene una poderosa herramienta
los elementos, individuos o
para generar diferentes niveles de explicaciones
eventos especficos.
dependiendo de la magnitud de la poblacin que
se desa investigar. Esa herramienta consiste en

24/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

el muestreo, la cual consta que la recoleccin de informacin de una parte de la


poblacin que es analizada por medio de tcnicas de recoleccin.

En primer lugar, la estadstica asume que todo anlisis realizado emerge de una
poblacin la cual se compone del conjunto de todos los elementos, individuos
o eventos especficos. Es comn encontrar que los censos contienen el total
de informacin de una poblacin especfica, como sucede con la informacin
disponible en INEGI. Un censo, es decir la extraccin de informacin de toda la
poblacin es costoso y requiere muchos recursos en tiempo, personas y otros insumos.
Piensa en los 120 millones de personas que vivimos a lo largo y ancho del pas.

Tambin hay otras agrupaciones llamadas


poblaciones. Por ejemplo, hay poblaciones
Muestreo: proceso por el cual
de menor tamao, como un lote de objetos
se recopila informacin de una
o el total de mercancas que produce una
poblacin.
empresa en un periodo determinado, por
Muestra: informacin que
ejemplo, una semana. Por supuesto no es
recopila por medio del muestreo.
el total de lo que produce una empresa
en el total de aos que lleva en operacin,
pero s es una poblacin del total de mercancas elaboradas en periodo de tiempo
especfico y que tienen caractersticas nicas.

Tambin hay otras agrupaciones llamdas poblaciones. Por ejemplo, hay poblaciones
de menor tamao, como un lote de objetos o el total de mercancas que produce
una empresa en un periodo determinado, por ejemplo, una semana. Por supuesto
no es el total de lo que produce una empresa en el total de aos que lleva en
operacin, pero s es una poblacin del total de mercancas elaboradas en periodo
de tiempo especfico y que tienen caractersticas nicas.

La muestra es una parte del total de la poblacin que nos interesa analizar con la
estadstica. Por lo tanto, el muestreo es el proceso por el cual se rene informacin
de una poblacin. La informacin recopilada por medio del muestreo se llama
muestra.

Los mtodos de muestreo se refieren a diferentes formas de recolectar informacin


para generar una muestra. En general, hay dos grandes grupos de muestreo: el
muestreo aleatorio y el muestreo sistemtico. Ambos mtodos de muestreo
tienen sus ventajas y limitaciones. Por otra parte, ninguno de los mtodos es
descartable; en todo caso, eso depende de los recursos y de los objetivos que sean
buscados por el investigador.

25/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

La diferencia entre ambos mtodos de muestreo depende del contexto y los rasgos
de la poblacin que se estudiar. Observa el siguiente cuadro:

Como puedes observar en la tabla, el muestreo aleatorio tiene mejores


posibilidades para generalizar los datos. Si 200 tornillos tienen fallas visibles en su
acabado, se puede indicar que la poblacin total de los 5,000 tornillos tiene fallas.
En el caso de la encuesta sobre uso de zapatos de tacn, los resultados de la
muestra son especficos para las personas encuestadas y no son generalizables.
Sin embargo, puede decirse que las mujeres encuestadas en ese tiempo y espacio
tienen ciertos rasgos especficos para las personas que contestaron el cuestionario.
No se pueden extender esos datos a todas las mujeres que acuden a las plazas
comerciales.

26/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

7. Ordenamiento de datos
Ordenamiento de datos:
El ordenamiento de datos implica su implica la jerarquizacin y la
jerarquizacin y organizacin de forma organizacin de los datos de forma
que pueda ser factible su anlisis. El que puedan ser analizados de
primer paso para ordenar los datos implica forma eficiente.
reconocer el tipo de variables, tal como
lo indica el Tema 5. Posteriormente, el investigador procede a iniciar el anlisis de
variables por separado o bien todas al mismo tiempo. Eso depender de la cantidad
de informacin con la que trabaje y de los objetivos que tenga la investigacin con
apoyo de procedimientos estadsticos. El siguiente tema profundiza en la parte
operativa de la ordenacin de datos.

En sntesis, el ordenamiento de datos consiste en realizar estos pasos:

a) Determinar las variables dependientes e independientes.


b) Establecer y ordenar jerrquicamente las variables discretas y continuas.
c) Indicar cuntas y cules son las variables cualitativas que se van a utilizar.

En este tema, el ordenamiento de los datos es un paso indispensable para poder


darles un tratamiento estadstico consistente, de utilidad para conocer fenmenos
sociales y naturales.

Actividad
Desarrolla el siguiente ejercicio:

1. Contabiliza la edad en aos cumplidos, el gnero y el grado escolar


de estudio, en aos y fracciones de los mismos tomando como
referencia la primaria, de 20 vecinos de tu colonia. Comienza con
personas que conozcas.

2. Organiza la informacin segn el ejemplo:

Variable cualitativa Variable discreta Variable continua


Edad en aos Grado escolar en aos
Gnero
cumplidos de estudio
Mujer 25 aos 12.5 aos de estudio
Hombre 18 aos 10.5 aos de estudio
...

27/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

8. Organizacin de informacin
Por medio de los mtodos como el muestreo, un investigador puede obtener una
gran cantidad de datos en relacin al fenmeno que est estudiando. Sin embargo,
los datos por s solos no proporcionan informacin sobre el fenmeno, por lo que
es necesario pasarlos por un proceso que los sintetice o resuma de manera que
sea ms sencillo interpretarlos, entenderlos y usarlos. Las tablas de distribucin de
frecuencias son la herramienta para organizar y tratar los datos para que permitan
observar la forma de su distribucin.

8.1 Tablas de distribucin de frecuencias

En las tablas de distribucin de frecuencias los valores de la variable, es decir,


los datos (xi ) son organizados de manera ascendente o descendente junto con
las frecuencias (fi ) de cada dato. Es decir, el nmero de veces que el dato es
observado dentro de una tabla. La tabla puede ser para datos no agrupados, as
como para datos agrupados o de intervalos de clase.

8.2 Tablas de distribucin de frecuencias para datos no agrupados

En el caso de que los datos se apropien de un nmero pequeo de valores o si la


variable es discreta. Por ejemplo, cuando se toman slo nmeros enteros, es posible
acomodar los datos en una columna y sus frecuencias respectivas en la segunda, ya
que la longitud de la tabla no ser demasiado grande. Sin embargo, para un mejor
estudio de los datos es conveniente considerar diferentes tipos de frecuencias,
como son las siguientes:

Frecuencia absoluta (fi ). Es el nmero de veces que aparece un determinado


dato x en el estudio. La suma de las frecuencias absolutas siempre es igual
al nmero total de datos que se estn considerando. Usualmente el nmero
total se representa por la letra N mayscula y el nmero total de variables a
considerar se denota por minscula. Entonces:

f 1 + f2 + + f n = N

Frecuencia relativa (fri ). En este tipo de frecuencia se hace la proporcin de


la frecuencia absoluta y el nmero total de datos. La suma de las frecuencias
fi
fri =
relativas es igual a 1.
N

28/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Frecuencia acumulada (f ai ). Es la suma


de las frecuencias absolutas de todos
los valores inferiores o iguales al valor
Nota:
considerado. Por ejemplo, si hay 8 datos
En algunas ocasiones las
ordenados de menor a mayor,x1, x2, ..., x8 frecuencias relativas y las
y se quiere saber el valor de la frecuencia relativas acumuladas se
acumulada del dato 5, la operacin sera: presentan en porcentajes,
para lo cual basta
fa 5 = f1 + f2 + f3 + f4 + f 5 con multiplicar esas
cantidades por 100%.

Frecuencia relativa acumulada (frai ). Es


el cociente entre la frecuencia acumulada
de un determinado valor y el nmero total
de datos.
fa i
fr a i =
N

Para mostrar la construccin de la tabla de distribuciones de frecuencias de datos


no agrupados se considerar el siguiente ejemplo:

Ejemplo 8.2

En un saln al que asisten 30 alumnos se les pregunt cuntos vasos de


refresco consumieron en la semana anterior a la aplicacin del cuestionario. Las
respuestas obtenidas de los alumnos fueron las siguientes:
{5, 6, 3, 1, 0, 4, 3, 1, 5, 5, 3, 2, 1, 2, 3, 2, 3, 4, 4, 1, 4, 1, 1, 3, 3, 1, 0, 0, 0, 2}

El primer paso para el tratamiento de los datos es agruparlos en orden


ascendente, como se hizo a continuacin:
{0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6}

De esta manera la tabulacin de distribucin es ms sencilla, puesto que es fcil


contabilizar cuantas veces se repite cada valor. La siguiente tabla incluye los
diferentes tipos de frecuencia, a la vez que se expone la forma de calcularlas:

29/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Una vez teniendo la tabla de Nota:


distribuciones de frecuencias es natural Si realizas la operacin en
las frecuencias relativas es
preguntarse acerca de la utilidad de esta, posible que notes que la suma
pues en ella es muy sencillo identificar no es exactamente 1. Esto se
informacin sobre el conjunto de los debe al error que se causa por
redondear el resultado de la
datos. Pero qu tipo de informacin? divisin. Usualmente este es
Por ejemplo, de la tabla anterior se un resultado aproximado y se
pueden desprender, entre otras, las ajusta segn sea necesario.
siguientes afirmaciones:

1. Dado que la cantidad de alumnos que


tom 5 o ms vasos de refresco es de 4 y se tienen 30 datos, se puede decir que
la mayora consumi menos de 5 vasos de refresco. El porcentaje de alumnos
que tom menos de 5 vasos de refresco es de 87%.

2. El porcentaje de alumnos que tom 5 vasos de refresco es de 29%

3. Ningn alumno tom ms de 6 vasos de refresco en la semana.

30/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Como puedes notar la informacin es presentada de manera entendible ms que la


lista de las respuestas a los alumnos. En realidad a lo que se dio importancia fue a
dicha respuesta no a quin perteneca. Para esta tabla la variable no era el nio sino
la cantidad de vasos que tomaba, y de sta se extrajo la informacin.

Dado que la cantidad de variables es pequea, se pudo registrar cada una de ellas.
Existen casos en que esto resulta inapropiado para trabajar, aunque no hay una
regla precisa de cundo considerar todas las variables o cundo agruparlas. Se
recomienda que si el nmero total de datos N es mayor de 50 o si el recorrido de la
serie de datos es mayor de 20, entonces se use el esquema agrupado de datos. En
la siguiente seccin se estudia la distribucin con datos agrupados.

8.3 Tablas de distribucin de frecuencias de clase o de datos


agrupados

En este caso la tabulacin de los datos estn ordenados en clases y aparece la


frecuencia de cada una; es decir, los datos originales de varios valores cercanos
en el conjunto se combinan para formar lo que se llama intervalo de clase. Por
ejemplo, en lugar de tomar la edad exacta de personas, pueden tomarse intervalos
de edad: de 0 a 5 aos, de 6 a 10, entre otros.

Es ms conveniente usar la distribucin agrupada cuando las variables tomen


valores continuos; es decir, la variable puede tomar cualquier valor entre dos
nmeros dados al realizar un experimento. Por ejemplo, cuando se estn
considerando mediciones de longitud de algunos objetos. sta magnitud puede
variar slo milmetros entre los objetos y no tendra caso tabular los que tienen
exactamente la misma medida. Es ms til saber cuntos objetos tienen una
longitud que oscila en un cierto tamao, como puede ser entre 1 y 3 cm.

Para realizar la organizacin en clases se necesita un arreglo determinado de las


observaciones, y para lograrlo se requiere seleccionar los intervalos de clase. Esta
seleccin depende de los datos o del fenmeno a estudiar. Sin embargo, el mtodo
ms usual para el tratamiento de la informacin puede contener los siguientes
puntos:

1. Ordenar los datos de menor a mayor para su clasificacin.

2. Determinar la magnitud de la variacin de los datos o el rango (R), es decir, la


longitud del intervalo (I) en el que estn contenidos todos los datos:

31/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

R = x mx - x min ; I = [x mx , xmin ]

Donde x min, x ms son los datos de menor y mayor valor numrico


respectivamente.

3. El siguiente punto til es definir la cantidad de clases, el nmero de clases (Nc)


debe tener un tamao razonable para poder interpretar la informacin en la
tabla. Existen varios mtodos para determinar este nmero:

a. Mtodo de raz. Consiste en sacar la raz cuadrada del nmero de datos (n)
que se tengan y redondearlo hasta el siguiente entero en caso de que no sea
exacta:
Nc = n
b. Mtodo de Sturges. Consiste en la elaboracin de la siguiente operacin
matemtica para obtener el nmero de clases: Nc = 1+3.3 (log10n).
Se requiere de la operacin de log10n, el cual es el logaritmo en base 10
del nmero de datos. Para realizar la operacin puedes hacer uso de una
calculadora cientfica o visitar el enlace http://www.wolframalpha.com/
input/?i=log10(). La operacin es sencilla y slo se escribe dentro del
parntesis el valor del nmero que quieres calcular, su logaritmo base diez
y la pgina arroja el resultado (adems proporciona mucha informacin
adicional que requiere mucho ms estudio de los temas siguientes para
entenderlo mejor).

Logartmos decimales
De todas las posibles bases que pueden tomarse para los logaritmos, las
ms usuales son la base 10 y la base e. Los logaritmos que tienen base 10 se
llaman logaritmos decimales, logaritmos vulgares o logaritmos de Briggs, y
para representarlos se escribe sencillamente log sin necesidad de especificar
la base:
log 10X = log X


Para saber ms, consulta en siguiente enlace:
https://youtu.be/xTxNSVxh6uI

32/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

4. Una vez que se sabe cuntas clases hay, es necesario determinar el tamao que
tendr cada clase, denominado amplitud de clase (Ac ), de manera que todos
los datos que se tengan pertenezcan a alguna de ellas, para esto se realiza la
operacin: R
Ac =
Nc
5. Definir los lmites superior (Ls) e inferior (Li) de cada clase para que sean claras al
momento de poner los datos.

6. Para evitar ambigedades en el reparto de los datos se consideran los lmites


reales de clase como sigue:

Lmite real inferior (Lri ) = Li - 0.5


Lmite real superior (Lrs ) = Ls +0.5

7. Las frecuencias en cada clase, las frecuencias relativas, las frecuencias


acumuladas y las frecuencias relativas acumuladas de cada clase se determinan
igual que los datos no agrupados.

8. Se determina la marca de clase (mi ) como el punto medio de la amplitud de


clase: Li + Ls
mi =
2
Para mostrar la forma de organizar los datos por medio de clases, considera el
siguiente ejemplo:

Ejemplo 8.

En un hospital son registradas las personas que ingresaron diariamente a visitar


a alguno de los pacientes. El registro fue realizado por 40 das y se obtuvieron
los siguientes datos:
{30, 35, 15, 21, 18, 32, 39, 20, 19, 20, 20, 34, 13, 13, 20, 35, 30, 17, 30, 31, 10, 32, 22, 14,
30, 36, 23, 14, 20, 34, 20, 28, 20, 16, 31, 38, 22, 12, 28, 13}.

Puedes realizar la tabla de frecuencias para analizar esta informacin. Para


empezar es necesario organizar los datos en orden ascendente:
{10, 12, 13, 13, 13, 14, 14, 15, 16, 17, 18, 19, 20, 20, 20, 20, 20, 20, 20, 21, 22, 22, 23, 28,
28, 30, 30, 30, 30, 31, 31, 32, 32, 34, 34, 35, 35, 36, 38, 39}.

33/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Los datos toman demasiados valores, algunos de los cuales slo aparecen una
vez. Esta observacin implica que una tabla de datos no agrupados puede no ser
apropiada1 para seguir con la organizacin de datos, por lo tanto hay que considerar
usar los intervalos de clase y sus respectivas frecuencias. Para ello se encuentra los
valores necesarios

Rango: R = x mx- x min = 39 - 10

Nmero de clase: Nc = 40 6.32 6


Amplitud de clase: Ac =
R =
29 =10 4.8 5
Nc 6

Acoplando toda la informacin en la tabla, el resultado es el siguiente:

Reflexiona
De la tabla anterior qu afirmaciones podras hacer con respecto a
la cantidad de personas que visitaban a los pacientes del hospital?,
para qu podra ser de utilidad est informacin?

Si bien las tablas de distribuciones ya son una forma ms clara de organizar los
datos que se tienen, tambin es importante presentar la informacin de manera
ms visual, esto es por medio de grficos.

1
No hay un criterio claro para esta eleccin, muchas veces depende del investigador y de lo que se
quiere exponer o del fenmeno en s.

34/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

9. Construccin de grficas
Es muy comn ver en los medios de comunicacin notas que refieren: el dinero, la
salud o la economa, entre otros, muchos temas que han cambiado con respecto a
otros tiempos o lugares. Al lado de esta informacin suele estar la imagen de una
grfica donde son presentados los datos que la apoyan. Su finalidad es concentrar
la informacin obtenida de manera que pueda ser presentada al pblico y, sin
conocimientos previos de estadstica, puedan entender las conclusiones vertidas
lo mejor posible. Existen diferentes tipos de grficas que son usadas en funcin de
la informacin que se desea resaltar para cada caso. A continuacin se presenta la
manera de generar los grficos a partir de las tablas de distribucin.

Grfica de barras y de pastel. Son ms usadas si los datos


pertenecen a variables cualitativas. Por ejemplo, la poblacin
por cada estado de la Repblica Mexicana. En la grfica de
barras la base de cada rectngulo lleva el nombre de la
variable y la altura de las barras es proporcional a los valores
que representa. Para la grfica de pastel el ngulo central
es proporcional al valor que representa, para trazarla puede
hacerse uso de la frmula:

ngulo de la rebanada valor que representa la rebanada


=
360 suma de todos los valores

Histograma y polgono de frecuencias. Son grficas para


representar la distribucin de datos continuos. El histograma
se presenta por medio de columnas y el polgono con una
grfica de lnea. Ambas son usadas para ver la distribucin de
los datos, adems proporcionan informacin sobre la clase
que tiene mayor concentracin. Las columnas del histograma
tienen por base el ancho del intervalo de la clase sobre el eje x y sobre el eje y
se coloca la frecuencia absoluta o relativa. Para el polgono de frecuencias se
dibuja un punto por cada coordenada formada por la marca de clase en el lugar
de la coordenada x y la frecuencia absoluta o relativa en el lugar de la coordenada \
para luego unir los puntos consecutivos por lneas rectas y cerrar los extremos
con el eje horizontal.

35/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Ojiva. Es una grfica de lnea donde se representa la frecuencia


relativa acumulada. Para trazarla se dibuja sobre el plano
cartesiano un punto con coordenadas en las marcas de . clase
en el eje x y la frecuencia relativa acumulada en eje y

A continuacin puedes ver grficas obtenidas a partir de los ejemplos.

Puedes usar el software Excel u Hoja de clculo, para construir las grficas. Este
proceso es sencillo. Para elaborar una grfica es necesario que tengas la tabla con
los datos o clases y las frecuencias, ya sea absolutas o relativas que desees graficar.

1. Selecciona los datos y las frecuencias en columnas sobre la tabla.

2. Elige la pestaa "Insertar" y, dentro de sta, la opcin "Grficos recomendados" .

3. Elige la que necesitas o ms te ayude a mostrar lo que requieres y da clic en


"Aceptar".

36/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

El resultado es un recuadro en el que se encuentra el grfico. Hay varias opciones


para mejorar la presentacin, van desde cambiar el tipo de diseo de la grfica
(en la imagen el crculo verde) hasta aadir elementos o los ttulos de las variables
(opcin en crculo azul de la imagen). Algunas de estas modificaciones se pueden
hacer dando doble clic con el botn izquierdo sobre el elemento. Para otros casos
se selecciona el grfico y se elige la pestaa: diseo, como se muestra en la figura:

37/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Reflexiona
Un tema que ha cobrado gran importancia en los ltimos aos,
debido a los problemas en la salud pblica por enfermedades
relacionadas, es el consumo de bebidas azucaradas. En alguno
de los ejemplos que se han dado, se incluye una relacin entre la
cantidad de refresco que consumen ciertas personas.

El artculo Consumo de bebidas para una vida saludable:


Recomendaciones para la poblacin mexicana2 hace un pequeo
anlisis sobre el consumo de bebidas azucaradas de personas en
ciertos rangos de edad. Analiza los tipos de datos que se presentan
a lo largo del artculo, Qu tipos de grficas son usadas para
presentar los datos? Extrae los datos de las figuras 3 y 4 para crear
tus propias grficas. Recuerda que esta informacin puede ser tratar
de diferente manera. Propn formas de analizarla para obtener
algunas conclusiones al respecto.

10. Distribucin de probabilidad en los fenmenos naturales


y procesos sociales
Para definir lo que es una distribucin de probabilidad son necesarios algunos
conceptos bsicos. Para empezar, la probabilidad es el clculo de que un evento
futuro suceda o no. Comnmente la probabilidad es expresada con un nmero
decimal entre cero y uno, en el caso de los extremos, lo cual mide la ocurrencia
de un resultado o evento. Si el nmero es cercano a cero, el resultado no es fcil
de obtener y, al contrario, los resultados con probabilidad cercana a uno son casi
seguros de obtener. Para manejar mejor los trminos en la probabilidad conviene
considerar las siguientes definiciones:

Experimento: consiste en observar los resultados en condiciones determinadas


por el investigador. Por ejemplo: lanzar una moneda al aire, escoger una carta de
una baraja completa, entre otros.

2
Juan A.,Rivera, Onofre Muoz-Hernndez et al. (2008). Consumo de bebidas para una vida
saludable: recomendaciones para la poblacin mexicana. Salud Pblica de Mxico. Vol. 50,
no. 2. Mxico. Disponible en Disponible en http://www.scielo.org.mx/scielo.php?script=sci_
arttext&pid=S0036-36342008000200011

38/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Evento: son los resultados del experimento. Puede ser simple si slo tiene una
caracterstica o conjunto con dos o ms. Por ejemplo, obtener cara al lanzar una
moneda es un evento simple y lanzar un dado y obtener un nmero par menor a
cinco un evento compuesto.

Espacio muestral: es el conjunto de todos los posibles eventos que pueden


ocurrir.

Al repetir varias veces un experimento es posible contabilizar las ocurrencias de


cada uno de los eventos en el espacio muestral y tabular las frecuencias, as como
tambin graficar.

Una variable aleatoria, en ocasiones llamada variable estocstica, es una manera


de describir los eventos en el espacio muestral por medio de nmeros. Para
ejemplificar se retomar la idea de observar, como experimento, los productos de
una fbrica. Pueden estar defectuosos o no defectuosos. Estos dos resultados son
el espacio muestral para la observacin de un producto y es til representarlos de
manera numrica. Para eso puede considerarse, 0 para defectuosos y 1 para no
defectuosos.

Otro modo de variable aleatoria puede ser el experimento de lanzar una moneda
10 veces. La variable aleatoria puede registrar el nmero de guilas que salen. Para
este caso, pueden considerarse los valores 0, 1, 2, 3, 4. Cabe mencionar que stas no
son las nicas variables aleatorias para estos ejemplos de experimentos.

De manera concreta, una variable aleatoria es una funcin que va de los eventos
en el espacio muestral a los nmeros reales. Usualmente, son representadas con
letras maysculas X o Y y tambin es comn que una variable aleatoria tenga un
significado de algn tipo, tal como fsico o geomtrico. Observa que aunque se
llame variable aleatoria en realidad es una funcin; sin embargo, es el nombre que
se considera convencionalmente apropiado pero siempre es conveniente tener
clara su naturaleza.

Si la variable aleatoria toma un nmero finito o numerable de valores es llamada


discreta y si toma una cantidad infinita no numerable de valores es continua, como
se vio en el Tema 6.

Considera el siguiente ejemplo: Dos estudiantes realizaron un experimento que


consisti en lanzar un dado. El primer estudiante se dispuso a lanzar un dado 600
veces y registrar las apariciones de los dados en la siguiente tabla de frecuencias:

39/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Nmeros 1 2 3 4 5 6

Frecuencia 97 99 98 92 96 118

El otro estudiante lanz simultneamente dos dados 600 veces y sumo los
nmeros obtenidos. En este caso su espacio maestral es: {2,3,4,5,6,7,8,9,10,11,12}. Los
resultados que obtuvo fueron los siguientes:

Nmeros 2 3 4 5 6 7 8 9 10 11 12

Frecuencia 14 31 40 68 101 113 88 62 53 14 16

Para poder analizar mejor sus resultados construyeron las grficas de barras con las
frecuencias correspondientes:

Como puedes ver, las grficas son muy diferentes. En una de ellas aparece casi el
mismo nmero de veces en todos los eventos; y en la otra, hay ciertos valores que
aparecen con mucha ms frecuencia que otros. Esto se debe a la probabilidad que
cada evento tiene. En estadstica, la probabilidad terica, para una variable aleatoria
discreta, se determina dividiendo la cantidad de resultados favorables del evento x
entre la cantidad de resultados totales. La probabilidad de tal evento x se denota P (x).

40/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

11. Distribucin de probabilidad


Es la asignacin de probabilidades a los valores de la
variable aleatoria, denotado por P (xi ), y que cumplen
con:

a) 0 P (xi ) 1

b) ni = 1 P (xi ) = 1

Donde xi es el valor de la variable aleatoria X y P (xi ) es


la probabilidad que se le asocia.

Para poder estudiar mejor tanto las variables aleatorias y las distribuciones de
probabilidad son necesarias algunas definiciones. No obstante, stas sern
estudiadas con mayor profundidad en el tema de medidas de dispersin
de la unidad siguiente debido a su importancia y a la informacin sobre el
comportamiento de un fenmeno que cumple con cierta distribucin de
probabilidad. A continuacin se presentan las definiciones.

Esperanza o valor esperado es el valor promedio que se obtendra si el


experimento se repitiera una cantidad infinita de veces. Para calcularlo puedes
expresarlo de la siguiente forma: {x1 , x2 , ... , xn } es el conjunto de los valores que
toma la variable aleatoria X, con su respectiva probabilidad P (xi ). Entonces el valor
esperado de X es:

E[X ] = P (x1 ) x1 + P (x2 ) x2 + + P (xn ) xn

Varianza de un conjunto de datos {x1 , x2 , ... , xn } es el promedio de los cuadrados


de las diferencias entre la media aritmtica y cada uno de los datos, es decir:

(x1 - x )2 + + (xn -x )2
v=
n

Desviacin estndar es la raz cuadrada de la varianza y se denota por:

41/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

La importancia de conocer estos valores es que pueden establecerse como los


datos que distan de la media a partir de la desviacin estndar. Esta propiedad se
enuncia en el Teorema de Chebyshev:

Teorema de Chebyshev. Para cualquier conjunto finito de nmeros y para cualquier


nmero real > 1 se tiene que por lo menos la fraccin:

1
1-
h2
De estos nmeros dista de la media a lo ms veces la desviacin estndar.

Con este teorema se puede asegurar, por ejemplo, que para un conjunto finito de
datos al menos 75% de ellos distan de la media a lo ms dos veces la desviacin
estndar. Pues:
3
1 - 12 = = 0.75
2 4
En los siguientes temas profundizar ms en el estudio de la probabilidad y su
utilidad en los resultados de un evento. Un ejemplo podra ser el de los beisbolistas.
Cuando un jugador toma su turno al bat y su record de jonrn es alto, se puede
hacer un clculo de probabilidad y formarse una idea si podr anotar uno ms en su
carrera.

12. Distribucin binominal


Ejemplo: SI EL EVENTO O EXPERIMENTO TIENE DOS
RESULTADOS; SI O NO, SANO O ENFERMO, XITO O
FRACASO, ETCTERA

Es la distribucin de probabilidad de la variable aleatoria, la


cual es el nmero de xitos al repetir n veces un experimento con dos resultados
posibles, con probabilidad p de obtener xito en cada experimento. Para este caso,
los valores de la esperanza, varianza y desviacin estndar son:

E [X ] = np, v[X ] = np ( 1 - p ), = np (1 - p )

42/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Para explicar mejor este tipo de distribucin, se muestra el siguiente ejemplo:

Ejemplo. Se considera la variable aleatoria X . Lo que hace esta variable es asignar


el nmero de guilas obtenidas luego de lanzar una moneda 5 veces (el evento
tiene dos resultados posibles: guila o sol). Para este experimento, el espacio
muestral son todos los grupos de 5 ceros y unos, donde el 1 representa guila y 0 el
sol. Por ejemplo, un evento posible es (0,1,0,1,1) y, entonces, la variable aleatoria es
x (0,1,0,1,1) = 3. La probabilidad de cada evento es:

P (a1 , , as) = pk ( 1 - p )n-k, con X (a1 , , as) = k


En este experimento se tiene que hay ( k )3 eventos en el espacio muestral con k
5

unos, todos esos elementos tienen la misma probabilidad pk (1-p )n-k Para trabajar
mejor los datos se construye la tabla de distribucin de probabilidades de X como
sigue:

Distribucin de probabilidades de x

5 5
x p (x ) k p (x ) k

0 5 5
0 1 1 1 1 0.0313
2 =
2 2

1 4 5
1 1 1 1 5 0.15625
2 =
2 2

2 3 5
2 1 1 1 10 0.3125
2 =
2 2

3 2 5
3 1 1 1 10 0.3125
2 =
2 2

3
La definicin de coeficiente binomial es precisamente la cantidad de formas de acomodar k unos
en cinco elementos..

43/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

4 1 5
4 1 1 1 5 0.15625
2 =
2 2

5 0 5
5 1 1 1 1 0.0313
2 =
2 2

El histograma de la variable aleatoria X es el siguiente:

En cada lanzamiento de la moneda la probabilidad de obtener guila es =12,


entonces el valor esperado, la varianza y la desviacin estndar son:

5 1 1
E[X ] = np = = 2.5, v[X ] = np ( 1 - p ) = 5 = 1.25,
2 2 2
= 1.25 = 1.180

Segn el teorema de Chebyshev es posible afirmar que la probabilidad de obtener


un valor entre 0.264 y 4.736 es de al menos 75%. De acuerdo a la tabla, los valores
entre 0.264 y 4.736 son 1,2,3,4 y la suma de las probabilidades para obtener esos
nmeros es:
0.15625 + 0.3125 + 0.3125 + 0.15625 = 9375

Se puede ver que la probabilidad que resulta es mucho ms que lo que estima el
teorema de Chebyshev. Esto se debe frecuentemente a que la distribucin tiene
una tendencia central.

44/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

13. Distribucin de Poisson


EVENTOS INDEPENDIENTES QUE OCURREN EN UN MDULO DISCIPLINAR
DETERMINADO O A UNA VELOCIDAD CONSTANTE EN EL TIEMPO, PRESENCIA DE
VIENTO, PRESENCIA DE GRANIZO, OCURRENCIA DE ACCIDENTES, ETCTERA

Es de las distribuciones ms comunes en la vida real. Y es usada para representar


el nmero de eventos de poca frecuencia que ocurren en el tiempo o en el espacio.
Para este tipo de distribucin es necesario saber el nmero promedio de eventos
que ocurren en un intervalo de tiempo o espacio, como:

Cantidad de productos elaborados por da en una fbrica.

Accidentes que ocurren en una ciudad por semana.

Nmero de manchas por metro cuadrado de tela, entre otros.

La distribucin de Poisson es una funcin de probabilidad descrita de la siguiente


- x
forma P (x ) = e x! , donde X y P (x ) es la probabilidad de x apariciones, es el
nmero promedio de eventos que ocurren por periodo de tiempo o unidad de
espacio. La manera de representar la distribucin de Poisson es la misma que
la binomial: por medio de una grfica de barras donde la altura de las columnas
representa la probabilidad asociada a cada valor de X. Para este caso puede ser
simtrica o presentar sesgo; es decir, cargarse ms hacia un lado u otro, lo cual
depende de .

Para explicar un poco ms el desarrollo de una distribucin de Poisson considera el


siguiente ejemplo:

Ejemplo. En la liga mexica de ftbol (Liga MX 2016) hasta la


Jornada 15, el equipo que encabezaba la tabla de posiciones
era el Monterrey. En los primeros 15 partidos que disput logr
anotar 34 goles3. Se puede plantear las siguientes preguntas
para hacer una investigacin: Qu probabilidad hay de anotar
3 goles ms? Cul sera la probabilidad de que en su prximo
partido el equipo logre anotar a lo ms 2 goles?

3
Fuente para la Jornada 15: http://espndeportes.espn.go.com/futbol/posiciones/_/liga/mex.1

45/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

En este caso puede darse el valor de goles por cada partido. En promedio se
anotaron 2.27 goles por cada 90 minutos de juego. Entonces, =2.27. La variable
aleatoria x es el nmero de goles anotados por partido. De manera que la
probabilidad de anotar 3 goles es:

3
e (-2.27)
2.27
P ( X = 3) = = 0.021409
3!

Para saber la probabilidad de anotar como mximo dos goles se deben considerar
las probabilidades de cada uno de los eventos y sumarlas, es decir:

1 2
e e
0
e (-2.27) (-2.27) (-2.27)
2.27 2.27 2.27
P ( X 2) = + + = 0.604009
0! 1! 2!

Los resultados anteriores dicen que existe una probabilidad de un 20% de que el
equipo anote 3 goles. Sin embargo, hay 60% por ciento de posibilidades de que
anote 0, 1 o 2 goles en su siguiente partido.

En el caso de una distribucin de Poisson, tanto la media como la varianza coinciden


con el valor de .

Actividad
Los puntos, goles o canastas en un encuentro deportivo son un buen
ejemplo de un fenmeno al que puede ajustarse una distribucin de
probabilidad de Poisson. Estudia los resultados de tu equipo favorito
(o el equipo que elijas) de cualquier deporte y analiza la probabilidad
de obtener varios resultados en su siguiente juego. Puedes mejorar
el intervalo de tiempo si cuentas con la informacin, por ejemplo, de
canastas en bsquetbol por cada cuarto o carreras por entrada en
bisbol, con lo que puedes calcular la probabilidad de anotaciones en
el prximo intervalo de tiempo.

46/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

14. Distribucin normal


Ejemplo. CARACTERSTICAS EN UNA POBLACIN: EDAD, ALTURA, PESO,
ETCTERA

Esta es una de las distribuciones ms usadas cuando se trata del estudio con
caractersticas cuantitativas de poblaciones de individuos, como edades, peso,
estaturas, entre otras. En principio, este tipo de distribucin es usada para variables
aleatorias continuas. Es sencillo considerar variables discretas como continuas,
como son la altura o el peso de las personas. Cuando se tiene una distribucin
continua cada elemento tiene la misma probabilidad de ocurrencia 0 por lo que al
trabajar este tipo de variables se debe determinar la probabilidad de que se tome
un valor dentro de un cierto intervalo. La distribucin normal tiene una grfica en
forma de campana, conocida como campana de Gauss o simplemente gaussiana,
en honor a Carl Friedrich Gauss, quien hizo muchos estudios al respecto. La funcin
que define la distribucin normal es:
1 x- 2
1 - 2
f ( x )= e
= 2

Donde es la media y la desviacin estndar, la ms comn es cuando =0 y =1,


conocida como distribucin normal estndar. La grfica es de la forma:

0.4

0.3

0.2

0.1

4 2 2 4

Para determinar la propiedad de caer en un intervalo es necesario obtener el rea


bajo la grfica de la funcin en el intervalo que se necesita. Basados en la misma

47/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

regla de las distribuciones de probabilidad se debe cumplir que la probabilidad del


espacio muestral debe ser P (()=1, entonces el rea bajo la funcin debe ser 1. Si
se construye una funcin que describa variables aleatorias no negativas y cuya rea
bajo la grfica sea 1 se denominan funciones de densidad de probabilidad.

Para trabajar de manera prctica conviene recordar la siguiente tabla para la


distribucin de los datos:
Distancia de la media Porcentaje de datos
dist 68%

dist 2 95%

dist 3 99.7%

De acuerdo con las propiedades de la


distribucin normal, 68% de los datos
distan de la media a lo ms en una
desviacin estndar; 95% estn cerca de
la media en a lo ms dos desviaciones
estndar; y la mayora de todos los datos,
en 99.7%, distan a lo ms 3 desviaciones
estndar de la media. Con esta
informacin se pueden hacer
afirmaciones respecto del comportamiento de los datos, como:

Ejemplo. Se ha observado que la distribucin de las calificaciones en una escuela


tiene un comportamiento aproximadamente normal. Si el promedio de calificacin
es de 6.5 y la desviacin estndar es de 1.3, entonces es posible afirmar que
aproximadamente

68% de los aspirantes sacan entre 5.2 y 7.8.

95% sacan entre 3.9 y 9.1

Y prcticamente todos, es decir 99.7%, obtienen una calificacin entre 2.6 y 10.

48/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

15. Conocer los tipos de hiptesis a probar en diversas


investigaciones cientficas y descartar las que no lo son
En los medios de comunicacin, especialmente en Internet, es muy comn
encontrarse con noticias que afirman que se ha comprobado cientficamente
algn resultado. En principio est el problema de qu quieren decir con ese
cientficamente comprobado. Lo comn es que en algn lugar se ha hecho un
estudio en el que rara vez se dan detalles al respecto. Sin embargo, ms importante
que eso es poder determinar un juicio propio sobre si el estudio referido puede
tener algn sentido. En general, se trata de anlisis estadsticos, pero con hiptesis
y afirmaciones que no tienen mucha relacin entre ellas y que son en su estructura
falacias. Un ejemplo muy burdo es cargar una piedra todo el da durante una
semana. Si en esta semana ningn tigre nos ataca, entonces significa que nuestra
piedra funciona como un excelente repelente de tigres, con una efectividad de
100%. Como se puede ver, las afirmaciones ni siquiera se relacionan de manera
clara. Muchas estadsticas falsas en Internet se basan en supuestos como stos.
Como un ejemplo ms, hace poco tiempo se difundi una noticia en la que
supuestamente en cierto da se pronosticaba un enorme terremoto en Mxico
debido a que los datos estadsticos de estos fenmenos en Japn y Per as lo
decan4. Esta informacin preocup a mucha gente. Sin embargo, era totalmente
falsa, como despus personal del Sismolgico Nacional advirti. Sin importar
los datos estadsticos de la posicin e intensidad de los sismos previos, stos no
estaban relacionados con las fuentes de sismos en Mxico y, an ms, a la fecha
estos fenmenos an no se pueden predecir.

Actividad
Busca alguna noticia que recurra al eslogan: Cientficamente
comprobado. Analiza si las hiptesis y resultados que menciona
pueden estar relacionados o son totalmente independientes.

4
Fuente: http://www.elasertivo.com/mexico/falsa-la-informacion-de-un-proximo-terremo-
to-en-mexico-ssn/

49/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

16. Cierre
En esta unidad te has percatado de que cuando se habla de mtodo, se refiere a la
forma ordenada y sistemtica. Cuando se hacen las cosas, tales como reflexiones,
experiencias, incluso deportes o cualquier otra, de manera rigurosa, entonces
es posible alcanzar los objetivos que se proponen, aunque nunca habr garanta
absoluta de lograrlo. Por ello, an cuando hay diferentes formas de llegar al
conocimiento, no todas las rutas resultan exitosas.

En esta unidad se estudi un mtodo riguroso de conocimiento y reflexin que


permite conocer el estado en que se encuentran las cosas. Slo esa informacin es
suficiente para tomar decisiones y realizar acciones de mejora tanto del ambiente
que nos rodea como de fenmenos sociales, polticos y econmicos que nos
competen.

Adems se revis el razonamiento riguroso, con mtodos de anlisis y tcnicas


adecuadas, que tambin ofrecen la posibilidad de tener una visin de aproximacin
al futuro, tema que se retomar en la siguiente Unidad. Te habrs dado cuenta que
por el comportamiento de los eventos, se puede hacer un clculo de probabilidad
y de aproximacin, nunca con una visin infalible, de lo que podra pasar en el
siguiente acontecimiento.

Por otro lado, hay dos conceptos que en el lenguaje comn se usan de manera
indiferente. Tal es el caso de posible y probable. El contenido de ambos es
realmente diferente para la estadstica. Cuando se dice que es posible que frente
a nuestra casa pase un automvil Ferrari, se puede hacer un razonamiento. Si en la
ciudad hay automviles Ferrari, realmente es posible que en alguna ocasin llegue
a circular uno frente a nuestro domicilio. Por el contrario, si frente a nuestro domicilio
pasan diariamente 500 automviles y ninguno de ellos es Ferrari, la probabilidad
de que pase uno hoy es casi cero. De esta manera se puede entender la diferencia
entre prediccin y proyeccin. En el primer caso se hace una prediccin, en tanto
que en el segundo es una proyeccin con los datos de acontecimientos conocidos.

De esta manera, para que procures tener un mtodo riguroso de reflexin y no


te dejes llevar por tanta charlatanera, como la que hoy nos ahoga con tanta
informacin de los medios masivos de comunicacin.

50/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

Fuentes
Bibliogrficas

Barrera, J. M. (10 de febrero de 2016). Surbubano, mejor transporte en el Valle de


Mxico. El Universal , p. Consultado el 12 de febrero 2016.

Cmara de Diputados. (2001). Evolucin y perspectiva del sector enrgtico en


Mxico 1970-2000. Mxico, Palacio Legislativo de San Lzaro: Centro de estudios de
las finanzas pblicas.

SAGE . (2009). Glossary of the Social and Behavioral Sciences. New York: SAGE
Publications.

Triola, M. F. (2013). Estadstica 11a Edicin. Mxico: Pearson educacin. Durkhiem, E.


(1979). La reglas del mtodo sociolgico. Buenos Aires: Plyade.

Dasinger et. al., M. L. (2003). Comparision of the Atkis, Ornish Weight Watchers and
Zone Diets for weight loss and heart disease risk reduction. Journal od American
Medical Association , 43-53.

Hernndez Sampieri et. al., R. (2014). Metodologa de la investigacin. Mxico: Mc


Graw Hill.

Kuhn, T. (1971). La estructura de las revoluciones cientficas . Mxico: Fondo de


Cultural Econmica.

Navarro, E. M. (2012). Estudio de la motorizacin en Mxico mediante la dinmica de


posesin vehicular: determinantes macroeconmicos y microeconmicos. Safandila,
Quertaro: Secretara de Comunicaciones y Transporte. Instituto Mexicano del
Transporte.

Electrnicas

Adelgazar rpido. (2016). HTTP://WWW.ADELGAZARRAPIDOWEB.


COM/. Recuperado el 11 de marzo de 2016. Disponible en: HTTP://WWW.
ADELGAZARRAPIDOWEB.COM/DIETAS-PARA-ADELGAZAR/DIETA-ATKINS/

Bienestar 180. (2016). 4 razones por las que el estrs aumenta tu peso. Recuperado

51/52
Mdulo 17. Estadstica en fenmenos naturales y procesos sociales
Unidad I. La estadstica descriptiva y los fenmenos naturales y procesos sociales

el 10 de marzo de 2016. Disponible en: HTTP://BIENESTAR.SALUD180.COM/


SALUD-DIA-DIA/4-RAZONES-POR-LAS-QUE-EL-ESTRES-AUMENTA-TU-PESO

Castillo, A. (2016). http://www.animalpolitico.com. Recuperado el 17 de marzo


de 2016. Disponible en: HTTP://WWW.ANIMALPOLITICO.COM/2016/03/LA-
CORRUPCION-EL-OTRO-CASTIGO-PARA-LOS-JOVENES-INFRACTORES/

Carrasco Arroyo, S. (2016). Aproximacin a la estadstica desde las ciencias


sociales. Recuperado el 15 de abril de 2016. Disponible en: HTTP://WWW.UV.ES/
CARRASCS/PDF/APROXIMACION%20ESTADISTICA.PDF

Ecojoven. (2016). http://www.ecojoven.com/seis/10/co2.html. Recuperado el: 23 de


marzo de 2016. Disponible en: HTTP://WWW.ECOJOVEN.COM/SEIS/10/CO2.HTML

Revista ndice. (15 de mayo de 2006). Quien es quien: Adolphe Quetelet. Disponible
en: HTTP://WWW.REVISTAINDICE.COM/NUMERO16/P2.PDF

Rojas Portilla et. al., E. (28 de septiembre de 2009). Probabilidades. Disponible en:
HTTP://ECA-M-MATEMATICA-2MEDIO-PROBABILLIDAD.BLOGSPOT.MX/: HTTP://
ECA-M-MATEMATICA-2MEDIO-PROBABILLIDAD.BLOGSPOT.MX/2009/09/
PROBABILIDAD-1-SUCESOS-ALEATORIOS-Y.HTMLH

Wikipedia. (2016). Wikipedia. Recuperado el 10 de marzo de 2016. Disponible en:


HTTPS://ES.WIKIPEDIA.ORG/WIKI/ESTAD%C3%ADSTICA#ORIGEN

52/52