Está en la página 1de 136



Mdulo
5 Pensamiento aleatorio y sistemas de datos


Serie DIDCTICA DE LAS MATEMTICAS

Gobernacin de Antioquia
Secretara de Educacin para la Cultura de Antioquia
Universidad de Antioquia, Facultad de Educacin

Diploma en Desarrollo de Competencias Bsicas en Matemticas


en la Educacin Bsica y Media del Departamento de Antioquia

Mdulo 5
Pensamiento Aleatorio y
Sistemas de Datos


Mdulo
5 Pensamiento aleatorio y sistemas de datos

Mdulo 5
Pensamiento Aleatorio y Sistemas de Datos

Jos Wilde Cisneros y otros autores


De esta edicin: Secretara de Educacin para la Cultura de Antioquia

ISBN: 978-958-9172-86-5
Tiraje: 3.100 ejemplares

Primera edicin, 2007.

Gobernacin de Antioquia.
Secretara de Educacin para la Cultura de Antioquia
Direccin de Fomento a la Educacin con Calidad.
www.seduca.gov.co
Email: pcalidad@seduca.gov.co

Diseo, diagramacin e impresin:


Editorial Artes y Letras Ltda.

Medelln, Colombia 2007


Anbal Gaviria Correa
Gobernador de Antioquia

Claudia Patricia Restrepo Montoya


Secretaria de Educacin para la Cultura de Antioquia

Libardo Enrique lvarez Castrilln


Director de Fomento a la Educacin con Calidad

Coordinadores rea de Matemticas


Secretara de Educacin para la Cultura de Antioquia

Gerardo valos valos


Supervisor de Educacin

Mara Eugenia Posada Calle


Profesional Universitaria

Autores
COMIT ACADMICO

Jose Wilde Cisneros


Oscar Fernando Gallo Mesa
Jess Mara Gutirrez Mesa
Carlos Mario Jaramillo Lpez
Orlando Monsalve Posada
John Jairo Mnera Crdoba
Gilberto de Jess Obando Zapata
Fabin Arley Posada Balvn
Guillermo Silva Restrepo
Mara Denis Vanegas Vasco

Convenio interadministrativo de la Gobernacin de Antioquia,


Secretara de Educacin para la Cultura de Antioquia con
la Facultad de Educacin de la Universidad de Antioquia


Mdulo
5 Pensamiento aleatorio y sistemas de datos


Agradecimientos

La Secretara de Educacin para la Cultura de Antioquia y la Facultad de Educacin


de la Universidad de Antioquia, agradecen la labor de coordinacin del Diploma:
Desarrollo de Competencias Bsicas en Matemticas en la Educacin Bsica y Media
del Departamento de Antioquia a su equipo tcnico, a todos los docentes que par-
ticiparon de l, y en particular, a las siguientes personas e instituciones educativas
que hicieron posible llevarlo a feliz trmino:

Integrantes de la Mesa Departamental de Matemticas.


Rectores de las Instituciones Educativas donde laboran los docentes integrantes
de la Mesa Departamental de Matemticas.
A los docentes del Diploma en Desarrollo de Competencias Bsicas en Matemti-
cas en la Educacin Bsica y Media del Departamento de Antioquia por la lectura
y sugerencias.
Al comit acadmico del Diploma en Desarrollo de Competencias Bsicas en Ma-
temticas en la Educacin Bsica y Media del Departamento de Antioquia por el
trabajo realizado en pro de esta obra.
A la Facultad de Educacin de la Universidad de Antioquia, a travs de sus progra-
mas de educacin matemticas por apoyar la consolidacin del grupo acadmico
que desarrolla el diploma.
Un agradecimiento muy especial al profesor Jos Wilde Cisneros por sus contri-
buciones para que en su totalidad este mdulo se hiciera posible, como fruto de
sus aos de experiencia, estudio e investigacin.


Mdulo
5 Pensamiento aleatorio y sistemas de datos


Contenido

Presentacin.......................................................................................................................................... 11

Introduccin
La estadstica en la escuela...................................................................................................................... 13

Unidad No.1
HACIA EL PENSAMIENTO ALEATORIO ........................................................................... 19
1. Hacia el pensamiento aleatorio......................................................................................................... 19
1.1. Muestreo...................................................................................................................................... 21
1.2. Los datos...................................................................................................................................... 23
1.3. Sobre la probabilidad.................................................................................................................. 23
2. Organizacin de datos....................................................................................................................... 27
2.1. Conteo y anlisis de datos......................................................................................................... 28
2.2. Situacin N 1 datos y conteo................................................................................................... 30
2.2.1. Datos sin agrupar, conceptos bsicos............................................................................ 30

Unidad No.2
DESDE LOS CONCEPTOS Y LOS PROCESOS . ............................................................... 59
2.1. Las medidas de posicin y variabilidad................................................................................... 59
2.1.1. Comprensin de las medidas de tendencia central...................................................... 59
2.2. Relacin entre Media, Mediana y Moda................................................................................... 69
2.3. Medidas de posicin (orden)..................................................................................................... 69
2.3.1. Cuartiles............................................................................................................................. 69
2.3.2. Desviacin Intercuartil..................................................................................................... 71
2.3.3. Deciles................................................................................................................................ 71
2.3.4. Percentiles.......................................................................................................................... 71
2.3.5. Clculos para datos sin agrupar...................................................................................... 71
2.3.6. Clculos para datos agrupados....................................................................................... 73
2.4. Medidas de dispersin (variabilidad)....................................................................................... 74
2.4.1. El rango o recorrido........................................................................................................... 75
2.4.2. Varianza.............................................................................................................................. 75
2.4.3. La desviacin estndar (S o )......................................................................................... 76
2.4.4. Coeficiente de variacin................................................................................................... 79


Mdulo
5 Pensamiento aleatorio y sistemas de datos

2.5. Medidas de asimetra................................................................................................................. 80


2.5.1. Comprensin del concepto bsico de simetra.............................................................. 80
2.5.2. Distribucin simtrica...................................................................................................... 81
2.5.3. Distribucin asimtrica positiva...................................................................................... 81
2.5.4. Distribucin asimtrica negativa.................................................................................... 82
2.5.5. Coeficiente de Asimetra de Fisher................................................................................. 82
2.6. Medidadas de Curtosis.............................................................................................................. 82
2.6.1. Distribucin mesocrtica................................................................................................. 82
2.6.2. Distribucin leptocrtica.................................................................................................. 82
2.6.3. Distribucin platicrtica................................................................................................... 83

Unidad No.3
EL AZAR Y LA PROBABILIDAD........................................................................................... 99
3.1. Un poco de historia................................................................................................................... 101
3.2. Algunos tpicos sobre aleatoriedad modelacin y probabilidad......................................... 103
3.2.1. Experiencia aleatoria...................................................................................................... 103
3.2.2. Experiencia aleatoria compuesta.................................................................................. 104
3.2.3. Modelos............................................................................................................................ 104
3.2.4. Probabilidad..................................................................................................................... 105

Bibliografa .......................................................................................................................... 133

10
Presentacin

Con el presente mdulo, el ltimo de la serie, entregamos a la comunidad educativa un tra-


bajo que propende por generar un espacio de reflexin a propsito de los elementos que dan
sustento a lo que en los Lineamientos Curriculares de Matemticas se denomina pensamiento
Aleatorio y sistemas de datos. Esperamos que este material se convierta en un documento de
trabajo que apoye la labor educativa, no slo a los docentes que participan del diplomado, sino
tambin a todos aquellos docentes del rea de matemticas, preocupados por darle sentido a
la enseanza de las matemticas en el ciclo de la educacin bsica y media de nuestro pas.

En ste documento se abordan algunas ideas que tienen que ver con el proceso de recoleccin
de datos, su representacin e interpretacin, as como el estudio del concepto de probabili-
dad. Se ofrece una propuesta bajo la cual Deben ser tratados en la escuela, entendindolos
como procedimientos que requieren de la reflexin permanente, dada su presencia tanto en
situaciones de la vida cotidiana como de las ciencias, y por tanto, entre otras ideas, obligado
a los docentes a indagar por:

La modelacin y simulacin de fenmenos fsicos.


Las diferentes estrategias de conteo.
Las diferentes formas de aproximacin a los conceptos matemticos de azar, posibilidad,
probabilidad, entre otros propios del pensamiento estadstico.

Adicionalmente se plantea un conjunto de ideas que permitan al docente orientar la toma de


decisiones acerca de la pertinencia de los datos, los mtodos para recoger informacin de
un experimento y las diferentes tcnicas de presentacin e interpretacin. De esta forma se
espera, que los elementos puestos a consideracin en este mdulo, sirvan de apoyo en esta
importante tarea.

Desde esta perspectiva, y reconociendo la poca produccin acadmica que en el pas se ha desa-
rrollado en torno a la estadstica educativa, queremos resaltar el trabajo mancomunado entre la
secretara de educacin para la cultura de Antioquia y la Facultad de Educacin de la Universidad
de Antioquia, por medio del diploma, para dar la oportunidad a que el docente formador, JOS
WILDE CISNEROS, materialice sus reflexiones, investigaciones y larga experiencia como profesor
de estadstica, a travs de este mdulo: PENSAMIENTO ALEATORIO Y SISTEMAS DE DATOS.

Esta experiencia, un tanto novedosa, se pone a disposicin de la comunidad acadmica como


un ejemplo de trabajo conjunto entre la administracin educativa y la academia, para permitir
que los docentes del departamento puedan construir, sistematizar y compartir las prcticas
investigativas con sus colegas. En este sentido, el equipo acadmico del diploma, coincidi
en que es una buena oportunidad para potenciar la iniciativa de este docente-autor y por ello
le acompa con sus sugerencias y recomendaciones para la organizacin y presentacin de
la informacin que en este mdulo aparece, que si bien no aborda toda la problemtica de
manera exhaustiva, es un buen intento que invita a los dems docentes a reflexionar sobre el
tema. Esperamos que los contenidos aqu tratados sean objeto de revisin y anlisis y como
producto de ello, hagan llegar al autor los respectivos comentarios.

11
Mdulo
5 Pensamiento aleatorio y sistemas de datos

12
Introduccin

La estadstica es una ciencia muy antigua que inicialmente fue utilizada por diferentes civiliza-
ciones como una herramienta para los censos de poblaciones, conteo de bienes y produccin. En
un segundo momento, se utilizaron tcnicas ms sofisticadas a partir de la necesidad sentida
de dar estructura matemtica a los datos recolectados. De esta forma las sociedades se han
beneficiado de dichos avances y a la vez se sentaron las bases de lo que hoy se conoce como
estadstica, la cual actualmente es una ciencia en constante desarrollo.

La recopilacin de datos que hacan los babilonios (3000 a. C), sobre la produccin agrcola y
los artculos vendidos o cambiados mediante trueque, podra considerarse como estadsticos,
y fueron encontrados en tablillas, con inscripciones cuneiformes. Tambin los egipcios, (ao
3100 a. C), ya llevaban las cuentas del crecimiento poblacional y los faraones recopilaban gran
cantidad de datos sobre la riqueza del pas, las familias, los soldados, las casas y la profesiones.
Esto fue de gran ayuda para el proyecto de construccin de las pirmides. Adems para el siglo
VI a. C, los egipcios tenan la obligacin de declarar, cada ao, su profesin y sus fuentes de
ingreso, siendo castigados con pena de muerte si no lo hacan.

Son muchos los datos que histricamente dan cuenta del uso de la estadstica en diferentes
pases y culturas, incluso en la Biblia se hace referencia al recuento de los israelitas que tenan
la edad para prestar el servicio militar, adems, y segn el Evangelio, lo que motiv a Jos y
Mara a viajar a Beln fue precisamente un censo. Pero la institucionalizacin de los censos
se le atribuye a los romanos (siglo IV a. C), tal vez porque fue el Imperio romano el primero en
recopilar una gran cantidad de informacin relacionada con la superficie, la renta y todos los
territorios que tena bajo su control.

En China y en la India (s IV a. C), se publicaron diferentes tratados sobre recuentos industriales,


agrcolas, comerciales, polticos y de economa.

Los recuentos que se hacan en Grecia (310 a. C) tenan que ver con la cantidad de soldados
y de esclavos. Calculaban los impuestos, determinaban los derechos de voto. As, grandes
hombres como Scrates, Herodoto y Aristteles destacaron la importancia de la estadstica
para el Estado.

En el continente americano, podra decirse que los quipos fueron la muestra y evidencia
de sus recuentos, pues los incas desarrollaron un sistema de estadstica muy perfeccionado,
hacan recuentos sobre la economa y la demografa. Los quipos eran unas cuerdas con nu-
dos que utilizaban para llevar sus cuentas, y les permita recordar los resultados en la tabla
de contar.

A pesar de lo expuesto anteriormente con relacin al uso de la estadstica, sta slo muy recien-
temente ha adquirido la categora de ciencia. A partir del s XI aproximadamente, empiezan a
aparecer las primeras obras de estadstica, especialmente descriptiva, destacndose las obras
de Jean Bodin en Francia (1530 1595), en la cual se explica la importancia de los censos; la
de Graunt (Londres 1620 1674) sobre la poblacin londinense, a ste ltimo se le considera

13
Mdulo
5 Pensamiento aleatorio y sistemas de datos

el fundador de la demografa y el iniciador de la estadstica investigadora, la cual se opona a


la postura universitaria alemana conocida como estadstica descriptiva.

Uno de los ms grandes avances en estadstica, se dio en el siglo XVII, cuando los bancos y
las compaas de seguros empezaron a utilizar los datos estadsticos, adems a tratar mate-
mticamente la demografa, la economa y muchos aspectos de las ciencias sociales. Fue en
Alemania donde comenz a tomar ms fuerza esta disciplina orientada a la descripcin de los
bienes del Estado, gozando de una sistematizacin y respondiendo a principios doctrinales.
Simultneamente en Francia, se desarroll la escuela probabilstica, la cual bas su desarrollo
en el clculo de probabilidades como instrumento de investigacin. Blas Pascal (1623 1662)
y Pierre de Fermat (1601 1665) quienes dan inicio al clculo de probabilidades, trataron de
dar soluciones a los juegos de azar y preguntas hechas por el Caballero de Mer en 1654, la
pregunta que movi a los dos grandes matemticos a escribir sobre el clculo de probabilidades
era Cmo distribuir las apuestas en una partida de dados que se interrumpe?

La estadstica logra mayor relevancia cientfica con los descubrimientos sobre el clculo de
probabilidades, y sobre el ajuste de curvas a un conjunto de datos, gracias a matemticos como
Euler, Simpson, Lagrange, Laplace, Legendre y Gauss, y es as como en 1834 nace la Royal
Statistical Society y en 1885, se cre el Instituto Internacional de Estadstica, en el cual se
propone establecer un mtodo uniforme de anlisis de datos y al uso correcto de stos, por
parte de los gobiernos, en la solucin de problemas polticos, econmicos y sociales.

1.1. La estadstica en la escuela

A diferencia de algunos fenmenos que se estudian desde el pensamiento variacional (razo-


namiento algebraico), cuyos objetos requieren, en general, apelar al uso de variables deter-
ministas, existen otros fenmenos, que requieren el uso de variables aleatorias. Esto puede
entenderse como dos formas diferentes de pensar: por un lado, se estudian fenmenos donde
es posible atrapar, a travs de un modelo funcional, la forma como estn relacionadas las va-
riables, mientras que por otro lado esto no siempre es posible.

Lo anterior significa que un experimento es determinista, si siempre que se realiza bajo las
mismas condiciones se obtienen los mismos resultados; en el caso contrario, cuando no es
posible predecir el resultado del experimento, se dice que es aleatorio. As por ejemplo; la
velocidad con que cae un cuerpo con respecto a la altura de donde se dej caer, corresponde
a un experimento determinista. Pero, un fenmeno aleatorio puede ser el lanzamiento de un
dado, en el cual no es posible determinar el valor que se obtendr en cada lanzamiento.

Desde el punto de vista escolar, lo anterior muestra que es necesario construir dos lneas
diferentes dentro del pensamiento matemtico, una que refleja el carcter exclusivamente
determinista, y otra que se encarga de estudiar el conjunto de situaciones que dependen de
los fenmenos aleatorios.

En Colombia, la Renovacin Curricular (proyecto de gran alcance en la educacin matemtica),


permiti la elaboracin de un marco terico global para la matemtica en los nueve grados de
la educacin bsica. Esta elaboracin estuvo dirigida por el Doctor Carlos Eduardo Vasco, quien
implement el llamado enfoque de sistemas, y propuso acercarse a los distintos campos de

14
Introduccin

la matemtica, a travs de la perspectiva de los sistemas; en particular plantea como de gran


importancia en la matemtica escolar, el estudio de los sistemas de datos estadsticos.

Partiendo de los avances en la Renovacin curricular con la implementacin de los diferentes


sistemas matemticos, y con el nimo de mejorar los procesos de enseanza y aprendizaje
de las matemticas en el pas, el MEN, inicia (1996) el proceso de construccin de los Linea-
mientos curriculares de matemticas y en 1998, son publicados y empiezan a socializarse con
diferentes grupos de maestros. (ver Interpretacin e implementacin de los estndares bsicos
de matemticas, 2005)

En los Lineamientos Curriculares se hace nfasis en el desarrollo del pensamiento aleatorio,


por su incidencia en la ciencia, en la cultura y en la forma de pensar cotidiana.

El desarrollo del pensamiento aleatorio, mediante contenidos de la probabilidad y la


estadstica debe estar imbuido de un espritu de exploracin y de investigacin tanto por
parte de los estudiantes como de los docentes. Debe integrar la construccin de modelos
de fenmenos fsicos y del desarrollo de estrategias como las de simulacin de experi-
mentos y de conteos. Tambin han de estar presentes la comparacin y evaluacin de
diferentes formas de aproximacin a los problemas con el objeto de monitorear posibles
concepciones y representaciones erradas. De esta manera el desarrollo del pensamiento
aleatorio significa resolucin de problemas. (MEN 1998).

Con la publicacin de los estndares bsicos de matemticas (2003), se da continuidad a lo


propuesto en los lineamientos curriculares, en trminos de la posibilidad que tienen los nios
de desarrollar del pensamiento aleatorio, a travs de anlisis de datos tanto cuantitativos como
cualitativos, sistematizacin de los mismos y nociones numricas como conteos mltiples y
algunas situaciones de combinatoria.

Desde esta perspectiva, los sistemas de datos se incorporaron en el currculo de matemticas


como elementos importantes, necesarios y pertinentes en el contexto social y escolar. Segn
Godino y Batanero (2004), las principales razones que fundamentan el estudio de la estadstica
son las siguientes1:

La estadstica es til para la vida posterior a la escuela, ya que en muchas profesiones se


precisan unos conocimientos bsicos del tema,

Su estudio ayuda al desarrollo personal, fomentando un razonamiento crtico, basado en la


valoracin de la evidencia objetiva, apoyada en los datos frente a criterios subjetivos.

Ayuda a comprender los restantes temas del currculo, tanto de la educacin obligatoria como
posterior, donde con frecuencia aparecen grficos, resmenes o conceptos estadsticos.

Adems, puesto que la estadstica elemental no requiere tcnicas matemticas complicadas y


por sus muchas aplicaciones, proporciona una buena oportunidad para mostrar a los estudiantes
las aplicaciones de la matemtica para resolver problemas reales. La estadstica es tambin

_____________________________________________________

1
Consultado el 19 de Octubre, 2005 en. http:// www.ugr.es/local/godino/edumat-maestros/ . Godino y Batanero. Didctica de las
matemticas para maestros. Proyecto Edumat Maestros.. Universidad de Granada., octubre de 2004.

15
Mdulo
5 Pensamiento aleatorio y sistemas de datos

un buen vehculo para alcanzar las capacidades de comunicacin, resolucin de problemas,


uso de ordenadores, trabajo cooperativo y en grupo, a las que se da gran importancia en los
nuevos currculos.

Cuando tenemos en cuenta el tipo de estadstica que se quiere ensear y la forma de llevar
a cabo esta enseanza debemos reflexionar sobre los fines principales de sta, los cuales
pueden ser:

Que los alumnos lleguen a comprender y a apreciar el papel de la estadstica en la sociedad,


incluyendo sus diferentes campos de aplicacin y el modo en que la estadstica ha contri-
buido a su desarrollo.

Que los alumnos lleguen a comprender y a valorar el mtodo estadstico, esto es, la clase
de preguntas que un uso inteligente de la estadstica puede responder, las formas bsicas
de razonamiento estadstico, su potencia y limitaciones.

Al avanzar paulatinamente de un grado a otro, se hace necesario la comprensin y significa-


cin de los objetos de estudio, esto incluye la comprensin de ideas bsicas sobre grficos,
resmenes estadsticos, diseo de experimentos, incertidumbre, conteo y probabilidad. A
partir de este momento, los conjuntos de datos deben ser vistos como un todo, describir sus
caractersticas y usarlas para realizar las diferentes comparaciones entre datos. Ello implica
reconocer que la base de toda investigacin en la vida real se realiza a partir de la recoleccin
de datos seleccionados en forma adecuada.

Desafortunadamente, La escuela se ha centrado en una enseanza tradicional de la estads-


tica, a travs de la aplicacin algortmica de frmulas para encontrar promedios, elaboracin
mecnica de grficas y construccin de tablas de distribucin de frecuencias, muchas veces
sin ningn tipo de interpretacin. Adems, al estudiante, se le proporcionan datos tomados
de diferentes textos, en contextos totalmente aislados de su realidad. De otro lado no se da
importancia a los resultados obtenidos.

Partiendo de lo anterior, se requieren maestros que diseen actividades con enfoques explo-
ratorios, que le permita al estudiante investigar y obtener sus propios datos o complementar
los dados por el docente. Hacer nfasis en la elaboracin de tablas y grficas como una forma
de sistematizar los valores obtenidos en los experimentos originales para el estudio de la dis-
tribucin de frecuencias.

Sobre la base de lo anterior, en el presente mdulo se trata de explorar algunos elementos que
permitan la reflexin entorno a la enseanza y aprendizaje de la estadstica y ms an, en
relacin con el desarrollo del pensamiento aleatorio a travs de los sistemas de datos.

En la primera unidad se exponen algunos conceptos bsicos relativos al pensamiento aleatorio


y a la organizacin y anlisis de datos, identificando caractersticas errneas que se han intro-
ducido en la enseanza de la estadstica en la escuela, como es el excesivo nfasis en el manejo,
poco conciente, de frmulas y clculo que poco aportan al desarrollo de este pensamiento.

En la unidad 1 se sientan las bases tericas: definiciones y sus respectivos anlisis, que per-
miten el desarrollo, tratamiento y organizacin de datos. En esta unidad se abarcan temas
relacionados con los diferentes procedimientos, tcnicas y enfoques para organizar, recolectar

16
Introduccin

y analizar un conjunto de datos obtenidos de una muestra para que se le d o tengan sentido
dentro de su contexto y realizar las inferencias de acuerdo con ello, sin olvidar las diferentes
formas de representacin basados en la distribucin de frecuencias.

En la segunda unidad se presenta un anlisis conceptual de las diferentes medidas de posi-


cin central al igual que las desviaciones, incluyendo conceptos, propiedades y un anlisis
justificado del uso de cada una de ellas de acuerdo a su papel en el tratamiento de datos.
Adicionalmente se construye el significado de estas medidas en diferentes situaciones para
el estudio y anlisis de las dificultades en su comprensin.

En la unidad nmero tres, se propone un conjunto de situaciones que permita a los estudiantes
comprender y diferenciar los conceptos de aleatoriedad y determinismo, aun cuando se expu-
sieron intuitivamente en la primera unidad. Igualmente se realiza un extensivo estudio de la
combinatoria para poder encontrar los espacios muestrales que conllevan a la probabilidad.

17
Mdulo
5 Pensamiento aleatorio y sistemas de datos

18
Unidad No.1
Hacia el Pensamiento Aleatorio

1. Hacia el pensamiento aleatorio2

Este tipo de pensamiento, llamado tambin probabilstico o estocstico, ayuda a tomar


decisiones en situaciones de incertidumbre, de azar, de riesgo por falta de informacin
confiable, en las que no es posible predecir con seguridad lo que va a pasar.

Este pensamiento se apoya directamente en conceptos y procedimientos de la teora de


probabilidades y de la estadstica inferencial, e indirectamente en la estadstica descriptiva
y en la combinatoria. Ayuda a buscar soluciones razonables a problemas en los que no hay
una solucin clara y segura, abordndolos con un espritu de exploracin y de investigacin
mediante la construccin de modelos de fenmenos fsicos, sociales o de juegos de azar
y la utilizacin de estrategias como la exploracin de sistemas de datos, la simulacin de
experimentos y la realizacin de conteos.

El azar se relaciona con la ausencia de patrones o esquemas especficos en las repeticio-


nes de eventos o sucesos, y otras veces con las situaciones en las que se ignora cules
puedan ser esos patrones, si acaso existen, como es el caso de los estados del tiempo; de
la ocurrencia de los terremotos, huracanes u otros fenmenos de la naturaleza; de los ac-
cidentes, fallas mecnicas, epidemias y enfermedades; de las elecciones por votacin; de
los resultados de dispositivos como los que se usan para extraer esferas numeradas para
las loteras y de las tcnicas para efectuar los lanzamientos de dados o monedas o para el
reparto de cartas o fichas en los juegos que por esto mismo se llaman de azar.

En las experiencias cotidianas que los estudiantes ya tienen sobre estos sucesos y estos
juegos, empiezan a tomar conciencia de que su ocurrencia y sus resultados son imprede-
cibles e intentan realizar estimaciones intuitivas acerca de la posibilidad de que ocurran
unos u otros. Estas estimaciones conforman una intuicin inicial del azar y permiten hacer
algunas asignaciones numricas para medir las probabilidades de los eventos o sucesos,
as sean inicialmente un poco arbitrarias, que comienzan con asignar probabilidad cero a
la imposibilidad o a la mxima improbabilidad de ocurrencia; asignar a cualquiera de

_____________________________________________________

2
Documento, Potenciar el pensamiento matemtico: un reto escolar. Estndares bsicos de competencias en matemticas. Bogot
2005.(paper).

19
Mdulo
5 Pensamiento aleatorio y sistemas de datos

dos alternativas que se consideran igualmente probables, y asignar 1 a la necesidad o a


la mxima probabilidad de ocurrencia.

Las situaciones y procesos que permiten hacer un conteo sistemtico del nmero de
combinaciones posibles que se puedan asumir como igualmente probables, junto con el
registro de diferentes resultados de un mismo juego, as como los intentos de interpretacin
y prediccin de los mismos a partir de la exploracin de sistemas de datos, desarrollan
en los estudiantes la distincin entre situaciones deterministas y situaciones aleatorias o
azarosas y permiten refinar las mediciones de la probabilidad con nmeros entre 0 y 1. Ms
tarde, esas situaciones y procesos pueden modelarse por medio de sistemas matemticos
relacionados con la teora de probabilidades y la estadstica.

El empleo cada vez ms generalizado de las tablas de datos y de las recopilaciones de


informacin codificada llev al desarrollo de la estadstica descriptiva, y el estudio de los
sistemas de datos por medio del pensamiento aleatorio llev a la estadstica inferencial
y a la teora de probabilidades. El manejo y anlisis de los sistemas de datos se volvi
inseparable del pensamiento aleatorio.

Los sistemas analticos probabilsticos y los mtodos estadsticos desarrollados durante


los siglos XIX y XX se han refinado y potenciado en los ltimos decenios con los avances
de la computacin electrnica y, por ello, hoy da ya no es tan importante para los estu-
diantes el recuerdo de las frmulas y la habilidad para calcular sus valores, como s lo es
el desarrollo del pensamiento aleatorio, que les permitir interpretar, analizar y utilizar los
resultados que se publiquen en peridicos y revistas, que se presenten en la televisin o
que aparezcan en pantalla o en hojas impresas como productos de los distintos programas
de anlisis de datos.

Por ello, no es ya necesario aprender las frmulas y procedimientos matemticos para


calcular la media o la mediana, la varianza o la desviacin estndar, sino avanzar gradual-
mente en el desarrollo de habilidades combinatorias para encontrar todas las situaciones
posibles dentro de ciertas condiciones, estimar si son o no igualmente probables y asig-
narles probabilidades numricas, as como en dominar los conceptos y procedimientos
necesarios para recoger, estudiar, resumir y diagramar sistemas de datos estadsticos y
tratar de extraer de ellos toda la informacin posible con la ayuda de calculadoras, hojas
de clculo y otros programas de anlisis de datos, con el fin de intentar predecir dentro de
ciertos rangos el curso de los acontecimientos respectivos y de tomar decisiones lo ms
razonables posibles ante la imposibilidad de saber con certeza lo que va a pasar.

A continuacin se presenta un esquema3 en el cual se muestran los principales conceptos


del pensamiento aleatorio, del cual se hace una breve descripcin.

_____________________________________________________

3
Tomado de Interpretacin e implementacin de los estancares bsicos de matemticas. Pg. 118.

20
Hacia el Pensamiento Aleatorio

Este esquema plantea una propuesta que deja atrs el uso exclusivo de clculos matemti-
cos, permitiendo observaciones de las cualidades fsicas de los objetos, fundamentacin del
anlisis exploratorio y la observacin de regularidades y patrones que se ajusten a modelos
(observaciones) con estructuras propias dentro de determinados conjuntos (clases).

1.1. Muestreo

En la toma de decisiones se hace necesario observar las caractersticas de una poblacin a


partir de un nmero determinado de ella, esto es lo que se tiene como idea de muestreo,
pero para inducirnos a tal concepto debe tenerse en cuenta el mtodo de seleccin de los
individuos, as por ejemplo, cuando se desea saber las caractersticas de los empleados que
ha dejado una empresa durante los ltimos cinco aos, es imposible ubicarlos a todos por
mltiples razones, entonces, para dar un informe, se realiza mediante la ubicacin represen-
tativa de algunos de esos elementos y de esa forma puede garantizarse una generalizacin
de todo el grupo. A veces es prctico y posible examinar a cada individuo de una poblacin
que se desea describir, ello se consigue mediante un censo. Se debe utilizar el muestreo
cuando no es posible contar o medir a cada individuo de la poblacin.

En estadstica se usa la palabra poblacin para referirse no slo a personas sino a todos los
elementos que son tomados en cuenta en una investigacin. As cuando un catador de vinos

21
Mdulo
5 Pensamiento aleatorio y sistemas de datos

va a determinar el sabor de todo un barril, el elemento a examinar es un vaso (un sorbo) de


vino y la poblacin es el barril de vino. Para seleccionar las muestras, se realizan muestreos
no aleatorios o de juicio en el cual la experiencia es vital para la identificacin de los ele-
mentos de la poblacin que deben incluirse en la muestra. En el muestreo aleatorio o de
probabilidad todos los elementos de la poblacin tienen igual opcin de ser escogidos en
la muestra. Con lo anterior se puede determinar en forma objetiva las estimaciones de las
caractersticas de la poblacin objeto de estudio que resultan de la toma de una muestra, lo
anterior lleva a describir matemticamente qu tan objetivas son nuestras estimaciones.

Para la obtencin de un buen proceso de muestreo aleatorio, se recomienda algunos mtodos:

a) Nmeros aleatorios: estos nmeros pueden ser generados por un programa de computa-
dor, o mediante una tabla de dgitos aleatorios, en donde la probabilidad de que aparezca
un digito del 1 al 9 es la misma en cualquier secuencia de igual longitud. Por ejemplo, se
desea realizar una encuesta sobre 100 estudiantes para conocer los hbitos de estudio
si se desea entrevistar a 10 de ellos escogidos aleatoriamente, se puede asignar a cada
estudiante un nmero desde el 00 al 99 y consultar una tabla y aplicar lo siguiente: reco-
rrer la tabla por columnas de arriba a abajo, empezando por la columna de la izquierda,
y leer slo los dos dgitos en cada fila, de esta forma los primeros nmeros seran 15, 09,
etc. Seguir de esta manera para conseguir los 10 estudiante, sino se obtienen, se repite el
proceso pero leyendo el tercer y cuarto dgito de cada grupo, en nuestro caso 81, 28 etc.

Grfico 4

La tabla representa nmeros aleatorios cuyo objetivo es el de ayudar a realizar un muestreo siste-
mtico el cual requiere menor tiempo y en ocasiones un costo menor que el aleatorio simple.
_____________________________________________________

4
Grfica escaneada de estadstica para administradores. Levin y Rubin. Pg. 320.

22
Hacia el Pensamiento Aleatorio

b) Muestreo sistemtico: en este mtodo los elementos son seleccionados dentro de un intervalo
uniforme que se mide con respecto al tiempo, al orden o al espacio. Por ejemplo al seleccionar
los 10 estudiantes, se puede escoger 1 cada dcimo nmero, as tendramos el 1, 11, 21 etc.,
esto presenta una desventaja ya que todos no tienen la misma opcin de ser seleccionados
por ejemplo los que tienen los dgitos 2, 3, 4 se quedan sin opcin de ser elegidos.

c) Muestreo estratificado: el objetivo es dividir la poblacin en grupos relativamente homo-


gneos (llamados estratos) y luego se establecen planteamientos de escogencia, o bien se
selecciona de cada estrato un nmero especfico de elementos correspondientes a la fraccin
de ese estrato en la poblacin como un todo o se extrae un nmero igual de elementos de
cada estrato. Este tipo de muestreo es muy bueno cuando se tiene a la poblacin ya dividida,
por ejemplo, en un grado se tienen a los estudiantes de acuerdo con las notas obtenidas y se
puede tomar una muestra de cada uno de los estratos. Se recomienda cuando cada grupo tiene
una pequea variacin dentro de s mismo, pero hay una amplia variacin entre los grupos.

d) Muestreo de racimo: en este caso se divide la poblacin en grupos y se toma una mues-
tra aleatoria de esos racimos (grupos). Se recomienda cuando hay una variacin amplia
dentro de cada grupo, pero los grupos son similares entre s.

e) Muestreo aleatorio simple: se debe seleccionar muestras mediante mtodos que permiten
que cada posible muestra tenga igual probabilidad de ser seleccionada y que cada ele-
mento de la poblacin tenga igual oportunidad de ser incluido en la muestra. Por ejemplo,
si deseamos enviar a dos docentes de un grupo de 4 a representar a la institucin a un
seminario de educacin. Si llamamos A, B, C y D las posibles parejas son: AB, AC, AD, BC,
BD, CD, si se observa bien vemos que se trata de combinaciones donde se toman 2 ele-
mentos de un grupo de 5. Observe que cada grupo posee una probabilidad de 1/6, y cada
docente tendra la posibilidad de P(A) = P(AB)+P(AC)+P(AD)=1/6+1/6+1/6=3/6=1/2
que serian probabilidades de asistir de cada docente al seminario.

1.2. Los datos5

Los datos pueden ser cualitativos o cuantitativos, los primeros se refieren a eventos o cuali-
dades no cuantificables como color, sexo, etc; los segundos por el contrario siempre son cua-
tificables, por ejemplo, las edades de las personas, las apuestas, etc. Dependiendo del tipo
de magnitud al que hagan referencia los datos se puede clasificar en discretos o continuos.

1.3. Sobre la probabilidad

Los fenmenos del mundo que nos rodean, estn estrechamente ligados con un conjunto
infinito de otros hechos, se trata de estudiar un nmero finito de tales vnculos, de tal modo

_____________________________________________________

5
Ver texto interpretacin e implementacin de los estndares bsicos de matemticas 2005.

23
Mdulo
5 Pensamiento aleatorio y sistemas de datos

que se establezcan relaciones o regularidades fundamentales, que pueden reflejar ciertas


desviaciones (las leyes no se cumplen con precisin) debido a la infinidad de vnculos no
previstos en el fenmeno a observar, estos fenmenos son llamados fenmenos aleatorios.
Se puede decir entonces, que la casualidad existe objetivamente en nuestro mundo ya que
no es posible obtener todos los nexos accidentales entre el fenmeno estudiado y la multi-
plicidad infinita de otros sucesos.

Si un fenmeno dado se estudia una sola vez, no se puede predecir cual ser la desviacin
accidental de la regularidad, sin embargo, si el nmero de observaciones del fenmeno se
hace grande, en las mismas desviaciones accidentales se descubren ciertas regularidades
que pueden ser estudiadas y usadas para determinar la influencia de las desviaciones men-
cionadas sobre el curso de los fenmenos por estudiar. Esto da nacimiento al estudio de las
regularidades en los fenmenos aleatorios frecuentes, los cuales pueden ser observados un
nmero ilimitado de veces en las mismas condiciones.

El resultado de un experimento puede ser caracterizado cualitativa o cuantitativamente, cual-


quier caracterstica cualitativa del resultado del experimento se denomina acontecimiento
(suceso), por ejemplo el impacto o el fallo de un tiro sobre un blanco. Cualquier caracterstica
cuantitativa del experimento se llama magnitud aleatoria, por ejemplo los puntos de coor-
denadas de impacto de un disparo, resultado de la medicin de cierta magnitud.

La probabilidad por su carcter abstracto, genera dificultades para su enseanza y apren-


dizaje, por lo tanto su aproximacin requiere de construir, con los nios, ideas intuitivas a
travs de situaciones azarosas donde no es posible procesos de raversibilidad. Es decir, que
no se pueden manipular los fenmenos para producir un resultado especfico, ni devolver
los objetos a su estado inicial deshaciendo la operacin concreta, por ejemplo en el juego
de la ruleta si se hace girar desde una posicin inicial hacia la derecha, es poco probable
que girndola hacia la izquierda se llegue a la posicin inicial, observe que este proceso de
reversibilidad est sujeto a un nmero infinito de otros hechos (la fuerza entre otros).

Se hace necesario tener en cuenta para la enseanza de la probabilidad que el nio diferencie
las situaciones aleatorias y las deterministas, con lo cual dada una serie de experimentos,
se pueda determinar cuales aparecen con mayor o menor frecuencia. Por ejemplo se pueden
realizar actividades en la cuales se construyan un par de dados en cartulina, a uno se le
coloca dos caras con el nmero cuatro y ninguna con el uno, al otro se le pega un pedazo
de plastilina en uno de los puntos. Se analiza a cual de los nmeros aparecen con mayor
frecuencias y si los estudiantes pueden predecir este hecho.

Se necesita de una buena comprensin de la combinatoria para poder abordar el tema de la


probabilidad, es decir el conteo es la parte fundamental y se debe realizar desde diferentes
modelos como el propuesto por Dubois, (1984,37-57):

Seleccin de una muestra a partir de un conjunto de objetos: este tipo de modelo, ge-
neralmente pide enumerar o contar las diferentes muestras de tamao dado que pueden
formarse a partir de un conjunto inicial, para ello este modelo permite observar si todos
los objetos son distinguibles (diferentes), o algunos son iguales; si considera repeticin
o no de elementos; si interviene o no la ordenacin de elementos.

24
Hacia el Pensamiento Aleatorio

Colocacin de objetos en casillas:(cajas, celdas, urnas) lo que se pide es enumerar o


contar las diferentes aplicaciones entre dos conjuntos de objetos, se precisa si los ele-
mentos son iguales o distintos, si las celdas (subconjuntos) son distinguibles o no, se
debe considerar el orden de colocacin de los objetos dentro de las celdas, si se permite
ms de un objeto por celda, si se permiten celdas vacas.

Particin en subconjuntos de un conjunto de objetos: este modelo pide clasificar los ele-
mentos de un conjunto inicial en un nmero dado de subconjuntos incompatibles, de modo
que la clasificacin sea exhaustiva, aqu se precisa si: los elementos son iguales o distintos,
si los subconjuntos son distinguibles o no, se debe considerar el orden de colocacin de
los objetos dentro de subconjuntos, si se permite ms de un objeto por subconjunto, si se
permiten subconjuntos vacos.

Rafael Roa Guzmn,(2000, Pg. 23) propone tres tipos de esquemas combinatorios que ayu-
dan a la interpretacin de los enunciados de las situaciones de recuento:

Estos esquemas slo son una ayuda para los docentes para solucionar preguntas en algunos
tipos de situaciones. En ningn momento se trata de seguir esquemas predeterminados y
menos ensearlos a los estudiantes.

Esquema de seleccin
Se requiere seleccionar muestras de un tamao r a partir de un conjunto de n objetos.

Esquema Modelo
Seleccin ordenada sin reemplazamiento Variaciones
Seleccin ordenada con reemplazamiento Variaciones con repeticin
Seleccin no ordenada sin reemplazamiento Combinacin
Seleccin no ordenada con reemplazamiento Combinaciones con repeticin

Esquema de colocacin
Cuando se requiere colocar r objetos dentro de n cajas (celdas o urnas) o bien establecer una
aplicacin de un conjunto de r objetos en otro conjunto de n objetos. Segn se considere que
el orden de los objetos dentro de las cajas debe o no tenerse en cuenta y los objetos sean
iguales o diferentes, se obtienen los siguientes casos:

a) colocaciones inyectivas: con a lo sumo un objeto por caja (r n)


b) colocaciones sobreyectivas: con a lo menos un objeto por caja (r n)
c) colocaciones biyectivas: con un solo objeto por caja (n = r)
d) colocaciones cualesquiera: se puede colocar el nmero que se desee de objetos en cada
caja o dejar alguna vaca.

25
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Colocaciones Objetos Celdas Tipo aplicacin Modelo


Ordenada Distintos Distintas Inyectiva V
Sobreyectiva r!*C n-1,r-1
Biyectiva Pn
Cualquiera r!*CR
No ordenada Distintos Distintas Inyectiva V
Biyectiva Pn
Cualquiera VR
Iguales Distintas Inyectiva C n,r
Sobreyectiva C n-1,r-1
Cualquiera CR

Donde CR: combinaciones con repeticin.


VR: variaciones con repeticin.
Pn: Permutaciones

Esquema de permutacin
Se pide efectuar una particin de un conjunto de r elementos en n subconjuntos.

Colocacin de objetos Particiones en subconjuntos


Ordenadas Ordenados
No ordenadas No ordenados
De objetos distintos De objetos distintos
De objetos indistinguibles De objetos indistinguibles
En cajas distintas Particiones ordenadas
En cajas indistinguibles Particiones no ordenadas
Inyectivas En subconjuntos vacos o con una unidad
Sobreyectivas En subconjuntos no vacos
Biyectivas En subconjuntos con una sola unidad
Cualquiera Subconjuntos con mas de una unidad y con vacos

Los esquemas anteriores no constituyen una clasificacin de problemas combinatorios, sim-


plemente se trata de cmo ajustarse a un modelo combinatorio en forma didctica.

Adems, no es necesario ajustarse a tales modelos en la bsica hasta el grado 8, si se hace


necesario llegar a ellos desde las diferentes actividades planteadas y a partir del grado 9

La diferencia de cada uno de estos modelos permite obtener un tipo diferente de conteo, el
cual puede ser permutacin, variacin o combinacin. Como puede verse, lo anterior nos

26
Hacia el Pensamiento Aleatorio

representa uno de los ncleos de la matemtica discreta, o simplemente mtodos en los


cuales intervienen conjuntos discretos y funciones definidas sobre los mismos.
Piaget considera la combinatoria como un componente esencial del pensamiento formal,
comparndolo con los esquemas de la proporcionalidad y la correlacin., indica adems que
el razonamiento hipottico deductivo opera por medio de las operaciones combinatorias que
se aplican sobre un conjunto de posibilidades que deben examinarse y enumerarse hasta
llegar a una conclusin.

Algunos autores, entre ellos Fischbein y Gazit consideran que el trabajo combinatorio, cuando
se emplea el diagrama arbolar debe realizarse por medio de las variaciones con repeticin, y
a continuacin el de las permutaciones, variaciones y combinaciones., proponen tareas que
incluyen dibujar el diagrama, contar grupos de elementos y en una ltima instancia obtener
a partir de un patrn la frmula.

Para empezar el trabajo combinatorio, algunos autores como Engel, Varga y Walser, proponen
utilizar una metodologa basada en juegos, introducir como ideas bsicas las reglas de la
suma, producto y cociente y finalmente utilizar los diagramas de rbol.

Los ejes expuestos se presentan a toda la comunidad de matemticas del departamento de


Antioquia un trabajo orientado hacia el desarrollo del pensamiento aleatorio que le ayuda
al docente a reorientar su trabajo en el aula y a dinamizar las relaciones con los diferentes
pensamientos, por igual se trata de un documento en permanente construccin que ayuda
de una u otra forma a desarrollar la propuesta curricular en el rea de matemticas de las
instituciones educativas. Este mdulo se compone de las siguientes unidades:

2. Organizacin de datos

Para la mayora de los estudiantes la estadstica es un tema misterioso donde operamos


con nmeros por medio de frmulas que no tienen sentido (Graham, 1987, p. 5).

En nuestra sociedad los avances de la ciencia y la tecnologa han sido acelerados y la estadstica
ha jugado un papel relevante en tal desarrollo al brindar herramientas de anlisis de variabilidad,
determinar relaciones entre variables y su complejidad, as mismo detallando modelos y optimi-
zndolos en su diseo, realizando predicciones y lo ms importante en la toma de decisiones.

Cabe notar la influencia que en psicologa ha tenido las investigaciones (realizadas por Piaget,
Inhelder, Fischbein entre otros) sobre razonamiento estocstico, tambin las relaciones entre
el desarrollo de cualquier pas y su sistema estadstico para producir informaciones claras y
precisas que conduzcan a la toma de decisiones en lo poltico, econmico y social.

El creciente inters por la enseanza de la estadstica se ve reflejado en los estndares


cuando se propone por ejemplo en grados 1 a 5 de bsica, los siguientes:

27
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Clasificar y organizar la presentacin de datos (relativos a objetos reales o even-


tos escolares) de acuerdo con cualidades o atributos.
Representar datos relativos a su entorno usando objetos concretos, pictogramas
y diagramas de barras.
Comparar y describir la distribucin de un conjunto de datos.

2.1. Conteo y anlisis de datos

Al hablar de la enseanza de la estadstica pensamos en el tipo de situaciones didcticas y


pertinentes a usar, de tal forma que le sea til, interesante y sobre todo que el estudiante elabore
a partir de ellas su propio conocimiento. La conceptualizacin debe estar de acuerdo con el pro-
ceso de desarrollo mental del nio, para ello la propuesta en el aula de clase debe evidenciarse
a partir de actividades y situaciones problemas progresivas, con el fin de que no se llegue a la
aritmetizacin o simplemente se llegue al llamado uso de frmulas a partir de una gua.

La recoleccin de informacin nos lleva al conteo, al uso del nmero en todo tipo de estudios
fenomenolgicos y es aqu donde el docente debe canalizar sus acciones didcticas y tener en
cuenta los planteamientos en los cuales segn Piaget e Inhelder el nio tiene conocimientos
intuitivos sobre la frecuencia relativa, distribucin, aleatoriedad y razonamiento combinatorio.
Proponer situaciones de acuerdo a la edad de tal forma que sean percibidas para llegar a inte-
riorizar en forma concreta el puente entre pensamiento numrico y pensamiento estadstico.

Entre las muchas conceptualizaciones de estadstica, de Cabri6 (Filosofa de la estadstica.1994)


propone una definicin muy interesante:

La estadstica estudia el comportamiento de los fenmenos llamados de colectivo. Est


caracterizada por una informacin a cerca de un colectivo o universo, lo que constituye su
objeto material; un modo propio de razonamiento, el mtodo estadstico, lo que constituye
su objeto formal y unas previsiones de cara al futuro, lo que implica un ambiente de incer-
tidumbre que constituyen su objeto o causa final.

Aparece en esta definicin el objeto material como un miembro de una coleccin, aparece pues
el nmero asociado a lo cardinal. Tal objeto nos da informacin respecto de algunas caracters-
ticas que deben o ameritan ser estudiadas, teniendo como principal motivador la informacin,
que nos indica que deben a partir de una muestra ser representativa respecto al colectivo e
igualmente ver en la muestra la variabilidad (incertidumbre) ya que una muestra puede ser di-
ferente de otra; implcitamente nos indica que las previsiones tienen incertidumbre y es debido
precisamente a que las inferencias se realizan a travs de las muestras y stas a veces no son
representativas pues en raras ocasiones se toma el universo (censos).

_____________________________________________________

6
Citado en Didctica de la Estadstica. Carmen Batanero

28
Hacia el Pensamiento Aleatorio

En nuestro tiempo, la informtica ha jugado un papel fundamental en el anlisis de datos, pues


se hace posible analizar conjuntos grandes de muestras de forma que se aprovecha la mayor
informacin posible, es aqu donde las representaciones mltiples juegan un papel significa-
tivo, ya que dicho anlisis se puede tabular, graficar (diferentes formas de acuerdo al tipo de
variable) y el nio nuevamente entra en el juego de la percepcin, por esto no debe verse el
anlisis tabular como un resumen ya que se pierden propiedades fundamentales en cada uno
de los objetos al realizar la distribucin de frecuencias por intervalos, esto es debido a que el
nio observa en los objetos cualidades individuales, por ejemplo como a alguien que le guste
el helado de fresa, pues al ver la distribucin de frecuencias se le pierde la idea individual, no
as cuando se le presenta un grfico de tortas ya que la complejidad de lo abstracto vara.

29
Mdulo
5 Pensamiento aleatorio y sistemas de datos

2.2. Situacin n 1 datos y conteo

2.2.1. Datos sin agrupar, conceptos bsicos


En el eje organizacin de datos se utilizan tcnicas como la clasificacin, organizacin,
representacin y modelos a partir de una presentacin de datos que pueden obtenerse
mediante:

1. Observacin directa: En la solucin de un problema de investigacin, se acude a la fuente


de la que se desea obtener la informacin, para ello se utilizan instrumentos como con-
versatorios o toma de datos por medio de apuntes de algn fenmeno que se esta obser-
vando, por ejemplo preguntar por los precios de algunos artculos en diferentes tiendas.
Otro ejemplo de observacin directa es anotar el nmero de infracciones de trnsito que
ocurren en un sitio determinado en intervalos de tiempo.

2. Encuestas: La encuesta es un procedimiento utilizado en la investigacin de mercados


para obtener informacin mediante preguntas dirigidas a una muestra de individuos re-
presentativa de la poblacin o universo, de forma que las conclusiones que se obtengan
puedan generalizarse al conjunto de la poblacin siguiendo los principios bsicos de la
inferencia estadstica, ya que la encuesta se basa en el mtodo inductivo, es decir, a partir
de un nmero suficiente de datos podemos obtener conclusiones a nivel general.

La principal ventaja de la encuesta frente a otras tcnicas es su versatilidad o capacidad


para recoger datos sobre una amplia gama de necesidades de informacin.

3. Archivo: Esta tcnica consiste en utilizar datos que fueron recogidos con anterioridad por
otra persona o un grupo de investigadores. Por ejemplo, tomar datos del anuario depar-
tamental, informes del Dane o Sistema nacional de pruebas, entre otros.

Se pueden observar hechos que ocurren en la naturaleza, como el crecimiento de una planta,
el tiempo que empleamos para ir de nuestra casa a la escuela o institucin educativa, ver
en el peridico los marcadores de los partidos de ftbol, apostar al cara y sello etc., estos
sucesos tienen caractersticas importantes como por ejemplo, al realizar una apuesta al cara
y sello estamos seguros que saldr una de las dos situaciones, a este tipo de sucesos los
llamamos deterministas, ya que se va a producir siempre la misma situacin en las mismas
condiciones. Pero a veces hay sucesos en los cuales no podemos determinar con certeza lo
que va a ocurrir, por ejemplo cuntos frijoles tiene una libra, con toda seguridad hay variacin
en el tamao de los frijoles al realizar comparacin con otra libra, en forma, tamao, etc., a
este tipo de sucesos los llamamos aleatorios.

En la aleatoriedad juega un papel importante el azar, ste se le atribuye en forma general a


los resultados de los juegos, generando la teora de probabilidades, ejemplo cuntas veces
obtengo un as, en cinco juegos.

Las situaciones que se presentan a continuacin, tienen como propsito:

30
Hacia el Pensamiento Aleatorio

Explorar e interpretar los datos, relacionarlos con otros, conjeturar, buscar configura-
ciones cualitativas, tendencias, oscilaciones, tipos de crecimiento, buscar correlaciones,
distinguir correlacin de causalidad, calcular correlaciones y su significacin, hacer in-
ferencias cualitativas, diseos, pruebas de hiptesis, reinterpretar los datos, criticarlos,
leer entre lneas, hacer simulaciones, saber que hay riesgos en las decisiones basadas en
inferencias (Vasco C. citado en lineamientos).

Una tabla de frecuencias es un resumen del conjunto de datos por analizar, por ello se debe
tener otras apreciaciones de ellos sobre todo cuando se realizan otras representaciones
como las grficas, las cuales llevan a observar hechos relevantes de la distribucin de
frecuencias, que a la vez nos permite establecer relaciones con otras distribuciones.

En el anlisis de la observacin de un individuo intervienen caractersticas o propiedades


que son atribuidas al azar, a ellas se les llama variables estadsticas. Estas se clasifican
en cualitativas y en cuantitativas, dependiendo si se trata de un atributo o de represen-
taciones numricas, adems pueden ser de tipos discretas o continuas, como en casos del
nmero de frutos de un cultivo de aguacate, el peso en kilos de tal cultivo.

El anlisis de datos al realizar medidas sobre la poblacin se obtiene valores experimen-


tales y de acuerdo a ello se asignan valores representativos acordes a las caractersticas o
atributos involucrados en un mismo individuo, tal medicin se lleva a cabo con la siguiente
tipologa:

a) Escala nominal: clasifica a los individuos de la poblacin en clases que se pueden dife-
renciar entre s pero no realizar relaciones de ningn tipo (orden).Ej. estado civil, color
de ojos, gusto por sabores etc. cada variable puede codificarse numricamente pero el
nmero no representa una magnitud.

b) Escala ordinal: aqu las categoras pueden ser ordenadas, pero la magnitud no es im-
portante ya que no hay proporcionalidad entre dos o ms categoras, as al tener un
orden por el gusto de los helados, el 1(fresa) indica el ms preferido y el 4 (chocolate)
el menos preferido.

c) Escala de intervalo: las categoras se clasifican y ordenan realizando una cuantificacin


entre dos o ms categoras. Esta medida exige un punto de referencia arbitrario y una
unidad de medida. Como ejemplo comn se tiene las escalas de medida de temperatu-
ras y eras cronolgicas, aqu el cero no es ausencia de , 0C indica que est el medio
ambiente fro (y mucho).

d) Escala de razn: adems del orden y la distancia, en esta escala es importante la razn
entre dos categoras, se hace necesario un cero absoluto como ausencia, as el decir
que un rbol de aguacates no dio frutos indica que tuvo cero (0) aguacates, si un rbol
produjo 300 aguacates y el otro 150 aguacates, uno obtuvo el doble que el otro, adems
existen variables continuas como volumen, rea etc.

31
Mdulo
5 Pensamiento aleatorio y sistemas de datos

La escala de medida de las variables, es importante debido al tipo de anlisis a realizar, ya


que ella sugiere la representacin grfica adecuada para obtener resmenes descriptivos
numricos adecuados, adems en el anlisis de datos, es importante disear instrumentos
adecuados los cuales nos permiten recolectar datos necesarios que nos conlleven a la solu-
cin de un problema en cuestin, entre otros se encuentra: medicin, observacin directa,
encuestas.

Luego se debe realizar un resumen de dichos datos, los cuales los representamos en las ta-
blas de frecuencia al igual que representaciones grficas. A este respecto Daz y Gutirrez
(1986.Pg. 18.) dicen en general no es posible una representacin grfica de atributos cua-
litativos, sin embargo ciertos datos nominales u ordinales pueden representarse mediante
grficos de barras.

Para las variables cualitativas y discretas, se acostumbra utilizar diagramas de barra y gr-
ficos de sectores, para las cuantitativas se utilizan histogramas y polgonos de frecuencias.
Se utiliza comnmente la ojiva en frecuencias acumuladas.

Tabla de frecuencias: Es una tabla en la cual se los valores posibles de una variable y se
registra el nmero de valores observados que corresponde a cada individuo.
En general la tabla contiene lo siguiente:

ni:es la frecuencia absoluta o resultado del conteo de cada una de las variables involucradas.
Las veces que se repite el dato Xi
fi:indica la frecuencia relativa para cada una de las variables.
: Este smbolo representa la suma total n, para indicar el total de la muestra.
fi = ni/n: es la forma de hallar la relacin entre una variable y el total de la muestra.
N: es la frecuencia acumulada
Fi*100: es el porcentaje acumulado.

Los datos se acostumbran a representar por Xi.

La suma n1 + n2 + +nm = es igual al nmero de datos.

La frecuencia absoluta acumulada Ni es la suma de las i frecuencias absolutas anteriores

Ni = ; Ni = Ni-1 + ni

32
Hacia el Pensamiento Aleatorio

As N3 = n1 + n2 + n3 = N2 + n3

La frecuencia relativa indica la proporcin de veces que ha ocurrido el dato Xi con respecto al
total de datos. Muchas veces es usual representarla en porcentaje, obteniendo fi = ni /n, se in-
terpretara como f3 = 4/10 =0.4= 40% el dato 3 representa el 40% de los datos de la muestra.

Observe que la frecuencia relativa es al menos igual a 0 y a lo ms igual a 1.

De esta forma la frecuencia relativa se convierte en una funcin, veamos:

Supngase que una muestra dada de tamao n consta de m valores numricamente


diferentes:

X1,X2, .Xm (m<=n)

Con frecuencias relativas correspondientes:


f1,f2,fm, entonces, en f(x) para cada X=Xj es igual a la frecuencia relativa correspondiente
fj y es igual a 0 para cualquier x que no aparece en la muestra.

La frecuencia acumulada relativa es la suma de la i frecuencias relativas anteriores:

Fi = ; Fi = Fi-1 + fi

Ejemplo F3 = f 1 + f2 + f3 = F 2 + f3

F3= 0.436 indica que los 4 primeros datos representan el 43.6% de los datos de la muestra.

Note que =1

Para el anlisis de datos en forma grfica, se tiene en cuenta los siguientes diagramas que
ayudan a resumir los datos:

Diagrama de barras
Los grficos de barras son utilizados para variables de tipo discreto y permiten representar
la frecuencia en cada uno de los niveles de las variables de inters. Particularmente, la altura
de cada barra es proporcional a la frecuencia o cantidad de elementos que pertenecen a la
categora en particular.

El siguiente grfico de barras muestra las veces que han ganado el campeonato mundial de
ftbol algunos pases.

33
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Diagrama de tortas (sectores)


El grfico circular es til para representar proporciones de distintas clases dentro de una
muestra. La muestra es representada por un crculo y cada una de las clases que la compo-
nen, por un sector de ste.

En este grfico el rea de cada sector es proporcional a la frecuencia de la modalidad que


representa, la cual es vista en un sector circular cuyo ngulo central se obtiene multiplicando
la frecuencia relativa por 360, de este modo se obtiene la amplitud del ngulo central.

Un mtodo para iniciar el anlisis exploratorio de los datos, previo al uso de los mtodos
estadsticos tradicionales, y que adems proporciona informacin rpida, visual es la repre-
sentacin grfica de tronco y hoja, descrito por Tukey, es utilizado para las representa-
ciones de distribucin de variables cuantitativas obteniendo con l no slo una grfica de
distribucin de frecuencias, si no la visualizacin de los valores de las observaciones objeto
de estudio. Esta representacin se basa en la ordenacin de los datos a manera de grfico,
pero sin llegar a ello, utilizando las decenas y las unidades.

Veamos su uso a travs del siguiente ejemplo que contiene las calificaciones obtenidas en
una prueba de matemticas:

34
Hacia el Pensamiento Aleatorio

78 93 61 100 70 83 88 74 97 72
66 73 76 81 83 64 91 70 77 86

Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir,
el nmero 51 se ver como 5 | 1. De esta manera las decenas se pondrn en una columna,
en forma vertical, y las unidades a su derecha:

Para entenderle un poco ms, hemos de decir que el primer rengln que dice 6 | 1 6 4 quiere
decir que entre la lista de datos se encuentran los valores 61, 66 y 64.

Esta es la representacin grfica tronco y hoja, donde cada rengln es una posicin de tronco
y cada dgito de la derecha es una hoja.

El procedimiento para realizarla es primero empezar con los troncos, es decir la columna de
la izquierda, y despus dato por dato ir llenando las hojas a la derecha de la lnea vertical,
en el tronco correspondiente.

Adems, si se desean tener los datos ordenados, y algunos los prefieren de esa manera, se pue-
den ordenar las hojas en cada rengln para que la representacin tenga la siguiente forma:

En realidad una representacin de tronco y hojas presenta la misma informacin que la lista
original de datos, pero de una manera mucho ms compacta (especialmente si la lista de
datos es ms grande) y manejable.

Pictogramas: Actualmente, y mucho en los medios masivos de comunicacin, se utilizan


grficos para ilustrar los datos o los resultados de alguna investigacin. Regularmente se
utilizan dibujos para representar dicha informacin, y el tamao o el nmero de estos dibujos
dentro de una grfica queda determinado por la frecuencia correspondiente. A este tipo de
grfica se le llama pictograma y stos son dos ejemplos:

35
Mdulo
5 Pensamiento aleatorio y sistemas de datos

El de la izquierda representa la poblacin de los Estados Unidos (cada hombrecillo representa


a dos millones de habitantes), el de la derecha representa la masa de tres planetas de nuestro
sistema solar tomando como unidad a la masa de la Tierra (cada? representa la masa de nuestro
planeta: Venus tiene masa menor y Neptuno tiene 17 veces ms masa que la Tierra).

Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de grfi-
cas, las posteriores s. Otros programas contemporneos (como el Corel Draw o el Harvard
Graphics) s son capaces7.

Nota: En la elaboracin de grficos, es de vital importancia la precisin, la claridad en los


ttulos, la eleccin del tipo de grfico y el uso de escalas adecuadas, todo ello para dar una
idea clara de la informacin que se desea comunicar.

ESTNDARES INVOLUCRADOS

Ahora encontrar una propuesta organizacional de los estndares asociados a las situacio-
nes propuestas y resueltas que sirven de base para discusiones de otras situaciones que los
docentes puedan plantear y de las que tienen esta unidad.

Conceptos y procedimientos
Las actividades que se presentan en la situacin uno apuntan a engrosar los conocimientos
de forma tal que conlleven a un entendimiento de las relaciones existentes entre los datos
(variables analizadas) con base en ello el anlisis exploratorio proporciona mtodos senci-
llos para la preparacin y organizacin de datos, detectar fallos en el diseo y recoleccin,
tratamiento y evaluacin de los mismos. Sirven las actividades para observar lo que est
sucediendo con los datos ausentes, identificando casos atpicos.

A partir de un conjunto de tcnicas sencillas sintetizar y presentar informacin contenida


en un conjunto de datos. Se examina en forma previa los datos como un paso necesario
_____________________________________________________

7
Tomado de :www.uagmx/matematicas/estadisticas

36
Hacia el Pensamiento Aleatorio

Sistemas de datos
Clasificar y organizar la presentacin de datos (relativos a objetos
reales o eventos escolares) de acuerdo con cualidades o atributos.
Primero a tercero
Representar datos relativos a su entorno usando objetos concretos,
pictogramas y diagrama de barras.
Representar dato usando tablas y grficas (de barras, diagramas de
lneas, circulares)
Interpretar informacin presentada en tablas y grficas (de barras,
Cuarto a quinto
diagramas de lneas, circulares).
Resolver y formular problemas a partir de un conjunto de datos pro-
venientes de observaciones, consultas y experimentos.
Comparar e interpretar datos provenientes de diversas fuentes (pren-
sa, revistas, televisin, experimentos, consultas, entrevistas).
Usar representaciones grficas adecuadas para presentar diversos
Sexto a sptimo
tipos de datos (diagramas de barras, diagramas circulares)
Resolver y formular problemas a partir de un conjunto de datos pre-
sentados en tablas, diagramas de barras, diagramas circulares.
Reconocer que, diferentes maneras de presentar la informacin,
puede dar origen a distintas interpretaciones.
Octavo a noveno Interpretar analtica y crticamente informacin estadstica prove-
niente de diversas fuentes (prensa, revistas, televisin, experimentos,
consultas, entrevistas).
Justificar inferencias provenientes de los medios o de estudios di-
seados en el mbito escolar
Dcimo a undcimo
Interpretar nociones bsicas relacionadas con el manejo de informa-
cin (como poblacin, muestra, variable, estadgrafo y parmetro).
Numrico
Reconocer el significado de nmero en diferentes contextos (medi-
Primero a tercero
cin, conteo, comparacin, codificacin, localizacin entre otros).
Analizar y explicar las representaciones de un mismo nmero (na-
Cuarto a quinto
turales ,fracciones, decimales, porcentajes).
Justificar operaciones aritmticas utilizando las relaciones y propie-
Sexto a sptimo
dades de las operaciones.
Mtrico
Diferenciar atributos mensurables de los objetos y eventos (longitud,
Primero a tercero
superficie, capacidad, masa y tiempo) en diversas situaciones.
Diferenciar atributos mensurables de los objetos y eventos (longitud,
Cuarto a quinto superficie, capacidad, masa, tiempo y amplitud angular) en diversas
situaciones.

37
Mdulo
5 Pensamiento aleatorio y sistemas de datos

el cual requiere tiempo y que habitualmente se descuida por parte de los docentes. Ac-
ceder a los datos conlleva una seleccin adecuada de acuerdo al grado en el cual se est
realizando el estudio y de acuerdo al tipo de variables involucradas, as poder realizar un
estudio de tipo numrico y tener una idea inicial de la informacin contenida en el con-
junto de datos.

Se prepara al estudiante para que comprenda gradualmente un proceso estocstico, a partir


de la adquisicin progresiva de los diferentes elementos que intervienen a partir de experi-
mentos aleatorios y no aleatorios, as mismo la preparacin hacia los conceptos bsicos de
la teora frecuencialista de la probabilidad.

GESTIN DE LA SITUACIN

La situacin en sus actividades no presenta nfasis en dificultades respecto a la parte te-


rica, aunque la actividad 2, se debe tener especial cuidado ya que se involucra en forma
intuitiva para el estudiante lo que representa el concepto de aleatoriedad, a partir de dos
actividades en la cual un estudiante realiza el experimento con el lanzamiento de los dados
y el otro coloca en la tabla segn su creencia los datos que desee.

El anlisis de las dos tablas es fundamental para poder comprender el proceso de aleatorie-
dad a partir de simulaciones, para ello se debe realizar un anlisis en grupo con todos los
estudiantes, esto debido a que no existen patrones definidos para el caso del experimento
simulado. Al comparar las diferentes grficas en el proceso real, se debe buscar patrones,
en este caso debe verse que la distribucin se asemeja a la campana de Gauss.

Actividad N 1. Recoleccin de datos

Propsitos
Recolectar informacin proveniente de diversas fuentes.
Realizar conteos con los elementos puestos en escena de la vida escolar

Actividad N 1 Juego con bloques lgicos

Material
Bloques lgicos.

En una bolsa se le colocan al estudiante:


6 crculos rojos
4 crculos amarillos
4 crculos azules
6 rectngulos rojos
6 rectngulos amarillos

38
Hacia el Pensamiento Aleatorio

Cmo jugar
1. Agrupar las fichas por color y forma: Crculos amarillos, rectngulos rojos etc.
2. Cuando haya terminado, se le pide que llene la siguiente tabla:

Cantidad
Nombre Color Relacin
(Frecuencia)
Crculo
Crculo
Crculo
Rectngulo
Rectngulo
Rectngulo
TOTAL --------------------

Situaciones para reflexionar


Cuntas fichas hay de color amarilla?
Cuntas fichas hay en total?
Cuntas piezas en total hay ms que amarillas?
Cul es la relacin de crculos amarillos respecto al total de piezas?
Cul es la relacin de crculos azules respecto al total de piezas?
Cul es la relacin de crculos rojos respecto al total de piezas?
Cul es la relacin de rectngulos amarillos respecto al total de piezas?
Cul es la relacin de rectngulos rojos respecto al total de piezas?
Cul es la relacin de rectngulos azules respecto al total de piezas?

Actividad n 2
El propsito es diferenciar un proceso aleatorio de otro que no lo es.

Jugando con dados

Material
1 dado sin cargar (normal)
2 jugadores

Cmo jugar
1. Cada uno lanza el dado, quien obtenga mayor puntaje realiza el experimento en forma
concreta as: Lanza el dado 40 veces y anota una x frente al nmero correspondiente,
hasta terminar.
2. El jugador perdedor, coloca los 40 resultados marcando con cruces donde el crea conve-
niente sin tirar los dados (simulacin).
3. Anote los datos obtenidos en la siguiente tabla:

39
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Prueba real
Nmero Marca (x) Frecuencia (conteo)
1
2
3
4
5
6
Total 40 40

Prueba simulada

Nmero Marca (x) Frecuencia (conteo)


1
2
3
4
5
6
Total 40 40

Situaciones para reflexionar


1. Cmo diferenciar un experimento aleatorio de otro que no lo es?
2. En el experimento real siempre se ha de tener la misma frecuencia?
3. Qu pasa si se obtienen 10 veces el nmero cinco?
4. Compara los dos experimentos colocando las X sobre cada nmero en la siguiente tabla:

Aleatorio Simulado

1 2 3 4 5 6 1 2 3 4 5 6

40
Hacia el Pensamiento Aleatorio

5. En qu se parecen?
6. El valor ms frecuente es el mismo?
7. Cul de las secuencias presenta mayor variabilidad (rango)?

Actividad n 3

Propsito: iniciar al estudiante en el proceso de tabulacin de datos y en la realizacin de


encuestas.

Consultando textos
Determinar cual es la vocal ms usada en nuestro idioma.
Para comenzar, la poblacin de estudio referida sern todas las vocales del idioma Espaol,
que es infinita. Pero podemos determinar una muestra a partir de una pgina completa de un
libro cualesquiera, no es un buen ejemplo de muestreo, pero la experiencia nos ha mostrado
que es una buena muestra para los propsitos de la clase.

Material
1. Libro. Se puede pedir que lleve (para grados 6 en adelante) el que estn leyendo en la
asignatura de espaol

Cmo empezar
La toma de la muestra se podr hacer realizando un listado de todas las vocales del texto en
el orden en que aparecen y luego sealando con un color para cada vocal.

Organizar en la siguiente tabla.


Para el caso de las vocales se consideran como variables nominales

Vocal ni fi % Ni Fi
a
e
i
o
u
Total = n

Situaciones para reflexionar


1. Cul es la vocal ms usada en nuestro idioma?
2. Coincide esta vocal para otro idioma?
3. Cmo hallaras el porcentaje de cada vocal?

41
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Actividad n 4
Realizar una encuesta entre los estudiantes del grupo, en la cual se va a observar la variacin
de la edad con el crecimiento y el sexo.
La pregunta problematizadora sera: Cual es la influenciad de la estatura con relacin a la
edad y el sexo?
La estatura tiene influencia en el crecimiento del pie?

Material
1. Metro.
2. Hoja o un cuarto de cartulina.

Cmo empezar
Cada estudiante lleva una hoja de papel o un cuarto de cartulina, se quita los zapatos y
dibuja en ella su pie (calca). Luego lo mide con un metro.
Se mide luego la estatura de cada uno (sin zapatos).
Cada estudiante le realiza las siguientes preguntas a cada uno sus compaeros:

1. Sexo M F
2. Estatura en cm.
3. Edad en aos cumplidos
4. Tamao del pie.

Llenar las siguientes tablas

Variable: sexo

Xi Sexo ni fi Ni Fi
1
2

Responda:
Qu porcentaje corresponde a las mujeres en tu grupo?
En el siguiente crculo, grfica los porcentajes de cada
variable

42
Hacia el Pensamiento Aleatorio

Variable: edad
Tipo:
Escala de medida:

Xi Edad ni fi Ni Fi

Situaciones para reflexionar


1. Qu porcentaje de estudiantes tiene la edad entre ____ y ____ ?
2. El nmero de estudiantes con ____ aos es _____
3. El 50% de los estudiantes tiene _____ o mas aos
4. La mayor frecuencia a qu porcentaje corresponde?

Elabore un grfico de Frecuencias acumuladas vs Porcentaje acumulados. (OJIVA)


En el eje Y coloque Ni al lado izquierdo y en el Y derecho coloca la Fi, para ello divida en 25%
este eje hasta completar el 100%. En el eje X coloca las edades.

5. Responder: En cual valor empieza el 25% de las edades menores?


6. Qu porcentaje de estudiantes poseen una estatura superior a ____CMS?

Para la estatura se aprovecha el mismo cuadro

43
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Xi Estatura ni fi Ni Fi

7. Qu porcentaje de estudiantes tiene la estatura entre ____ y ____ ?


8. El nmero de estudiantes con ____ cms es _____
9. El 50% de los estudiantes tiene _____ ms cms.
10. La mayor frecuencia a qu porcentaje corresponde?

Ahora organizaremos algo diferente, por sexo, realizamos las 2 tablas con respecto a la me-
dida del pie para luego concluir y comparar.

Sexo femenino
Variable: medida del pie en cms

Xi medida del pie en cms ni fi Ni Fi

Sexo: masculino
Variable: medida del pie en cms

Xi medida del pie en cms ni fi Ni Fi

44
Hacia el Pensamiento Aleatorio

Situaciones para reflexionar


1. En cual de los sexos existe mayor medida del pie?
2. Cual cree que es la razn para llegar a esa conclusin?
3. Cual de los datos posee mayor dispersin? ( Rango)

Ahora realice un diagrama de barras para ambos sexos para comparar la medida del pie.

Sexo femenino: Sexo masculino

Si se supone que la longitud de un pie es de acuerdo a la edad normal y est entre _____
cms y ______ cms, qu porcentaje de estudiantes se consideran normales en crecimiento
para ambos sexos?
Se puede decir que la mitad de los estudiantes tiene entre ____ y _____ cms?
Qu porcentaje de cada sexo tiene medida de pie inferior a _____ cms?

Actividad n 5

Propsito: conceptuar sobre cada una de las frecuencias matemticamente.

Un docente coloc una tabla de frecuencias en el tablero sobre el nmero de tornillos defec-
tuosos en una muestra de 20 cajas, pero al terminar son el timbre para salir a descanso y
los estudiantes borraron algunos datos, por favor aydenos a encontrarlos y responda las
inquietudes que se formulan:

Xi : tornillos defectuosos ni (cajas) fi Ni Fi


0 2 0.10 10%
1 3 0.15
2 0.25 50%
3 16
4 4

45
Mdulo
5 Pensamiento aleatorio y sistemas de datos

a. Qu porcentaje de tornillos tiene 3 o mas defectos?


b. En qu rango se encuentra el 25% y 75% de tornillos defectuosos?
c. Cual es la cantidad de cajas con mas tornillos defectuosos?

Actividad n 6
En un campeonato de ftbol intercolegiado se han inscrito 12 equipos. Los puntos que se
dan por partido jugado son: 3 al ganador, 0 al perdedor y en caso de empate 1 a cada equi-
po, excepto en la semifinal (tercera fase) donde en caso de empate, el ganador se decidir
por tiros desde el punto penal. Los organizadores del campeonato construyeron el siguiente
diagrama donde se observa la programacin general de los partidos en cuatro fases: (Icfes,
2002, Pg. 33)

46
Hacia el Pensamiento Aleatorio

Situaciones para reflexionar


1. El peridico de la institucin quiere analizar el diagrama de los partidos por fase. Realice
las conclusiones pertinentes de acuerdo al nmero de partidos jugados en cada fase.

2. Si su funcin fuera el de reorganizar el diagrama de los partidos por fase, de tal forma que
un equipo tenga mayor posibilidad de pasar de un subgrupo de la fase 2 a un subgrupo
de la fase 3, cmo lo hara?.

3. Un comentarista del peridico trat de resumir la informacin del diagrama del campeo-
nato con respecto a la cantidad de partidos, realizando la siguiente tabla:

Fases grupos subgrupos


Nmero de
1 2 3 4 A B C D 1 2 A B
partidos
6 6 1 1 6 6 6 6 6 6 1 1

Analice si los datos coinciden con la totalidad de la informacin del diagrama.

4. Un equipo ha llegado a la final y de los partidos que jug empat 2 y perdi uno. Repre-
sente grficamente los puntos que hizo el equipo por partido.

Las siguientes actividades se prestan para que el estudiante realice un anlisis basado en
los conceptos anteriores.

5. Los ejercicios del 4 al 7 son tomados de las pruebas TIMSS

47
Mdulo
5 Pensamiento aleatorio y sistemas de datos

6.

7.

48
Hacia el Pensamiento Aleatorio

SITUACIN: Datos y conteo, datos agrupados

Conceptos bsicos
El objetivo de toda investigacin estadstica es llegar a resultados confiables, precisos
(quedando siempre incertidumbre, no siempre exactos), esto nos indica que debe existir un
margen de error pero debe llevarse al mnimo en lo posible, debemos pues estar dentro de
mrgenes tanto por exceso como por defecto, para ello, la variable a la cual se le realiza el
estudio debe de provenir de una muestra grande, suficiente como para considerar errores
experimentales pequeos. Todo resultado de un experimento en el cual la informacin es
representada en forma volumtrica no nos indica mayor informacin concreta sobre las ca-
ractersticas a estudiar debido a que pueden tomar valores aislados o puede estar dentro
de un intervalo8, sin embargo para poderla manejar se debe recurrir al proceso o tcnica de
agrupacin de datos, esta tcnica es aplicable tanto a datos discretos como a continuos, tal
tcnica, permite agrupar en intervalos y marcas de clase la informacin obtenida sin perder
demasiada informacin.

Al tomar la decisin de agrupar datos, se debe tener en cuenta el nmero de intervalos en


el cual se va a dividir. Para ello no existen criterios nicos, al respecto Batanero y Godino
(2001) comentan: no existe una regla fija, y en ltima instancia ser un compromiso entre
la prdida de la informacin que supone el agrupamiento y la visin global y sinttica que
se persigue.

Daremos aqu varios enfoques sobre diferentes autores, respecto a la forma de realizar una
agrupacin de datos por intervalos, no se recomienda uno en particular simplemente se
adapta a la situacin de anlisis ms deseada o pertinente.

Edwin Kreyszig,(1973. Pg. 33) propone: un intervalo I debe contener todos los valores de
la misma (muestra). Se subdivide I en subintervalos llamados intervalos de clase o celdas;
los puntos medios de estos intervalos se denominan marcas de clase. Se dice que los va-
lores de la muestra en cada uno de los intervalos forma una clase. Al nmero de valores en
una clase se le llama frecuencia de clase; su divisin entre el tamao n de la muestra es la
frecuencia relativa de clase. Esta frecuencia, considerada como funcin de las marcas de
clase, se denomina funcin de frecuencias de la muestra agrupada.

En muchas aplicaciones ser posible obedecer las siguientes reglas que son tiles:

1. Todos los intervalos de clase debern tener la misma longitud.

2. los intervalos de clase se escogern de manera que las marcas de clase correspondan a
nmeros simples ( nmeros con pocos dgitos diferentes de cero)

_____________________________________________________

6
Al estudiar por ejemplo el nmero de hijos por familia de estrato 1 se tiene una variable de tipo discreto en el cual se puede tener 0
hijos por lo cual es un dato aislado, y en el estudio de la estatura de estudiantes de un grado, se puede tener una pequea que no
sea muy comn pero est dentro de un intervalo.

49
Mdulo
5 Pensamiento aleatorio y sistemas de datos

3. Si un valor de la muestra coincide con el punto extremo comn de dos intervalos de clase,
lo tomaremos en cuenta sumando a la frecuencia de clase de cada uno de los intervalos
de clase. De ser posible escogeremos los intervalos de clase de tal manera que no sucedan
tales coincidencias.

Al escoger menos intervalos, se perder ms informacin, ya que los valores originales de


la muestra no aparecern explcitamente. El agrupamiento debe hacerse de tal manera que
solo se eliminen los detalles que no son esenciales. En muchas aplicaciones prcticas se
pueden escoger entre 10 y 20 intervalos de clase.

La muestra agrupada puede cambiar si se cambian las marcas de clase, reteniendo las lon-
gitudes y el nmero de intervalos de clase. Se observa pues que hay factores arbitrarios en
el proceso de agrupamiento.

Si se va a comparar una muestra con otra previamente agrupada, es importante que se es-
coja el mismo agrupamiento, eje estudios demogrficos, la edad se agrupa por lo general en
intervalos del primer ao de vida, despus los siguientes cuatro aos y luego en intervalos
de 5 (o 10) aos. Si se ignora esta convencin, sera muy difcil comparar los resultados de
diferentes estudios.

Godino y Batanero9 comentan: Una regla que se utiliza a menudo es tomar un entero prxi-
mo a la raz cuadrada del nmero de datos como nmero de intervalos. Para proceder a la
construccin de una distribucin de frecuencias con datos agrupados es preciso tener en
cuenta las siguientes nociones:

Mximo: se llama mximo de una variable estadstica continua al mayor valor que toma la
variable en toda la serie estadstica.

Mnimo: es el menor valor que toma la variable en toda la serie estadstica.

Recorrido: es la diferencia entre los valores mximo y mnimo en toda la serie estadstica.

Clase: es cada uno de los intervalos en que podemos dividir el recorrido de la variable
estadstica.

Extremo superior de clase: es el mximo valor de dicha clase.

Extremo inferior de clase: es el mnimo valor del intervalo.

Marca de clase: es el punto medio de cada clase.

Segn el extremo superior de cada clase coincida o no con el extremo inferior de la clase siguien-
te, podemos distinguir dos clases de tablas de frecuencias. Si el extremo superior de cada clase

_____________________________________________________

9
Anlisis de datos y su didctica. Godino y Batanero.2001.

50
Hacia el Pensamiento Aleatorio

coincide con el inferior de la siguiente, los intervalos se suponen semiabiertos por la derecha.
Es decir, en cada clase se incluyen los valores de la variable que sean mayores o iguales que
el extremo inferior del intervalo, pero estrictamente menores que el extremo superior.

La informacin de una tabla puede resumirse grficamente as:

Histograma: consiste en unos rectngulos construidos sobre los ejes cartesianos, y las reas
son proporcionales a las frecuencias de cada intervalo. La base de cada rectngulo se cons-
truye sobre el eje X y representan los intervalos de clase. La altura representa la frecuencia
de cada clase.

Cada observacin representada en un histograma ocupa un rectngulo de igual rea y de


base dada por el ancho del intervalo correspondiente.

Para cada intervalo, el rectngulo que representa su frecuencia, puede imaginarse formado
por un apilamiento de los rectngulos correspondientes a sus observaciones.

Intervalos Frecuencia
[1-2) 6
[2-3) 10
[3-4) 4
[4-5) 2
[5-6) 1

En la tabla anterior, todos los intervalos tienen el mismo tamao. Esto hace que, la altura
del rectngulo asociado a cada intervalo sea directamente proporcional a la frecuencia co-
rrespondiente.

Grfico de cajon: el grfico de caja es una representacin que describe la informacin con-
tenida en una muestra basndose en cinco estadsticas:

Valor mximo (Mx.)


Tercer cuartil (Q3)
Mediana (m)
Primer cuartil (Q1)
Valor mnimo (Mn.)

Como puede observarse, las estadsticas calculadas para construir este grfico, dividen el
recorrido de los valores observados en cuatro partes. Cada una de stas contiene aproxima-
damente el 25% del total de las observaciones.
La interpretacin del grfico est basada en la comparacin de las longitudes de los
cuatro tramos.

51
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Debe tenerse presente que cada uno de los tramos tiene la misma cantidad de elementos,
por lo tanto los tramos de menor longitud representan una mayor densidad. Es decir, los
tramos ms cortos representan una mayor aglomeracin de elementos muestrales.

Nota: La ventaja de esta representacin reside en que permite resumir datos en forma simple,
entregando una visin global de la muestra con pocos elementos. A pesar de la simplicidad
de este grfico, no es fcil entenderlo en un comienzo y, al igual que muchos otros, requiere
de algn cuidado en su anlisis para poder interpretar la informacin que entrega. Este tipo
de grfico se estudiar con detalle en la seccin de medidas de posicin.

Polgono de frecuencias: es la lnea que resulta de unir los puntos medios de la base supe-
rior de cada rectngulo.

La diferencia fundamental entre ambas es que en el polgono de frecuencias se aaden dos


clases con frecuencias cero: una antes de la primera clase con datos y otra despus de la
ltima. El resultado es que se sujeta la lnea por ambos extremos al eje horizontal y lo que
podra ser una lnea separada del eje se convierte, junto con ste, en un polgono.

52
Hacia el Pensamiento Aleatorio

El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investi-


gacin durante el ao de 1990 en cinco pases (fuente: Revista Ciencia y Desarrollo,
1994, XIX(114):12):

OJIVA: llamado polgono acumulativo de frecuencias, se obtiene uniendo la abscisa correspon-


diente al extremo superior de cada clase y la ordenada a la frecuencia acumulada hasta dicha
clase, pero sta se obtiene de aplicar parcialmente la misma tcnica a una distribucin acu-
mulativa y de igual manera que stas, existen las ojivas mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por
sto la aplicacin de la tcnica es parcial):

1. Un extremo de la ojiva no se amarra al eje horizontal, para la ojiva mayor que sucede
con el extremo izquierdo; para la ojiva menor que, con el derecho.

2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor
que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que
est sobre la frontera de clase 4:00 se ven las visitas que se realizaron en una hora mayor
que las 4:00 horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma
anloga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son
el nmero de observaciones menores que la frontera sealada (en caso de tiempos sera el
nmero de observaciones antes de la hora que seala la frontera).

Si se utiliza una distribucin porcentual acumulativa se obtiene una ojiva (mayor que o menor
que segn sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente
ejemplo es la misma ojiva menor que se acaba de usar, pero con una distribucin porcentual:

53
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Datos agrupados.
Cuando la muestra consta de 30 o ms datos, lo aconsejable es agrupar los datos en clases
y a partir de estas determinar sus caractersticas y por consiguiente las de la poblacin de
donde fue tomada.

Ejemplo:
Los siguientes datos se refieren al dimetro en pulgadas de una tubera.

6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00


6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10
7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15

a) Agrupe datos, considere k = 6 para este caso.


A veces la obtencin de k se realiza en forma arbitraria, teniendo en cuenta tomar entre 5 y 25
intervalos como lmite , los especialistas utilizan la llamada regla de Sturges (1926), si k es el
nmero de intervalos deseados y n el nmero de datos, entonces k = 1+3.32log(n), pues como
se puede apreciar el nmero de intervalos es arbitrario y depende mas de la experiencia y no
de la teora ya que si se toman demasiados intervalos, la agrupacin es ineficiente ya que
no se reduce lo suficiente el conjunto de datos originales. Si se toman pocos intervalos se
pierde la informacin original y por supuesto el objetivo de la investigacin.

b) Obtenga: Histograma, polgono de frecuencias, ojiva y distribucin de probabilidad.


Solucin: Agrupando datos;
Rango = valor mximo valor mnimo
1. R = VM - Vm = 7.25 6.00 = 1.25

Nmero de intervalos:
2. k = 6

54
Hacia el Pensamiento Aleatorio

Amplitud de cada intervalo: este valor casi siempre contiene varias cifras decimales, se re-
comienda por simplicidad redondear por encima al nmero de cifras decimales que tengan
los datos originales.

3.

Los intervalos pueden tener la misma amplitud o stas pueden ser diferentes dependiendo
de la naturaleza de los datos.

4. Formando clases. Lmites de los intervalos.


Para formar la primera clase se toma un valor un poco menor que el valor menor encontrado
en la muestra; donde

LI: lmite inferior.


LS: lmite superior.

Los lmites de los intervalos deben escogerse de tal forma que incluyan los valores mximo
y mnimo para que la ampliacin se reparta por partes iguales en los extremos.
La marca de clase es el punto medio de cada intervalo: xi = (LS-LI)/2
El conteo de datos se realiza por cada intervalo.

Marca Lmite real Lmite real Frecuencia Frecuencia


LI LS Frecuencia
de clase inferior superior relativa Relativa acumulada
5.97 6.18 2 6.075 5.965 6.185 2/40 = 0.05 0.05
6.19 6.40 5 6.295 6.185 6.405 5/40=0.125 0.175
6.41 6.62 7 6.515 6.405 6.625 0.175 0.350
6.63 6.84 13 6.735 6.625 6.845 0.325 0.675
6.85 7.06 7 6.955 6.845 7.065 0.175 0.850
7.07 7.28 6 7.175 7.065 7.285 0.15 1.000
Total 40 1.000

Grficas:

55
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Situaciones para reflexionar


a. Cul es el intervalo de mayor frecuencia?
b. Cmo estn distribuidas las frecuencias?
c. Cuntos tubos tiene un dimetro mayor a 6.736 pulg?
d. Qu porcentaje mide menos de 6.515 pulg?
e. Entre cuales lmites est el 25% de los tubos mas gruesos?

Conceptos y procedimientos
En la representacin grfica, el estudiante debe tener habilidad para lectura crtica de datos,
lo cual le permite ser competente en este pensamiento, ya que se deja de ser repetitivo y
solamente se estara en un sistema estadstico donde lo principal es la aplicacin reiterativa
de una frmula. Curcio (1989) describe tres niveles distintos de comprensin de grficos:

a) Leer los datos: este nivel de comprensin requiere una lectura literal del grfico; no se
realiza interpretacin de la informacin contenida en el mismo. Por ejemplo en una nube
de puntos, se refiere a cuestiones sobre la lectura de las escalas o encontrar el valor de
una de las coordenadas de uno de los puntos, dado el valor de la otra coordenada.

b) Leer dentro de los datos: incluye la interpretacin e integracin de los datos en el grfico;
requiere la habilidad para comparar cantidades y el uso de otros conceptos y destrezas
matemticas. Por ejemplo en cuestiones de covariaciones, indicar si la relacin, podra ser
representada o no mediante una funcin lineal o si sobre la relacin es directa o inversa.

c) Leer ms all de los datos: requiere que el lector realice predicciones e inferencias a
partir de los datos sobre informaciones que no se reflejan directamente en el grfico.
Aqu se podra predecir el valor de y para un x dado.

56
Hacia el Pensamiento Aleatorio

GESTIN DE LA SITUACIN

Las actividades propuestas presentan niveles de complejidad apropiados para los grados
6,7 y 8, este tipo de actividad puede proponrsele los estudiantes desde el comienzo de
la campaa para la eleccin de personero en las diferentes instituciones, en la cual ellos pue-
den realizar las encuestas y diferentes tems basados en el propuesto. Se puede realizar en
grupos de tres estudiantes para fortalecer el trabajo en equipo y adems las competencias
ciudadanas, por ejemplo con relacin a la participacin democrtica y lograr por otro lado la
integracin con el rea de sociales ya que los estudiantes de estos grados pueden aportar
ideas sobre el gobierno escolar.

Con respecto a la actividad ocho se tiene un prototipo clsico que est en la mayora de los
textos escolares, pero la forma de realizar la reflexin no es la tradicional ya que ha sido
tomada de una de las preguntas de tipo Icfes en la cual se evala la competencia de com-
presin de lectura de grficas.

Actividad n 7
En una institucin educativa, para el cargo de personero se postularon 4 candidatos. Una
semana antes de las elecciones se realiz una encuesta, tomando una muestra representativa
de todo el estudiantado y se formul una pregunta acerca del candidato de su preferencia.
Los resultados obtenidos se expresan en la siguiente grafica10:

Situaciones para reflexionar


Con base en la informacin, se puede afirmar con certeza que:

a. Todos los estudiantes de la muestra respondieron la pregunta.


b. En candidato 1 obtuvo casi el mismo nmero de votos que el candidato 2.
c. Los candidatos 1 y 2 obtuvieron la misma votacin.
d. El candidato 2 obtuvo la mitad de votos que el 4.

La siguiente tabla de frecuencias es compatible con la grfica?

_____________________________________________________

10
Adaptado de Icfes 2002. La prueba. El Tiempo.

57
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Candidato N de votos
1 21
2 11
3 34
4 19
Total 85

a. No, debido a ________________________________________________


b. Si , significa que _________________________________________________

Una vez realizada la eleccin, se dio como absoluto ganador al candidato 3, que obtuvo 56%
de la votacin total. La popularidad del ganador se increment 2% en los tres ltimos das
antes de la eleccin. Esto quiere decir que:

a. El candidato 3 obtuvo 672 votos a su favor de los 1200 posibles.


b. De los 1200 estudiantes, 24 corresponden al 2%.
c. Faltando 4 das, de los 1200 votantes, 648 votaran por l.
d. El candidato 3 obtuvo 12 votos ms al aumentar su popularidad.

Actividad n 8
Se ha preguntado a un cierto nmero de familias por el nmero de hijos: Los resultados ob-
tenidos estn representados en una tabla y en un diagrama de barras11.

Nmero de Nmero de
hijos familias
0 2
1 4
2 6
3 ?
4 2
5 ?
Total ?

Situaciones para reflexionar


Completar la tabla

Al analizar el diagrama de barras, se puede afirmar:


a. La mayora de las familias tiene 4 o mas hijos.
b. El 70% de las familias tiene 2 o mas hijos
c. El 50% de las familias tiene 2 o menos hijos
d. 30 familias tienen 2 hijos
_____________________________________________________

11
Tomado de Sistema Nacional de Evaluacin de la educacin. 2002. 9 grado

58
Unidad No.2
Desde los conceptos y los procesos

2.1. Las medidas de posicin y variabilidad

2.1.1. Comprensin de las medidas de tendencia central

Realizado el proceso de anlisis de datos en forma descriptiva, se hace necesario el proce-


der a la realizacin de los resmenes estadsticos que nos proporcionan la forma como se
distribuyen los datos calculando una serie de valores alrededor de los cuales se agrupan
dichas observaciones.

Los estndares para los grados quinto y sexto Encuentra la media, la mediana y la moda de
un sistema de datos e interpreta su significado para el grado sexto Interpreta diagramas
de barras, diagramas circulares y pictogramas y calcula frecuencias, medianas, modas y
medias a partir de ellas12 lo anterior nos permite buscar que los docentes puedan construir
primero sus propios modelos, conceptos e interpretaciones y luego a partir de fuentes docu-
mentales y nuevas experiencias les permita llevar a sus estudiantes situaciones problmicas
que le eviten dificultades en la conceptualizacin de estas importantes medidas, situaciones
que evidencien en los estudiantes argumentaciones, conjeturas, hiptesis y todas aquellas
competencias implcitas en la escogencia de una medida de tendencia central de acuerdo
con el contexto que se le presente y de all puedan realizar sus modelaciones.

Conceptualizaciones
Las medidas de centralizacin o tendencia central son medidas que buscan centralizar la
informacin de alguna manera, por lo tanto son medidas de sntesis que recopilan las carac-
tersticas ms relevantes de la distribucin de frecuencias.

Promedios (media aritmtica)


Son medidas que hace uso de toda la distribucin de frecuencias. Por esta razn, la media
(promedio) es un valor tpico o representativo de los datos, el cual dice alrededor de qu
valor se agrupa los datos con respecto al centro de la distribucin. Cambell (1974)13 observa

_____________________________________________________

12
Estndares Bsicos de Matemticas. MEN (2003).
13
Citado en el documento Concepciones de los maestros de primaria en formacin sobre los promedios. (Batanero, Godino y
Navas) 1997.

59
Mdulo
5 Pensamiento aleatorio y sistemas de datos

que debido a la representatividad, se tiende a situar la media en el centro del recorrido de


la distribucin, propiedad que es cierta para distribuciones simtricas que analizaremos
ms adelante.

Brosseau (1983) afirma que en la enseanza de la media existe un obstculo de tipo didc-
tico al introducir el simbolismo, y que es ms prctico facilitar inicialmente la comprensin
del significado realizando ejemplos concretos o comparaciones.

ESTNDARES INVOLUCRADOS

Ahora encontrar una propuesta organizacional de los estndares asociados a las si-
tuaciones propuestas y resueltas. Se presenta un esquema organizativo de la estructura
conceptual presente en el pensamiento aleatorio y sistemas de datos.

Sistemas de datos
Primero a Tercero Identificar regularidades y tendencias en un conjunto de datos
Cuarto a Quinto Comparar y describir la distribucin de un conjunto de datos.
Usar e interpretar la mediana, promedio.
Usar medidas de tendencia central (media, mediana, moda) para
Sexto a Sptimo
interpretar el comportamiento de un conjunto de datos
Reconocer relacin entre un conjunto de datos y su representacin.
Octavo a Noveno Interpretar conceptos de media, mediana y moda.
Seleccionar y usar algunos mtodos estadsticos adecuados, segn
el tipo de informacin
Describir tendencias que se observan en conjuntos de variables re-
Dcimo a Undcimo
lacionadas.
Usar comprensivamente algunas medidas de centralizacin, locali-
zacin, dispersin y correlacin (percentiles, cuartiles, centralidad,
distancia, rango, varianza, covarianza y normalidad).
Numrico
Usar la estimacin para establecer soluciones razonables acorde
Primero a Tercero
con los datos del problema.
Justificar regularidades y propiedades de los nmeros, sus relacio-
Cuarto a Quinto
nes y operaciones utilizando calculadoras o computadores.
Variacional
Reconocer el conjunto de valores de una variable en situaciones
Sexto a Sptico
concretas de cambio.
Identificar relaciones entre propiedades de las grficas y propieda-
Octavo a Noveno
des de las ecuaciones algebraicas.

60
Desde los conceptos y los procesos

El siguiente esquema muestra un posible modelo que permite acceder a la Estadstica


Descriptiva, tomando como base fundamental el Anlisis Exploratorio de Datos, en este
sentido se consigue un entendimiento bsico de los datos y de las relaciones existentes
entre las variables analizadas.

61
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Veamos algunos anlisis de situaciones en la cual el significado y comprensin de las me-


didas de posicin es de vital importancia antes de mencionar un algoritmo en particular o
propiedades para resolver situaciones problemas.

Conceptos y procedimientos
Este grupo de actividades llamadas de aprestamiento tiene como objetivo el clculo de las
medidas de tendencia central, en especial la media aritmtica, y para ello se usa la compren-
sin de los conceptos de acuerdo con la estimacin de medidas que los estudiantes deben
ubicarse en un rango posible. As mismo se aborda situaciones en las cuales el promedio
ponderado juega un papel fundamental.

GESTIN DE LA SITUACIN

Se tienen dos actividades con una dificultad en la forma de emplearse el concepto y por
consiguiente la comprensin del mismo respecto a la media ponderada, esto se debe b-
sicamente a que se aplica el algoritmo en forma mecnica, sin comprender su significado,
adems, porque no se visualiza el conjunto de datos como un todo.

Al respecto, Godino (1966) indica el problema de la comprensin est por consiguiente,


ntimamente ligado a cmo se concibe el propio conocimiento matemtico. Los trminos y
expresiones matemticas denotan entidades abstractas cuya naturaleza y origen tenemos
que explicitar para poder elaborar una teora til y efectiva sobre qu entendemos para
comprender tales objetos.

Se deben proponer actividades que en forma progresiva origine la comprensin de la media


y las dems medidas de tendencia central, para ello debe centrarse en una representacin
semitica de los objetos abstractos que usamos actualmente para enfrentar la situacin en
donde los diferentes smbolos sean los representantes de cada uno de los datos que inter-
vienen en la solucin de la situacin.

As, simblicamente, se expresa la media como = (x1+ x2 ++ xn) / n


En donde los xi son los valores observados de la variable y n es el nmero total de datos.
La media presenta las siguientes propiedades, que se deben tener en cuenta al momento
de su interpretacin y solucin de la situacin segn el contexto:

a. Es un valor comprendido entre los extremos de la distribucin.


b. La suma de las desviaciones de los datos respecto a la media es cero.
c. El valor medio es influenciado por los valores de cada uno de los datos
d. La media no tiene que ser igual a uno de los valores de los datos.
e. El valor obtenido puede ser una fraccin. Esta propiedad debe entenderse y com-
prenderse ya que no tiene sentido segn el tipo de variable considerada, ocurre
cuando por ejemplo al realizar un estudio sobre una variable cuantitativa discreta
como el promedio de nmero de hijos por familia.
f. Hay que tener en cuenta los valores nulos en el clculo de ella.

62
Desde los conceptos y los procesos

g. La media es un representante de los datos a partir de los que ha sido calculada. Esta
propiedad es interesante en la medida que debe comprenderse el efecto que, sobre las
medidas de posicin central tiene un cambio en alguno o todos los datos.
h. Cuando aparecen valores extremos y pocos significativos la media puede no ser re-
presentativa.
i. No es posible calcularla si el carcter es cualitativo o cuando existen datos agrupados
con algn intervalo no acotado.
j. La media es el centro de gravedad de la distribucin y es nica para cada distribucin.

Actividades de aprestamiento

Actividad 1 Midiendo en tu institucin


Trabaja por parejas.
Uno de los compaeros, toma una distancia del patio de descanso con un metro, y la sea-
la como una recta (con tiza), la longitud la anota en un cuaderno, luego el otro compaero
estima la longitud (sin medirla). Se anotan en cada cuaderno las medidas y las diferencias
entre el valor estimado y el valor real de la medida.

Luego se realizan preguntas como las siguientes:


Crees que si repites el experimento varias veces, la medida estimada ser igualada o muy
aproximada a la real?.
Cuntas veces ser necesario realizar el experimento?.
Luego cambia con tu compaero, comparan cual de los dos obtiene mejores estimaciones.
Nota: Realiza esta experiencia con segmentos cortos dibujados en el cuaderno.

Actividad 2 Tiro al blanco


Este experimento se consigue en la pgina 26 del mdulo 1 Pensamiento Numrico, la va-
riacin consiste en lo siguiente:

4 jugadores.
Lanzar el objeto desde diferentes distancias 1m, 2m y 3m, 4m, 5m y se tiene en cuenta las
veces que cae en el centro.
Cada jugador realiza 6 lanzamientos.
A medida que realiza el juego, se van tomando los datos en un cuaderno de los registros
obtenidos.
De acuerdo con los resultados:
Cul de los dos jugadores es el ms acertado en cada una de las distancias?.
Cul es el mejor de todo el grupo?.
Crees que si practicas bastante, tiene mayor probabilidad de acertar en el centro?.

63
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Actividad 3
En una clase de 6 (IEAB14, 2004) algunos estudiantes miden con metro tradicional (metro cos-
turero) otros con metro de construccin y otros con una escuadra, un mismo pedazo de baldosa,
obteniendo los siguientes valores en centmetros: 21.3; 21.2; 21; 21.2; 21.4; 21.5; 21.3.

Cul sera la mejor estimacin de la medida del pedazo de baldosa?

Como puede verse, se obtienen diferentes valores debido posiblemente a la imperfeccin del
instrumento o quizs a la malicia del estudiante al realizar una comparacin con alguno de sus
compaeros y simplemente uno midi y los dems dieron datos aproximados. Para solucionar el
problema simplemente basta con sumar los valores y dividir por 6, obtenindose 21.28 cm.

Lo que se analiza en este sentido es que a partir de un conjunto de medidas conocidas, se


debe obtener una medida que es desconocida en presencia de errores. Cul es la razn que
nos lleva a concluir que el valor verdadero est mas cercano a una de las medidas?

Actividad 4
En una urbanizacin de un barrio, se desea estimar el nmero promedio de nios por fami-
lia. Se divide el nmero total de nios de la urbanizacin por 100 que es el nmero total de
familias) y se obtiene como resultado 1.4

De acuerdo con lo anterior se puede afirmar que:


a. La mitad de las familias de la urbanizacin tienen 2 nios o menos.
b. En la urbanizacin hay ms familias con 1 hijo que con 2 hijos.
c. El nmero ms comn de nios es 2.
d. En la urbanizacin hay 140 nios

Actividad 5
En el grado 6 (IEAB, 2004) los estudiantes resolvieron la siguiente situacin: Juan tiene
$1500, Pedro $ 500, Jos $300, Mara $700, Nelly $1800 y Andrs no tiene plata. Cmo re-
partir el dinero en forma equitativa?

En este ejercicio la mayora de los estudiantes sum y dividi por 5. Dieron varios argumen-
tos, uno y el principal era que a Andrs no le corresponda dinero pues no era injusto darle la
plata de los dems. En esta situacin se trata de repartir equitativamente (uniformemente)
por lo tanto es buena opcin la media aritmtica.

Actividad 6
En una bodega tienen 20 tanques con lquido, 12 contienen leche y el resto contienen agua,
la cantidad promedio de cada tanque con leche es 1200 lits y la cantidad promedio de cada
tanque con agua es de 400 lits. Cul es la cantidad promedio de lits de los 20 tanques?

_____________________________________________________

14
Institucin Educativa Andrs Bello, en la cual laboro.

64
Desde los conceptos y los procesos

Este ejercicio es resuelto de la siguiente manera en la mayora de los casos:


(1200+400)/2 =800 lits.
Ntese que esta situacin no puede resolverse por la media simple, sino que se debe ampliar
el concepto al de media ponderada, (1200x12 + 400x8)/20 =880 lits.

Conceptos y procedimientos
Para el siguiente bloque de actividades, es fundamental tener en cuenta el siguiente concepto:

Mediana
Es la medida que, una vez ordenados los valores de la variable en orden creciente y repeti-
dos tantas veces como indica su frecuencia, deja a su izquierda y derecha el mismo nmero
de observaciones, es decir, deja el 50% a su izquierda y el 50% de las observaciones a su
derecha, se representa por Me.

Este estadstico15, se refiere a todo el conjunto de datos, y no a ninguna de las observaciones


en particular, al respecto, Cobo y Batanero(2000) comentan decir que un colectivo tiene
una cierta tendencia o referirse a uno de sus resmenes estadsticos implica que el colectivo
es una coleccin de individuos idnticos que varan respecto a la propiedad de inters. La com-
prensin de dicho estadstico implicar tambin las de las variabilidad de los datos respecto
a su valor, se debe comprender que proporciona informacin global de la muestra.

Bajo esta perspectiva, se da un tratamiento al concepto de mediana para identificar la forma


en la cual debe calcularse algoritmicamente, requiere primero de su comprensin debido a las
dos formas de calcularla, ya que no siempre est en la posicin central, puede no coincidir con
alguna de las observaciones, as, para su clculo debe tenerse en cuenta cuando el nmero
de observaciones es par y cuando impar y el tipo de datos. Una caracterstica importante es
que la mediana es invariante si se disminuye una observacin inferior a ella o si se aumenta
una superior, adems este estadstico no contempla todos los valores de los datos.

GESTIN DE LA SITUACIN

Existe de pronto un poco de confusin del estudiante al tratar de ubicar la mediana en el


centro de los datos sin tener en cuenta que debe ordenarse para ubicar el punto medio de
la distribucin, por lo que de alguna manera interioriza el concepto, pero no lo comprende
debido a que olvidan a qu secuencia numrica se refiere dicho valor.

Actividad 7
Considerando el nmero de hijos de un grupo de familias, se han obtenido los siguientes
valores: 2, 0, 2, 4, 4 , 6, 6, 4, 6, 7, 4, 4, 7, 4, 2, 0, 4, 6, 7, 7

Cual estadstico convendra aplicar: la media o la mediana, como justificara la escogencia?

_____________________________________________________

15
Hablamos de estadstico para referirnos a muestras y parmetros para poblaciones.

65
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Actividad 8
En la siguiente serie numrica, 2, 2.5, 3, 3.25, 4, 5, 6.5, 7.5, 50. Cual estadstico es ms
representativo?

Actividad 9
Un vendedor ambulante de confites, de lunes a sbado, vende las siguientes cantidades
en unidades:

a. 110, 120, 130, 120, 130, 130


b. 110, 120, 128, 140, 130, 100
c. 80, 72, 96, 70, 70, 100

Cul es el estadstico ms representativo en caso de promediar las ventas?.


Si los confites los vende a 2 por $ 100, cul seria el promedio de las ventas?.
En este caso la media sera mejor representante que el promedio?

Ahora veremos cmo calcular la mediana, ya que como se dijo depende del tipo de datos,
de la forma de presentacin y del nmero de datos que interviene.

2.1.2.1. Datos no tabulados

Esta forma de clculo se tuvo en cuenta en la solucin de las situaciones anteriores, depen-
diendo si el nmero de datos es par o impar, para el caso de impares, la observacin obtenida
ocupa el centro, teniendo presente que se han ordenado creciente o decrecientemente.

En el caso que el nmero de valores es par, la mediana corresponde a la media aritmtica


de los valores que se ubican en el centro, es en este caso donde este estadstico no coincide
con ninguno de los valores, a menos que los valores centrales sean iguales.

2.1.2.2. Datos tabulados

Veremos ahora lo que sucede si los valores se encuentran en una tabla de frecuencias, en
tal caso es til hallar las frecuencias acumuladas, esto nos permite realizar un diagrama de
frecuencias absolutas acumuladas, siendo n/2 la ordenada correspondiente a la mediana y
con n como el nmero de datos. Aqu se presentan algunos inconvenientes debido al tipo
de variable si es continua o discreta. Si se trabaja con las frecuencias relativas acumuladas,
en la representacin grfica la ordenada correspondiente a es el valor correspondiente
a la mediana.

Ejemplo:
En un sondeo de opinin sobre como est planteando el seleccionador de Brasil los partidos
de ftbol de preparacin para el prximo mundial, se obtuvo los siguientes datos:

66
Desde los conceptos y los procesos

Opinin fi hi % Fi Hi
1.Totalmente de
20 0,392 39,2% 20 39,2%
acuerdo
2.De acuerdo 10 0,196 19,61% 30 58,82%
3.Indiferente 8 0,157 15,69% 38 74,51%
4.En desacuerdo 6 0,118 11,76% 44 86,27%
5.Totalmente en
7 0,137 13,73% 51 100,00%
desacuerdo
Total 51 1,000 100,0%

Veamos las grficas acumuladas tanto para frecuencias, como para porcentajes:

Fig 1 (Frecuencias acumuladas) Fig 2 (Porcentajes)

La modalidad que corresponde al 50% indica que el 50% o ms de la poblacin estn de


acuerdo con el seleccionador.

Observe que en este caso ningn valor xi corresponde en la fig1 a una frecuencia relativa
acumulada donde F(x)=n /2, para este caso 26, igual ocurre en el anlisis del porcentaje
acumulado en la fig2. Por lo tanto se analiza que el valor de la mediana es tal que:

F(xi-0) < < F(xi+0), es decir, tal que n1+ n2+ni-1< n/2 < n1+ n2++ni

Observe que el valor corresponde al salto que tiene la grfica en la distribucin para uno
de los valores de la variable, ello se debe a que todos los valores comprendidos entre ni-1 y
ni son iguales a xi, y uno de ellos ocupa exactamente la posicin n/2.

Ahora variemos el problema y demos la situacin en la cual el nmero de datos es par:F(x) = n/2,
la mediana est indeterminada entre los valores xi y xi+1, ya que cualesquiera de los valores
de x incluidos en el intervalo (xi,xi+1) cumple la definicin de mediana.

67
Mdulo
5 Pensamiento aleatorio y sistemas de datos

2.1.2.3. Clculo para datos agrupados

Se tiene en cuenta la aplicacin del modelo:

Xmed = Li +

Li, es el lmite inferior que contiene a los datos de frecuencias acumuladas.


Fmed-1 es la frecuencia acumulada anterior en donde est la mediana.
A es la amplitud de cada intervalo.
Fme es la frecuencia en donde se ubica el Li.

En el trabajo con datos agrupados (trabajo por intervalos), prcticamente se debe tomar los
modelos (llamados frmulas) funcionales y tener algunas propiedades en cuenta respecto de
cada medida de tendencia central, por ejemplo, la mediana es la nica medida central que hace
mnima la suma de todas las desviaciones absolutas, siendo adems en la representacin grfica
el valor que divide la vertical del histograma en dos partes de reas de igual medida. Para la
moda se debe tener en cuenta su utilizacin se realiza tanto como para variables cualitativas
y cuantitativas. Cuando se calculan estas dos medidas, no influyen los valores extremos, como
si ocurre con la media, por lo cual es poca representativa en estos casos, otra propiedad es que
no usan toda la informacin posible y adems, sus clculos son slo aproximaciones.

La moda
Si se tiene en anlisis una variable cualitativa, la media no se puede calcular, por lo tanto
es de vital importancia en la descripcin del grupo de datos el uso de la moda, el cual es
el valor de la variable que tiene mayor frecuencia. Adems, sta no es nica siempre, cada
moda corresponde a un mximo local de la distribucin de frecuencias, se enfatiza que en la
moda lo importante son las frecuencias y no el valor de la variable. Se representa por Mo.

Algunas distribuciones presentan dos valores para la moda, esto es poco comn en el tra-
bajo experimental, en otras ocasiones, si se presenta significa que los datos provienen de
dos distribuciones diferentes. Por ejemplo, si dos mquinas que producen un mismo artculo
trabajan promedios diferentes bastante alejados entre s y se desea reunir la produccin
total, la distribucin de frecuencias resultante sera de tipo binomial.

2.1.3.1. Clculo para datos sin agrupar

El nico estadstico que se puede utilizar en presencia de variables nominales es la moda,


que como su nombre indica, es el valor-categora que ms se presenta. La moda es el valor
que corresponde al mximo del diagrama diferencial (diagrama de barras o histograma).

En la siguiente figura (Fig3), correspondiente al ejemplo del seleccionador del equipo brasi-
leo, se muestra la moda, indicando estar totalmente de acuerdo con l.

68
Desde los conceptos y los procesos

Fig3

2.1.3.1. Clculo para datos agrupados

Xmo = Li + donde Li es el lmite inferior que contiene la mayor frecuencia

absoluta, d1 es la diferencia entre la mxima frecuencia y la anterior; d2 es la diferencia entre


la mxima frecuencia y la siguiente.

2.2. Relacin entre Media, Mediana y Moda

La moda es la abscisa correspondiente al punto mximo de la curva. La mediana, por su parte es


la abscisa del eje que divide la curva en dos partes de igual rea. La media es la abscisa corres-
pondiente al centro de gravedad de la curva debajo de la cual se asume una masa uniforme.

2.3. Medidas de posicin (orden):

Indican la posicin relativa que ocupa una observacin en una distribucin de frecuencias.
Son tambin llamados cuantiles, y son valores o estadsticos de orden que dividen a la
distribucin en partes iguales, es decir, en intervalos que comprenden el mismo nmero
de observaciones. Al ordenar los datos, se llama cuantil de orden q en el cual 0 < q < 1, y
se representa por xq, al valor de la variable que est por debajo de l (la proporcin r de
los valores observados). Por ejemplo la mediana, es el cuantil 0.5, puesto que la mitad del
conjunto de datos es menor que o igual a este valor. La razn anterior permite comparar los
cuantiles con los porcentajes, as, podemos decir que en una distribucin cualquiera, 50%
de los datos estn en el cuantil 0.5 o por debajo de l.

Dentro de estos estadsticos tenemos:

2.3.1. Cuartiles
Son tres valores de la variable, que dividen al conjunto de observaciones en cuatro grupos
iguales, en donde en cada grupo se halla el 25% de la poblacin. Este concepto favorece en

69
Mdulo
5 Pensamiento aleatorio y sistemas de datos

gran medida la comprensin y significado del diagrama de cajas. Los Cuartiles se representan
por: Q1, Q2 y Q3 que representan el primer, segundo y tercer cuartil respectivamente.

2.3.1.1. Primer cuartil (Q1)


Considera el 25% de la informacin a su izquierda y el 75% a la derecha, es decir, es el valor de la
variable que supera al 25% de las observaciones y a la vez, es superado por el restante 75%.

2.3.1.2 Segundo cuartil (Q2)


Considera el 50% de la informacin tanto a la derecha como a la izquierda, este coincide
con la mediana, este valor de la variable supera al 50% de las observaciones y a la vez, es
superado por el otro 50%.

2.3.1.3. Tercer cuartil (Q3)


Considera el 75% de la informacin a la izquierda y el 75% a la derecha, es el valor de la va-
riable que supera al 75% de las observaciones, pero es superado por el 25% restante de las
observaciones.

Ejemplo:
Puede resultar de inters conocer qu porcentaje de automviles sobrepasa el estndar de
emisiones de gases que es aceptable segn la legislacin vigente. Ya no se trata en este
ejemplo de describir el centro de un conjunto de datos, se hace necesario ser ms especfico.
Es probable que la emisin de gases promedio de un conjunto de automviles est dentro
de la norma. Pero, es aceptable que el 25% de ellos no la cumpla?

Otro ejemplo
Se podra dividir el grupo de estudiantes en cuatro categoras: A, B, C y D. Pues supongamos
se asignan tres tipos de becas a los estudiantes, de la siguiente forma. Al 25% que obtenga
mejores notas (categora A para ms excelentes) se le da una beca por 5 aos. Al 25% que
le sigue en calificaciones (categora B ms sobresalientes) se le otorga una beca por 3 aos.
Al 25% siguiente (categora C entre sobresalientes y aceptables) una beca por 1 ao y al 25%
restante (categora D) no se le otorga ninguna beca.

Esto indica por ejemplo, que en una clase de 20 estudiantes que estn ordenados por ca-
lificaciones en forma descendente (si las aceptamos cualitativamente) de: Excelente a
Deficiente se becan por 5 aos, del 6 al 10 se becan por 3 aos, del 11 al 15 se becan por 1
ao, y del 16 al 20 no reciben beca.

Adems, si deseramos conocer que oportunidad tenemos de obtener una beca. Podramos
tomar un grupo de notas o datos, de forma aleatoria entre todas las notas de la institucin,
esto representara una muestra. Luego se determina cuales son las calificaciones que es-
tablecen a qu categora pertenece el estudiante. Esto es equivalente a calcular cada uno
de los cuartiles (primer, segundo y tercer cuartil), que no es otra forma, que los valores
correspondientes a la escala de calificaciones, en las cuales se producen los cambios para

70
Desde los conceptos y los procesos

cada categora. Es decir, el tercer cuartil representa la calificacin a partir de la cul estn
ubicados el 25% de los estudiantes de categora A, el segundo cuartil (la mediana) es igual
a la calificacin en la cual hay 50 % de los estudiantes por encima y 50% por debajo, los que
estn entre el segundo y el tercer cuartil son el 25% de estudiantes categora B. Y el primer
cuartil representa la calificacin por debajo de la cual hay 25% de estudiantes categora D,
adems los que estn entre el primer cuartil y el segundo son el 25% categora C.
Esto puede de una forma ms sencilla permitirle tambin tener una buena idea de que opor-
tunidad tiene de obtener una determinada beca dentro de este curso.

2.3.2. Desviacin Intercuartil:

Esta medida de dispersin se construye basndose en la diferencia entre el tercer y primer


cuartil. En realidad es la mitad de esa diferencia.

Desv. Inter. = Q3 Q1

Este estadstico cumple una funcin similar a la desviacin estndar, pero es mucho ms
resistente al efecto de valores extremos en los datos. De hecho, los cuartiles primero y tercero
dejan entre s la mitad de la muestra, La otra mitad se encuentra fuera y por lo tanto la presen-
cia de un bajo nmero de datos extremos no cambia el valor de la desviacin intercuartil.

2.3.3. Deciles

Son 9 valores que dividen a la distribucin en 10 partes iguales, cada una de las cuales contiene
el 10% de las distribuciones. Se representan por D1, D2,D9. Si N es el tamao de la poblacin,
el decil k-simo deja a su izquierda (k.N)/10 observaciones y a su derecha (10-k).N/10.

2.3.4. Percentiles

Son 99 valores de la variable que dividen a los datos en 100 partes iguales. Se representan
por Pk, donde k indica el porcentaje de datos que quedan a su izquierda, es decir, Pk = Xi
indica la puntuacin porcentual acumulada k.

2.3.5. Clculos para datos sin agrupar

El clculo de las medidas de posicn, debe realizarse mediante el uso de los grficos de
cajn, o en su defecto utilizando los modelos o funciones expuestas a continuacin:

2.3.5.1. Cuartiles

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza:

El primer cuartil:

Cuando n es par:

71
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Cuando n es impar:

Para el tercer cuartil

Cuando n es par:

Cuando n es impar:

2.3.5.2. Deciles

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
funciones:

Cuando n es par:

Cuando n es impar:

Siendo k, el nmero del decil.

2.3.5.3. Percentiles

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
funciones:

Para los percentiles, cuando n es par:

Cuando n es impar:

Siendo k, el nmero del percentil.

Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el per-
centil 50 y el tercer cuartil con el percentil 75.

72
Desde los conceptos y los procesos

2.3.6. Clculos para datos agrupados

2.3.6.1. Cuartiles

Calculamos Q1 para datos agrupados mediante el uso del siguiente modelo:

Q1= Li + ; en donde, Fa es la frecuencia acumulada anterior a la que

contiene a Q1 ; fQ1 es la frecuencia en el intervalo que contiene a Q1

La interpretacin es similar a la anterior

2.3.6.2. Deciles

D3 = Li + La interpretacin se realiza similar a los cuartiles

D7 = Li +

2.3.6.3. Percentiles

De forma similar que en los anteriores estadsticos, se realiza la interpretacin.

P70 =Li +

P30 =Li +

Nota: Se aconseja utilizar estos estadsticos para variables continuas, cuando la distribucin
contiene un nmero grande de intervalos y se requiere examinar una parte de la distribucin
que presenta una caracterstica espacial a ser estudiada.

73
Mdulo
5 Pensamiento aleatorio y sistemas de datos

2.4. Medidas de dispersin (variabilidad)

Se refieren a la extensin de los datos en una distribucin, es decir, el grado en que las
observaciones se distribuyen. Ella nos proporciona informacin adicional para juzgar la
confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente
dispersos, la posicin central es la menos recomendable o representativa, como un todo, que
cuando stos se agrupan ms estrechamente alrededor de la media. Si la dispersin es cero,
indica ausencia de dispersin.

Veamos mediante un ejemplo lo expuesto anteriormente, comparando dos muestras hipot-


ticas: 20, 40, 120 con 56, 58, 66

Si calculamos la media de ambas muestras obtenemos:

1= ( 20+ 40+ 120)/3 =60

2= (56 + 58+66)/3 =60

Observe que ambas muestras tienen el mismo tamao 3 e igual promedio 60, pero existe
una diferencia fundamental entre ellas, porque los valores de la primera se encuentran mas
separados unos de otros (y, por lo tanto, tambin del valor medio) que los valores de la se-
gunda muestra, por lo anterior se hace necesario el estudio de medidas de variabilidad que
permitan diferenciar muestras como las anteriores.

Fig 4 Fig 5

En los grficos, se ve claramente que en la Fig5 los datos estn mas cerca de 60 (el promedio)
que en la Fig4, lo cual indica que hay mayor dispersin con respecto a la media en la Fig4.

En Economa, por ejemplo, ganancias ampliamente dispersas son indicio de un mayor riesgo
para los accionistas (debido a los niveles extremos, tanto positivos como negativos), que en
el caso en que los niveles de dispersin de las ganancias permanecen relativamente esta-

74
Desde los conceptos y los procesos

bles. En medicina es preocupante una droga cuya pureza promedio es buena, pero que oscila
desde muy pura hasta altamente impura, ya que es riesgosa para la vida humana.

2.4.1. El rango o recorrido

Una manera de medir la variacin en un conjunto de valores es calculando el recorrido. El re-


corrido es la ms sencilla y directa de las medidas de dispersin, y a la vez la menos confiable
de las medidas de variacin. Se trata simplemente de la distancia entre el valor menor y el
valor mayor en un conjunto de observaciones. El hecho de que slo tome en consideracin
dos valores, hace que la medida sea muy pobre. Ntese que si hay un valor extremo en la
distribucin, se tendr la impresin de que la dispersin es grande cuando, en realidad, si
hiciramos caso omiso de esa calificacin, podramos encontrar que dicha distribucin es,
por el contrario, una distribucin compacta. El recorrido refleja nicamente las dos cali-
ficaciones extremas de la distribucin, es decir, solamente dos puntuaciones exactas de un
grupo son las que lo determinan, ignorando todas las dems puntuaciones. El recorrido no
puede darnos una idea precisa con respecto a la dispersin y, en el mejor de los casos, debe
considerarse slo como un ndice preliminar o muy aproximado.

2.4.2. Varianza

Dado un conjunto de datos, una forma de medir su variabilidad consiste en calcular las dife-
rencias de cada dato respecto del centro de los datos representado por su promedio. Como
las diferencias tienen signos negativos o positivos, segn el dato sea menor o mayor que
el promedio, la simple suma de las diferencias no sirve por los valores que se compensan.
Tanto es as, que la suma de estas diferencias es siempre cero. Al usar la varianza muestral,
debe notarse que los resultados obtenidos no estn en la misma unidad de medida que los
datos originales:

2 = Aqu N representa el tamao de la poblacin, fi la frecuencia

de cada una de las clases. la media; xi el punto medio de la clase.

Nota: La anterior simbolizacin (frmula matemtica) se usa para poblaciones, en caso de


tener muestras, se divide por (n-1) y se representa por S2, siendo n el nmero de observa-
ciones de la muestra.

Si los datos son sin agrupar se toman las siguientes modelaciones:

_
2 = con como media ; N tamao de la poblacin, x la observacin

o elemento observado.

75
Mdulo
5 Pensamiento aleatorio y sistemas de datos

2.4.3. La desviacin estndar (S o )

Dependiendo si es para una muestra o para una poblacin es la medida de dispersin ms


adecuada para la estadstica descriptiva. Tanto en la escalas de intervalo como en las de
razones, la varianza y la desviacin estndar son las mejores medidas de dispersin. Toman
en consideracin todos los puntajes y controlan por el efecto de valores extremos. La des-
viacin permite una interpretacin precisa de las calificaciones dentro de una distribucin.
Si todos los sujetos son iguales en una caracterstica (por ejemplo, rendimiento acadmico),
entonces el resultado ser igual a cero. Por el contrario, si aumentan las diferencias, aumen-
tar el rendimiento (ndice), alejndose ms y ms del punto cero.

Se define matemticamente como: la raz cuadrada positiva de la varianza.

Lo anterior se simboliza:

= (Para poblacin y con datos agrupados)

La desviacin ser pues =

Levin et. al. (1996. Pg.119) dicen respecto a la desviacin estndar

nos permite determinar, con un buen grado de precisin, dnde estn localiza-
dos los valores de una distribucin con relacin a la media. Podemos hacer esto
de acuerdo con un teorema establecido por el matemtico ruso P.L. Chebyshev
(1821-18949). El teorema de Chebyshev dice que no importa qu forma tenga la
distribucin, al menos 75% de los valores caen dentro de 2 desviaciones estn-
dar a partir de la media de la distribucin, y al menos 89% de los valores caen 3
desviaciones estndar a partir de la media

La cita anterior permite medir con ms precisin el porcentaje de observaciones que caen
dentro de un alcance especfico de las curvas simtricas con una forma de campana (distri-
bucin normal).

Figura 6

76
Desde los conceptos y los procesos

Observe que el 68% de los datos caen dentro de 1 desviacin a partir de la media
El 95% de los valores est dentro de 2 desviaciones a partir de la media.

Aproximadamente el 99% estar en el intervalo que va desde 3 desviaciones por debajo de


la media hasta 3 desviaciones por encima de la media.

Lo anterior nos permite utilizar un modelo para ver estos resultados, que se calculan as:

Resultado estndar de la poblacin =

Resultado estndar de la muestra =

Consideremos la interpretacin en pruebas saber para obtener una mejor idea de lo ante-
riormente expuesto:

Anlisis por puntaje promedio y desviacin estndar16


El puntaje promedio indica el comportamiento global de los estudiantes a nivel individual, ins-
titucional, municipal, departamental o nacional. Este puntaje da cuenta del desempeo general
en relacin con los diferentes niveles de dificultad que existen en la prueba. En cada una de las
pruebas, y por cada grado (5 y 9), el puntaje flucta entre 0 y 100 puntos aproximadamente.

Por su parte, la medida de la dispersin o desviacin estndar refleja qu tan homogneos


o heterogneos son los resultados, es decir, informa si los puntajes individuales obtenidos
por las y los estudiantes son similares entre s o, por el contrario, hay algunos estudiantes
con puntajes muy altos y otros con puntajes muy bajos.

Se espera entonces que el promedio sea alto, es decir, que tienda a 100 y que la desviacin
estndar sea baja, es decir, tienda a 0.

En este tipo de resultados podemos obtener cuatro posibilidades de anlisis de acuerdo con
la relacin entre puntaje promedio y desviacin estndar:

1. Cuando el puntaje promedio de la institucin es mayor o superior al del grupo de


referencia (municipio, departamento o pas), pero su desviacin estndar es menor
o inferior a la de dichos grupos de referencia. Ello significa que el puntaje promedio
obtenido por la institucin super al de dicho grupo de referencia, y que el desem-
peo de los estudiantes en las pruebas fue homogneo. Es decir, la mayora de los
estudiantes tuvieron mejores desempeos que los del grupo de referencia: Este es
un resultado deseable en trminos de calidad, al que toda institucin debe aspirar
mediante la realizacin de planes de mejoramiento.

_____________________________________________________

16
http//www.colombiaaprende.edu.co .Tomado del MEN. Anlisis de Pruebas saber.

77
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Fig7 Puntaje promedio superior y desviacin estndar inferior

2. Cuando el puntaje promedio y su desviacin estndar son mayores o superiores a los


del grupo de referencia (municipio, departamento o pas). Ello significa que algunos
de sus estudiantes obtuvieron puntaje promedio muy alto, pero hay otros estudiantes
de la misma institucin que obtuvieron resultados muy bajos.

Fig8 Puntaje promedio y desviacin estndar superiores

3. Cuando el puntaje promedio y su desviacin estndar son menores o inferiores (lo


contrario del caso anterior) a los del grupo de referencia (municipio, departamento o
pas). Ello significa que los estudiantes de la institucin en su mayora tiene niveles
en el desarrollo de competencias inferiores a los del grupo de referencia.

78
Desde los conceptos y los procesos

Fig9 Puntaje promedio y desviacin estndar inferiores

4. Cuando el puntaje promedio es menor o inferior al del grupo de referencia (municipio,


departamento o pas), pero la desviacin estndar es superior a la de dicho grupo de
referencia. Ello significa que la media de la institucin estuvo por debajo de la media
de dicho grupo de referencia y que los resultados presentan alta dispersin; en otras
palabras, en la institucin la mayora de los estudiantes presentan desempeos bajos,
pero dentro de ellos hay quienes presentan desempeos supremamente bajos.

Fig10 Puntaje promedio inferior y desviacin estndar superior

2.4.4. Coeficiente de variacin

La desviacin estndar S o es til como medida de la variacin dentro de un conjunto de


datos. Ms an, si las medias son iguales se pueden comparar directamente las dos S. Sin

79
Mdulo
5 Pensamiento aleatorio y sistemas de datos

embargo, cuando se desea comparar la dispersin en dos conjuntos de datos, comparar las S
puede conducir a resultados sin sentido, si las medias difieren o si las unidades de medicin
son diferentes. Esto es as, puesto que cada S se obtiene a partir de la media particular que
corresponde a cada conjunto.

Lo que se necesita en situaciones como sta es una medida de variacin relativa, en lugar
de una variacin absoluta. La medida que nos puede resolver este problema es el coeficiente
de variacin (C.V.), llamado de Pearson, que es la relacin entre la S y la media aritmtica.
Se multiplica adems por 100, para considerar el resultado en forma de porcentaje. A mayor
porcentaje, mayor es la variacin y viceversa.

CV = para la poblacin

CV = para la muestra

Para realizar un buen anlisis, de stas medidas, antes veamos un concepto importante que tiene
que ver con la forma en que se dispersan los datos, lo cual nos conllevar a realizar anlisis en
la forma correcta donde se debe tomar una medida de posicin acorde al contexto de trabajo.

2.5. Medidas de asimetra

2.5.1. Comprensin del concepto bsico de simetra

En el anlisis de datos se aplica a las distribuciones que cumplen con la siguiente carac-
terstica: definido un centro (media, mediana u otra) las dos mitades resultantes se corres-
ponden la una con la otra.

La importancia radica en que si una distribucin es totalmente simtrica, posee ciertas ca-
ractersticas peculiares, como la coincidencia de las medidas de tendencia central o como
requerir menos funciones muestrales para el anlisis de la distribucin, al respecto Vicente
Manzano y Ana Duran (2001. vol17) comentan:cualesquiera dos valores equidistantes al
centro cuentan tambin con la misma frecuencia (y, por lo tanto, con la misma frecuencia
acumulada con respecto al mismo centro)

As, debe tenerse en cuenta que la simetra es una dispersin, en la cual si es equitativa con
respecto a un centro, la distribucin es simtrica, si es diferente a un lado, la distribucin
es asimtrica. Se tiene diferentes tipo de medida de simetra, lo cual al operara sobre las
diferencias de los datos respecto a la media, se tienen los llamados momentos as: El primer
momento se anula, el segundo corresponde a la varianza y no distingue el sentido de la dis-

80
Desde los conceptos y los procesos

persin, el tercer momento seala la importancia de la dispersin ya que indica el sentido y


adems, por ser una tercera potencia conserva invariantes los signos originales, con lo que
es sensible al sentido de la dispersin.

Mientras mas dispersos estn los datos, mas se incrementa el valor del tercer momento, sin
querer indicar que es una causa para una mayor simetra.

Las siguientes grficas nos dan idea de la asimetra:

Fig 11 Distribucin Simtrica

2.5.2. Distribucin simtrica: existe la misma concentracin de valores a la derecha y a la


izquierda de la media)

Fig 12 Distribucin de Asimetra a derecha

2.5.3. Distribucin asimtrica positiva: existe mayor concentracin de valores a la derecha


de la media que a su izquierda

81
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Fig 13 Distribucin de Asimetra a izquierda

2.5.4. Distribucin asimtrica negativa: existe mayor concentracin de valores a la izquierda


de la media que a su derecha

2.5.5. Coeficiente de Asimetra de Fisher

Sirve medir el nivel de asimetra, que viene dado por

Para el anlisis se tiene en cuenta que xm es la media, ni es la frecuencia, n el nmero de


observaciones.

Los resultados pueden ser los siguientes:


g 1 = 0 (distribucin simtrica; existe la misma concentracin de valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribucin asimtrica positiva; existe mayor concentracin de valores a la derecha
de la media que a su izquierda)
g1 < 0 (distribucin asimtrica negativa; existe mayor concentracin de valores a la izquierda
de la media que a su derecha)

2.6. Medidadas de Curtosis

La curtosis es una medida relacionada con la forma de la curva de frecuencias.


2.6.1. Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de
los valores centrales de la variable (el mismo que presenta una distribucin normal).

2.6.2. Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de


los valores centrales de la variable.

82
Desde los conceptos y los procesos

2.6.3. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de


los valores centrales de la variable.

Fig14

Curtosis
El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores al-
rededor de la zona central de la distribucin.

El Coeficiente de Curtosis viene definido por el siguiente modelo (frmula algebraica):

Los resultados pueden ser los siguientes:

g 2 = 0 (distribucin mesocrtica) .
g2 > 0(distribucin leptocrtica ).
g2 < 0 (distribucin platicrtica) .

GESTIN DE LA SITUACIN

Las actividades propuestas, deben realizarse en parejas para discutir algunos conceptos
importantes y sobre todo los que estn relacionados con los cuantiles debido a que al utilizar
las formas funcionales se pueden presentar algunas incoherencias respecto a las interpreta-
ciones, caso tal en que el educador debe intervenir y aclarar cada aspecto.

Actividad 10

Tomemos un dado y lo lanzamos 30 veces, anotamos las frecuencias en la siguiente tabla y


la completamos:

83
Mdulo
5 Pensamiento aleatorio y sistemas de datos

xi ni Ni hi Hi
1
2
3
4
5
6
total

Situaciones para reflexionar:


El punto 3 a qu percentil equivale?
Qu nos indica lo anterior?
La mediana en qu puntuacin estar?
Qu decil corresponde al puntaje 4?
Cuntos superan la puntuacin 4?
Qu puntuacin es superada por el 25%?
A qu porcentaje corresponde la moda?
Cual ser la medida de posicin ms representativa para esta situacin y cmo la analizas?

Actividad 11: pesando papitas

Material:
Una balanza muy buena (gramera) sensible.
En el grupo cada estudiante trae un paquete de papitas de la misma marca y del mismo
sabor.
Marcadores
Cinta de enmascarar

Instrucciones
Los paquetes se marcan con un nmero en forma ascendente con la cinta de enmascarar.
Se anota el peso neto de cada paquete de papita.
En la balanza se pesa el paquete y se anota en el cuaderno, esto lo realiza cada uno de los
estudiantes.
Luego se destapan las papas y se pesan sin el papel.
Los estudiantes intercambian los datos.
Se realizan dos tablas, una con el peso de las papas con papel, la otra sin el papel.
Para cada tabla halle: promedio. Compare cada uno de los resultados con el valor neto. Que
le dice esta diferencia?

84
Desde los conceptos y los procesos

Ahora realice un grfico de frecuencias acumuladas por cada tabla y realice una comparacin
y analice cual presenta mayor dispersin respecto al promedio.
Que le recomiendas a los productores de las papitas?
NOTA: si el grupo es demasiado grande, se le recomienda colocar 8 u 10 valores nicamente
y as trabajar cada tabla. (Esto no es agrupar en intervalos).

Actividad resuelta (Anlisis)

Prueba de Aptitud Acadmica.


En la tabla siguiente se tiene los puntajes obtenidos en la Prueba de Aptitud Acadmica por
30 jvenes, provenientes de un mismo establecimiento educacional:

En esta actividad, se quiere calcular (aunque no es nuestro objetivo en el mdulo) a partir


de la modelacin (utilizar frmulas) las diferentes medidas de posicin y las de variacin,
para realizar anlisis, que debe tenerse en cuenta en las investigaciones que realizan los
estudiantes en las otras asignaturas, se recalca el hecho que es de formacin mecnica
antes que de formulacin como situacin problmica. Sin embargo el siguiente estndar,
nos permite estar dentro del pensamiento aleatorio y sistemas de dato:

Resolver y formular problemas seleccionando informacin relevante en conjuntos de


datos provenientes de fuentes diversas (prensa, revistas, televisin, experimentos, con-
sultas, entrevistas).

Aptitud Aptitud
Aptitud Verbal Aptitud Verbal
Matemtica Matemtica
1 685 664 16 730 642
2 490 548 17 618 533
3 580 567 18 690 654
4 705 665 19 680 542
5 470 452 20 690 678
6 620 506 21 710 732
7 650 618 22 742 749
8 702 718 23 685 570
9 643 621 24 595 574
10 540 555 25 674 657
11 575 502 26 722 747
12 600 531 27 585 620
13 500 478 28 505 482
14 680 558 29 600 643
15 587 600 30 543 500

85
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Para tabulacin del problema, se realizaron los clculos con el programa Excel.

Datos de aptitud verbal.

Intervalo fi Xi hi Fi Hi Xi*fi Xi - (Xi - )2*fi


470 1 489,5 0,033 1 0,033 489,5 -171,6 29446,56
509 3 528,5 0,100 4 0,133 1585,5 -132,6 52748,28
548 2 567,5 0,067 6 0,200 1135 -93,6 17521,92
587 4 606,5 0,133 10 0,333 2426 -54,6 11924,64
626 5 645,5 0,167 15 0,500 3227,5 -15,6 1216,8
665 2 684,5 0,067 17 0,567 1369 23,4 1095,12
704 8 723,5 0,267 25 0,833 5788 62,4 31150,08
743 5 762,5 0,167 30 1,000 3812,5 101,4 51409,8
Total 30 1 19833 196513,2

Ahora hallemos el promedio

= = 661.1

Lo anterior indica que en promedio la aptitud verbal de los estudiantes es de 661.1 puntos.

Fig15

Mediana (Xmed).
Hallamos primero a n/2 as: 30/2=15. El siguiente modelo nos permite hallar la mediana
para datos agrupados.

86
Desde los conceptos y los procesos

Xmed = Li +

Ahora se ubica el Li , que es el lmite inferior que contiene a 15 dentro de los datos de fre-
cuencias acumuladas, para nuestro caso es 587

Fmed-1 es la frecuencia acumulada anterior en donde est la mediana, en nuestro caso es


10, la A es la amplitud de cada intervalo aqu es 509 470 = 39 y fmed es la frecuencia en
donde se ubica el Li en este ejemplo es 5.

Xmed= 587 +(15 10)*39/5 = 626.

Lo cual indica que el 50% de los estudiantes poseen una aptitud verbal de 626 puntos o ms.

Moda (Xmo).
Mediante el siguiente modelo se halla la moda para datos agrupados:

Xmo = Li + La mxima frecuencia se encuentra en fi = 8, luego Li = 665

d1 = 8-2 = 6; d2 = 8 - 5 = 3

Xmo = 665 + = 691

Esto nos indica que el puntaje ms frecuente en aptitud verbal es de 6914 puntos, lo cual
indica que no es una medida representativa para este ejemplo.

Al comparar la mediana con el promedio, nos damos cuenta que existe una diferencia, as,
661.1 626 = 35.1, cual indica la existencia de un sesgo en los datos, lo cual se aprecia en
la asimetra de la Fig15.

Cuartiles
Calculamos Q1 para datos agrupados mediante el uso del siguiente modelo:

Q1= Li +

Veamos: hallemos n/4; 30/4= 7,5 que se ubica en Fi = 10, as Li = 548, Fa = 6, fQ1=4

87
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Q1 = 548 + = 562,62

Indica que el 25% de los estudiantes obtuvo un puntaje en aptitud verbal de menos de 562,62
puntos, o tambin puede interpretarse como el 75% de los estudiantes obtuvo un puntaje en
aptitud verbal superior a 562,62 puntos.

Es de vital importancia hacer la acotacin para los Cuartiles de la siguiente manera: si se


desea hallar el cuartil 3, el modelo cambia a 3n/4, si se desea hallar el cuartil dos el modelo
se cambia por 2n/4, lo que indica obtener el 50% o media de las observaciones.

Tambin si los datos no estn agrupados, el modelo cambia as:

Q1 = a medida que se va hallando un cuartil distinto, se cambia en el modelo


2n/4 etc.

Deciles

D3 = Li +

Hallemos 3n/10 = 90/10=9; esta frecuencia se encuentra en Li = 548, Fa = 6; fD3=4

D3 = 548 + = 577,25

Nos indica que el 30% de los estudiantes obtuvo un puntaje de 577,25 o menos en aptitud
verbal.

De acuerdo al decil que se va a hallar, se cambia en el modelo, por ejemplo si se va a hallar


el decil 7, se coloca 7n/10 y as sucesivamente.

Percentiles

P70 =Li + , se trabaja de forma similar a las anteriores

Hallemos 70n/100 = 2100/100= 21, lo que indica que Li =665, Fa =17, fp70=8

P70 =665+ = 684,5

88
Desde los conceptos y los procesos

Lo que indica que el 70% de los estudiantes obtuvieron un puntaje en aptitud verbal de 684.5
o menos.

Para datos sin agrupar, se tiene en cuenta el siguiente modelo:

P60 = , se tienen en cuenta las variaciones de las que se ha venido hablando,

para P85 se cambia 85n/100.

Veamos las medidas de dispersin


Para la desviacin tpica

S =

S = = 26,032

Esto indica que la desviacin con respecto a la media es de 26.032 puntos.

Es en esta parte se utiliza el teorema de Chebyshev para analizar su importancia, como sabe-
mos que el promedio de puntaje en aptitud verbal de los estudiantes es de 661.1 se tiene:

661.1-2(26.032) = 608.46
661.1+2(26.032) = 713,16

Esto significa que el 75% de los datos es decir 30*0.75 = 22.5 de los datos se encuentran
entre 608.46 y 713.16 puntos.

Hallemos ahora el coeficiente de variacin, ste permite comparar varios conjuntos de datos
expresados en diferentes unidades, o en las mismas unidades pero con distinto orden de
magnitud. Se expresa en porcentaje.

CV = = 0.0393 = 3.93% de variacin absoluta con respecto a la media.

El dato anterior permite realizar una comparacin con los estudiantes para la aptitud mate-
mtica, indicando donde se obtiene un mejor rendimiento. Entre mas cerca est a cero el CV
indica que la muestra es muy homognea y por supuesto se tiene una muestra confiable.

89
Mdulo
5 Pensamiento aleatorio y sistemas de datos

A continuacin se hace un anlisis para la grfica de cajn, para ello, usamos los estadsticos:

Mx. =749
Mn. = 452
Xme = 626
Q1 = 562,6
Q3 = 691.8 (comprubelo)

Ahora se traza una lnea horizontal de longitud proporcional al recorrido de la variable, en


ella se colocan los extremos Mn. y Mx.

Paralelo al eje, se construye una caja rectangular con altura arbitraria y cuya base va desde
el primer cuartil al tercero, o sea desde 562,6 hasta 691,8, veamos.

La caja se divide en dos partes, trazando una lnea a la altura de la mediana; Xme = 626:
Cada parte indica el intervalo de variabilidad de una cuarta parte de los datos, es decir, el
25% de los datos est entre 452 y 562.6 as:

90
Desde los conceptos y los procesos

El otro 25% de la puntuacin se encuentra entre 562.6 a 626 y 626 a 691.8.

A la caja as dibujada se le adicionan dos guas paralelas al eje (se ve como una), una a cada
lado, con las siguientes caractersticas: el primer segmento se prolonga desde el primer
cuartil hasta el valor mximo entre el mnimo de de la distribucin y la diferencia entre Q1
-1.5*(Q3 Q1), en nuestro caso tenemos

562.6 - 1.5*(691.8 - 562.6) = 368.8

Por lo tanto el mximo entre 452 y 368.8 es 452.

El otro segmento abarca desde el tercer cuartil hasta el mnimo entre el mximo de la dis-
tribucin y la suma de Q1 +1.5*(Q3 Q1) en este caso

562.6 +1.5*(691.8 - 562.6) = 756.4

Indica que el otro extremo se prolonga hasta 756.4

El anlisis es el siguiente:
Si alguno de los datos quedan fuera del intervalo cubierto por la caja y estos segmentos,
indica que se tienen puntos atpicos, se sealan con una marca que puede ser un asterisco
(*), esto demuestra que son valores muy alejados de los valores centrales de la distribucin,
esto indica lgicamente la simetra. Sirve adems esta caja para comparar la misma variable
en dos muestras diferentes.

Segn la explicacin anterior, que comparacin se puede hacer con respecto a la puntuacin
obtenida en aptitud verbal?

Se ajustan los estadsticos obtenidos a ese razonamiento?

91
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Actividad propuesta (Continuacin)

Ahora se realizar las mismas operaciones para el anlisis de la aptitud matemtica.


A continuacin se le da la tabla de frecuencias para aptitud matemtica:

Intervalo fi Xi hi Fi Hi Xi*fi Xi - (Xi - )2*fi


452 1 473,5 0,03333 1 0,033 473,5 -161,9667 26233,20111
495 2 516,5 0,06667 3 0,1 1033 -118,9667 28306,13556
538 5 559,5 0,16667 8 0,267 2797,5 -75,96667 28854,67222
581 7 602,5 0,23333 15 0,5 4217,5 -32,96667 7607,607778
624 4 645,5 0,13333 19 0,633 2582 10,03333 402,6711111
667 6 688,5 0,2 25 0,833 4131 53,03333 16875,20667
710 1 731,5 0,03333 26 0,867 731,5 96,03333 9222,401111
753 4 774,5 0,13333 30 1 3098 139,0333 77321,07111
Total 30 1 19064 194822,9667

Debe comparar cada una de los resultados para observar la dispersin y las dems medidas.

Cul de los datos presenta mayor simetra con respecto a la media?


En cul de las pruebas les fue mejor a los estudiantes?
Analice el CV para cada prueba y justifique cual de las dos es ms confiable.
Haga una grfica de cajn y realice el anlisis pertinente. Se pueden comparar los resulta-
dos con los de aptitud verbal?

Conceptos y procedimientos

Las actividades que se presentan a continuacin pretenden que a partir de anlisis de la


distribucin de frecuencias con diferentes medidas de tendencia central iguales, se puedan
observar los diferentes grados de variabilidad.

El docente debe tener en cuenta dentro del anlisis de las actividades, que al recurrir al
clculo del coeficiente de variacin, es una medida relativa y que su utilidad radica en que
es independiente de la unidad usada en los valores de la variable, por lo cual se pueden
comparar distribuciones cuyos datos estn medidos en diferentes unidades.

En las medidas de variabilidad, es importante destacar algunas propiedades relevantes


tanto de la varianza como la desviacin tpica:

a. A medida que los datos se alejan de la media, la varianza y la desviacin tambin.


b. Al aumentar el tamao de la muestra, disminuyen los dos estadsticos.

92
Desde los conceptos y los procesos

c. Cuando todos los datos de la distribucin son iguales, los dos estadsticos son iguales
a cero.
d. Para el clculo se utilizan todos los datos de la distribucin, por tanto, cualquier cambio
de valor ser detectado.

Es conveniente adems realizar diagramas de dispersin como el siguiente:


La obtencin de datos, por ejemplo que relaciona la estatura con el peso, permite la realiza-
cin de diagramas como el siguiente, realizado en excel:

X Y
45 160
55 145
55 150
55 165
56 165
58 162
58 165
60 160
60 163
60 170 Fig16
68 155
68 170
69 172
70 175
70 180
85 175
87 180
90 190

Este diagrama de dispersin (Fig16), indica relacin existente entre la altura y el peso. Se
puede estimar la estatura de una persona que pesa 60 kg.

El objetivo principal es la obtencin de todos los estadsticos y el respectivo calculo de las


desviaciones y a partir de esos datos obtener informacin sobre la mejor medida.

Actividad n 1

Ahora se proponen una serie de situaciones en las cuales debes utilizar razonadamente los
estadsticos apropiados segn el contexto.

93
Mdulo
5 Pensamiento aleatorio y sistemas de datos

1. Con los datos de la situacin de tiro al blanco, completa la siguiente tabla:

Jugador 1m 2m 3m 4m 5m
A
B
C
D

Cul de los jugadores es ms eficaz?

Realiza una grfica en un mismo plano con cada jugador y compara los resultados de acuerdo
con los estadsticos numricos.

Entre qu lmites vara el 75% de los valores centrales?


Si uno de tus compaeros obtiene 5 puntos, en qu percentil se ubica?
Existen valores atpicos en la distribucin?.
A qu fenmeno le atribuyes el resultado?.

Actividad n 217

Un estudio nutricional en una institucin educativa en el cual se midi el peso de acuerdo con la
edad, y result que el peso promedio fue de 52 Kg., cuando el esperado era de 58 Kg. Despus de
hacer una serie de labores nutricionales para aumentar el peso durante un lapso de tres meses,
se tomaron nuevamente los pesos y los resultados se muestran en las siguientes grficas:

Fig 17 Fig 18

_____________________________________________________

17
Adaptado de Examen de Estado.2004-2

94
Desde los conceptos y los procesos

Situaciones para reflexionar


1. De acuerdo con ello, analice si las labores nutricionales fueron efectivas.
2. Al hacer una comparacin de las dos figuras (Fig17 y Fig18), analice: si el promedio de
edad es superado por menos estudiantes que los que superan el peso promedio.
3. Dos estudiantes que no estuvieron presentes en la medicin, se les hizo la medicin del
peso a la semana siguiente y ellos pesaron 50 y 54 Kg. Respectivamente, analice la efec-
tividad de la labor nutricional teniendo en cuenta estos nuevos pesos.

Tiro al blanco (Nuevamente)


Actividad n 3

En la siguiente situacin, se toma el puntaje obtenido en 6 lanzamientos para cada jugador.

Material
Una cartulina, en la cual se dibujan crculos concntricos con los puntajes dados.

Como jugar
Formar grupos de 6 estudiantes, con un dado se ordena la salida de mayor a menor puntaje
obtenido. Si hay empate se resuelven lanzando nuevamente los dados. Cada jugador anota
en la tabla el respectivo puntaje, marcando con una X las veces en que cay en cada crculo.
Si cae fuera, se repite el lanzamiento.

95
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Jugador -2 10 15 20 TOTAL
1 XX
2
3
4
5
6
TOTAL

Situaciones para reflexionar


1. Halla el promedio total (de todos los jugadores).
2. Calcula la variacin o dispersin que obtuvo cada uno de los jugadores con respecto al
promedio.
3. Qu te indica los porcentajes que caen en el intervalo X S?.
4. Cul es la muestra menos asimtrica?
5. Cunto te desviaste?

Problema
Los siguientes datos son ficticios: en una clase se realiza una encuesta sobre la cantidad de
dinero que le dan a los estudiantes y sobre las variables dadas en la tabla.

Sexo Deporte Peso Estatura Calzado Pesos


2 1 59 161 37 1500
1 3 45 160 38 2500
1 2 65 166 39 0
2 2 74 170 41 1500
1 1 68 175 40 2500
2 2 69 176 41 3000
1 3 86 191 42 3500
2 3 58 154 38 2500
1 3 74 168 39 0
1 1 64 166 38 2500
2 3 64 166 40 2000
2 2 74 170 41 1500
1 1 68 175 40 2500
1 3 69 176 41 3000
2 2 86 191 42 3000
1 2 65 166 39 0
2 2 74 170 41 1500

96
Desde los conceptos y los procesos

1 1 68 175 40 2500
2 2 69 176 41 3000
1 3 86 191 42 3500
2 3 58 165 39 2500
sexo: 1= hombre 2= mujer Deporte: 1= nada, 2=poco , 3 = mucho

En la siguiente tabla, se adjuntan los resmenes estadsticos de algunas de las variables


consideradas en una clase con nios de 6 grado, incluye la cantidad de dinero que se le
da para los descansos.

Variable Peso (kg) Estatura (cm) N zapato Pesos


Media 68,7142857
Mediana 68
Moda 74
Des.Tpica 9,6813166
Mnimo 45
Mximo 86
Rango 41
Datos 20

Situaciones para reflexionar


a. Termine de ubicar la informacin de las dems variables.
b. Qu medida es ms adecuada para cada variable?
c. Cul de las variables presenta mayor/menor dispersin?
d. Qu estudiante sera ms representativo en cada una de las variables (de acuerdo a
la tabla)?.
e. Existe algn estudiante que sea representativo en todas las variables?
f. Son ms altos los estudiantes que practican mucho deporte?
g. Reciben las nias ms dinero que sus compaeros?
h. Realiza diagramas de dispersin para analizar diferentes variables, por ejemplo deporte_
estatura.

97
Mdulo
5 Pensamiento aleatorio y sistemas de datos

98
Unidad No.3
El azar y la probabilidad

Introduccin
Llegar a las instancias de la didctica de probabilidades no es fcil, ya que en nuestro pas
no se tienen muchos conocimientos sobre proyectos de investigacin sobre la enseanza de
la probabilidad y temas afines y ms a niveles de bsica y media tcnica, por lo tanto es a
partir de los estndares bsicos de matemticas que nos proponemos realizar estrategias que
permitan desarrollar en nuestros estudiantes un razonamiento y pensamiento formal para que
ellos descubran en forma progresiva esquemas de representacin implcitos en las diferentes
niveles de situaciones problemas.

El punto de partida para esta unidad est basado en los significados de la aleatoriedad, y
experimento aleatorio como conceptos claves en la concepcin de la probabilidad. Para ello,
el proceso de generacin de una sucesin es lo que se denomina experimento aleatorio, los
posibles resultados de dicho proceso son los sucesos aleatorios y la sucesin obtenida en una
serie de ensayos es la secuencia aleatoria.

Para Piaget e Inhender la comprensin del azar por parte del nio vista como complemen-
taria a la relacin causa-efecto forma un marco de referencia para identificar los fenmenos
aleatorios. Desde el punto de vista fsico, el azar se caracterizar por procesos de mezcla
irreversible, mientras que la causalidad mecnica tendr una reversibilidad intrnseca18.

En la parte de aleatoriedad la propiedad de reversibilidad no es funcional a como volver los ope-


randos primitivos al deshacer la operacin por su proceso inverso que lo permite. Por ejemplo19, si
hacemos girar la aguja en una ruleta, desde una posicin inicial, impulsndola hacia la derecha,
es muy poco probable que un impulso a la izquierda devuelva la aguja a su posicin inicial.

Para Piaget, el nio tiene un pensamiento irreversible, que le permite colocar una barrera en
la comprensin de la aleatoriedad debido a que no puede diferenciar entre acontecimientos
reversibles y fortuitos, originados por mezclas de causas irreversibles. Tal motivacin lleva
al nio hasta la etapa de las operaciones concretas en la que pueden claramente aparecer
factores de caracterizacin de los fenmenos causados y poder adquirir en forma intuitiva el
significado de aleatoriedad.

_____________________________________________________

18
Citado en la tesis doctoral de Luis Serrano Romero. Significados institucionales y personales de objetos matemticos ligados a la
aproximacin frecuencial de la enseanza de la probabilidad.
19
Tomado de Didctica de la estadstica. Carmen Batanero. Pg. 56.

99
Mdulo
5 Pensamiento aleatorio y sistemas de datos

En tal sentido, Fischbein rechaza las ideas de Piaget respecto a la concepcin del azar cuan-
do concibe que esa idea no es innata y la no comprensin de causa y efecto por parte del
nio en el periodo preoperacional, pues se basa en la intuicin primaria del azar, es decir,
existe una distincin entre fenmeno aleatorio y determinista a partir de los 7 aos, adems
los nios al practicar los juegos de azar sencillos son capaces de elegir la opcin de mayor
probabilidad. Plantea que la distincin entre azar y lo deducible no se realiza espontnea y
completamente al nivel de las operaciones formales.

En los fenmenos aleatorios los resultados aislados son imprevisibles, pero el conjunto
de posibilidades puede determinarse mediante un proceso de desarrollo de razonamiento
combinatorio, con lo que se vuelve previsible. Lo anterior se debe comprender para poder
expresar la idea de probabilidad como la razn de posibilidades de un caso en particular y
el conjunto de posibilidades.

Puede observarse que el pensamiento aleatorio, tambin involucra otros tipos de pensamiento
como el numrico y variacional, este ltimo ofrece formas de realizar modelos a travs de las
funciones que intervienen en las situaciones de las distribuciones de probabilidad.

En el siguiente esquema se propone tomar como base fundamental las probabilidades, par-
tiendo de la aleatoriedad y el anlisis combinatorio.

100
El azar y la probabilidad

3.1. Un poco de historia

Aproximadamente por el ao 3500 a.C., los juegos de azar eran practicados con objetos de
hueso, considerados como los precursores de los dados, y fueron ampliamente desarrolladas
en Egipto y otros lugares. Dados cbicos con marcas virtualmente idnticas a las de los dados
modernos han sido encontrados en tumbas egipcias que datan del ao 2000 a.C. Sabemos
que el juego con dados ha sido popular desde esa poca y que fue parte importante en el
primer desarrollo de la teora de la probabilidad20.

Se dice que probabilidades numricas para ciertas combinaciones de dados ya haban sido
calculadas por Girolamo Cardano (1501 - 1576) y por Galileo Galilei (1564 - 1642). Cardano en
su obra Lanzando los dados, publicada 87 aos despus de su muerte, introduce conceptos
de combinatorios en clculos de probabilidad y define la probabilidad como el numero de
resultados favorables dividido por el nmero de posibles resultados.

Se acepta generalmente que la teora matemtica de la probabilidad fue iniciada por los
matemticos franceses Blaise Pascal y Pierre Fermat. Cuenta la historia que un da de 1654
Antoine Gombaud, Caballero de Mr, un noble francs con inters en los juegos de los
dados y las cartas, llam la atencin de Pascal en una aparente contradiccin en un juego
popular de dados. Este caballero crey haber encontrado una falsedad en los nmeros al
analizar que el comportamiento de los dados era diferente cuando se utilizaba un dado que
cuando se empleaban los dos. La falsedad consista en una comparacin errtica entre las
posibilidades de obtener un seis con un solo dado u obtener un seis con ambos. El juego
consista en lanzar un par de dados 24 veces, y el problema en decidir cuando apostar por
un doble seis en una tanda de 24 lanzamientos. Una regla de juego aparentemente bien
establecida indujo a Mr a creer que apostar a un doble seis en 24 lanzamientos podra ser
provechoso, pero sus propios clculos indicaron lo contrario. Lo anterior se debi a que Mr
no tuvo en cuenta que al jugar con dos dados se entra al anlisis de probabilidades com-
puestas en el cual se deben calcular por la multiplicacin. En una carta de Pascal a Fermat
en la que narraba esta ancdota conclua que el caballero Mr tiene mucho talento, pero
no es gemetra; esto es, como sabis un gran defecto (carta del 29 de julio de 1654)21

Este problema y otros propuestos por de Mr, llev a un intercambio de cartas entre Pascal
y Fermat, en las cuales los principios de la teora de la probabilidad fueron formulados por
primera vez. Aunque algunos problemas especiales en los juegos de azar haban sido re-
sueltos por algunos matemticos italianos en los siglos XV y XVI (Cardano, Galilei), ninguna
teora general se desarroll antes de esta famosa correspondencia.

Basndose en dicha correspondencia, el fsico-astrnomo-matemtico alemn Christian Huy-


gens, maestro de Leibniz, public en 1656 el libro De ratiociniis in ludo aleae (Razonamientos
en juegos de azar), el primer libro impreso sobre probabilidad.

_____________________________________________________

20
Tomado de: http//correo.puj.edu.co/probabilidad/historia.
21
La historia de la probabilidad. Ponencia Rev Col Cienc Vol 16:1.2003. Luis F Restrepo y Julin Gonzlez.

101
Mdulo
5 Pensamiento aleatorio y sistemas de datos

En 1689 Jacob Bernoulli public un importante trabajo sobre series infinitas y su ley so-
bre los grandes nmeros en teora probabilstica. Fue un temprano precursor del uso de
la teora probabilstica en medicina y meteorologa en su trabajo Ars conjectandi (El arte
de la conjetura), publicado de manera pstuma, en 1713. Este trabajo estaba dedicado a
establecer las nociones bsicas de probabilidad. Para esto fue necesario introducir tambin
un buen nmero de nociones bsicas de combinatoria pues se usaron fuertemente como
aplicaciones al clculo de probabilidades. Se puede decir que con los trabajos de Bernoulli
se inicia el establecimiento de la combinatoria como una nueva e independiente rama de
las matemticas.

A finales del siglo XVIII, se evidenci la existencia de analogas entre los juegos de azar y
fenmenos aleatorios en fsica, biologa y ciencias sociales. Contribuciones de importancia
fundamental fueron hechos hacia finales del siglo XVIII y comienzos del XIX por los mate-
mticos, astrnomos y fsicos franceses Joseph Louis Lagrange and Pierre Simon Laplace, el
matemtico y astrnomo germano Karl Friedrich Gauss, y el matemtico francs Simen-Denis
Poisson. Las permutaciones fueron primeramente estudiadas por Lagrange en 1770 e invent
y madur el clculo de variaciones y ms tarde lo aplic a una nueva disciplina la Mecnica
Celestial, sobre todo al hallazgo de mejores soluciones al Problema de tres cuerpos.

La publicacin ms importante de esta era fue Thorie analytique des probabilits (1812) de
Laplace, en la cual se discuten aplicaciones prcticas de la teora (errores en observaciones; la
determinacin de las masas de Jpiter, Saturno y Urano; mtodos de triangulacin para super-
vivencia; y problemas de geodsicas, en particular la determinacin del meridiano de Francia)
y desarrolla el concepto de distribucin normal, descubierta en primera instancia por Abraham
de Moivre. Adems, complement el trabajo comenzado por Gauss sobre teora de errores.

En 1801 Gauss public Disquisitiones Arithmeticae, su principal trabajo y uno de los ms


importantes en la historia de las matemticas. Esta obra cubre temas de teora de nmeros,
anlisis matemtico, teora de probabilidades, geometra, fisicomatemtica, astronoma y
geodesia. En probabilidad mostr que sta puede representarse por una curva en forma de
campana (distribucin gaussiana), que es la base en la distribucin estadstica de datos.

En 1837, en su Obra Recherches sur la probabilit des jugements... (Investigaciones sobre


la probabilidad de opiniones) Possion introduce lo que conocemos como la distribucin de
Poisson, o ley de Poisson de los grandes nmeros, un mtodo aproximado usado para describir
probables ocurrencias de eventos improbables en un nmero grande de ensayos inconexos.

Entre 1850 a 1900 el desarrollo de la probabilidad fue dominada por la escuela rusa de teora
probabilstica (Petersburgo), enfatizando en mtodos matemticos rgidos. Las figuras ms
prominentes de esta escuela fueron Pafnuty Chebyshev, y sus discpulos Andrei Markov y
Alexander Lyapunov. Markov se enfoc principalmente en el mtodo de movimientos. Su
introduccin de la cadena de Markov como un modelo para el estudio de variables aleatorias
hizo posibles grandes cantidades de investigacin en procesos estocsticos. Un uso prctico
para su matemtica se encontr en el uso de sus cadenas para modelar la alteracin de vocales
y consonantes en los trabajos literarios rusos. l tambin escribi un libro de probabilidad y

102
El azar y la probabilidad

estadstica, uno de los mejores de su tiempo. Su trabajo influy en muchos otros matemticos
famosos y estadsticos, incluso S. N. Bernstien, V. yo. Romanovsky, y Jerzy Neyman (quin
entonces tom las estadsticas a un nuevo y ms prctico nivel).

Pearson aplic la estadstica a los problemas biolgicos de la herencia y la evolucin, resal-


tndose la publicaciones realizadas entre 1893-1912 tituladas Contribuciones de la Mate-
mtica a la teora de la Evolucin, en las cuales se encuentran contribuciones al anlisis
de regresin, coeficiente de correlacin el incluy el test de fi al cuadrado y fue l quien
acu el termino de desviacin estndar.

La rama toma su forma actual a partir de los aos 30s cuando Kolmogorov establece con
sus axiomas para el clculo de probabilidades las bases matemticas para asentar la teora,
con lo cual, adems se aclaran las aparentes paradojas existentes. Todo esto aparece en
su famosa monografa Grundbegriffe der Wahrscheinlichkeitsrechnung, (1933). Los ante-
cedentes del esquema Kolmogorov son: I. Los notables avances que en el rea del anlisis
matemtico se dan durante la primera dcada de este siglo con la creacin de la teora de
la medida (E. Borel) y de la integral de Lebesgue. Esto surge independientemente de la
probabilidad, a pesar de lo cual, resulta ser la herramienta ideal para su desarrollo y slido
sustento matemtico. Por el lado de la probabilidad, se cuenta con la demostracin de E. Borel
de la ley fuerte de los grandes nmeros en donde ste ya maneja la nocin de probabilidad
con las propiedades aditivas. Por otra parte, los trabajos de Norbert Wiener y los de Paley
y Zigmund, contienen desarrollos importantes de la teora y en ellos ya manejan la idea de
probabilidad como medida .

3.2. Algunos tpicos sobre aleatoriedad modelacin y probabilidad

Es conveniente antes de ingresar a los conceptos de la probabilidad dejar claro el concepto


de aleatoriedad y sobre como podemos realizar modelos que nos llevarn a la comprensin
de la teora formal del tema en cuestin.

En el atlas de 2005 se tiene la siguiente significacin:

3.2.1. Experiencia aleatoria


Experiencia cuyo resultado depende del azar. Son experiencias aleatorias el lanzamiento de
una moneda, el de un dado, o la extraccin de una carta de una baraja. Los elementos de
una experiencia aleatoria se llaman sucesos aleatorios o, simplemente, sucesos.

Tambin se consideran experiencias aleatorias algunos acontecimientos relacionados con


la sociologa, la demografa, la economa u otras ciencias cuyos resultados se estudian ms
eficazmente si se consideran como aleatorios que si se pretende estudiar las causas con-
cretas que los provocan; es el caso, por ejemplo, del nmero de accidentes de trfico que se
producen en un fin de semana en una cierta carretera.

103
Mdulo
5 Pensamiento aleatorio y sistemas de datos

3.2.2. Experiencia aleatoria compuesta


Si se puede considerar como resultado de concatenar dos o ms experiencias simples. As,
extraer tres cartas de una baraja es una experiencia que se puede considerar compuesta por
tres experiencias sencillas consistentes cada una de ellas en extraer una carta.

Las experiencias simples que dan lugar a una compuesta se llaman independientes si el
resultado de cada una de ellas no influye en el de las siguientes. La experiencia consistente
en lanzar dos dados, uno tras otro, se compone de dos experiencias independientes, pues el
resultado que se obtenga en el primero no afecta a las probabilidades en el segundo.

Dos o ms experiencias consecutivas son dependientes si el resultado de cada una afecta a las
probabilidades de los sucesos en las siguientes. Por ejemplo, en la experiencia consistente en
sacar dos cartas de una baraja, al extraer la primera se modifica la composicin de la baraja.
Por tanto, las probabilidades en la segunda dependern de lo que ocurri en la primera.

Aunque no aparece el trmino aleatoriedad, se da una idea intuitiva y por lo tanto como en
la mayora de los textos, se ve claramente que el proceso aleatorio, est relacionado con las
probabilidades y el azar.

Para Batanero (2001, Pg. 2), partir de la observacin (mtodo cientfico) de los fenmenos
que ocurren en la naturaleza podemos diferenciar aquellos que son constituidos por el azar
y que representan aleatoriedad y contingencia24, cuando se tiene un fenmeno aleatorio,
decimos que ste es reproducible en las mismas condiciones, aunque presente diferentes
resultados pero sin saber con certeza lo que ocurrir en una experiencia particular, por ejem-
plo, no s con seguridad el tiempo que demora un ciclista en recorrer 100km. Pero se puede
reproducir la situacin en las mismas condiciones para analizar los diferentes resultados que
se producen (se puede hacer un recuento del tiempo gastado por dos o ms ciclistas, puede
ser una prueba contra reloj). Por el contrario en una situacin contingente, el fenmeno no
es repetible bajo las mismas condiciones, as en el est presente el azar, por ejemplo cuando
se va por una calle y ocurre un accidente de trnsito.

3.2.3. Modelos
En cuanto a los modelos, Carlos Eduardo Vasco25 comenta Para m, el principal propsito del
pensamiento variacional es la modelacin y no es propiamente la resolucin de problemas ni
de ejercicios. Al contrario para m, los mejores problemas o ejercicios deberan ser desafos
o retos de modelar algn proceso. Para poder resolver un problema interesante tengo que
armar primero un modelo de la situacin en donde las variables covaren en forma semejante
a las de la situacin problemtica

Vasco, en el mismo documento dice La modelacin es pues el arte de producir modelos


matemticos que simulen la dinmica de ciertos subprocesos que ocurren en la realidad.

_____________________________________________________

20
Tomado de: http//correo.puj.edu.co/probabilidad/historia.
21
La historia de la probabilidad. Ponencia Rev Col Cienc Vol 16:1.2003. Luis F Restrepo y Julin Gonzlez.

104
El azar y la probabilidad

Los estudiantes deben aprender a realizar modelos en todas las ciencias (reas o asignaturas)
y en sus diferentes etapas de la vida escolar, con lo cual se forma un proceso de aprendizaje
eminentemente significativo, por ello a partir de ah la propuesta de trabajo en la parte de
probabilidad debe partir de la modelacin y simulacin de fenmenos aleatorios.

Como ya se tiene una idea de la aleatoriedad, se debe pasar a realizar modelaciones, por
ejemplo, no s con seguridad el tiempo que demora un ciclista en recorrer 60km en una
competencia contra reloj, al calcular el tiempo que gasta el ciclista, se debe tener en cuenta
la hora en la cual se realiz la experiencia, el tiempo (invierno, verano), sitio (veldromo, pista
callejera etc.). Todos estos puntos sern importantes para tratar de encontrar un modelo que
nos describa el tiempo gastado y se requiere del juicio personal y del anlisis cuidadoso de
la situacin para decidir cules de los aspectos de la realidad son los que en definitiva nos
parecen importante para resolver el problema que planteamos. Ntese pues que se tiene ya
la idea intuitiva de un experimento aleatorio.

Ahora para construir el modelo, debemos tener en cuenta una serie de decisiones: aceptamos
que el tiempo de llegada del prximo ciclista es independiente del que acaba de llegar?.
Trataremos los tiempos como variable continua?.
Cules son otras variables, adems del tiempo de llegada que me podran interesar en el
trabajo con el modelo?.

Una vez que hemos construido un modelo matemtico para la situacin (por ejemplo acep-
tamos que los tiempos de espera siguen una distribucin uniforme entre un ciclista y otro)
y obtenidas las conclusiones a partir del modelo queda todava la parte ms importante:
comparar estas conclusiones con el comportamiento real de la situacin analizada y decidir
que el modelo matemtico nos proporciona una buena descripcin de la realidad. Resalta-
mos el hecho de que construir un modelo es obtener una mejor comprensin de una parte
de nuestro mundo y, as, poder predecirla y si es posible controlarla. Un modelo no es real,
ni tampoco verdadero;

3.2.3. Probabilidad
En toda ciencia y en especial las matemticas es vital e importante analizar los diferentes
puntos de vista sobre la comprensin de los significados de los conceptos puestos en juego
al igual que el razonamiento acerca de errores y dificultades en su enseanza ya que ellos
inciden en la toma de decisiones en situaciones de incertidumbre.

Si bien es cierto que aprovechando las distribuciones de probabilidad se empieza a for-


mar el concepto de probabilidad frecuencialista, debe tenerse en cuenta que es apenas
un abrebocas a las discusiones planteadas por la gran mayora de autores en cuanto a la
interpretacin y la conceptualizacin de la misma, debido a los diferentes enfoques y defi-
niciones dadas a la probabilidad.

Por ejemplo al realizar un experimento un nmero determinado de veces, n , se sabe que la


frecuencia absoluta del suceso es ni, por lo tanto el cociente h = ni/n es la frecuencia relativa

105
Mdulo
5 Pensamiento aleatorio y sistemas de datos

de dicho suceso (estudiado en los apartes de las tablas de frecuencia), lo importante es que
se puede observar que dicha frecuencia varia entre 0 y 1. El valor de la frecuencia relativa
de ese suceso no es fija para n, ya que se trata de un fenmeno aleatorio y adems, al rea-
lizar el mismo experimento n veces, por dos o ms personas, se pueden obtener diferentes
valores de las frecuencias relativas. Sucede que para una serie grande de repeticiones del
experimento, las frecuencias relativas se van acumulando alrededor de un valor fijo. Tal he-
cho se conoce como la ley de los grandes nmeros. Un ejemplo fue el realizado por Pearson
quien al lanzar una moneda 24000 veces, obtuvo una frecuencia relativa de 0.5005 para las
12012 caras. Se cuenta que Buffn lanz una moneda 4040 veces y obtuvo 2048 caras, cuya
frecuencia relativa es 0.506930.

Con las observaciones anteriores se construye el primer concepto de probabilidad: como


un proceso aleatorio en el cual la frecuencia relativa converge a un valor, al repetir un expe-
rimento un nmero grande de veces.

En el concepto anterior de hecho, presenta quizs entre otros, las fallas:


a. No se tiene en cuenta que los sucesos deben tener la misma ocurrencia, es decir deben
ser equiprobables (regla de Laplace), por ejemplo cuando se lanza una tachuela, la pro-
babilidad de caer de cabeza que acostada no es la misma.
b. El tamao de la muestra ya que a mayor tamao de la muestra, existe menor variabilidad
y que en muestras pequeas existe mayor variabilidad.
c. Nuunca se obtiene el valor exacto de la probabilidad, sino una estimacin al mismo.

Los anteriores anlisis permitieron el concepto de la regla de Laplace, partiendo como se coment
en la parte histrica de la solucin de algunos juegos de azar, en el cual se considera un espacio
muestral finito para la ocurrencia de n sucesos elementales en el cual ninguno de ellos puede
ocurrir con mayor frecuencia que los otros, en tal caso la probabilidad de estos sucesos es 1/n.,
a partir de este hecho, Laplace habla de sucesos compuestos y dice que las probabilidades de
un suceso que se descompone en k sucesos elementales puede calcularse como k/n.

De lo anterior, se llega a la conocida regla de Laplace en la cual la probabilidad de un suce-


so que puede ocurrir en un nmero finito de ocasiones es considerada como una fraccin
cuyo numerador es el nmero de casos favorables y el denominador el nmero de todos los
casos posibles.

Segn Godino et. al. (1987), esta definicin se encontr inadecuada incluso en la poca de
Laplace, ya que adems de ser circular y restrictiva, no ofreci respuesta a la pregunta de
qu es realmente probabilidad; slo proporcion un mtodo prctico de clculo de probabi-
lidades de algunos sucesos sencillos. Por otro lado, esta definicin no puede aplicarse a los
experimentos con un nmero infinito de posibilidades o a aquellos casos en que el espacio
muestral es finito, pero no puede aceptarse la condicin de simetra26.

_____________________________________________________

26
Carmen Batanero. Significados de la probabilidad en la educacin secundaria.

106
El azar y la probabilidad

Uno de los inconvenientes para la aplicacin de este concepto es que si se tiene un espacio
muestral infinito, es imposible aplicar la regla anterior.

Existe adems, otra forma de asignacin de probabilidades: de manera subjetiva, esto es,
asignar una probabilidad a un evento de acuerdo con la experiencia de la persona, se cita por
ejemplo cul es la probabilidad de que Colombia clasifique al mundial del 2010? y las perso-
nas dan sus opiniones, desde luego muy subjetivas. Pero la verdad es que con el teorema de
Bayes se tiene un nuevo punto de vista que permite transformar las probabilidades a priori
(antes de realizar el experimento) de varias causas, una vez observadas sus consecuencias,
a probabilidades a posteriori, que incorporan la informacin de los datos observados.

En este sentido las probabilidades son tomadas como grado de creencia de una persona, el
cual est basado en su experiencia para asignar probabilidades, as al final resulta engorroso
calcular la probabilidad de un suceso ya que diferentes personas tienen distintas concep-
ciones y por supuesto conocimientos respecto a un hecho en particular.

Dentro de las dificultades expuestas en el prrafo anterior, se encuentra que ya no es po-


sible hallar una regla para asignar probabilidades para expresar los grados de experiencia
personal, ni la realizacin del suceso varias veces en las mismas condiciones (en medicina,
economa), no hay regla fija que permita asignar un valor numrico a una probabilidad.

Es a partir de Borel que se empieza a organizar el significado de probabilidad como un tipo


especial de medida, al cual Kolmogorov aplica la teora de conjuntos y de la medida, para
darle un enfoque axiomtico, el concepto ms aceptado hoy da.

Veamos como construir el enfoque axiomtico: en la gran mayora de los experimentos


aleatorios es cierto que la frecuencia relativa de un suceso A en un gran nmero de ejecu-
ciones es aproximado a un nmero P(A), llamado ocurrencia o probabilidad del evento A en
el experimento esto indica que si se realiza el experimento muy a menudo, la frecuencia
relativa es aproximadamente igual a P(A).

Como P(A) tiene que ver con la frecuencia relativa, se tiene que:
0 P(A) 1
Si A y B son eventos mutuamente excluyentes27 ( AB ), se cumple que:
P (AB) = P(A) + P(B)
Si al conjunto de todos los resultados posibles del experimento lo llamamos espacio muestral
S, se tiene que:
P(S) = 1
Si el espacio muestral es infinito y A1, A2, . Son eventos mutuamente excluyentes, se tiene que:
P(A1A2 ) = P(A1 )+ P(A2 )+

_____________________________________________________

27
Al tratar con conjuntos, se debe tener en cuenta que la interseccin entre dos conjuntos es vaca para que sean disjuntos.

107
Mdulo
5 Pensamiento aleatorio y sistemas de datos

El anterior anlisis nos hace ver claramente que hay posibilidades cuya asignacin es 0, por
ejemplo la posibilidad de realizar un viaje al sol, a tal posibilidad se les conoce como imposibles,
pero tambin nos indica que existe una posibilidad de 1,tal posibilidad es conocida como segura,
por ejemplo la probabilidad de que llueva el prximo ao, adems existe la opcin de movernos
en el intervalo 0 Probabilidad (de un evento) 1, lo cual indica que existen un nmero infinito
de asignaciones para la ocurrencia de un evento, as mismo indica que existe una funcin para
la asignacin de probabilidades para cada uno de los posibles eventos del espacio muestral.

3.2.3.1. Sesgos de la probabilidad


En el anlisis de la probabilidad, es comn observar que los estudiantes obtengan algunos
sesgos que contribuyen a un razonamiento subjetivo de las probabilidades.

Polya28 trata el trmino heurstica y se refiere a la comprensin del mtodo que conduce a la
solucin de problemas y mas concretamente a las operaciones mentales tpicamente tiles
en este proceso. Aade que la heurstica se construye sobre una experiencia resultante,
simultnea con la solucin de problemas.

Al respecto Kahneman et. al (1982, pag.106) conceptualizan la heurstica como procesos


mentales que restringen la complejidad de un problema, de modo que sea accesible al reso-
lutor. Dicen adems que esto no garantiza la solucin al problema planteado al contrario del
algoritmo que produce la solucin para cualquier problema, dentro de una clase dada.

En los juicios probabilsticos se encuentran algunos sesgos, que fueron estudiados por Tver-
sky y Kahneman, siendo ellos tratados en las heursticas siguientes:

3.2.3.1.1. Heurstica de la representatividad


Consiste en calcular la probabilidad de un suceso basado en la representatividad del mismo res-
pecto a la poblacin de la que proviene. En primer lugar, se prescinde del tamao de la muestra,
y con ello del estudio de la variabilidad del muestreo, produciendo una confianza indebida en las
pequeas muestras. En segundo lugar, se supone que cada repeticin del experimento, aunque
sea limitada, ha de producir todas las caractersticas de la poblacin. Por ejemplo, se espera que
la frecuencia de una caracterstica en la muestra coincida con la proporcin de la misma en la
poblacin; por ello tras una larga racha de aparicin de un suceso se espera intuitivamente la
aparicin del suceso contrario, olvidando la independencia de los ensayos repetidos.

Como concepciones errneas que surgen de sta heurstica, se tienen los segos respecto a
la muestra, lo cual indica que se deben reproducir todas las caractersticas de la poblacin
aunque se trate de una muestra pequea

3.2.3.1.2. Heurstica de la disponibilidad


Consiste en realizar un juzgamiento ms probable por los sucesos que son ms fciles de
recordar. Esta heurstica se apoya en el concepto de muestra, ya que al evaluar un estudio

_____________________________________________________

28
Citado en la tesis doctoral de Luis Serrano Romero. Significados institucionales y personales de objetos matemticos ligados a la
aproximacin frecuencial de la enseanza de la probabilidad.

108
El azar y la probabilidad

se usan muestras, con ello se corre el riesgo de que la muestra no sea representativa de la
poblacin a estudiar, tambin se debe a falta de razonamiento combinatorio.

3.2.3.1.3. Heurstica de accesibilidad


Consiste en estimar la probabilidad de un suceso de acuerdo a la facilidad con que se recuer-
den ejemplos en los que dicho suceso ocurri o por la facilidad con que pueden generarse
ejemplos en los que tal suceso ocurre.

3.2.3.1.4. Sesgo de equiprobabilidad


Lecoutre, Durand y Cordier, en sus experimentos describen la creencia de los individuos en la
equiprobabilidad de todos los sucesos asociados a cualquier experimento aleatorio, incluso
en aquellos en que no es aplicable el principio de la indiferencia.

3.2.3.1.5. Errores sobre la probabilidad condicional

A los estudiantes les resulta difcil comprender que la probabilidad de un suceso pueda condicio-
narse por otro que ocurra despus de l. Por ejemplo pueden encontrar sin sentido la pregunta
sobre probabilidad de que la madre de una persona de ojos azules tenga ojos azules.

ESTNDARES INVOLUCRADOS Y RELACIONADOS

A continuacin se presentan los estndares relacionados con los elementos tericos pues-
tos a consideracin en esta unidad, igualmente, abarcan la mayor parte de las situaciones
propuestas.

Sistemas de datos
Describir situaciones o eventos a partir de un conjunto de datos.
Explicar desde su experiencia la posibilidad o imposibilidad de ocurrencia
Primero a Tercero de eventos cotidianos.
Predecir si la posibilidad de ocurrencia de un evento es mayor que la de otro.
Hacer conjeturas y poner a prueba predicciones acerca de la posibilidad de
Cuarto a Quinto ocurrencia de eventos.
Comparar diferentes representaciones del mismo conjunto de datos.
Usar modelos (diagramas de rbol, por ejemplo) para discutir y predecir
Sexto a Sptimo posibilidad de ocurrencia de un evento.
Hacer conjeturas acerca del resultado de un experimento aleatorio usando
proporcionalidad y nociones bsicas de probabilidad.
Octavo a Noveno Comparar resultados experimentales con probabilidad matemtica esperada.
Resolver y formular problemas seleccionando informacin relevante en
conjuntos de datos provenientes de fuentes diversas (prensa, revistas ,
televisin, experimentos, consul tas, entrevistas ).

Dcimo a Undcimo Disear experimentos aleatorios (de las ciencias fsicas, naturales o sociales)
para estudiar un problema o pregunta.
Usar conceptos bsicos de probabilidad (espacio muestral , evento, inde-
pendencia.. .).

109
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Numrico
Reconocer significados del numero en diferentes contextos
Primero a Tercero Usar diferentes estrategias de clculo y de estimacin para resolver proble-
mas en situaciones aditivas y multiplicativas.
Interpretar las fracciones en diferentes contextos.
Cuarto a Quinto
Analizar y explicar las distintas representaciones de un mismo nmero.
Justificar el uso de representaciones y procedimientos en situaciones de
Sexto a sptimo
proporcionalidad
Comparar y contrastar las propiedades de los nmeros sus relaciones y
Dcimo a Undcimo
operaciones
Variacional
Construir secuencias numricas y geomtricas utilizando propiedades de
Primero a Tercero
los nmeros y de las figuras geomtricas.
Predecir patrones de variacin en una secuencia numrica, geomtrica o
Cuarto a Quinto
grfica.
Reconocer el conjunto de valores de una variable en situaciones concretas
Sexto a sptimo
de cambio.
Octavo a Noveno Modelar situaciones de variacin con funciones.
Analizar las relaciones y propiedades entre las expresiones algebraicas y
Dcimo a Undcimo
las grficas de funciones polinmicas y racionales.

SITUACIONES DE APRESTAMIENTO

Actividad n 1: jugando a los dados

Esta situacin se toma del Mdulo 2 pgina 36.

Materiales
2 dados

Como se quiere es repetir el proceso, el estudiante debe llenar la hoja, pero variamos la for-
ma: escribe las posibles maneras de obtener cada uno de los resultados de la parte superior
(como total)

2 3 4 5 6 7 8 9 10 11 12
4+2
3+3
5+1

110
El azar y la probabilidad

Es importante el orden en que salga cada nmero del dado?


Cul de los totales se presenta con mayor frecuencia?
A cul de los totales le apostara con mayor seguridad?. Explica tu respuesta.
Consideras como equivalente los resultados 5+1 y 1+5?. Por qu?
Cul es la cantidad total con mayor y menor posibilidad de salir en un lanzamiento de los
dos dados?
Cul es la probabilidad de cada cantidad?
Es ms probable sacar un seis con un solo dado que un doble seis (con dos dados)?
Cul es la probabilidad de obtener un doble nmero?
Cul es la probabilidad de que, al lanzar dos dados, la suma sea 10?
Cul es la probabilidad de que, al lanzar 5 dados, exactamente tres caigan en 1?

GESTIN DE LA ACTIVIDAD

En esta parte se explora claramente la pertinencia del concepto de espacio muestral, el inicio
a la combinatoria, y se aprovecha la propiedad conmutativa para diferenciar una permuta-
cin de una combinacin, esto ocurre por ejemplo al tener un resultado como 5+1=1+5, es
lgico que en los niveles inferiores se aproveche esta situacin para resaltar nuevamente la
descomposicin de un nmero.

Nota: Al contestar la ltima pregunta de la situacin anterior, deben buscarse primero todas
las posibles combinaciones de pares posibles al lanzar los dados.

La actividad anterior se puede expandir para tres dados, lanzamiento de tres monedas y
observar el espacio muestral para cada suceso.

Actividad n 2 Pascal y de Mer29

1. En 8 lanzamientos consecutivos de un dado se intenta obtener un uno, donde el juego se suspen-


de despus de tres intentos fallidos en qu proporcin ha de ser compensado el jugador?

_____________________________________________________

29
Tomado de Instituto de Matemticas. UNAM. Investigacin probabilidad.2002.

111
Mdulo
5 Pensamiento aleatorio y sistemas de datos

2. En una partida de dados intervienen dos jugadores y apuestan 32 doblones de oro cada
uno, eligiendo un nmero diferente, gana el juego el primero que obtenga tres veces el
nmero que eligi. Despus de un rato de juego, el nmero elegido por el primer apostador
ha salido dos veces mientras el otro jugador slo una vez ha acertado, en este instante
la partida debe suspenderse. Cmo dividir los 64 doblones de oro apostado?

Para resolver esta situacin, se deben realizar modelos.

Nota: En la correspondencia entre Pascal y Fermat estuvieron de acuerdo en que el primer


jugador tiene derecho a 48 doblones de oro30.

Actividad n 3 El tringulo de pascal

Existe una forma sencilla de obtener las probabilidades de cualquier combinacin especial.
Pascal dedujo una forma para obtener una cara en el lanzamiento de una moneda, se bas
simplemente en la formacin triangular de nmeros, la cual muestra la forma de obtener cara
o sello o cualquier combinacin de ellas en determinado nmero de lanzamientos.

Por ejemplo para una moneda, la posibilidad de que salga cara es una entre dos, o sea, .
Para 3 monedas: si todas las opciones son sellos: 1/8; dos sellos una cara 3/8; dos caras y
un sello, 3/8 etc.
En el lanzamiento de cinco monedas, las posibilidades son uno entre 32 para que salgan
cara o sello; 5/32 para cuatro sellos y una cara.

Situaciones para reflexionar


1. Si se lanzan dos monedas, cul es la probabilidad de que salgan dos caras?

_____________________________________________________

30
Ponencia La historia de la probabilidad. Luis F Restrepo y Julin Gonzlez.Rev Col Cien Pec. Vol 16:1,2003

112
El azar y la probabilidad

2. Si se lanzan dos monedas, cul es la probabilidad de que salgan una cara y un sello?
3. En el lanzamiento de seis monedas:
a. Cul es la probabilidad de que todas salgan cara o todas sellos?
b. Cul es la probabilidad que 5 sean caras y una sea sello?
c. Cul es la probabilidad que 3 sean sellos y tres sean caras?

GESTIN DE LA ACTIVIDAD

Observe que en el tringulo de Pascal cada fila se obtiene de la inmediata superior, de esta
forma se escribe un 1 en cada extremo y debajo de cada par de nmeros contiguos se es-
cribe la suma, as, cada fila representa la posibilidad de que salgan cara o sello al lanzar un
nmero determinado de monedas.

Es importante resaltar la forma del tringulo de Pascal en la obtencin de binomios perfec-


tos, cubos, etc.

Principios fundamentales de conteo


El conteo o enumeracin, puede ser un proceso intuitivo primario del nio, que se interio-
riza o mejor an se estructura como una intuicin secundaria en la escuela al realizar los
primeros estudios sobre aritmtica, pero que luego se va desentendiendo o prestando poca
atencin debido al poco campo de aplicacin que se le encuentra en esta etapa para luego
recordrsele nuevamente en el lgebra, quizs la geometra y el clculo en el estadio de las
operaciones formales, lo anterior no tiene sentido ya que se necesita una continuidad en la
formalizacin de la conceptualizacin del nio.

Numerosas investigaciones demuestran que con frecuencia los estudiantes universitarios


(adultos) presentan sesgos en su razonamiento probabilstico como una consecuencia de un
razonamiento y una formacin deficiente en conteo (combinatoria).

El conteo hace parte de las matemticas discretas, su estudio sistemtico comenz en el


siglo XVII, cuando se plantearon problemas de tipo combinatorio en el estudio de los juegos
de azar, pues contar el nmero de objetos que verifican ciertas propiedades es tan impor-
tante para encontrar la solucin de problemas de diversos tipos, sobre todo en el clculo de
probabilidades de sucesos.

Para adentrarnos a la obtencin de resultados correctos en el desarrollo de las probabili-


dades, debemos considerar algunos conceptos bsicos de conteo al igual que de teora de
conjuntos ya que ambos son complementarios.

Empezaremos considerando nuevamente la palabra experimento, para referirnos a las


observaciones obtenidas de situaciones tanto en forma incontrolable, as como las que se
obtienen en condiciones controlables.

113
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Cuando efectuamos un experimento, se puede tener uno o ms resultados, los cuales denomina-
remos eventos. Aqu se tiene el primer contacto como conjunto. Por ejemplo si deseamos contar el
nmero de bacterias producidas en un vaso de yogurt, algunos eventos de inters pueden ser:

A: Contenido de 1500 bacterias.


B: el nmero de bacterias que contiene est entre 1500 y 3000.000

Tambin los eventos pueden estar asociados al lanzamiento de un dado como en la seccin
anterior, e interesarnos solamente por:

A: Se observe un nmero par.


B: se observe un 2 o un tres.
C. Obtener un dos.

Aqu se puede empezar a trabajar en la diferenciacin de eventos, pues en el caso de los dados,
la obtencin de un nmero par, se puede descomponer en varios como: obtener 3, 5, 7, 9, 11,
de esta forma el evento inicial se convierte en un evento compuesto, por el contrario el evento
obtener un 2, no se puede descomponer, razn por la cual se le llama evento simple.

Se aprovecha la teora de conjuntos para expresar las relaciones entre varios experimentos
asociados. Si consideramos los conjuntos en forma topolgica como agrupaciones de puntos,
se puede asociar cada evento simple con un experimento, en el cual cada punto distinto es
llamado punto o espacio muestral, as este espacio es considerado como un experimento
en el que se asocian todos los posibles puntos muestrales.

Nace as el concepto de espacio muestral finito, cuando los puntos del experimento son fini-
tos o un nmero infinito contable (enumerable) de puntos muestrales, tales espacios se les
denomina discretos. Por ejemplo en el conteo de los puntos entre 1500 y 3000.000 es infinito,
pero aqu se puede establecer una correspondencia biunvoca entre el nmero de puntos
muestrales diferentes y los nmeros enteros.

Puede observarse que el evento es un subconjunto del espacio muestral.

Actividad n 4 Una obra de teatro

En la institucin educativa donde usted labora, se va a montar una obra de teatro, que se
debe estrenar en dos semanas, por lo apresurado de la agenda se escoge a tres hombres
y dos mujeres para que protagonicen los papeles principales (masculino y femenino), de
cuntas formas puede elegir el director a esta pareja?

Actividad n 5 Vistiendo muecos

Un grupo de nios de tercero, posee un mueco el cual deben vestir, es decir colocarle ca-
misa y pantaln, cuentan con tres camisas y dos pantalones, de cuntas maneras diferentes
pueden ellos vestir al mueco?

114
El azar y la probabilidad

Actividad n 6 Recin casados

Una pareja de recin casados decide comprar una cocina y un equipo de sonido, el almacn
a donde acuden, le ofrecen 4 tipos de equipo de sonido de tres marcas diferentes y 3 clases
de cocina. De cuntas maneras distintas pueden realizar la compra?

Actividad n 7 Sobre la subjetividad de la aleatoriedad

Se introducen dos regletas de igual tamao pero una de color rojo y otra de color amarillo dentro
de una bolsa. Se saca una al azar y se anota el color, se devuelve la regleta a la bolsa.

Situaciones para reflexionar


1. Un estudiante anota los siguientes resultados:
a. R, R, R, R, R, A, A, A, A, A
b. R, A, R, A, R, A, R, A, R, A
c. R, A, R, R, R, A, A, R, A, R
Cul secuencia considera que sea la correcta?
2. Despus de haber obtenido un resultado y devolver la regleta a la bolsa, crees que pue-
das predecir con seguridad el prximo resultado?
3. Si realizas otras 10 extracciones y anotas los resultados, esto sera una especie de
entrenamiento,de acuerdo con lo anterior es ms probable que la prxima regleta sea
roja que amarilla?
4. De los ltimos tres resultados escritos, te parece ms probable alguno de ellos?

GESTIN DE LA ACTIVIDAD

El objetivo es indagar sobre la percepcin del estudiante sobre la regularidad representada en


la convergencia de la frecuencia relativa de sucesos elementales que conllevan a la probabilidad
frecuencialista, con patrones aleatorios de muestras pequeas. Se interesa tambin el ejercicio
por la aplicacin intuitiva de la regla de Laplace, en cuanto a la equiprobabilidad de eventos.

La respuesta c presenta una sucesin en la cual se manifiesta la regularidad global y la


variabilidad local.

En la segunda pregunta, el objetivo es ver si el estudiante posee el concepto de probabilidad,


debido a que el estudiante puede hablar de suerte, o no comprender el trmino seguro, o en
un ltimo caso puede creer que puede influenciar el azar, controlando el experimento, por
ejemplo tratando de palpar las regletas. Al respecto, Fischbein dice que en los estudiantes
se presentan algunas distorsiones en los juicios probabilsticos debido a que no poseen
una definicin clara de los trminos: cierto, posible e imposible, llegando incluso a
confundir raro con imposible.

115
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Actividad n 8

Colocar 4 regletas de diferente color (amarillo, verde, azul, roja) en fila. De cuntas formas
se pueden alinear?

GESTIN DE LA ACTIVIDAD

Se trata de una situacin de colocacin de objetos distinguibles (diferentes regletas de di-


ferentes colores) en posiciones (las cuales pueden ser celdas, casillas) distinguibles, igual-
mente se puede analizar como una situacin cuyo esquema es la seleccin ordenada con
agotamiento de todas los elementos, lo cual hace necesario un riguroso establecimiento de
posiciones (cuatro en este caso) sin repeticin (elegir las 4 regletas en orden sucesivo).

Se observa que la regleta roja puede ocupar la primera posicin de 4 formas, obtenindose
un cambio de las dems, esto da la idea bsica de permutacin y por lo tanto se puede ha-
blar de un modelo como la forma de permutar (cambiar) n elementos tomando n a la vez, sin
tener repeticiones de ellos, as es conveniente aplicar la notacin de n!.

Actividad n 9

Se introducen en una bolsa 4 regletas, dos amarillas, una verde y una caf. Se toma una regleta
al azar y se anota su color. Sin volver la regleta a la caja, se toma una segunda regleta y se
anota su color. Se contina as hasta seleccionar las 4 regletas.De cuntas formas diferentes
se puede realizar la seleccin?.

GESTIN DE LA ACTIVIDAD

Se tiene un esquema donde la seleccin es el ordenamiento en el cual se combinan elementos


distinguibles y no distinguibles (las dos regletas del mismo color). En este modelo las formas
de obtener las secciones corresponden al cambio de un nmero determinado de objetos en el
cual se repite una de ellas dos veces. Como puede verse, se trata de una seleccin exhaustiva
donde el orden es importante y en el cual en las regletas de igual color, el cambio de orden
no produce una nueva seleccin.

Este modelo para los grados superiores, puede llevarse a la permutacin con repeticin sin duda con
elementos que el estudiante puede tener en cuenta sin problemas de aprendizaje y aplicacin.

116
El azar y la probabilidad

En general, para este modelo igual que el anterior al permutar n elementos tomando r a la vez, es
importante el orden y adems se tiene en cuenta los elementos que se repiten de cada grupo.

Una manera importante de ver este concepto es en el trabajo con diagrama arbolar, veamos
o que sucede en este anlisis:

La situacin del verde se repite para el caf, de tal manera que se obtiene una solucin del
problema en forma acertada, este tipo de diagrama da al estudiante una visin de la estruc-
tura del problema, y a partir de l, los estudiantes asimilan el principio constructivo de las
configuraciones combinatorias y adems, les proporciona un significado intuitivo global para
la comprensin del modelo (frmula) algebraica. Este diagrama tambin, le da una forma de
lo que significa la enumeracin en forma elemental.

Es de anotar que para ejercicios donde el resultado es muy grande, queda casi imposible la
manera de usar este diagrama, adems, debe tenerse en cuenta que se pueden presentar
algunas dificultades en el estudiante en la interpretacin del diagrama, pues en ocasiones
cuando el nmero de enumeracin es grande, trata de buscar un patrn aplicando una fr-
mula algebraica que puede ser la no conveniente.

Actividad n 10

Se dispone de tres vasos iguales con jugo (ver figura). Se desean colocarlos sobre 4 porta-
vasos de diferentes motivos: Uno con la bandera de Antioquia, el otro con la bandera del
Nacional, otro con la Bandera del Medelln y un ltimo con la bandera del Envigado. Como
cada portavaso slo puede contener a lo sumo un vaso. De cuntas formas se pueden co-
locar los vasos sobre los portavasos?.

117
Mdulo
5 Pensamiento aleatorio y sistemas de datos

GESTIN DE LA ACTIVIDAD

Se trata de un modelo en el cual se trata de colocar objetos no distinguibles (vasos igua-


les) sobre objetos distinguibles (portavasos con diferentes logos), generndose un modelo
donde el orden no interviene, teniendo una seleccin no ordenada. En este momento, el
docente, segn el grado donde est trabajando introduce el concepto de combinacin en
forma adecuada. Observe que el orden de colocacin de los vasos (seleccin) no produce
nuevas combinaciones.

Seleccionar 3 vasos idnticos entre cuatro portavasos diferentes, se realiza una seleccin
no exhaustiva ya que en cada portavaso se coloca un solo vaso, de forma que los vasos no
se pueden repetir, de esa forma el orden de seleccin de los portavasos no produce nuevas
configuraciones, es decir el orden de colocacin no influye para la formacin de nuevas
configuraciones, lo anterior nos lleva a la idea de combinaciones.

Actividad n 11

Para simular una lotera, se introducen en una bolsa tres balotas numeradas con los dgi-
tos 3,5 y 6. Extraemos una balota a l azar y anotamos el dgito, no se devuelve a bolsa y se
saca una segunda balota, se repite el proceso. Cuntos nmeros distintos de tres cifras se
pueden obtener?

Actividad n 12

Un parqueadero dispone de 5 casetas numeradas del 1 al 5, si llegan tres clientes potenciales


y ninguna de las casetas est ocupada, de cuntas formas se pueden parquear?

118
El azar y la probabilidad

GESTIN DE LA ACTIVIDAD

Esta situacin trata de colocar tres objetos diferentes (distinguibles) en celdas distinguibles,
se puede interpretar como una situacin de seleccin ordenada sin reemplazamiento, esto
indica que cada que se tome una decisin por parte de un cliente en la escogencia de la
caseta, se produce una nueva configuracin, debido a que cada cliente puede seleccionar
una caseta disponible.

Veamos como se puede utilizar el diagrama de las celdas con la aplicacin del principio de
la multiplicacin:

Observe que el cliente 1 se puede ubicar de 5 formas diferentes, quedando 4 casetas dispo-
nibles para el segundo y tres para el tercer cliente.
Pero tambin, y en grados superiores puede emplearse el modelo algebraico de las variaciones.
En general, se trata de la colocacin de r objetos en n celdas, teniendo en cuenta el orden de
colocacin, lo cual nos lleva a conceptuar sobre las variaciones.

Actividad n 13

Un estudiante, posee cuatro lminas de diferentes equipos de ftbol, y decide repartirla


entre tres de sus amigos. De cuntas formas diferentes es posible realizar el reparto?

GESTIN DE LA ACTIVIDAD

Esta situacin trata del reparto de un conjunto de objetos diferentes (las lminas) en tres
subconjuntos distinguibles (sus amigos). No hay restriccin en la forma de reparticin, es
decir, respecto al nmero de objetos en cada subconjunto, lo cual lleva a la formacin de
grupos de 4 personas, entre un conjunto de 3 elementos (personas), con repeticin en la cual
el orden de los elementos en el grupo influye.
Este modelo, que es de particin y seleccin tiene en cuenta la identificacin de un patrn
de formacin de las configuraciones, vemos un anlisis:
El nmero de elementos a repartir puede ser 0,1,2,3 4 porque un amigo puede recibir
exactamente esa cantidad, ya que si decide darle las 4 lminas a uno slo, los dems no
recibirn ninguna.
Se puede aprovechar para descomponer el 4 en diferentes y posibles sumandos:

119
Mdulo
5 Pensamiento aleatorio y sistemas de datos

a. 4 = 4+0+0 = 0+4+0 = 0+0+4; con lo cual se indica que existe una sola forma de repartir
las lminas (las 4 a cada uno de los 3).
b. 4 = 1+3+0 = 1+0+3 = 3+0+1 = 0+1+3 = 3+0+1 = 0+3+1, cada una de las seis des-
composiciones, da lugar a 4 configuraciones posibles (modos de repartir las lminas).As,
por ejemplo si se tiene las lminas de N, E, M, y C al asignarle una de ellos a un amigo,
las otras 3 se asigna a otro de los amigos.
c. 4 = 2+2+0 = 2+0+2= 0+2+2. Aqu, cada una de las tres descomposiciones obtenidas,
da lugar a 6 configuraciones diferentes, en efecto se puede aplicar el modelo algebraico
de combinacin, al no poder repetir objetos y adems, como el orden no influye, las dos
lminas que se dan a una persona 4 de 2.
d. Finalmente, 4 = 2+1+1 = 1+2+1 =1+1+2. cada una de estas tres descomposiciones,
da lugar a 12 nuevas configuraciones. Si se han distribuido dos lminas a uno de los
amigos (para lo cual hay 6 configuraciones) las otros dos se distribuyen entre los amigos
restantes, lo cual se puede realizar de dos maneras diferentes, al aplicar el principio de
la multiplicacin, se obtienen las 12 configuraciones.
e. Si se suman los totales de las configuraciones, se obtienen: 3x1+6x4+3x6+3x12=81

La otra forma de analizar la situacin, que puede ser ms conveniente en grados inferiores
a 8 es la colocacin en celdas de las reparticiones as:

Observe la acomodacin en las celdas (amigos) 4 la asignacin de las tres lminas (equipos).

Actividad n 14

En una bolsa, se tienen 4 balotas seleccionadas con los nmeros 3, 5, 6 y 8. se elige una balota
de la bolsa , se anota su nmero y se devuelve a la bolsa. Se elige una segunda balota, se
anota su nmero y se devuelve a la bolsa, finalmente se elige una tercera balota y se anota
su nmero. De cuntas formas puede obtenerse un nmero de tres cifras?

120
El azar y la probabilidad

Actividad n 15 La locura instantnea31

La situacin problmica es: A un arquitecto le piden construir dos columnas formadas


por 4 cubos cuyas caras son de diferentes colores (4), pero las columnas se deben colocar
de modo que aparezcan los cuatro colores (diferentes) en cada uno de los cuatro lados de
la columna. En la segunda los 4 colores iguales en cada uno de los lados de la columna.

GESTIN DE LA ACTIVIDAD

Se empieza a reforzar el trabajo con estudiantes de octavo y noveno grado basados en las
situaciones problemas y el uso adecuado de las regletas de Cuisinaire. En esta fase se logra in-
crementar el razonamiento de los estudiantes, y a potenciar la creatividad lgica en general.

Se trata de contrastar en parte, la teora de Fischbein32 realizando indagaciones en estu-


diantes cuyas edades oscilan entre 9 a 13 aos y circunstancias bajo las cuales stos ad-
quieren esquemas combinatorios, as como las posibilidades y estrategias de intervencin
didcticas pertinentes.

Se debe primero dibujar en el plano el cubo y luego pintar las caras y despus armar los
cubos y de esta manera tratar de hallar la solucin. La situacin anterior se resuelve de la
siguiente forma en el aula:

Formar grupos de cuatro estudiantes, cada uno construye un cubo de iguales dimensiones por
ejemplo todos de 5 cm. de lado. Se pintan con colores diferentes las seis caras (pueden ser:

_____________________________________________________

31
Adaptado del texto: Matemticas Discretas y combinatoria. Pg. 541 Ralph P. Grimaldi
32
Effects of age and instruction on combinatory hability in children. (1970)

121
Mdulo
5 Pensamiento aleatorio y sistemas de datos

amarillo, azul, rojo, verde). El objetivo del juego es colocar los cubos en una columna, de modo
que aparezcan los cuatro colores diferentes en cada uno de los cuatro lados de la columna.

Luego cada columna con los 4 colores diferentes por cada cara de la columna formada.
Para intentar estimar el nmero de disposiciones posibles, se pueden realizar las siguientes
preguntas:

a. Si queremos colocar el primer cubo en la parte inferior de la columna,cuntas formas hay


de hacerlo?.
b. Al colocar el cubo 2 sobre el primero, de cuntas maneras se puede hacer?.
c. Si continuamos con este razonamiento cuntas formas hay en total para los cuatro cubos?.

Este problema se puede extender de acuerdo con el grado, se les pide que pinten las 6 caras
de los 4 cubos, repitiendo 2 colores y se le realizan las mismas preguntas. Se pueden dejar
dos caras sin pintar y resulta otro tipo de ejercicio. Se puede dejar una sola cara sin pintar y
las otras caras con diferentes colores etc. Realizarlo con todas las caras de diferentes colores.
Se debe manejar cada situacin que se presente y analizarlas siempre con 4 cubos y con las
mismas condiciones, ya que si presenta las diferentes situaciones para armar una columna
(por ejemplo 1 cubo sin dos caras sin pintar, 1 con 2 caras repetidas, otro con 6 colores dife-
rentes etc.) se le forma ya no una situacin sino un verdadero caos.

Hacer 4 cubos con los mismos colores y se repiten dos colores

Otra variacin, hacer 4 cubos dejando dos caras sin pintar.

Veamos como se podra solucionar la situacin inicial:

122
El azar y la probabilidad

Cubo 1 Cubo 2

Cubo 3 Cubo 4

Observe que la situacin anterior requiere:


1. Saber donde ubicar cada color, ya que al armar los cubos, se pueden tener una o ninguna
solucin de la situacin.
2. Aprovechar la manera de mover los cubos para ensear el concepto de rotacin y las formas
en que puede realizarse.
3. Conceptuar sobre combinaciones y permutaciones.
4. Tambin se introduce el concepto de probabilidad, despus de obtener el espacio muestral.

Las preguntas a resolver:


1. De cuntas formas se puede ubicar el cubo de la base?
2. Cuntas opciones tiene el siguiente cubo?
3. El tercer cubo de cuntas maneras puede ubicarse?
4. Y el cuarto?
5. En total cuntas formas existen de formar las combinaciones?
6. Cmo se resolver la situacin si se pintan los cubos con 6 colores diferentes?

Estimemos el nmero de disposiciones posibles. Si se quiere colocar el cubo1 en la parte


inferior de la columna, hay a lo sumo cuatro formas posibles, al desdoblar el cubo 1 vemos
que no hay diferencia si se coloca la cara roja o la cara amarilla opuesta sobre la mesa. Slo
nos interesa las 4 caras restantes en la base de la columna. Con tres pares de caras opuestas,
habr como mximo cuatro formas de colocar el primer cubo. Ahora considere el segundo

123
Mdulo
5 Pensamiento aleatorio y sistemas de datos

cubo, aunque se repitan algunos colores, ningn par de caras opuestas tiene el mismo co-
lor. Por lo tanto se tienen 6 formas de colocar el segundo cubo sobre el primero. Entonces
podemos rotar el segundo cubo sobre el primero para ubicar la columna con diferentes
colores, de tal forma que no se cambie la cara de arriba del primer cubo o la cara de abajo
del segundo cubo. As con 4 rotaciones posibles se puede colocar el segundo cubo de 24
formas diferentes; observe que se hace necesario la aplicacin del teorema fundamental de
la multiplicacin, continuamos con este razonamiento, y se observa que hay 4*24*24*24 =
55296 FORMAS POSIBLES POR CONSIDERAR para resolver el problema, sin embargo podra
no haber solucin al armar las torres.

Ahora resuelva la situacin para la segunda columna.

Actividad n 1633

Al acabar una reunin a la que asisten cierto nmero de personas, entre ellas se dan la mano.
Cuntos apretones de mano se dieron si haba 5 personas?.
Cuntos apretones de mano se dieron si haba 7 personas?.
Cuntas personas haba si en total se dieron 6 apretones de mano?.
Cuntas personas haba si en total se dieron 45 apretones de mano?
Llamando n al nmero de personas escribe una expresin en funcin de n que d el nmero
de apretones de mano.

GESTIN DE LA ACTIVIDAD

Esta situacin puede relacionarse con una anloga de Geometra plana, basta para ello sugerir
al estudiante una representacin, que por una parte le permite hallar la expresin pedida,
basado en regularidades y patrones, en donde las personas se representan por puntos del
plano (no alineados) y cada apretn un segmento que tiene por extremo dos de los puntos
dibujados, como se ve a continuacin.

En este caso se obtendr un saludo entre dos personas A y B.

Entre tres personas, se da la siguiente ilustracin.

Lo que nos indica que hay 3 apretones de manos entre tres personas

_____________________________________________________

33
Adaptada de Carmen Azcarate y Jordi Deulofeu. Funciones y grficas.

124
El azar y la probabilidad

Si hay 4 personas, ocurre algo ms estructurado

Lo que indica que intervienen las diagonales del cuadrado, en este caso se tiene 2 diagonales
sumadas al nmero de lados, nos da 6 saludos. Observe que parece ser que de cada vrtice
sale una diagonal por lo que en total para la suma de diagonales por vrtice se tienen 4; sin
embargo cada diagonal es realmente una lnea, de esta manera, existen dos diagonales en
cualquier cuadriltero.

A partir de este momento se le propone al estudiante hallar el nmero de diagonales de un


polgono, conocido el nmero de vrtices del mismo.

As desde el grado 6 se puede llevar a cabo la solucin de la siguiente forma: teniendo en


cuenta esta tabla, presentada por Mnera :

N Total de
Total de
Figura N N diagonales diagonales que Total
diagonales en
polgono Lados vrtices que salen por salen de todos saludos
el polgono
cada vrtice los vrtices
Tringulo
Cuadriltero
Pentgono 5 5 2 10 5 10
Hexgono
Heptgono
Octgono
Nongono
Decgono
Enegono n

Se debe llegar a la siguiente conclusin para el total de saludos: , a partir de

la cual se debe variar el tipo de pregunta y de acuerdo con el grado.

_____________________________________________________

34
Tabla adaptada de Jhon Jairo Mnera, en el documento: construcciones de aprendizajes matemticos desde el enfoque de situa-
ciones problemas.

125
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Observe que la solucin a la situacin se puede realizar utilizando el modelo de combi-


nacin, ya que se tiene n personas para que se saluden entre dos, lo cual nos conlleva a
saludos para el caso de encontrasen 30 personas.

Actividad n 17

De cuntas formas diferentes pueden sentarse alrededor de una mesa circular un padre y
sus tres hijos?

GESTIN DE LA ACTIVIDAD

En este tipo de actividad, se agrupan los elementos de tal manera que se deja en una posicin
fija un elemento, en este caso p que representa al padre, las dems posiciones las cuales
son h1, h2, y h3 se deben permutar para obtener el nmero pedido de formas diferentes.
Observe que se tienen en total 6.

Se debe proponer al estudiante un proceso con 5 elementos para buscar un patrn que lo
gue hacia una conclusin, la cual le permita obtener permutaciones circulares para cual-
quier nmero de elementos.

Actividad n 18

De cuntas formas diferentes pueden ubicarse las vocales y las consonantes b y c en la


siguiente figura?

126
El azar y la probabilidad

GESTIN DE LA ACTIVIDAD

En esta actividad debe tenerse en cuenta el principio fundamental de la multiplicacin, en


el cual se permuta en forma circular 6 elementos y el otro elemento queda ocupando una
posicin central, para ello debe basarse en el patrn obtenido en la propuesta anterior.

OTRAS SITUACIONES CON PROBABILIDADES

GESTIN DE LA ACTIVIDAD

El objetivo de la actividades siguientes es observar de modo a priori las conclusiones de


los estudiantes, ya que la mayora puede decidir que la respuesta correcta es la d, en la
actividad n 1, sin tener en cuenta el razonamiento combinatorio puesto en escena en las
actividades anteriores, recurriendo de esta manera al sesgo de la equiprobabilidad, adems,
intervienen los sucesos compuestos.

Para la actividad n 2 se pone en juego la equiprobabilidad y la estimacin frecuencial de la


probabilidad.

En la tercera actividad, se trata de que el estudiante se inicie en predecir algunas situaciones,


basado en reglas sencillas que le sern de utilidad para calcular probabilidades de eventos
compuestos, los cuales son dependientes o independientes.

Actividad n 19

Cuando se lanzan tres dados simultneamente, Cul de los siguientes resultados es ms


probable que ocurra?
a. un 3, un 2 y un 5.
b. Un 6 tres veces.
c. Un 4 dos veces y un 6.
d. Los tres resultados son equiprobables.
e. Es imposible saberlo.

Actividad n 20

Cul de las siguientes afirmaciones te parece verdadera cuando se lanza un dado?. Dar una
explicacin a tu razonamiento.
a. La probabilidad de obtener un tres es mayor que la de obtener un cinco.
b. La probabilidad de obtener un dos es menor que la de obtener un cuatro.
c. La probabilidad de obtener un uno es igual a la de obtener un seis.
d. La probabilidad de obtener un dos es mayor que .

127
Mdulo
5 Pensamiento aleatorio y sistemas de datos

Actividad n 21

Si se tiene en una bolsa 3 regletas de color blanco y tres de color azul, de tamaos congruen-
tes (igual medida) y forma, describe todos los posibles resultados si:
a. Se saca la primera regleta, se anota su color y se introduce en la bolsa nuevamente.
b. Igual al anterior, pero no se devuelve la regleta a la bolsa.

Actividad n 22

Al lanzar dos monedas simultneamente, es ms fcil obtener una o dos caras?

GESTIN DE LA ACTIVIDAD

Una forma de representar las posibilidades de la actividad anterior, es el clculo de las pro-
babilidades a partir del diagrama arbolar, muy til cuando se trata de experimentos com-
puestos, a continuacin se puede observar la construccin de dicho rbol.

Un anlisis es :puesto que en la mitad de las veces se obtiene cara en el primer lanzamiento
(experimento) y de esta mitad, la mitad de las veces se obtiene cara en el segundo lanza-
miento, la probabilidad de obtener dos caras es la mitad de un medio, lo que es un cuarto.
En el diagrama del rbol, matemticamente, la probabilidad final de un resultado se obtiene
como el producto de las probabilidades en cada rama que lleva a dicho resultado.

Conceptos y procedimientos
En la siguiente actividad es de vital importancia el reconocimiento de la relacin existente
entre la combinatoria y la probabilidad, adems, se estudian las concepciones de los estu-
diantes sobre las sucesiones de Bernoulli, empezando por la idea de sucesin limitada de
ensayos, que progresivamente se va ampliando.

Uno de los conceptos que interviene es el de probabilidad condicional, el cual nos indica
la probabilidad de que un evento B suceda cuando se sabe que algn otro evento A se ha

128
El azar y la probabilidad

presentado, lo anterior se expresa matemticamente como P(B | A). esta expresin, comn-
mente se lee la probabilidad de que el evento B ocurra dado que ocurri A. Como frmula
funciona de la siguiente manera:

P(A | B) = P (A B)/ P(A), en donde P(AB) es la probabilidad de que los sucesos A y B se


den simultneamente, teniendo en cuenta el espacio muestral.
Para los eventos independientes, la ocurrencia de uno, no afecta al otro, teniendo entonces
matemticamente la siguiente forma:
Dos eventos A y B son independientes, si y slo s:
P(B |A) = P(B) y P(A| B) = P(A)
Lo anterior trae como consecuencia que: P(AB) = P(A)P(B) en eventos independientes.
La actividad presta atencin primero en que se trata de una experiencia aleatoria, y como
segundo, nos hallamos frente a una breve sucesin de pruebas Bernoulli, ya que cada ex-
traccin tiene en cuenta dos posibles resultados.

Actividad n 23

En una bolsa se tienen dos regletas, una de color verde y otra de color amarillo, ambas de
iguales dimensiones (forma y tamao). Se saca una de ellas, se anota su color y se devuelve
a la bolsa.

a. Realiza la experiencia dos veces ms.


b. Crees que existen otras posibles secuencias en la extraccin de las regletas?. En caso
afirmativo, escribe alguno de los resultados que podran haber salido.
c. De los ltimos resultados que escribiste, cul te parece ms probable?.Explique.
d. Es posible escribir todos los posibles resultados que se pueden obtener al sacar tres
veces una regleta de la bolsa, si cada vez se devuelve la regleta a la bolsa?
e. Realiza 5 extracciones y anota su resultado.
f. De acuerdo con los resultados anteriores es ms probable que la prxima regleta extrada
sea azul?
g. Supongamos que se tiene el siguiente juego entre dos personas, y una de ellas apuesta a
que siempre saca la regleta amarilla. En cada extraccin se juega una moneda de $50. Si
la regleta sale amarilla, gana $50 en caso contrario pierde una moneda de $50. La persona
al principio del juego tena 50 monedas. Realiza esta prueba 10 veces como si fueses el
apostador y anota tus resultados.
h. Segn los resultados,cuntas monedas tendras ahora?.
i. Haz una grfica, de acuerdo a la frecuencia y el nmero de monedas que tienes despus
de cada jugada. ( Repita el experimento 3 veces de la extraccin de las diez regletas)

129
Mdulo
5 Pensamiento aleatorio y sistemas de datos

60
59
58
57
56
55
54
53
52
51
50
49
48
47
46
45
44
43
42
41
40
1 2 3 4 5 6 7 8 9 10

j. Despus de las 5 primeras jugadas, el jugador tena 51 monedas. Ha pasado de 50 a 51


monedas siguiendo la secuencia: A V A A V.
k. Existen otras secuencias?.
l. Cul es la mayor ganancia que se puede obtener en las 5 primeras jugadas?
m. Es lo anterior poco o muy probable?
n. El jugador tiene ahora 53 monedas y va a realizar tres jugadas ms. es ms probable
que despus de estas jugadas tenga nuevamente 53 monedas, que tenga tres ms o que
tenga tres menos que antes? Explica.

Actividad n 24

Para la ruleta representada por el grfico siguiente:

130
El azar y la probabilidad

El conjunto de resultados posibles es {verde, amarillo, rojo}, con la siguiente funcin fre-
cuencial:
Rojo
Verde 3/8
Amarillo 3/8
Cul es la probabilidad de obtener el suceso {rojo, verde}?

Actividad n 25

Cul es la probabilidad de obtener cara y 6 en el lanzamiento simultneo de una moneda


y un dado?

Actividad n 26

En una bolsa se tienen 3 bolas de color rojo y 6 bolas de color amarillo. Se extraen sucesivamente
dos. Llamamos el suceso A=obtener la bola roja y el suceso B=obtener la bola roja.
Hallar la probabiliodad de obtener los sucesos A y B, es decir, P(A y B) en los siguientes casos:
a. Se devuelve la primera bola a la bolsa.
b. No se devuelve la bola a la bolsa.

Actividad n 27

Una urna contiene 6 monedas de $500 y 4 de $100. Se extraen dos monedas, una a continua-
cin de otra y sin reemplazamiento.
Cul es la probabilidad de que ambas sean de $100?.
Cul es la probabilidad que la primera sea de $500 y la segunda de $100?
Cul es la probabilidad que las dos sean del mismo valor?
Cul es la probabilidad que la segunda sea de $500?

131
Mdulo
5 Pensamiento aleatorio y sistemas de datos

132
Construcciones Bsicas del Doblado de Papel

Bibliografa

ABEL, Daz. Armando., Gutirrez (1986). Curso de estadstica general. U de A. Facultad de


educacin.

BATANERO, C. (2000) .Significado y comprensin de las medidas de posicin central.

BATANERO, C. (2001). Didctica de la estadstica. Geeug.Granada.

BATANERO, C., Godino, J , y Navarro _ Pelayo. (1994). Razonamiento Combinatorio. Madrid.


Sntesis.

BATANERO, C., J.Godino. (1997). Concepciones de los maestros de primaria en formacin sobre
los promedios.(paper).

BATANERO, C., J.Godino.,D. R.Green.,P. Holmes y A. Vallecillos. Errores y dificultades en la


comprensin de los conceptos estadsticos elementales.(Paper).

BATANERO., Godino y Navas (1997) .Concepciones de los maestros de primaria en formacin


sobre los promedios.(paper).

Biblioteca de Consulta Microsoft Encarta 2005. 1993-2004 Microsoft

BROUSSEAU, G.( 1983).. Les obstacles epistmologiques et les problmes en mathmatiques.


Recherches en didactique des mathematiques.

CAIZARES, Jess.(1997). Influencia del razonamiento proporcional y combinatorio y de creencias


subjetivas en las intuiciones probabilsticas primarias. Tesis de doctorado.

CISNEROS, Jos y otros. (2005). Implementacin e interpretacin de los estndares bsicos de


Matemticas. Medelln.

CISNEROS, Jos. Estadstica. Educacin semipresencial. Coopropol.1998.

COBO, Belen y Carmen, Batanero. (2000). La mediana en la educacin secundaria obligatoria:un


concepto sencillo.(paper). .

CURSIO, F. (1989). Developing graph comprensin. Reston.

133
Mdulo
5 Pensamiento aleatorio y sistemas de datos

DUBOIS, J.G (1984). Une sistematique des configurations combinatories simples. Educational
studies in mathematics. Paris.

ENGEL, A (1973). Probabilidad y estadstica. Valencia.

ENGEL, A., Varga, T. y Walter, W. (1976). Hasard ou strategie?. Paris.

ESTRADA, Asuncin. Anlisis de las actitudes y conocimientos estadsticos elementales en la


formacin del profesorado.(paper).

FISCHBEIN, E. (1975). The intuitive sources of probabilistic thinking in children.

FISCHBEIN, E. y Gazit, A. (1988). The combinatorial solving capacity in children and adolescents.

GODINO, J ., Batanero, C. (2001) Estocstica y su didctica para maestros. Granada.

GODINO, J., Batanero, C. y Caizares, M. (1987). Azar y probabilidad. Fundamentos didcticos


y propuestas curriculares. Editorial Sntesis.

GULLON, A.(1970). Introduccin a la estadstica aplicada. Editorial Alambra.

INHELDER, B y Piaget, J. (1955). De la logique de lenfant a la logique de ladolescent. Paris.

KAHNEMAN, D., Slovic, P. y Tversky, A. (1982). Judgement Ander uncertainty: Heuristics and
biases. Cambrige university.

KREYSZIG, Erwin (1973). Introduccin a la estadstica aplicada. Principios y mtodos.Edit Limusa..

LEVIN, Richard.(1996) Estadstica para administradores. Prentice Hall.

MENDENHALL,William., Scheaffer, Richard. y Wackerly, Dennis.(1986) Estadstica Matemtica


con aplicaciones. Grupo editorial Iberoamrica.

MINISTERIO DE EDUCACIN NACIONAL .Lineamientos curriculares para matemticas. Santaf


de Bogot.1998.

MINISTERIO DE EDUCACIN NACIONAL. Anlisis de Pruebas saber. Consultado de: http//


www.colombiaaprende.edu.co .

MINISTERIO DE EDUCACIN NACIONAL. Estndares bsicos de Matemticas y Lenguaje


.Santaf de Bogot. 2003.

134
Bibliografa

MNERA, J.(2006). Construccin de aprendizajes matemticos desde el enfoque de situaciones


problemas. Revista Formando maestros.I.E. Normal Superior de Envigado N 3.

PIAGET, J. e Inhelder, B. (1951). La gnese de lide de hasard chez lenfant. Paris. Presses Uni-
versitaires de France.

POLYA (1957). Cmo plantear y resolver problemas. Mxico . Edit.Trillas.

PUGACHEV (1973). Introduccin a la teora de las probabilidades. Editorial Mir.

RALPH P. Grimaldi. Matemticas discreta y combinatoria. Edi. Adison Wesley Longman.

ROA, Guzmn.(2000) Razonamiento Combinatorio en estudiantes con preparacin matemtica


avanzada. Tesis de doctorado. Granada.

SERRANO, L (1996). Significados institucionales y personales de objetos matemticos ligados a la


aproximacin frecuencial de la enseanza de la probabilidad. Tesis de doctorado.Granada.

TUKEY,J.W.(1997). Exploratory data anales. Addisson Wesley.

VICENTE, Manzano y Ana, Duran . Anales de psicologa (2001, Vol. 17): Comprensin y medida
del concepto de simetra.

135
Mdulo
5 Pensamiento aleatorio y sistemas de datos

136