Está en la página 1de 119

UNIVERSIDAD PERUANA LOS ANDES

FACULTAD DE DERECHO Y CIENCIAS POLÍTICAS


ESCUELA PROFESIONAL DE DERECHO

ESTADÍSTICA
CATEDRÁTICO:

FLORES RIVERA, Misael David

VÁLIDO PARA:

TERCER CICLO SECCIONES: A1, C1

2021
m Estadística
3#
Raúl Cerilla Melchor, Roly Quiñones Inga
M
W:

UNIDAD I:
ESTADÍSTICA Y
GENERALIDADES

PRIMER OBJETIVO ESPECÍFICO:


Identificar los orígenes de! derecho mediante la lectura comprensiva de
textos preseieccionados, para que ei estudiante elabore un ensayo sobre
las problemáticas del concepto de Derecho.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
Estadística
Raúl Cotilla Melchor, Roly Quinonez Inga

Lecturas da ía semana 1:
OBLIGATORIOS

Bibliografía 1 (En impreso):


Hugo García Maansilla (2014) Antecedentes históricos de la Estadística y sus
fundones.

Temas de lectura sobre el artículo:


• Antecedentes históricos de la Estadística.

Objetivo:

Bibliografía 1 (En impreso):


Hugo García Mansilla (2014) Antecedentes históricos de la Estadística y sus
fundones.

Temas de lectura sobre el artículo:


« Antecedentes históricos de la Estadística.

Preguntas:
1. ¿Quien fundó la estadística como un mercader de mercería?
2. Que trataba el libro pequeño “ Natural and poísíieal observatiofís”
3. Quien acuñé finalmente la palabra estadística
4. Haga un comentario breve sobre la lectura
ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS
FUNCIONES
Hug® García Mansilfa

1. ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS


FUNCIONES

Al igual que ha ocurrido con otras muchas disciplinas, a lo largo del


tiempo se ha pensado que la estadística es un procedimiento
extraordinariamente complicado. Cuando leemos artículos en los que
aparecen resultados estadísticos nos queda la impresión de que lo dicho
en ellos es una verdad absoluta e incontrovertible que está apoyada por
todo un aparato matemático. Esto no es forzosamente cierto, se puede
adquirir con relativa facilidad un conocimiento básico de la estadística.

1.1 Bosquejo Histórico

Iniciaremos el estudio de la estadística con algunos antecedentes históricos,


que nos mostraran sus aplicaciones, por una parte y por otra, su naturalidad
en situaciones de la vida real.

La estadística fue fundada por el londinense John Graunt, “un mercader de


mercería”, en un pequeño libro “Natural and political Observations made
upon the Bells of Mortality”. Este libro fue el primer intento para interpretar
fenómenos biológicos de masa y de la conducta social: a partir de datos
numéricos escribir las cifras brutas de nacimientos y defunciones en
Londres, de 1604 a 1661. El opúrculo de Graunt apareció en 1662. Treinta
años más tarde, la Royal Society publicó en su “Phiiosophical Transactions”
un artículo sobre tasas de mortalidad escrito por el eminente astrónomo
Edmund Halley. Ambas publicaciones constituyen la base de todo trabajo
posterior sobre esperanza de vida, indispensable para la solvencia de las
compañías de seguros de vida. 1
John Graunt nació en 1620 en Berchin Lañe, Londres, bajo el signo de las
siete estrellas, donde su padre tenía una tienda y el hogar. Aprendió pronto
el oficio de vendedor de mercería y prosperó en el negocio. El éxito le dio la
posibilidad de dedicarse a ocupaciones más amplias que las de la venta
de artículos de mercería. Aubrey lo describe como “una persona muy
ingeniosa y estudiosa... se levantaba muy temprano para sus estudios antes
de abrir la tienda”. Se hizo amigo de Sir William Petty, más tarde autor de
un conocidísimo libro sobre la nueva ciencia de la aritmética política, y
probablemente discutió con él las ideas expresadas en sus “Obervations”
Las tablas de mortalidad, que atrajeron la atención de Graunt, eran
publicadas s^manalmeníe por la compañía de Sacristanes parroquiales y
contenían el número de muertes acaecidas en cada parroquia, sus causas y
también un “Recuento de todos ios entierros y bautizos habidos en la
semana” en las cuales anotaban el número de nacimientos de acuerdo a los
que acudían al bautismo y lo mismo sucedía cuando presentaban sus
defunciones (en las parroquias se llevaba el control).

Un ejemplo de las observaciones hechas por Graunt en 1632 fueron las


siguientes:
Varones
lautizados
Bautizad
Total
Varones
Enterrados 4,60
T o ta I 9,53
-C

Con estos datos deducía las siguientes


observaciones:

a) Hay más varones que hembras


b) Pocos murieron de hambre
c) Hay pocos asesinatos
d) Los lunáticos son pocos

Las “Observations” impresionaron tan favorablemente a Carlos II, que este


propuso especialmente a Graunt como socio fundador de la recientemente
constituida Royal Society. Para prevenir cualquier posible objeción al hecho
de que Graunt era tendero, “su majestad dio este encargo particular a su
Sociedad, de que si encontraban algún comerciante más dé su estilo, lo
admitiesen sin más ceremonia”. Graunt fue elegido socio fundador de la
Royal Society en 1662.

El mérito de las “Observations” fue inmediatamente reconocido, y fomentó el


estudio de las estadísticas de vida en el continente. El libro alcanzó varias
ediciones. La quinta, publicada tras la muerte de Graunt fue ampliada por
Petty. Los historiadores han discutido largo tiempo la contribución de Petty
al trabajo original. Aubrey que era malicioso, sólo dice que Graunt fue
“inspirado” por Petty, pero implica mucho más. Parece indudable que el
libro es una obra conjunta.

Desde luego, Graunt escribió la mayor parte, incluidas las aportaciones


científicas más valiosas. Petiy añadió lo que Thomas Browne llamaría
“Elegancia”, y así aumentó la popularidad del libro. Sir William Petty era un
hombre presuntuoso y algo engreído, incapaz de decidir si patrocinar a
Graunt o acreditar su trabajo. No hay pruebas de que alguna vez hubiese
entendido la importancia y originalidad de lo que había hecho su amigo.

Graunt fue miembro del consejo común de la ciudad y desempeñó otros


cargos, pero al convertirse al catolicismo dejó el comercio y cualquier otra
obra pública. Graunt tenía cabeza y talento para el trabajo, y era jocoso y
fecundo en su conversación.

Graunt murió de ictericia la víspera de Pascua en 1674 y fue enterrado en ia


iglesia de St. Dunston.

John Arbuthnot1

En los trabajos de Graunt y Halley se basó John


Arbuthnot en 1970 para probar la existencia de Dios.
Su argumento dice:

No es posible la suposición de que el sexo está


distribuido entre la descendencia humana en una
forma puramente casual; debe intervenir una
providencia divina que controla las proporciones de
los sexos.
La demostración de Arbuthnot es el primer ejemplo conocido de inferencia
estadística. Anchenwall un economista, acuñó en 1760 la palabra estadística,
que deriva del término italiano statista. La raíz de la palabra procede del
latín status que significa estado o situación.

'www_history.mcs.st-andrews.ac.uk/history/pictDisplay/Arbuthnot.html
Estadística
Raúl Conila Melchor, Roly Quinonez Inga

Lecturas d@Sa semana 2°


OBLIGATORIOS

Bibliografía 1 (En Impreso):


Hugo García Mansilla (2014) Estadística General:
Temas de lectura sobre el artículo:
® conceptos Básicos.

Objetivo:

Definir adecuadamente los términos estadísticos y construir modelos mediante la


organización de distribución de datos.

Preguntas:
5. ¿Qué se entiende por estadística?
6. ¿Cómo se llama el área de la cual los datos estadísticos son recopiiados?.
7. ¿Porqué es importante la estadística?
8. Haga un paralelo entre la estadística descriptiva e inferencias

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
CAPITULO 1

ESTADÍSTICA GENERAL.
CONCEPTOS BÁSICOS

;QUE ES LA ESTADÍSTICA?

Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer


lugar, comprender lo que él termino significa en la actualidad así como conocer algo de
su origen.

Como en la mayoría de los vocablos, la palabra “estadística” tiene diversos significados


para diferentes personas. Cuando la mayoría de la gente escucha el término lo relaciona
con cuadros o tablas llenas de cifras sobre nacimientos, muertes, matrimonios,
divorcios, accidente de automóviles, etc., que ofrecen, por ejemplo, en los almanaques
anuales, y que indudablemente usan el término con toda corrección. A decir verdad, el
término en cuestión fue inicialmente usado para tabular las funciones del Estado en lo
que respecta a los datos necesarios para una planeación idónea, reglamentaciones y
recaudación de impuestos. Los cobradores de impuestos y los encargados de hacer
este tipo de análisis eran llamados “estadísticos” por su dedicación a compaginar datos
e informes requeridos por el Estado.

En la actualidad, desde luego, la palabra “estadística” se aplica en este primer sentido


para casi todo relacionado con los informes basados en hechos y consignados en base
a números, lo que comúnmente se denomina: "Hechos y cifras”. Los anunciadores de
radío y televisión nos informan que “en unos cuantos minutos darán la estadística del
juego ...’y los periódicos con frecuencia publican artículos a cerca de concursos de
belleza en los cuales brindan las “estadísticas” de las concursantes.

Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con
la materia los desconoce. La estadística es una rama del conocimiento el campo de las
matemáticas aplicadas, que utiliza sus propios símbolos, términos, contenido, teoremas
y técnicas. Cuando se estudia la "estadística” normalmente se pretende dominar
algunas de estas técnicas.

Para todos aquellos ya iniciados en los misterios de campo de las estadísticas, el


vocablo tiene una segunda aceptación; las estadísticas son cantidades que han sido
calculadas con datos de muestreo: una sola cantidad así calculada se denomina
“estadística”. Por ejemplo, la media de la muestra es una estadística, así como también
lo son la mediana de la muestra y el modo. La varianza de la muestra es una estadística,
como también lo es la gama de la muestra. El coeficiente de correlación de la muestra
es asimismo una estadística.

La estadística está desarrollada para tratar con datos numéricos o información


cuantitativa. La palabra "estadística", por lo tanto ha sido ampliamente referida ya sea a
la información cuantitativa misma como a los métodos que tratan con la información.
Los estadísticos prefieren llamar a la información cuantitativa Datos Estadísticos y a
los métodos que tratan con la información los Métodos EstadSs&cos.

Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales
podemos recolectar, organizar, presentar y analizar datos numéricos de un conjunto de

1
individuos permitiéndonos extraer conclusiones válidas y efectuar decisiones lógicas
basadas en dicho análisis.

Los DATOS son agrupaciones de cualquier número de observaciones relacionadas.


Para que tos datos sean útiles, las observaciones deben estar organizadas en tai forma
que se puedan identificar tendencias y llegar a conclusiones lógicas.

DATOS ESTADÍSTICOS
La información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o
conjuntos) de números que muestren relaciones significativas. En otras palabras, los datos
Estadísticos son números que pueden ser comparados, analizados e interpretados.

Un número aislado que no se compara o que no muestra relación significativa con otro
número no es dato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos
estadísticos, puesto que las edades pueden ser comparadas y analizadas, y los
resultados de los análisis pueden ser interpretados.

El área de la cual tos datos estadísticos son recopilados, se le conoce como población
o universo.

Si deseamos tener las edades de 25 estudiantes en la clase de Biometría, podemos


simplemente preguntar a cada estudiante su edad: así tenemos un conjunto completo
de datos. Sin embargo recopilar tales datos de una población finita pero grande es
algunas veces imposible o impráctico. A fin de evitar la tarea imposible o impráctica,
usualmente se extrae una muestra de elementos representativos de la población. La
muestra entonces, utilizada para el estudio estadístico y los resultados de la muestra
son usados como las bases para describir, estimar o predecir las características de la
población.

Podemos resumir los significados del término “ Estadístics” como sigue:


1. La acepción publica de cifras y hechos, gráficas y mapas. El término en este
sentido se usa en plural.
2. La materia propiamente dicha, con su terminología, metodología y conocimientos
particulares. Bajo este concepto el término se usa en singular.
3. Cantidades calculadas sobre datos de muestreo, en cuyo caso el término se usa
en plural.

IMPORTANCIA ACTUAL DE LA ESTADISTICA


La aplicación de las técnicas estadísticas se ha extendido tanto, y la influencia de la
estadística en nuestra vida es tan grande, que difícilmente podemos ponderarla lo
bastante.

Nuestra abundancia agrícola actual se puede explicar parcialmente gracias a la


aplicación de la estadística a los planos y a los análisis de los experimentos agrícolas.
Este es un campo en el cual la técnica estadística se utilizó relativamente al principio.
2
Algunas de tas preguntas que los métodos de la estadística ayudan a contestar sor,:
¿Qué clase de maíz da los mejores rendimientos? ¿Qué ciase de mezcla alimenticia se
debe dar a las gallinas para que obtengan el mayor peso? ¿Qué dase de mezcla de
semillas de pasto da mayor número de toneladas de forraje por hectárea? Todas estas
preguntas y cientos mas nos afectan a todos en forma directa a través del mercado
domestico.

La metodología de la estadística también se usa constantemente en la investigadón


médica y farmacéutica. La eficacia de nuevos medicamentos se determina por medio
de experimentos realizados primero en animales y, posteriormente, en seres humanos.
Los adelantos de la investigación médicas y las nuevas drogas nos afectan casi a todos.

La estadística también es empleada por ios gobiernos. La información económica es


objeto de estudio y afecta la polftica del gobierno en lo que respecta a los impuestos y
a partidas asignables a obras públicas (tales como caminos, presas, etc.), a fondos para
la asistencia pública, y otros. La estadística del desempleo influye incrementando los
esfuerzos para disminuir el porcentaje correspondiente. Los métodos estadísticos se
aprovechan para evaluar el funcionamiento de todo tipo de equipo militar, desde las
batas para las pistolas hasta enormes proyectiles dirigidos. La teoría de las
probabilidades y la estadística (espedaimente un nuevo campo llamado teoría
estadística de la toma de decisiones) se usan como ayuda para tomar decisiones
sumamente importantes en los altos niveles.

En cuanto a la industria privada, el empleo de las estadísticas es casi tan importante en


sus efectos como en el sector gubernamental. Se usa las técnicas estadísticas para el
control de calidad de los productos en proceso y para evaluar la aceptación de los
nuevos productos que se van a lanzar al mercado. La estadística se emplea en el
mercado, en las decisiones para la ampliación de los negocios, en el análisis de la
eficacia de la publicidad, etc. Las compañías de seguros se basan en las estadísticas
para fijar sus tarifas a un nivel realista. La lista sería interminable. La estadística se
emplea en la geología, biología, psicología, sodología; en todo sector en el que las
decisiones deben de hacerse a base de los datos o informes incompletos. Se usan
también en pruebas educadonales, para medidas de seguridad en la ingeniería. La
meteorología, la ciencia de la predicción del tiempo, también esta usando la estadística
actualmente.

Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría
supuesto que las estadísticas ayudaran a un erudito o a un investigador histórico a
determinar quien es el autor de obras en disputa? En este particular, creemos que el
ejemplo mas conocido es el del empleo de las estadísticas para establecer la prolongada
controversia sobre quien fue el autor de los ensayos literarios en los “Federalist Papers”.

En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena
tiene la pesca de las truchas; sobre cual sería el tipo más adecuado del vaso para el
agua de los restaurantes; así como la estrategia óptima para juegos de destreza y azar,
tales como el bridge, los solitarios, el veintiuno, el béisbol, etc.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en


todo y en cada uno de nosotros. Los resultados de los estudios estadísticos se pueden
ver, aunque quizás no se comprendan, al recibir nuestros sueldos, en los pagos de
pensiones, del seguro social, los premios de las primas de seguros, en nuestra
satisfacción al consumir diversos productos y en nuestra propia salud.

3
G L A S E S D E E S T A D ÍS T IC A

La estadística normalmente se divide en dos grandes categorías: La estadística


DESCRIPTIVA y ia estadística INFEREMCiAL

Como complemento a las breves consideraciones de los elementos básicos de la


probabilidad, hay dos clases de estadísticas tratadas en este libro. El nombre que
naturalmente mas se ajusta a este tipo de estadística es el de estadística descriptiva.
La clasificación de datos; el trazo de los histogramas que corresponden a las
distribuciones a una población; la representación de los datos por medio de otras clases
de gráficas, tales como las lineales, las gráficas en barras, los pictogramas; él cómputo
de medidas muéstrales, medianas y modos; él cómputo de varianzas, las medidas de
las desviaciones absolutas y de la gama; todas estas operaciones se refieren a la
estadística descriptiva. La labor estadística ejecutada en el siglo XIX y principios de este
siglo, fue en su mayor parte la estadística descriptiva.

ESTADÍSTICA DESCRIPTIVA
Significado de Estadística

La palabra “Estadística’’ ha sido frecuentemente referida a la información cuantitativa o


numérica. También ha sido referida ampliamente a los métodos que se tratan con ia
información. Sin embargo esto debería aclararse y llamar a la información, datos
estadísticos y a los métodos, métodos estadísticos.

La estadística descriptiva es la parte de la estadística que agrupa las técnicas apropiadas


para la organización, representación y descripción de un conjunto de datos con el
propósito de resaltar sus rasgos, más importantes y extraer la información esencial que
contiene. En nuestros términos, diremos que la estadística descriptiva permite tener una
visión “a vuelo de pájaro” de la variable que miden los datos para adelantar conclusiones
acerca de ella o preparar un estudio mas fino de la misma para la toma de alguna decisión.

En pocas palabras, la Estadística Descriptiva permite tener una visión “a vuelo de


pájaro* de la variable que miden los datos para adelantar conclusiones acerca de ella
o preparar un estudio más fino de la misma, para la toma de alguna decisión.

Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de
Historia. Como él está usando estadística para describir el
comportamiento de esa clase y no para hacer una generalización
acerca de varias clases, se puede decir que él está usando estadística
descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal
forma que sean más fáciles de entender son ejemplos de estadística
descriptiva.

ESTADÍSTICA INFERENCIA!.
Y su significado

La segunda parte importante de la estadística se refiere a la EstadSstics SnfmmcM.


Antes definimos a ia estadística como la ciencia para tomar decisiones ante alguna
incertidumbre; esto es, llegar a la mejor resolución sobre bases de una información
MUESTRA: Una muestra es una agrupación de algunos elementos de la población, pero
no todos. La mayoría de las veces no es posible o práctico observar todos los eiemenios
de la población, en todo caso se toma solo una parte de ella.
PARÁMETRO: Cuando una medida se calcula a partir de los datos de una población.
ESTADÍSTICO: Cuando una medida se calcuîa a partir de los datos de una muestra.

MEDIDA ESTADÍSTICO (MUESTRA) PARAMETRO (POBLACIÓN )


Medía aritmética (Promedio) X
M
Desviación Estándar S a
Número de datos o elementos n N
VARIABLE; Es una característica que toma valores diferentes en personas, lugares y
cosas diferentes.
VARIABLE ALEATORIA: Son variables cuyos valores son el resultados de factores
fortuitos.
VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los
valores que esta puede obtener (estos valores se asocian a cualquier valor entero).

Ejemplos 1.3:
« El número de automóviles vendidos en un mes.
« El número de clientes esperando servicio en la caja de un
supermercado.
s El número de tubos electrónicos de T.V. producidos en una hora
determinada.

VARIABLE ALEATORIA CONTINUA; Es aquella que puede tomar cualquier valor de


entre todos los contenidos en un intervalo de recta.

Ejemplo 1.4:
o La cantidad de energía eléctrica producida en una planta
hidroeléctrica en un día.
© El tiempo necesario para completar el ensamblaje de un artículo en
una planta. !
o La cantidad de petróleo bombeado cada hora en un pozo.

La estadística está desempeñando un importante papel ascendente en casi todas las facetas
del progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su
influencia se extiende a la agricultura, biología, negocios, química, comunicaciones,
economía, educación, electrónica, medicina, física, ciencias políticas, psicología,
sociología, y otros campos de la ciencia. Este desarrollo de la estadística está ligada a los
métodos científicos en la toma, organización, presentación y análisis de los datos, tanto
para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con
tales análisis.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en


todos y cada uno de nosotros. Los resultados estadísticos se pueden ver, aunque quizás
no se comprendan, al recibir nuestro salario, en los pagos de pensiones, los premios de
las primas de seguro, en ^’^stra satisfacción al consumir diversos productos y en nuestra
propia salud.

6
Estadística
Raúl Cotilla Melchor, Roiy Quiñonez Inga

Lecturas de la semana 3:
OBLIGATORIOS

Bibliografía 3 (En impreso):


Carlos Veliz Capuñay (2010) Distribución de frecuencias

Temas de lectura sobre el articulo:


© variables estadísticas.

O b je tiv o : Definir adecuadamente las variables estadísticas y construir modelos


mediante la organización de distribución de datos.

Preguntas:
9. ¿Qué se entiende por variable estadística?
10. ¿Cómo se clasifican ías variables?.
11. ¿Existen otras variables diferentes a la variable nominal y ordinal y cuáles son?
12. Haga un paralelo entre la variáble nominal y ordinal

UÍNÜVERSfDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
VARIABLES ESTADÍSTICAS
Las variable^ constituyen la herramienta fundamental de la Estadística, por
que son la base esencial del estudio que s@ desea realizar y por tal motivo
analizaremos cómo pueden ser éstas.

Las variables son:

- Características.
- Atributos.
- Rasgos.
- Cualidades.

Oe acuerdo con el tipo de medida que describe cada una de las variables,
éstas se clasifican en dos tipos que son:

1. Variables cualitativas.
2. Variables cuantitativas.

Las variables cualitativas se subdividen en:

a) Nominales b) Ordinales

Definición

Variable cualitativa es cuando solamente se busca en ella una cualidad o


un atributo.

Variable cualitativa nominal es aquella que agrupa los elementos en


categorías sin
tener un orden.
Variable cualitativa ordinal es cuando las categorías en que se agrupan los
elementos, pueden ser ordenados.
Las variables estudiadas de acuerdo con sus características, se resumen en
el siguiente cuadro:

VARIABLE <

a) Discreta
CUANTITATIVA
V b) Continua
1. NOMINAL

Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia. Este tipo de variables sólo nos permite establecer relaciones de
igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza
en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de
variables es el Género ya que nosotros podemos asignarle un valor a los hombres y otro
diferente a las mujeres y por más machistas o feministas que seamos no podríamos establecer
que uno es mayor que el otro.

2. ORDINAL

Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia contando con un orden lógico. Este tipo de variables nos permite establecer
relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o
menor que otra. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede
establecer que una persona con título de Postgrado tiene un nivel de educación superior al de
una persona con título de bachiller. En las variables ordinales no se puede determinar la
distancia entre sus categorías, ya que no es cuantificable o medible.

3. INTERVALO

Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números
de su escala es igual. Con este tipo de variables podemos realizar comparaciones de
igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente
entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que
operaciones como la multiplicación y la división no son realizables. Un ejemplo de este tipo de
variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la
misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una
temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.

4. RAZÓN

Las variables de razón poseen las mismas características de las variables de intervalo, con la
diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia
total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta,
Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables
permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son
algunos ejemplos de este tipo de escala de medida.

Debido a la similitud existente entre las escalas de intervalo y de razón, SPSS las ha reunido en
un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las variables de
escala son para SPSS todas aquellas variables cuyos valores representan magnitudes, ya sea que
cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuación los
diferentes procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de medida de
cada variable.

B. Análisis Descriptivo de aroerd© al nivel de Medida

No todos los procedimientos estadísticos son realmente útiles para la totalidad de los niveles de
medida. Cada uno de los tipos de medida posee ciertas características, las cuales debemos tener
en cuenta en el momento de realizar un análisis descriptivo. En la tabla [5-2], encontrarás
algunos de los procedimientos que resultan ventajosos en los análisis descriptivos de los
diferentes niveles de medida. Es necesario aclarar que esta tabla es sólo una muestra de, las
medidas que se pueden emplear; en algunos textos de estadística aparecen tablas más amplias y
detalladas de los procedimientos.

Escala de Medidas de Medidas de Medidas de


Frecuencias dispersión distribución Gráficos
medida posición
Sectores y
Nominal Si Moda No No
Barras
Sectores,
Ordinal Si Moda No No
Barras Áreas
Media, Histograma,
Escala No Mediana, Si Si Áreas
Moda Dispersión

Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los
mismos procedimientos de análisis, por lo que se agrupan como variables categóricas. A partir
de este punto cuando nos refiramos a las variables categóricas debemos recordar que se alude a
las variables de tipo Nominal y Ordinal.

Es importante resaltar que para los análisis descriptivos no hay una gran diferencia entre estos
dos tipos de variables, pero si existe diferencia en los análisis de Inferencia. Antes de conocer
como se efectúan estos procedimientos en SPSS, es necesario exponer las razones por las que
ciertos procedimientos no son de utilidad en algunos de los niveles de medida.

B.1« Variables Categóricas

Para las variables que representan categorías o grupos de pertenencia, los principales
procedimientos estadísticos, que se pueden utilizar en su análisis descriptivo son las frecuencias
(Recuento), el Porcentaje, i&Moda, en algunos casos la mediana y los gráficos más favorables
son el de Sectores y el de Barras.

Para comprender mejor la razón de estos procedimientos vamos a realizar el análisis de la


variable Género, la cual cuenta con los valores ( 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 2 , 2 ) ; en donde el valor uno
(1) representa al género Femenino y el valor Dos (2) al género Masculino. Las frecuencias y sus
respectivos porcentajes para esta variable serían los expuestos en la tabla [5-3]. Ahora si
hallamos las principales medidas de tendencia central, obtenemos los resultados expuestos en Ja
tabla [5-4].

Género del encuestad© Estadísticos


Frecuencia Porcentaje
Válidos Femenino g 80 0 Media 1 .20
Masculino 2 20.0 Mediana u to
Total 10 100 0 Moda 1r 5-4

Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos indica
que en promedio los encuestados cuenta con un género de (1.2). Este resultado no posee una
interpretación aplicable a la información de la variable, por lo que esta medida no es de utilidad
en el análisis descriptivo.

Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al
género Femenino, pero si en vez de 10 valores tuviéramos únicamente dos (1 y 2), la mediana
sería de (1.5), cuya interpretación no es aplicable a la información de la variable. La mediana se
puede utilizar cuando estamos trabajando con variables que contienen un elevado número de
categorías y su interpretación se debe manejar como un factor informativo para el investigador
y no como una medida representativa en el reporte.

Por último encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que la
categoría con mayor frecuencia dentro de la variable es la correspondiente al género Femenino.
Las medidas de dispersión y distribución no son aplicables a este tipo de variables ya que sus
ecuaciones nos permiten determinar cómo se comportan los datos respecto a un punto central o
media. Si hallamos la desviación estándar para los datos del ejemplo, obtendríamos un valor de
0.42164, que nos indicaría que el promedio del género presenta una variación de ±0.42, cuyo
resultado no sería aplicable a la interpretación de la variable.

B.2. Variables de Escala

Este tipo de variables nos permite realizar análisis más profundos de los datos, aplicando una
gran variedad de medidas. Al contrario de las variables categóricas en este tipo de variables las
frecuencias no son de utilidad en los análisis descriptivos, debido a la gran cantidad de valores
que suele tomar. Supongamos que realizamos un sondeo de edad con una muestra de 500
personas, si generamos una tabla de frecuencias obtendríamos fácilmente unos 60 o 70 rangos
diferentes haciéndola muy extensa y poco informativa.

Para las variables de escala son más informativas la medidas como la media, la mediana, la
desviación estándar, la asimetría y otras más, a las cuales se les suele denominar Medidas de
Resumen.
Estadística
Raúl Conila Melchor, Roly Quiñonez Inga
■.’iis'i
'

Lecturas de 8a semana 4:
OBLIGATORIOS
a

Bibliografía 1 (En impreso):


Carlos Veliz Capuñay (2010) Distribución de frecuencias

Temas de lectura sobre el artículo:


variables estadísticas cuantitativas, p. del 3 al 13

Objetivo: Definir adecuadamente las variables estadísticas cuantitativas y


construir modelos mediante la organización de distribución de datos.

Preguntas:
13. ¿Qué se entiende por variable estadística cuantitativa?
14. ¿Cómo se clasifican las variables cuantitativas?.
15. ¿Existen otras variables diferentes a la variable discreta y continua y cuáles son?
16 . Haga un paralelo entre la variable discreta y continua.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
Universidad Católica Andrés Bello
Preparaduría Probabilidades y Estadísticas

UNIVERSIDAD CATOLICA ANDRES BELLO


Uib. Montalbán - La Vega - Aparrado 29068
, ^ ^ Teléfono: 471-4148 Fax: 471-3043
M Caracas. 1021 - Venezuela
$ iH f ___________
¿acuitad de Ingeniería
Escoda de Ingeniería Informática

ESTADÍSTICA DESCRIPTIVA (VAffiAtiÜsS)


a

Variables: Es una característica o atributo que puede asumir diferentes valores y se


dividen en cualitativas y cuantitativas.

o Cualitativas: Son aquellas que no aparecen de forma numérica, sino como


categorías o atributos (sexo, profesión, color de ojos).

® Cuantitativas: Son aquellas que pueden expresarse numéricamente


(temperatura, salario, número de hijos). A su vez este tipo de variables se
dividen de la siguiente forma:

« Variables Discretas: Son el resultado de contar y sólo toman valores


enteros (número de hijos).
« Variables Continuas: Son el resultado de medir y pueden contener
decimales (temperatura, peso, altura).

Debemos destacar que los problemas expuestos en esta sección son sacados de libros,
guías, internet o cualquier otra herramienta bibliográfica.

1) Determinar el tipo de variables (cualitativas, cuantitativas discretas, cuantitativas


continuas)
c i/alií¿Tio<¡.i
Variables fiJct». Cuantitativas Discretas Cuantitativas Continuas
Sexo de ios estudiantes
Peso
Estado Civil
Carreras que se estudian en la
UCAB
Calificación de un producto (muy
bueno, bueno, regular, malo, muy
malo)
Puntuaciones en un test de
inteligencia
Número de estudiantes en un

Preparador: BduardoLakatos Contreras


Universidad Católica Andrés Bello
Preparaduría Probabilidades y Estadísticas

salón de clases
Religión
Salario mensual de una empresa
Clase social de los alumnos de la
UCAB
Números de la ruleta
Temperatura registrada en un mes
Código Postal
Cantidad de acciones vendidas en
la bolsa de valores
Edad

Escala de Medición: Son las escalas que se utilizan para clasificar más detalladamente las
variabJes las cuales se dividen en 4 niveles (nominal, ordinal, intervalo, razón)

e Escala Nominal: Clasifica los datos en categorías mutuamente exclusivas. Es una


asignación numérica a atributos sin que exista una relación de orden o jerarquía
entre ellos.

« Escala Ordinal: Clasifica los datos en categorías que pueden ser jerarquizadas o
divididas en rangos, sin embargo no se puede determinar con precisión las
diferencias entre rangos. Existe la relación mayor o menor que entre las
categorías de la variable.

e Escala de Intervalo: Esta escala en contraste con la ordinal tiene diferencias


precisas entre unidades de medida, sin embargo el cero es relativo, esto quiere
decir que si en la medida de la variable da cero no hay suficientes argumentos
como para garantizar la ausencia dei mismo. (Si medimos la temperatura en
grados Celsius y nos da 0° esto no quiere decir que hay ausencia de temperatura,
al igual si medimos el coeficiente intelectual de un individuo y nos da 0 esto no
quiere decir que el individuo tiene ausencia de inteligencia, en estos casos el
cero es relativo)

o Escala de Razón: Posee todas las características de la escala de intervalo y existe


un cero absoluto por lo tanto existen razones verdaderas entre diferentes
unidades de medida.

2) (Prof. José Campos) Indique la escala de medición de las siguientes variables


(nominal, ordinal, intervalo, razón)

Variables Nominal Ordinai Intervalo


Sexo de los estudiantes X
Peso
Estado Civil x
Carreras que se estudian en la UCAB X

Preparador: Eduardo Lakatos Contreras


Universidad Católica Andrés Belio
Preparaduría Probabilidades y Estadísticas

V
A
Calificación de un producto (muy bueno, bueno,
regular, malo, muy malo)
Puntuaciones en un test de inteligencia 1 X
Religión X
Número de estudiantes que le escriben a un X
desconocido por el chat
Clase soda! de los alumnos de la UCAB X
Número de estudiantes en un salón de clases X
Marca de Refrescos X
Temperaturas medidas en un laboratorio cada hora X
Distancia diaria recorrida por cada estudiante para ir de X
su casa a la UCAB
Tiempo que requiere un estudiante para responder un X
examen
Puntuación de los estudiantes en un examen X
Preferencia por cierta marca de refresco X
Parroquias a las que pertenecen los estudiantes que X
estudian en la UCAB
Cantidad de acciones vendidas en la bolsa de valores ■ ! X
Vida media de los bombillos (medido en horas) ; X
Escuelas a la que pertenecen los alumnos de la UCAB X

Preparador: Eduardo Lakatos Contreras


Estadística Raul Corilla Melchor - Roly Quiñones Inga

rz ,

UNIDAD II:
REPRESENTACIÓN GRÁFICA Y
MEDIDAS DE CENTRALIZACIÓN

PRIMER OBJETIVO ESPECÍFICO:


Identificar e interpretar las representaciones gráficos y mediante los
cálculos apropiados hallan las medidas;de centralización para datos
cuantitativos adoptando criterios adecuados en la construcción de
modelos estadísticos descriptivos, para su aplicación oportuna en el
análisis e interpretación de datos para cas'os reales mostrando precisión,
perseverancia y seguridad en el tratamiento de los datos, uso de
calculadora y/o computadora como instrumentos.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
Estadística Raul Corilla Melchor - Roly Quiñones Inga

1
1

OBJETIVO ESPECÍFICO

Identificar los elementos esenciales de una representación gráfica


para elaborar en el programa Microsoft Excel.

CONTESTA LAS PREGUNTAS

© ¿Cuáles son los elementos de un gráfico estadístico?


® ¿Qué procedimiento se realiza para elaborar un gráfico
estadístico? 1
© ¿Cómo se presenta un gráfico estadístico?
© Elabora un gráfico estadístico en el programa Microsoft
Excel.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
ESTADISTICA DESCRIPTIVA

MÉTODOS GRÁFiCOS

La forma de la distribución de frecuencias se percibe más rápidamente si la I


representamos gráficamente. Se resume la información de la muestra de forma
grafica con fines clarificadores o para enfatizar y descubrir determinadas
características que de otra manera seria muy difícil de apreciar. Un gráfico
siempre es mas inmediato de comprender que un conjunto de datos
estadísticos. Las representaciones graficas varían según el tipo de variable:

a. Gráficos para variables Discretas y Categóricas

DIAGRAMA DE BARRAS: Es la representación gráfica usual para variables


cuantitativas discretas o para variables cualitativas. En el eje de ordenadas ,
representamos los diferentes valores de la variable (X j) . Sobre cada valor
levantamos una barra de altura igual a la frecuencia (absoluta o relativa).
Ejemplo:
180
160
140
120
100
80
60
40
20
0
1er 2do 3er 4to
trim . trim . trim . trim.

DIAGRAMA DE SECTORES O DE PASTEL: Es el más usual en variables


cualitativas. Se representan mediante círculos. A cada valor de la variable se le
asocia el sector circular proporcional a su frecuencia.

Ejemplo: Los siguientes datos corresponden a una encuesta referente a


elecciones locales de un partido político:

Xj f¡
a favor 50%
en contra 40%
abstención 1 0%

Para construir el diagrama de sectores partimos del hecho de que un circulo


encierra un total de 360 grados. Luego, mediante una regla de tres simple,
repartimos los 360 grados en distintos sectores, de acuerdo con cada
porcentaje; tenemos así que para determinar el sector correspondiente al 50%,
resolvemos la ecuación:

I00

Prof. Simón Cabrera página 13 de 32


ESTADISTICA DESCRIPTIVA

Esto es, el 50% corresponde a un sector circular de medida 180 grados. A


/ continuación, con ayuda de un transportador, señalaremos el sector circular de
medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10%
se tiene 36 grados. La siguiente figura muestra la representación grafica.

b. Gráficos para variables continuas

HISTOGRAMA: Es la representación gráfica de las frecuencias agrupadas de


una variable continua sobre intervalos. A diferencia de los diagramas de barras,
los histogramas dibujan rectángulos unidos entre si, lo que significa que existe
continuidad en la variable cuyos valores se representan en el eje horizontal que
se haya dividido en intervalos de igual amplitud. Las áreas de los rectángulos
son proporcionales a las frecuencias que representan. f

E je m p lo : 8

H istogram a correspondiente a las horas extras


laboradas por un grupo de obreros petroleros.

15 20 25 30 35 40 45 50 55 60 65

Clases

Prof. Simón Cabrera página U de 32


Facultad : Ingeniería
Escuela : Computación
Asignatura: Eroprwiáfea^

Tema: "CREACIÓN DE GRÁFICOS ESTADISTICOS EN EXCEL 2 013".



Objetivos ThS
Distinguir los diferentes tipos de gráficos que posee Microsoft Excel 2 0 1 3 .
Crear gráficos estadísticos en hojas de cálculo. • i,
v.>.

Introducción.

E
n Microsoft O ffice Excel 2013, es fácil crear gráficos de aspecto profesional. Sólo con
seleccionar un tipo, un diseño y estilo de gráfico (opciones de fácil acceso en la nueva cinta de
opciones de Office Excel 2013), obtendrá resultados profesionales inmediatos cada vez que
cree un gráfico. Para hacerlo aún más sencillo, puede guardar sus gráficos favoritos 'cómo una
plantilla de gráfico que'podrá aplicar rápidamente cuando cree un nuevo gráfico.

85 Crear gráficos en Excel


99
Para crear un gráfico básico en Excel que pueda m odificar y dar formato más
adelante, debe especificar, en primer lugar, los datos del gráfico en una hoja de
1 0 0 ---------------- 1
-------- c -= 3 -----
cálculo. A continuación, sólo tiene que seleccionarlos y elegir el tipo de gráfico
que desea utilizar en la cinta de opciones (ficha Insertar, grupo Gráfi¿ás).
4- Datos de la hoja de cálculo. -‘ I
2 G ráfico creado a partir de datos de la hoja de cálculo.- '0 ,
TRI TR2

Excel ofrece varios tipos de gráficos para mostrar datos


ante una audiencia de forma elocuente. Cuando cree un
gráfico o modifique uno existente, puede elegir entre
distintos tipos de gráfico (gráfico de columnas o circular)
y subtipos (gráfico de columnas apiladas o gráfico 3D).
Puede crear también un gráfico combinado utilizando
varios tipos de gráficos en uno solo.

Ejemplo de gráfico com binado que usa un tipo de gráfico


de columnas y líneas.
E E 3 P ro y e c ta d o 1----- 'Rea!

Materiales y Equipo a utilizar


Guía de Laboratorio N° 8.
Computadora con W indow s 7 y Microsoft Excel 201 3.
Dispositivo de Almacenamiento (USB).

E B SB 9
Cargar en pantalla el archivo Alm acen.xlsx, que al tenerlo en pantalla nos daremos cuenta que
posee varias hojas en la parte inferior. Primeramente nos iremos a la hoja llamada VENTAS.
2 EmpremáfUta, Guía 8

Tipo: Columnas.
E s tilo : C o lu m n a a g r ip a d a eirá 3 © /

1. Vamos a seleccionar los datos desde la celda DEPTO hacia la derecha hasta ABRIL y después
hacia abajo hasta sombrear todos los números.
2. Clic en Insertar
3. Clic en Insertar gráfico de columnas:
4. Estilo: Columna agrupada en 3D
5. Modificarlo hasta que se vea así:
PRIM ER TR IM ESTRE 2014

r DEPTO ¡ ENERO i MARZO ¡ ABRIL


ÁHÜÁCHAPAN 25000 41000 75000
SONSONATE i 15700 .. 26000 82000 1 ENERO
SANTA ANA , 65000 45000 16000 MARZO
LA LIBERTAD 1 45 300 ■ 39000
35000 B ABRIL
CHALATENANGO | ..61000 , . 430ÓQ .35000

U JSlhriw

Antes nos movemos a la hoja llamada COMPRAS.


G R A F IC 0 2 :

Tipo: Circular.
Estilo: Circular 3D
1. Vamos a seleccionar los datos de las 2 columnas Sucursal y Zapatos incluyendo todos los números
de estas 2 columnas. j
2. Clic en Insertar ;
3. Clic en Insertar gráfico circular o de anillos:
4. Estilo: Circular en 3D 1
5. Modificarlo hasta que se vea así:
COM PRAS AL PROVEEDOR DE ZAPATOS

° CENTRO c PLAZA M U N D O SAN LUIS o APOPA » LOURDES


Empremáíisc, Guíes 8

Tipo: Ciresjlcar.
isfsb e ClrgyBor
1. Vamos a seleccionar los datos de las 2 columnas Sucursal y Carteras pero por estar separadas
necesitamos utilizar la tecla CTRL para poderlas sombrear individualmente, si tienes duda de cómo
hacerlo consultarle a tu instructor.
2. Clic en Insertar
3. Clic en Insertar gráfico circular o de anillos:
4. Estilo: Circular
5. Modificarlo hasta que se vea así:

COMPRAS DE CARTERAS A SIMAN

COMPRAS
SUCURSAL I ZAPATOS I CARTERAS I CINCHOS
CENTRO
A
PLAZA M UNDO

iCÉNTOO m PLAZA MUNDO SAN LU/5 mAPOPA m LOURDES

Tipo: Circular.
Estilo: Anillo.
1. Vamos a seleccionar los datos de las 2 columnas Sucursal y Cinchos pero por estar separadas
necesitamos utilizar la tecla CTRL para poderlas sombrear individualmente.
2. Clic en InsertaV
3. Clic en Insertdr gráfico circular o de anillos:
4. Estilo: Anillo j
5. Modificarlo hbsta que se vea así:
COMPRA DE CINCHOS AL MERCADO CENTRAL
Empremótica, Guía 8

Antes nos movemos a la hoja llamada NOTAS.


3 3 3 S !
1. Vamos a seleccionar los datos de las 4 columnas desde Estudiante hasta N ota3 de los primeros 5
alumnos.
2. Clic en Insertar
3. C lic en Insertar gráfico cuadro combinado:
4. Estilo: Columna agrupada - línea ;
5. M odificarlo hasta que se vea así: el

■ *
MATERIA: EMPREMATICA PRIMER PERIODO

1 8

VERONIKITA JUANITO

NOTAI

1. Vamos a seleccionar los datos de las 2 columnas de Estudiante y Promedio u tiliza n d o .^ tecla Ctrl
y sombrear todos los alumnos en ambas columnas.
2. Clic en Insertar #
3. Clic en Insertar gráfico radial
4. Estilo: Radial con marcadores •
5. M odificarlo hasta que se vea así:

PROMEDIO DE LOS ESTUDIANTES

; ESTUDIANTE NOTAI NOTA2 W0TA3 PROMEDIO &.0Q


7.C0
60}

JOSESiTO
H ü i :
1. Vamos a seleccionar los datos de las 3 columnas de Estudiante, N o ta l y Nota3 utilizando la tecla
Ctrl y sombrear los primeros 4 alumnos en ambas columnas.
2. Clic en Insertar
3. Clic en Insertar columna
4. Estilo: Columna apilada
5. M odificarlo hasta que se vea así:

6.5
ESTUDIANTE NOTAI NOTA2 NOTA3 PROMEDIO

6 MOT A3

o N O TAI

B l M l

Para el siguiente ejercicio necesitamos incluir una nueva columna después de la de PROMEDIO, se
llamara TOTAL

En ella necesitamos diseñar una fórmula que nos permita saber cuántos alumnos son APROBADOS y
para ello utilizaremos la formula condicional de SI. Digitaremos la siguiente formula debajo de la
palabra TOTAL.

= s ó (f7 > = 6 ;1 ;" " ) enter

La columna nos quedara así:

ESTUDIANTE NOTAI PJOTA2 N0TA3 PROMEDIO TOTALESÍ Ahora al lado derecho


PEPITO 1 S IIIS s 3 5.33 diseñaremos una tablita
JÜAN1TO1 ? liB I f s : pequeña que nos dará estos
resultados:
A R M A R IA ' V - ’-'
KARiNA 5
ESTADO R E S illS j
APROBADOS
REPROBAQOS^
6 Empremótica, Guia 8

En este momento veremos cómo obtener los datos de 7 y 2 de respuesta. Así:


En la celckfcde la derecha de la palabra APROBADOS escribimos lo siguiente:
=sum a(g7:g15) y dar enter
Nos da la suma de todos los números 7 /
En la celda de la derecha de la palabra REPROBADOS escribimos lo siguiente:
=contar.blanco(g7:g15) y dar enter
Nos da como resultado la suma de los espacios en blanco que hay en ese rango y nos da 2

GRAFIC08:
1. Vamos a seleccionar los datos de las 2 columnas
2. Clic en Insertar
3. Clic en Insertar G ráfico Circular
4. Estilo: Circular
5. M odificarlo hasta que se vea así:
ESTADO RESULTADO
RESULTADO DE LOS PROMEDIOS
APROBADOS
REPR03A0GS

I APROBADOS
I REPROBADOS

Antes casi terminando la práctica de hoy nos movemos a la hoja llamada ENCUESTA. Esta posee los
siguientes datos: i

A D U LTO S N IN O S
DEPARTAMENTO HOMBRES MUJERES DEPARTAMENTO VARONES HEMBRAS DEPARTAMENTO TOTALES
-AHUACHAPAN 241 AHUACHAPAN 24 AHUACHAPAN
SONSONÁTE • MI • 325 - ■ >1 5U N SO í Sa Ü-: .
'SANTA ANA . 245' _ 165 san ta ANA 25 .21 SANTA ANA
LA UBf P.fAO 2o'i; 325 ÍXUBHKTAO. •''' _ tó;. '_ ;S2; LA 1lili R IA !) ^
CHALA i -NANGO . 125,; 412 CHAIA T KNAN GO 37 12 CHALA [ENANCO
¿ABAÑAS 2S4:V ■ 321 CABANAS. 3i CABANAS' ^

IO IA L F S
Ü
1 1

Necesitamos obtener los totales de cada columna utilizando la función llamada =SUMA y en la tera
columna debemos obtener un TOTAL que es la suma de HOMBRES + MUJERES + VARONES
HEMBRAS de cada departamento. Si nos sale todo bien se parecerá así:
ático, Guía 8

H H H H NINOS
DEPARTAMENTO HOMBRES MUJERES DEPARTAMENTO VARONES HEMBRAS DEPARTAMENTO TOTALES^
AHUACHAPAN _1S0 _ 2 4É AHUACHAFAN _ _,5
_S;_ _ '¿¿AM 'AHUACHAFAN m
SÖÄSONATF _ ^ T .^ 1 ~~ ' T .-» ? _____
SANT/VANA. ; s a n t a a ñ a .': S '^ H |p f ;; ?.fe
LÄ LIHÉr Ta »
CHALA fENANCiO __
' ¿S4
.^12r> _
"
_41 2
3? 5
CHALATCNANGO __ a _ 32 ¿2. ü s a k ¡M¡
IPBiES.,

Al final necesitamos obtener un gráfico de la siguiente manera:

TOTALES DE LOS DEPTOS

Sis*JJrilfACHAPAM ' SON50NATE SANTAANA LA LIBERTAD CHALÂTENAMGO GAÜÁflAS

Bueno hasta aquí llega esta práctica de gráficos estadísticos, esperando que hayamos aprendido
como crearlos y diseñarlos de manera profesional. N o se les olvide grabar su archivo cada 5 minutos.
Hasta la próxima.

Investigación y Ejercicios Complementarios.


1. Que es una base de datos?
2. Tipos de ordenamientos en una hoja electrónica?
3. Como filtrar datos en una hoja de Excel

pilo] l[®T9|gel| íejg

1. h ttp ://w w w .a u la c lic .e s /g u ia -o ffic e -2 0 1 3 /in d e x .h tm


Estadística
Raúl Corilla Melchor, Roly Quiñonez Inga

Lecturas de la semana 6:
OBLIGATORIOS

Bibliografía 1 (En impreso):

Moya Calderón, Rufino. (1999). Estadística Descriptiva, Edit. San


Marcos, Lima - Perú.

Temas de lectura del libro:


Medidas de tendencia central (media aritmética, mediana, moda)

Objetivo: Utilizar la media y mediana en la interpretación de datos de manera


precisa y publicar trabajos extraídos de la realidad.

Preguntas:
17. ¿Qué se entiende por medidas de tendencia central?
18. ¿la media aritmética y la mediana son estadísticos e qué se diferencian?, explique
19. ¿Qué es la moda, dar algunos ejemplos?
20. Identifique alguna casos prácticos de aplicación de moda, mediana y media
aritmética

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
Medidas de tendencia central
Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de
la distribución de datos se denomina medida o parámetro de tendencia central o de
centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de
la distribución, independientemente de que esté más o menos centrada, se habla de estas medidas
como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas.

Entre las medidas de tendencia central tenemos:

• Media aritmética
• Media ponderada
• Media geométrica
• Media armónica
• Mediana
• Moda

Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las
medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está
observando, en este caso se observan variables cuantitativas.

La media aritmética
Artículo principal: Media aritmética

La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el
número de sumadores.

Por ejemplo, las notas de S alumnos en una prueba:

niño nota
1 6,0 -Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 -Luego el total se divide entre la cantidad de alumnos:
4 7,0 27,6/5=5,52
5 6,1

• La media aritmética en este ejemplo es 5,52

La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le
llama también promedio o, simplemente, media.

D efinición formal

Dado un conjunto numérico de datos, x\, X2, xD, se define su media aritmética como
Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
también puede calcularse para variables agrupadas en intervalos.

Propiedades

Las principales propiedades de la media aritmética son:3

• Su cálculo es muy sencillo y en él intervienen todos los datos.


• Su valor es único para una serie de datos dada.
• Se usa con frecuencia para comparar poblaciones, aunque es másapropiado acompañarla
de una medida de dispersión.
• Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya
que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio
valor
• Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor prefijado,
esto es, el valor de es mínimo cuando. Este resultado se conoce como Teorema
de König. Esta propiedad permite interpretar uno de los parámetros de dispersión más
importantes: la varianza.
• Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si
entonces, donde es la media aritmética de lo s, para i - 1,..., n y a y b números reales.
• Es poco sensible a fluctuaciones muéstrales, por lo que es un parámetro muy útil en
inferencia estadística.

Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy
diversas, tiene también algunos inconvenientes, como son:

• Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la


cantidad y amplitud de los intervalos que se consideren.

La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).

• Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto
menos homogéneos sean los datos, menos información proporciona. Dicho de otro modo,
poblaciones muy distintas en su composición pueden tener la misma media.- Por
ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m,
evidentemente, tendría una estatura media de 1,95 m, valor que representa fielmente a
esta población homogénea. Sin embargo, un equipo de jugadores de estaturas más
heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría también,
como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi
ninguno de sus componentes.

• En el cálculo de la media no todos los valores contribuyen de la misma manera. Los


valores altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo
del salario medio de una empresa, el salario de un alto directivo que gane 10.000 € tiene
tanto peso como el de diez empleados "normales" que ganen 1.000 €. En otras palabras,
se ve muy afectada por valores extremos.

• No se puede determinar si en una distribución de frecuencias hay intervalos de clase


abiertos.

Media aritmética ponderada


A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para
determinado estudio. En esos casos se puede utilizar una media ponderada.
Si son nuestros datos y son sus "pesos" respectivos, la media ponderada se define de la siguiente
forma:

Media maestral
Esencialmente, la media muestral es el mismo parámetro que el anterior, aunque el adjetivo
"muestral" se aplica a aquellas situaciones en las que la media aritmética se calcula para un
subconjunto de la población objeto de estudio.

La media muestral es un parámetro de extrema importancia en la inferencia estadística, siendo de


gran utilidad para la estimación de la media poblacional, entre otros usos.

Moda
Artículo principal: Moda (estadística)
La moda es el dato más repetido de la encuesta, el valor de la variable con mayor frecuencia
absoluta. En cierto sentido la definición matemática corresponde con la locución "estar de
moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En variables continuas,


expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario
obtener un valor concreto de la variable, se recurre a la interpolación.

Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-Ó-9-5-6-1-5-3-


7. El número que más se repite es 5, entonces la moda es 5.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos
se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen
la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el
intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos
partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
Siendo la frecuencia absoluta del intervalo modal y y las frecuencias absolutas de los intervalos
anterior y posterior, respectivamente, al intervalo modal.
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la
siguiente tabla (debajo):
¡ Caiificaciones [ í 'j í ¡3 ¡4 ¡5 ¡6 [7 ¡8 ¡9;

!Número de alumnos ;2 !|2 *4 I5 (8


: t9 •¡3 1¡4 !\2 1:

Propiedades
Sus principales propiedades son:
• Cálculo sencillo.
• Interpretación muy clara.
• Al depender solo de las frecuencias, puede calcularse para variables cualitativas. Es por
ello el parámetro más utilizado cuando al resumir una población no es posible realizar
otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las
características más frecuentes de determinado sector social. Esto se conoce
informalmente como "retrato robot"

Inconvenientes
• Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muéstrales. Por otra paite, en variables agrupadas en intervalos, su valor
depende excesivamente del número de intervalos y de su amplitud.
• Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de
la moda, no afectan en modo alguno a su valor.
• No siempre se sitúa hacia el centro de la distribución.
• Puede haber más de una moda en el caso en que dos o más valores de la variable
presenten la misma frecuencia (distribuciones bimodales o multimodales).

Mediana
Artículo principal: Mediana (estadística)
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez
que éstos están ordenados de menor a mayor.2 Por ejemplo, la mediana del número de hijos de
un conjunto de trece familias, cuyos respectivos hijos son: 3 , 4 , 2 , 3 ,2 , 1 ,1 , 2 ,1 , 1 ,2 , 1 y 1, es 2,
puesto que, una vez ordenados los datos: 1,1 ,1 ,1 ,1 , 1 ,2 , 2 ,2 , 2 ,3 , 3 ,4 , el que ocupa la
posición central es 2:
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable,
por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores
centrales. Por ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana


Existen métodos de cálculo más rápidos para datos más numerosos (véase el artículo principal
dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se halla el
"intervalo mediano" y, dentro de éste, se obtiene un valor concreto por interpolación.

Cálculo de la mediana para datos agrupados


Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen
« fi fí i
derecho).
1 2 2 . !.
- - ...
Así, aplicando la fórmula asociada a la mediana para n impar, obtenemos ¡2 2 4
AT(39+l)/2 = X20 y basándonos en la fórmula que hace referencia a las
frecuencias absolutas: ¡3|4 8 i
!

> 5 13 j
N A < nl2 <Ni = ATI9 < 19.5 < N2Q 5 6 19 = 19

N
00
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En 6 9
nuestro ejemplo, 21 (frecuencia absoluta acumulada para Ai = 5) > 19.5 con lo ¡7 4 32 ¡
que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como
estamos hablando de calificaciones, serán puntos) | 8 |4 36 j

9 2 38 j
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.

Ejemplo (N par)

Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la
siguiente tabla (debajo):

Calificaciones 12 3 4 5 6 7 8 9
Número de alumnos 2 2 4 ¡5 6 i9 4 4 2 \

Cálculo de la Mediana:

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).

Si volvemos a utilizar la fórmula asociada a la mediana para ti par, obtenemos X(38/2)-Z19 y


basándonos en la fórmula que hace referencia a las frecuencias absolutas —> N \ - \ < n / 2 < N \ =
JV18 < 19 <M 9

Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el
decimonoveno y el vigésimo lugar.

En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el vigésimo


hasta el vigésimo octavo)

con lo que Me - (5+6)/2 = 5,5 puntos.

Propiedades e inconvenientes
Las principales propiedades de la mediana son:-

• Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de


transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número,
deja a la mediana inalterada.
• Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso
cuando alguno de ellos no está acotado.
• No se ve afectada por la dispersión. De hecho, es más representativa que la media
aritmética cuando la población es bastante heterogénea. Suele darse esta circunstancia
cuando se resume la información sobre los salarios de un país o una empresa. Hay unos
pocos salarios muy altos que elevan la media aritmética haciendo que pierda
representatividad respecto al grueso de la población. Sin embargo, alguien con el salario
"mediano" sabría que hay tanta gente que gana más dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor
varía en ñinción de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan
bien como la media aritmética.
™ Estadística Rau! Gorilla M e lc h o r- Roly Quiñones Inga |

Lecturas de la sem ina 7:


MODA

Autor: Rufino Moya Calderón

Lectura obligatoria de todo el artículo.

OBJETIVO ESPECÍFICO

Identificar las características principales de la moda y su


aplicación en la investigación jurídica.

CONTESTA LAS PREGUNTAS


. i
!
© ¿Cuáles son las características de la Moda?
® ¿Qué procedimiento se realiza para determ inar la moda?
® ¿Cómo se interpreta la moda?
© Elabora un ejemplo de resolución de la moda.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
De_í010_.pdt «3 2B-U-U llt28

- Guía

Moda: es e( valor cíe la variable que aparece con mayor frecuencia, es el valor de la variable que más
se repite en un conjunto de datos

© Ejemplo:

Se ha tabulado información sobre el color de ojos de los integrantes de un curso:

Color de'ojos Número de niños


Café * ’ * ’ ’¿O'’ " *'
Negros 4

Verdes ’ ’ ' 10 ' ' ''


Azules ’ ’ ’ 3 ’ ’ ’
Celestes 2.............

El color de ojos más frecuente en el curso es e l café, por eso decimos qué el color de ojos café es la
moda.

1) la siguiente tabla muestra el sabor de helado favorito de las


personas que trabajan en una oficina.

r Sabor de helado : Número de personas^


Chocolate :• 9
Frutilla : a

Vainilla • 6
Piña : 3
Pistacho : 2
V J

Según los datos de la tabla ¿Cuál es la moda?

43
DE_6O10_.pdf 45 28-11-13 11 >28

Hlií &: g ;,□dja ¿ q il ^Mc d i a. - G uío ¡\!¿V!¿.

Dados'los histogramas de frecuencia, estimar en el gràfico el valor


de la moda:

1) Dada el histograma y polígono de frecuencias donde se m uestra el número de pacientes con cáncer
gástrico y su rango de edad. Estimar el valor de la moda de la variable edad.

V
* Fuente hctp:;7www.monografias.com/
trabdiosSl/presefuacion-ddtos-
•estad il t ¡cos/presen cac ion- da tos-
estddist¡cos2.shtml )

18 - 20
22 - 24
2 6 - 28 1 , ■ _ • 3 4 -3 6
30 - 3 ;
' ',n
3 8 -4 0
' 4 2 -4 4

w" . r "'~ ,0
4 0 -4 8
rKL-
’ 5 0 -5 2 *
.
Edad

2) Dado la grafica, donde se muestra el precio del kilogramo de pan en cuatro


almacenes. Estimar el valoi de la moda para el precio del pan.

PRECIO KILOGRAM O DE PAN EN CUATRO ALM ACENES

Oo
c
CU
Q_
c
a>
c
ro
CL
Q)
“O
ob
oa»

A LM ACEN 1 ALMACEN 2 A LM A C E N 3 A LM A C E N 4

45
Estadística Raul Corilla M elch o r - Roly Q uiñones Inga [

Lecturas d© !a semana 8:
¿Qué son y para qué sirve Bas medidas de posición
no central?

Autor: Esmeralda Ballesteros Doncel.

Lectura obligatoria de todo el artículo.

OBJETIVO ESPECÍFICO

Reconocer las medidas de tendencia no central: cuartiles,


quintiles, deciles y percentiles.

CONTESTA LAS PREGUNTAS

© ¿Cuáles son las medidas de tendencia no central?


® ¿Qué procedimiento se realiza determ inar cuartiles,
quintiles, deciles y percentiles?
© ¿Cuál es la diferencia de cuartiles, quintiles, deciles y
percentiles?
o Elabora un gráfico esquemático de la lectura.

_____________________ ^

b-
UNIVERSIDAD PERUANA LOS ANDES
ESCU ELA ACAD ÉM ICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
■T V I ■ i '■i I's i ' \l ■ *. I ■r -.‘ >v ' ' I • I .¡ ■■• ; t ■I •-.! i
• ' -> 1 \ .. | I ( | pi I :• . \ I :.%!,■ . . . \ : |’ I .1

CUARTILES, DECILES Y PERCENTILES

Aunque la varianza y la desviación estándar son la medidas de dispersión más


útiles en análisis estadístico, existen otras técnicas con las cuales puede
medirse la dispersión de un conjunto de datos. Estas medidas adicionales de
dispersión son los cuartiles, los deciles y los percentiles.

Cuartiles.
Son valores de la variable que dividen los datos ordenados en cuartos; cada

conjunto de datos tiene tres cuartiles. El primer cuartil, Q x ,es un número tal

que a lo sumo 25% de los datos son menores en valor que Q¡ y a lo sumo 75%

son mayores. El segundo cuartil es la mediana (50%). El tercer cuartil, Q 3 , es

un número tal que a lo sumo 75% de los datos son menores en valor que Q3 y

a lo sumo 25% son mayores.

Datos clasificados en orden ascendente

25% 25% 25% 25% .

Lt a Qi a l s

Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes
iguales. El primer cuartil es ese valor debajo del cual clasifica el 25% de las
observaciones, y sobre el cual puede encontrarse el 75% restante. El segundo
cuartil es justo la mitad. La mitad de las observaciones están por debajo y la
mitad por encima; en este sentido, es lo mismo que la mediana. El tercer cuartil
es el valor debajo del cual está el 75% de las observaciones y encima del cual
puede encontrarse el 25% restante.

2
■i y i ■ • 11! ■»i • \i * ». i >r-.* *v. i > I -• i 'A •• • ■• í : I •! 11 . '
; • i i m -s r>| i ' '.i *.i :p i. •(
y ./

La determinación de los cuartiles con frecuencia es de utilidad. Por ejemplo


muchas escuelas de posgrados admitirán sólo a aquellos estudiantes que
estén en el 25% superior (tercer cuartil) de los candidatos. Las empresas, con
frecuencia, desean señalar las plantas cuyos deficientes registros de
producción los colocan por debajo del cuartil inferior. Con un poco de
imaginación es posible prever numerosos ejemplos en los cuales la
determinación de cuartiles puede ser de gran beneficio.

Deciles.
Son valores de la variable que dividen los datos ordenados en diez partes
iguales (9 divisiones).

Datos clasificados en orden ascendente

10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 %

L¡ D\ D2 D a D5 D6 D -j D% D9

Percentiles.
Son los valores de la variable que dividen un conjunto de datos clasificados en
100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El

k-ésimo percentil, Pk , es un valor que a lo sumo k% de los datos son menores

en valor que Pk y a lo sumo (100 - k)% de los datos son mayores.

Datos clasificados en orden ascendente

1% 1% 1% 1% ... 1% 1% 1 %, 1%

3
I • i ». t I’ ' i • \i •
s
( * .. .......... ’
. ! I V I J, I -.| r : , \ I
« J *• i
s !. • * I . !y i
? • i : I • •: *
.i
ay
Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los
percentiles en 100 partes. El primer decil es la observación debajo de la cual
se encuentra el 10% de las observaciones, mientras que el 90% restante se
encuentra encima de éste. El primer percentil es el valor debajo del cual se
encuentra el 1% de las observaciones, y el resto están encima de éste. Puede
aplicarse una interpretación similar al resto de deciles y percentiles. Todo
conjunto de datos tiene 9 deciles y 99 percentiles.
Un percentil y su ubicación en un arreglo ordenado se identifica mediante los
subíndices. Por ejemplo, el decimoquinto percentil se indica como P i5, y su
ubicación en la serie ordenada es L15.

Para ilustrar el cálculo de percentiles, se asume que se tienen observaciones


para el número de acciones correspondientes a 50 acciones transados en la
Bolsa de Valores de Nueva York, como se muestra en la siguiente tabla. Vale
la pena destacar que los datos han sido puestos en una serie ordenada. El
lugar del P ésimo percentil se halla

En donde Lp es el sitio del percentil en una serie ordenada


n es el número de observaciones
P es el percentil deseado

Se asume que se desea calcular el percentil 25, P25, para las acciones de la
tabla. Se debe hallar el primero su ubicación en la serie ordenada.

25
i 25 = (50 + 1)
100

4
y
• t r -,i - \ l . *.
s . ‘. ! I
!» ! m
PI I
i i I •• i *.i ■c* ¡
, Í i . vl t ' H1 ». «I
' r 1•
S Jf
Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los
percentiles en 100 partes. El primer decil es la observación debajo de la cual
se encuentra el 10% de las observaciones, mientras que el 90% restante se
encuentra encima de éste. El primer percentil es el valor debajo del cual se
encuentra el 1% de las observaciones, y el resto están encima de éste. Puede
aplicarse una interpretación similar al resto de deciles y percentiles. Todo
conjunto de datos tiene 9 deciles y 99 percentiles.
Un percentil y su ubicación en un arreglo ordenado se identifica mediante los
subíndices. Por ejemplo, el decimoquinto percentil se indica como P-|5, y su
ubicación en la serie ordenada es L -i 5 .

Para ilustrar el cálculo de percentiles, se asume que se tienen observaciones


para el número de acciones correspondientes a 50 acciones transados en la
Bolsa de Valores de Nueva York, como se muestra en la siguiente tabla. Vale
la pena destacar que los datos han sido puestos en una serie ordenada. El
lugar del P ésimo percentil se halla

En donde Lp es el sitio del percentil en una serie ordenada


n es el número de observaciones
P es el percentil deseado

Se asume que se desea calcular el percentil 25, P25, para las acciones de la
tabla. Se debe hallar el primero su ubicación en la serie ordenada.

¿25 = (S o + i ) ^

4
L25 = 12.75

3 10 19 27 34 38 48 56 67 74
Números de acciones
transadas en la Bolsa de 4 12 20 29 34 39 48 59 67 74
Valores de Nueva York (en 7 14 21 31 36 43 52 62 69 76
100’s)
9 15 25 31 37 45 53 63 72 79
10 17 27 34 38 47 56 64 73 80

El valor resultante de 12.75 decide que el percentil 25 está ubicado al 75% del
trayecto comprendido entre la doceava observación, que es 2 0 y la treceava
observación que es 21, es decir, P25 =20 + 0.75 (21-20) = 20.75.

Si se desea calcular el percentil 35, se halla

¿35 = (50 + l ) ^

t 35 = 17.85

El percentil 35 está al 85% del trayecto comprendido entre la observación 17,


que es 29 y la observación 18 que es 31, es decir P 35 = 29 + (0.85)(31-29) =
30.7. Por tanto el 35% de las observaciones está por debajo de 30.7 y el 65%
restante por encima de 30.7.

Regresando a los deciles y cuartiles por un momento, se nota que el primer


decil es igual a P 10, el segundo decil es igual a P20, y así sucesivamente.
Adicionalmente, el primer cuartil es igual a P25, el segundo cuartil es igual a P50,
y P75, se encuentra en el tercer cuartil. Teniendo esto en mente, el cálculo de
deciles y cuartiles se vuelve simplemente un asunto de determinación de los
percentiles apropiados de acuerdo con las reglas que se acaban de establecer.

5
Como vemos en el diagrama de caja siguiente, al ubicar la caja entre el primero
y el tercer cuartil, se puede tener una idea de la distribución de los datos, es
decir, se observa que hay una mayor concentración de datos hacia los valores
pequeños puesto que la caja está desplazada a la izquierda.

20

Valor menor Valor mayor

Primer cuartil Qi Tercer cuartil Q3

Segundo cuartil Q2o mediana

Deciles

En cuanto al octavo decil, bastaría con ubicar la posición en que se encuentra a


ti 14
través de la fórmula 8— = 8— = 11.2. Esto quiere decir que entre el dato que se
10 10
encuentra en la posición 1 1 y la 1 2 está el octavo decil, pero más cerca de la
11 que de la 12 puesto que la posición es la 11.2. El resultado sería 9.2 porque
entre el 9 y el 19 (que son los datos cuyas posiciones son 11 y 12
respectivamente) hay exactamente 10 unidades.

Percentiles

Con relación a los percentiles pedidos, tendríamos que ubicar las posiciones
correspondientes como lo hicimos con los deciles. Para la posición del percentil
n 14
42 tendríamos la siguiente fórmula 42— = 42— = 5.88. Esto quiere decir que
100 100

el percentil 42 se encuentra entre los datos que ocupan la posición 5 y la 6.


Afortunadamente en este caso ambos datos son 3 por lo que el percentil 42 es
3.

Para el percentil 50 basta con buscar la mediana puesto que coinciden. La


mediana de esta colección es 4. Por último, el percentil 87 se buscaría con el
> Cfe

/i 14
mismo procedimiento usado anteriormente, es decir, 87— = 87 — = 12.18 nos
100 100

daría ia posición del percentil buscado que en este caso es entre las posiciones
12 y la 13, más cerca de la primera. El resultado sería que el percentil 87 toma
el valor de 19.18.

Ejemplo 2.
Ejemplo: En la siguiente serie simple, que corresponde a la edad de los
trabajadores de una micro empresa: 33, 26, 66, 45, 28, 59, 33, 36, 26, 45, 62,
45, ordenar los datos y calcular los cuartiles uno, dos y tres, los deciles uno,
tres, cinco y nueve; y, los percentiles nueve, diez y cincuenta.

Solución.
Ordenamos los datos de mayor a menor:
26, 26, 28, 33, 33, 36, 45, 45, 45, 59, 62, 66

Cuartiles
Hallamos la ubicación del cuartil uno con la fórmula:
n+ l
0 ,=
4

Q\ = -— 7 — = 3.25

Calculamos el valor del cuartil uno:

El primer cuartil se localiza entre el tercer y cuarto valor y se encuentra a 0.25


de la distancia entre ellos. Como el tercer valor es 28, y el cuarto es 33,
obtenemos la distancia entre ellos restando el valor mayor del menor; es decir,
33 - 28 = 5. Para ubicar el primer cuartil, hay que moverse a 0.25 de distancia
entre el tercer valor y el cuarto, por lo que 0.25(5) = 1.25. Para terminar el
procedimiento, sumamos 1.25 al primer valor, y resulta así que el primer cuartil
es:
Q t = 2 8 + 1.25 = 29.25

8
‘»Lrf*'
/ . i I ■ , | I'' I ' \l . •• -II • ' t--1■! I-I . - ‘i . •
I 1Á ’ S ■II V| |'| I ! I '! i ••■. ¡I' I 'I
y
n 14
mismo procedimiento usado anteriormente, es decir, 87— = 87— = 12.18 nos
K 100 100

daría la posición del percentil buscado que en este caso es entre las posiciones
12 y la 13, más cerca de la primera. El resultado sería que el percentil 87 toma
el valor de 19.18.

Ejemplo 2.
Ejemplo: En la siguiente serie simple, que corresponde a la edad de los
trabajadores de una micro empresa: 33, 26, 66, 45, 28, 59, 33, 36, 26, 45, 62,
45, ordenar los datos y calcular los cuartiles uno, dos y tres, los deciles uno,
tres, cinco y nueve; y, los percentiles nueve, diez y cincuenta.

Solución.
Ordenamos los datos de mayor a menor:
26, 26, 28, 33, 33, 36, 45, 45, 45, 59, 62, 66

Cuartiles
Hallamos la ubicación del cuartil uno con la fórmula:
n+ l

e, - - ^ - 3 . 2 5

Calculamos el valor del cuartil uno:

El primer cuartil se localiza entre el tercer y cuarto valor y se encuentra a 0.25


de la distancia entre ellos. Como el tercer valor es 28, y el cuarto es 33,
obtenemos la distancia entre ellos restando el valor mayor del menor; es decir,
33 - 28 = 5. Para ubicar el primer cuartil, hay que moverse a 0.25 de distancia
entre el tercer valor y el cuarto, por lo que 0.25(5) = 1.25. Para terminar el
procedimiento, sumamos 1.25 al primer valor, y resulta así que el primer cuartil
es:
Qi = 2 8 + 1.25 = 29.25

8
Estadística
Raúl Corilta Melchor, Roly Quinonez Inga

Lecturas de la semana 9:
OBLIGATORIOS

Bibliografía 1 (En impreso):


Manuel Córdova Zamora (2009). Estadística descrotiva e inferenciail Quinta edición.
Lima-Perú: MOSHERA S.R.L. Pontificia Universidad Católica del Perú.

Temas de lectura del libro:


• Medidas de dispersión. Páginas 62-73

Objetivo: Analiza e interpreta las medidas de dispersión en datos agrupados y no


agrupádos en el contexto real y en la investigación científica.

Preguntas:
21. ¿Qué se entiende por medidas de dispersión?
22. ¿la varianza y la desviación estándar son estadísticos que miden la variabilidad de
los datos estudiados con respecto a la media?, explique
23. ¿Es la varíanza o la desviación estándar la que define la curva normal?
24. Haga un paralelo entre la varianza y la desviación estándar.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
Capitulo 3

MEDIDAS DE DISPERSIÓN

3.1 Introducción
Las medidas de tendencia central no son suficientes para describir un conjunto de
valores de alguna variable estadística. Los promedios determinan el centro, pero nada
indican acerca de cómo están situados los datos respecto al centro.
En primer lugar se necesita una medida del nivel de la dispersión o la variabilidad de
los datos con respecto a su centro con la finalidad de ampliar la descripción de los datos o
de comparar dos o más series de datos.
En segundo lugar se necesita una medida del grado o nivel de la asimetría o la
deformación en ambos lados del centro de una serie de datos, con el fin de describir la
forma de la distribución de los datos. Esta medida se denomina índice de asimetría.
En tercer lugar se necesita una medida que nos permita comparar el apuntamiento o
curtosis de distribuciones simétricas con respecto a la distribución simétrica normal. Esta
medida se denomina índice de apuntamiento o curtosis.
Las estadísticas de asimetría y apuntamiento se incluyen en este capítulo de medidas de
variabilidad dada su poca importancia para tratarlos como un capítulo aislado. Por otro
lado, la forma de la distribución queda descrita por la ubicación de los promedios en la
distribución de frecuencias o por la ubicación de los cuartiles en una gráfica de caja.
Finalmente las medidas de curtosis son válidas sólo para distribuciones simétricas.
El lector debería correr paquetes de computo entre otros el MCEST para las
aplicaciones de este capitulo o usar una calculadora con aplicaciones estadísticas.
Medidas
rí-,
ty

3.2 Medidas de dispersión o de variación


Las medidas de dispersión o variabilidad son números reales qu
}í'i
nivel de separación de los datos con respecto a un valor central, qu
inedia aritmética.
Las principales medidas de dispersión son:
El rango.
El rango intercuartil,
La varianza,
r» La desviación estándar, y
El coeficiente de variación.

3.2.1 £1 rango o recorrido de una variable


^ Definición. El rango de variación o recorrido, denotado por R es el ni
ív lo diferencia del valor máximo ( x ^ ) menos el valor mínimo (xmin) c
Observados de variable X. Esto es,
^ = * max - * ra¡„
£
&.
El rango de los datos es una medida de dispersión muy fácilmente
? muy inestable, ya que depende únicamente de los dos valores extrem
' valor puede cambiar grandemente si se affade o elimina un sólo dato,
% muy limitado.
y* Por ejemplo, las dos series de datos:
a) 1, 4, 4, 5, 5, 5, 5, 6, 6, 9
b) 1, 2, 3, 4, 5, 6, 7, 8, 9
tienen ambas la misma media S, y el mismo rango 8. Pero, las dos series
dispersión, ya que la segunda tiene mayor variabilidad.
El empleo del rango como medida de comparación de vari;
justificado cuando se precise rápidamente de una medida de disp
tiempo de calcular algunas de las otras.

3.2.2 El rango intercuartil


efinición. El rango intercuartil, denotado por RI, es el número
"í diferencia del cuartl 3 menos el cuartil 1 de los datos. Esto es,
Ri=Qi-Q x.
El rango intercuartil es una medida que excluye el 25% superior (
el 25% inferior (cuarto inferior), dando un rango dentro del cual se
/central de los datos observados y a diferencia del rango de los dat(
afectada por los valores extremos.
64 Estadística

Si el rango intercuartil es muy pequeño entonces describe alta uniformidad o pequeña


variabilidad de los valores centrales.
Por ejemplo, en la distribución de frecuencias de los 45 salarios quincenales se obtuvo
los cuartiles Qt = 53.4$, y Q3 = 66.75$, entonces, el rango intercuartil es
Rl = Qi~ Q\ =13.35$. Por lo que podemos concluir que el 50% de los 45 salarios varía en
el rango de 13.35$.
El rango semiintercuartil denotado por RSI, es igual al rango intercuartil dividido por 2
Si la distribución de frecuencias de los datos es simétrica, entonces, los cuartiles Q¡ y
Qi son equidistantes de la mediana Q2. En este caso, el rango intercuartil es equivalente a
Q2 ± RSI. Por lo tanto, Q%± RSI contiene también exactamente el 50% de los datos.
Si la distribución es casi simétrica, se concluye que el intervalo: mediana ± RSI
contiene aproximadamente el 50% de los datos.
Por ejemplo, si en una distribución de frecuencias simétrica de 100 datos observados
se obtiene Qi=62, Q¿=66, entonces por lo. tanto, el 50% de los datos se hallan
comprendidos en el intervalo 66±4.
NOTA. Si la distribución de frecuencias tiene marcada asimetría, el rango intercuartil es
preferible a la desviación estándar como medida de dispersión.
Por otro lado, el rango intercuartil se aplica a variables medidas en escala por lo menos
ordinal

3.2.3 La varianza y la desviación estándar


La varianza, es una medida que, en promedio, cuantifica el nivel de dispersión o de
variabilidad de los valores de una variable cuantitativa con respecto a su media aritmética.
Si los datos tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los
valores tienden a distribuirse lejos de su media, la varianza será grande.
La varianza
Definición. La varianza se define como la media aritmética de ios cuadrados de las
diferencias de los datos con respecto a su media aritmética.
La varianza entendida como una media cuadrática calculada de una muestra será
denotada por sj¡ y si es calculada de una población se denotará por a 2. Los métodos de
cálculo las dos varianzas son idénticos, por esto, el método es conocido cómo método de
población (ver nota sobre varianza poblacional).
La varianza es una medida de dispersión que genera unidades de medición al cuadrado,
por ejemplo, $2, Km2, etc.
La desviación estándar
Definición. La desviación estándar es la raíz cuadrada positiva de ia varianza.
La desviación estándar definida como la raíz cuadrada de la media cuadrática de una
muestra se denotará por s„.
Medidas

Esto es,

Cálculo de la varianza
1) Varianza de datos no agrupados
La varianza de » mediciones: xx,x 2,...,x„ de alguna variable i
media es x, es el número reai:
n

Z u -
2 Suma total de cuadrados de diferencias ~t
" # de datos n

Se comprueba que: ^ '¿ x f - n x x 2


M i=\
Por lo tanto,
n

EJEMPLO 3,1
Calcule la varianza y la desviación estándar de los 45 salarios quiñi
'el ejemplo 1.3
OLUCIÓN

n = 45 , t i , =2670$, í = = 59.333, Y x f =
/-i 45
uego, la varianza de los 45 salarios sin agrupar es el número:
n

s2„ = ------ x 2 = 164530 - (59.333)2 = 135.778$*


n 45
entras, que la desviación estándar es:

fe s„ = -Js* = ^135.778 = 11.652$


hierve que la varianza está en $2, mientras que la desviación estándar e:

¥t.
(>H ^ ^

k k
n *• 45. k - 8 , Y 4 f i x m i= 2694, £ / ¿ x«,2 = 166452
/-i i=i
Liiefiti, Itt vni iun/u os el número

Y fixm f
" n 45 45..

La desviación estándar es: s = V ? = Vi 14.916 = 10.7199 dólares.


Ol)Ncrve i)iio la varianza de los mismos datos, pero, no agrupados es 135.778$2.

Calculo de la varianza con frecuencias relativas


Puracalcular la varianza de n datosobservados de una variablecuantitativa X
oi'giuiiuios en unadistribución de frecuenciasrelativas (oporcentajes) devariable
dtecreta o por intervalos, se hace h¡ =/ (/n , para cada / = 1 , 2 Si la distribución de
frecuencias es por intervalos, entonces,

í = X ~ * w' = X /,<x/”' y =Y,hi xmf


/» \ n / - i í= i n t-í
k
y la varianza es el número: x mf - x 2
/»i
Varianza de la población
La varianza a 2 de una población finita de N datos X i , x 2 ,...,x N sin agrupar y cuya
media es se define por:
N N

X (*< -n )2
a2 =— ---------- = ¿=!------ u2
N N p
Si formamos todas las muestras posibles de tamaño n y calculamos sus varianzas
utilizando la fórmula s„ = (*/ - x ) /n (método de población), resulta que la media
de todas estas varianzas vale:
n -1 ?
-----o .
n
Para que el promedio de todas las varianzas sea igual a a 2 se aplica la varianza
A»-i ~ ~ í ) 2/ ( " - 0 (método de muestra) que se obtiene de multiplicar a s2 por
« /(» -!). Por esta razón, algunos autores de esta materia definen la varianza (en
estadística descriptiva) con denominador n -1 .
Estas 2 varianzas se tratan en el capitulo 9 de estimación de parámetros.
Medidas

3.2.4 Coeficiente de variación: Dispersión relati


Definición. El coeficiente de variación, denotado por CV, es una n
relativa (libre de unidades de medición), que se define como el cocii
estándar entre la media aritmética. Esto es,

CV =4r, o en%
x
El coeficiente o Indice de variación se utiliza para comparar la \
más series de datos que tengan medias iguales o diferentes o que
medida iguales o diferentes (por ejemplo, comparar la variabilidad d
medidos en kilogramos con la de otra serie de datos medidos en metros
Por dar un ejemplo, si las calificaciones en matemática I de dos
tienen ia misma desviación estándar igual a 14, no podemos concluir
tienen la misma variabilidad (salvo que tengan medias igual»).
Del mismo modo, si la desviación estándar de H1 es 2 y la de I
concluir que las notas de H2 son más dispersas que las de Hl. La varí
grupos depende, además, de sus medias.
En el primer caso, si se indica que la media del horario Hl es 16 y
H2 es 11, los coeficientes de variación respectivos son:

CV, = = — = 0.875, o 87.5%, CK2 = - ^ = — = 1.27


1 í, 16 2 x2 11
Es decir, las calificaciones obtenidas en Hl son más homogén*
variabilidad que las calificaciones del horario H2.

3.2.5 Uso de las medidas de dispersión o de varis


La varianza es la medida de variabilidad cuyo cómputo transform
unidades de medición de los valores de la variable.
La desviación estándar es la medida de variabilidad cuyo cómputo r
unidades de medición de la variable.
El coeficiente o Índice de variación es la medida de variabilidad ci
un número abstracto (carece de las unidades en las que vienen expresad
1) Si dos o más grupos de datos (observados en el mismo tipo c
medias aritméticas iguales, entonces, es más dispersa o de mayor
que tiene mayor valor, una cualquiera de sus medidas de variación
s\ o s, o CV.
Si hay marcada asimetría, es preferible comparar la varíabil
intercuartil.
2) Si dos o más seríes de datos, no tienen medias iguales (o casi iguales) o no tienen las
mismas unidades de medición (variables diferentes), entonces, es más homogénea o de
menor variabilidad la serie que tenga menor coeficiente de variación CV, sin importar su
forma de asimetría.

Valores estandarizados
Cuando se necesiten comparar valores observados' que pertenecen a diferentes
distribuciones de datos, las que difieren en su media aritmética o en su varianza, o difieren
en el tipo de unidad de medida (variables diferentes), entonces se estandarizan los valores
observados de la variable aplicando la variable “estandarizadora” o variable estándar Z.
Para una distribución de datos de variable X la variable estándar Z se define por:

La variable Z estandariza en cero cualquier media x y estandariza en 1 cualquier


varianza s%. (Se deja como tarea para el lector comprobar que Z tiene media igual a 0 y
varianza igual a 1)
Los valores estandarizados indican la posición relativa de las unidades estadísticas
dentro de su grupo. Por lo tanto Z es otra medida de posición, además, de los percentiles.

EJEMPLO 3.4
Las calificaciones en un examen final de Matemáticas e Historia generaron las medias 13
y 17 y las desviaciones estándar 3 y 4 respectivamente. Si un alumno obtuvo 14 en
Matemáticas y 16 en Historia, ¿en cuál de los dos cursos tiene mejor rendimiento relativo?
SOLUCIÓN
El hecho de que tenga 16 en Historia y 14 en Matemáticas, no significa que tiene mejor
rendimiento en Historia.
Se deben calcular los rendimientos relativos con la puntuación estandarizada 2
14-13
En Matemáticas z = -------- = 0.333
3
1 —17
En Historia z = -------- -- -0.25
4
En consecuencia, el alumno tiene mejor rendimiento en Matemáticas ya que tiene
muyor rendimiento relativo en esa asignatura

3.2.6 Propiedades de la varianza.


J) La varianza es un número real no negativo y viene expresada en mediciones cuadráticas.
Mientras, que la desviación estándar es también un número real no negativo que viene
oxpresuda en las mismas unidades en las que se observan los datos.
Medida:

2) Dada, la media x y la varianza de n datos de una variable X,


cuadrados de los valores es igual a nx(s2 +x2) .
n
En efecto, para datos no agrupados se tiene por ejemplo, xf ■
i- 1
3) Si la variable cuantitativa X se transforma en Y = aX +b (esto <
valores x¿ es transformado en y, = ax¡+b), entonces, la varianza«
Y denotadas ahora por Var(X), VcaiY) respectivamente, verifican
(¡comprobar!):
Var(Y) = a2 x Var(X)
Consiguientemente, DesvEstcbiY) = |a|x DesvEstdr{X).
Como casos particulares se tiene:
Si Y = b, entonces, Var(b) = 0. Es decir, si los n datos de una varia
constante, entonces, su varianza es igual a cero.
Si Y =X+b, entonces, Var(Y) = Var(X). Es decir, si sumamos i
valor de la variable, la varianza y en consecuencia la des\
cambian.
Si Y = aX , entonces, Var(Y) =a2 x Var(X). Es decir, si muí
constante a a cada valor de la variable, la varianza de los nuevos
la varianza de los antiguos valores multiplicada por o2.

4) La varianza y la desviación estándar se calculan también, en distribi


de intervalos de amplitud diferentes, siempre que puedan determina]
clases. Por otra parte, estas medidas dependen de todos los datos }
cambios de cada uno de estos, basta que uno de los datos cambie
estas medidas.

5) Dados k series de datos con tamaños, medias y varianzas respectivas


fj„x„s2, n2,x2,s 2i ,...,ni ,xlt,s2t entonces, la varianza te
n = n, + n2 + ...+ nk datos es el número:
k k
£ « ( x ( í2 +xf ) X
s j =~ ------------------- (x„f, donde, x„ ------
" n n

6) Desigualdad de Chebyshev
Cualquiera sea la forma de la distribución (simétrica o asimét
observados de una variable X, el intervalo 3c+ Axín], dor
por lo menos
Sea = 25, s„t - 20, entonces la varianza global s 2x o s 2 es el número,

Sn Z n, «i x<< + ^ ) + E W|”■xti, + ^i2) _2 3019200+1300000 (23Q)2 = 1()9()$2

b) La relación lineal de Y condes Y = 1.2A" + 5, entonces,'


Lamediade Yes: j> = 1.2xí + 5 = 1.2x230 + 5 = 281
La varianza de Y es: s2 = (1,2)2 x j 2X = ( 1.2)2x 1090. = 1569.6
80
La recaudación total es RT = ^ yf = 80 x (s2 + y2) = 80x( 1569.6+(281 )2) = 6442448
t-i
La utilidad neta = Ventas - costos = 6442448 - 18400 = 6424048

3.3 índices de asimetría


Definición. Se dice que una distribución de frecuencias variable discreta es simétrica, si
son iguales las frecuencias de sus valores equidistantes del valor central.
Se dice que una distribución de frecuencias por intervalos es simétrica, si son iguales las
frecuencias de los intervalos equidistantes del intervalo central.
En una distribución de frecuencias simétrica coinciden en su centro la media, la median
y la moda (figura 3.1.a). En contraposición, si estos 3 promedios no coinciden, entonces, la
distribución tiene forma asimétrica con cola o sesgo a la derecha (figura 3.1.b) o a ¡a
izquierda (figura 3.1 .c).
Por lo tanto, el orden de ubicación de los promedios describe la simetría o la
asimetría de la distribución de los datos.

2 “ Me “ Mo Mo <Me <X x < Me < Mo


a) Simétrica b) Asimetría p o s it iv a c) Asimetría negativa
Figura. 3.1

El hecho de que dos distribuciones pueden tener la misma media y la misma desviación
estándar, no garantiza que estas sean simétricas. Pueden diferir en el grado de asimetría.
Otro modo de describir la simetría o asimetría de la distribución de los datos es
aplicando una gráfica de cajas (Ver sección 3.5).
Existen varios métodos de medir la asimetría de la distribución de los datos, uno de
vhíos csel coeficiente o índice de asimetría de Pearson.
Medida

Definición. El índice de asimetría de Pearson es el número real

s
Como en distribuciones de marcada asimétría se verifica: x - Mo = 3
otra forma de expresar el índice de asimetría es:

A
.s 3 x (x - Me) .
----------------------

Interpretación de la medida de asimetría As.


Si la distribución de los datos es simétrica, As = 0. Ver la fij
observa, además, que coinciden los tres promedios: x = M e- Mo.
Si As#0, la distribución es asimétrica. Además, es asimétrica po:
cola a la derecha, si As> 0, (Fig. 3.1b donde Mo < Me <x). Y, e
o sesgada o de cola a la izquierda si, As< 0 (Fig. 3.l.c donde x < Me
Por ejemplo, la distribución de los 45 salarios quincenales del ejet
en siete intervalos tiene asimetría negativa, pues:
A, . -3 *-<* ~-M
A , 3.x (59.867 - 60,75) = _
i 10.72

NOTA. (Otros Índices de asimetría)


El índice de asimetría de Pearson aplicando momentos se define p
As ------- ----------- don(]ej A/3 = y'XXj - x ) 3 , s„ = la desvil
(n -l)(n -2)s„
Esteindice^es utilizado ppr ítísipaquetes.de cómpytOtestadísticc
asunetrí^ de distribuciones dj^Ja’forma'dato^frecuepcia. J '* \
Para n datos tabulados en k intervalos, un método alternativo es
asimetría de Fisher definido por:

As = ^ 3/ n en donde M3 = V /¡{m, - x)3 , s„ =la desviaci



Si la distribución es simétrica As = 0. Si As > 0 , es asimétrica po
es asimétrica negativa.
Por ejemplo, continuando con el ejemplo 1.3, el índice de asimetr
quincenales organizados como variable discreta en la forma date
As = -0.375. Y de los mismos datos tabulados en 8 intervalos es: As =
NOTA (Ojivas asimétricas y simétricas). Las ojivas o curvas de frec
presentan formas particulares según el tipo de asimetría. Por ejemplo,
curva de frecuencia acumulada A es de una distribución con asimetría t
Ojiva C es de asimetría extrema positiva. La ojiva B es de una distribu«
figura 3.2b la diagonal D es la ojiva de una distribución normal. La ci
una distribución simétrica leptocúrtica, y la E de una platicúrtica. (Ver 3
I

Lecturas de 8a semana i©:


OBLIGATORIOS

Bibliografía 1 (En Impreso):


Carlos Véliz Capuñay (2011). Estadística y aplicaciones. Tercera edición. Lima-Perú:
Servicios Copias Gráficas S.A.

Temas d@lectura del libro:


o Coeficiente de variación y aplicaciones. Páginas 57-66

O b jetivo: Analiza e interpreta las la homogeneidad o heterogeneidad de los datos


agrupados y no agrupados en el contexto real y en la investigación científica.

Preguntas:
21. ¿Qué se entiende por medidas de coeficiente de variación?
22. ¿En un estudio social cuál es el límite entre la homogeneidad y heterogeneidad de
los datos en estudio?.
23. ¿Es el coeficiente de variación que nos indica cuan dispersos están los datos
estudiados?
24. Haga un cuadro comparativo entre la varianza y el coeficiente de variación .

U N IV E R S ID A D PERUANA LOS ANDES


i ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
COEFICIENTE DE VARIACIÓN

INTRODUCCIÓN

Tal como se expuso en la presentación referente a las medidas de dispersión,


el coeficiente de variación (también llamado coeficiente de variación de
Pearson), es el cociente entre la desviación típica y la media.

C V = ^ (100%)

Si se comparan dos distribuciones que utilizan las mismas unidades, sus


dispersiones se pueden calcular mediante la desviación estándar siempre que
sus medias aritméticas sean iguales o muy próximas. En caso contrario, se
utilizará el coeficiente de variación que cuanto menor sea menor será la
dispersión y, por tanto, mayor será la representatividad de la media aritmética.

El coeficiente de variación mide la dispersión relativa, como cociente entre la


dispersión absoluta (desviación estándar) y el promedio (media aritmética). El
coeficiente de variación se puede representar en porcentaje, multiplicándolo
por 100.

UTILIDAD DEL COEFICIENTE DE VARIACIÓN

El coeficiente de variación sólo se debe calcular para variables con todos los
valores positivos. Todo índice de variabilidad es esencialmente no negativo.
Debemos trabajar con variables positivas para asegurarnos de que la media es
mayor a cero (recuerda que una división entre cero es una indeterminación).

El coeficiente de variación también es muy útil al comparar dos o más


conjuntos de datos que son medidos en las mismas unidades pero difieren
hasta tal punto que una comparación discreta de las respectivas desviaciones
estándar no es muy útil. Como ejemplo, supon que un inversionista potencial
estuviera considerando comprar acciones en una de dos compañías, A o B,
que se cotizan en la bolsa de valores. Si ninguna compañía ofreciera
dividendos a sus accionistas y si ambas compañías estuvieran igualmente
calificadas en términos de crecimiento potencial, el inversionista potencial
podría considerar entonces la variabilidad de los dos valores para tomar su
decisión. Ahora supon que cada una de las acciones de la empresa A ha
promediado $50 durante los meses pasados con una desviación estándar de
$10. Además, supón que en ese mismo periodo, el precio por cada acción de la
compañía B promedio $12 con una desviación estándar de $4. En términos de
las desviaciones estándar reales, el precio de las acciones de la compañía A
parece ser más volátil que el de las acciones de la compañía B. Sin embargo,
puesto que los precios promedio por acción de los dos valores son tan
diferentes, sería más apropiado para el inversionista considerar la variabilidad
en el precio relativa al precio promedio con el fin de examinar la
volatilidad/estabilidad de los dos valores. Para la compañía A el coeficiente de
variación es CV = ($10/$50)100% = 20%; Para la compañía B el coeficiente de

variación es CF = ($4/$12)100% = 33.3%. Por tanto, en cuanto a la media, el

precio del valor B es mucho más variable que el precio del valor A.

EJERCICIOS RESUELTOS

Ejemplo 1.
Con los siguientes datos: 21, 35, 36, 38 y 45 cuya media aritmética es 35 y su
desviación estándar 7.823, calcular el coeficiente de variación.
Solución.
7 871
CV = (100% ) = 22.35%
35

Ejemplo 2.
Después de haber registrado los datos correspondientes al peso y la estatura
de 40 varones, se asentaron en la siguiente tabla los resultados del cálculo de
la media y la desviación estándar.

68.34 pulgadas 3.02 pulgadas


172.55 libras 26.33 libras

Calcula el coeficiente de variación de las estaturas, después el coeficiente de


variación de los pesos; finalmente, compara ambos resultados.

Solución.
Debido a que tenemos estadísticos muéstrales, los dos coeficientes de
variación se obtienen de la siguiente manera:

E sta tu ra C V = 3 m P ul (100% ) = 4.42%


6 8 3 4 pul

(100% ) = 15.26%

Aún cuando la diferencia en unidades de medida (pulgadas y libras) imposibilita


la comparación de la desviación estándar de 3.02 pulgadas, con la desviación
estándar de 26.33 libras, es posible comparar los coeficientes de variación, que
carecen de unidades. Se observa que las estaturas (con CV = 4.42%) tienen
una variación considerablemente menor que los pesos con (CV = 15.26%). Lo
anterior tiene sentido, ya que, por lo general, vemos que los pesos de los
hombres varían mucho más que sus estaturas. Por ejemplo, es muy raro
Estadística
I Raúl Corilla Melchor, Roly Quinonez Inga

Lecturas de Sa semana 11
OBLIGATORIOS

Bibliografía 1 (En impreso):


Carlos Véliz Capuñay (2011). Estadística y aplicaciones. Tercera edición. Lima-Perú:
Servidos Copias Gráficas S.A.

Temas d¡@lectura del libro:


© Grupos de datos bidimensionales. Páginas 76-82

O b jetivo : Analiza e interpreta dos o más variables definidas en el contexto laboral y


en la investigación científica.

Preguntas:
¿Qué entiende por datos bidimensionales?
¿En un estudio social por ejemplo se pueden desarrollar estudios bidimensionales
como la talla y peso de los abogados que realizan investigación en el contexto
criminal, podría proponer otros casos de datos bidimensionales?.ejemplos
¿Es que casos concretos se aplica este tema en el campo de su carrera profesional?
Haga un cuadro bidimensional con problemas de carácter social.

UNIVERSIDAD PERUANA LOS A N D E S


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
1.-Variable Estadística Bidimensional. Tablas de frecuencia

1.1.- Concepto de variable estadística bidimensional. Ejemplos.

En m uchas ocasiones no basta con estudiar la descripción de un fenómeno y sus variaciones,


es conveniente conocer a qué son debidas esas variaciones. Puede resultar interesante e incluso
necesario estudiar los cambios producidos en una variable en relación con otras, o cómo influyen unas
variables para que otra cambie. Cuando se estudian conjuntamente varias variables se entra en el
campo de la estadística m ultivariable (muchas variables). Si el estudio se reduce a dos variables, como
en este tema, se llama estadística bidimensional.
La estadística bidimensional estudia fenómenos en los que intervienen dos variables
conjuntamente, buscando la relación que existe entre ambas. Así, por ejemplo, se puede estudiar la
influencia que tienen los ingresos de una determ inada familia en los gastos que tiene, o cómo influye
la velocidad de un cierto automóvil en su consumo de combustible, o qué relación existe entre los
pesos y las estaturas de un grupo de personas. Una variable bidimensional se representa por un par
(X, Y), donde X es la prim era variable y toma los valores xv x2, x3, ...,xn e Y la segunda y toma los
valores, y17 y2, y3, ...,yn.
Sin embargo, al considerar dos variables de una población o muestra, no podem os afirmar que
se trata de una variable bidimensional porque la relación entre las variables puede no ser estadística.
Así, entre dos variables puede existir:

0 Dependencia Funcional.
Cuando es posible predecir con exactitud los valores de una variable a partir de los de la otra,
se dice que ambas variables están en relación funcional. Dada la variable (X,Y) existirá una función
f(x) tal que y¡ = f(x,). Para cada valor de x se puede conocer el valor de y.
Ejemplo:
a) La altura desde la que cae un cuerpo y el tiempo que tarda en llegar al suelo está sujeto a la
ley de la gravedad. Siempre tarda lo mismo en recorrer el mismo espacio.
b) El precio de una tela es función del coste del metro de tela y del núm ero de metros.

6 Independencia o Incorrelación.

Cuando las dos variables no tienen ninguna relación entre ellas y podem os estudiarlas por separado.
Ejemplo:
a) La estatura y la nota de matemáticas.
b) La nota en selectividad y el núm ero de letras del nombre.

6 Dependencia estadística o correlación.


Cuando no podem os establecer una relación funcional pero tampoco podem os afirmar que no existe
interrelación, se dice que están en relación estadística.
Lo que nos proponem os a lo largo de estos apartados es determ inar el grado de correlación que existe
entre las variables.
Ejemplo:
a) De un colectivo se anota el núm ero de horas de sueño y la edad de cada individuo. Hay una
tendencia general a afirm ar que a m ayor edad menos horas de sueño, pero no podem os
afirmar con exactitud que a X años le corresponden Y horas de sueño.
b) Otro ejemplo de relación estadística es el n° de cigarrillos consumidos y el riesgo de fallo
cardiaco.

Estadística Bidimensional. -2-


6 Diagrama de dispersión. Nube de Puntos

A • Una m anera sencilla y eficaz de estudiar la posible correlación entre


variables es recurrir a los diagram as de dispersión, que son
representaciones gráficas en un sistema de ejes cartesianos donde
cada par (x, y) se representa por un punto. La representación gráfica
resultante se denom ina diagram a de dispersión o nube de puntos.

Podemos apuntar un par de ideas sobre la nube de puntos:


1.- En muchas ocasiones la nube de puntos sugiere la forma de la gráfica de alguna función
conocida: una recta, una parábola, una función exponencial. Esto significa que puede existir
alguna relación entre las variables. Si así ocurriese, se diría que las variables están
correlacionadas.
2.- Si la forma de la nube es estirada y sus puntos se pueden encerrar en una elipse, la estrechez
de esa elipse es un indicador de la fuerza de la correlación

1.2.-Tablas bidim ensionales de frecuencias. Tablas de doble entrada.

Lo prim ero que tenemos que resolver es como tabular los datos obtenidos en las observaciones.
Podemos construir una tabla de frecuencias, pero son mucho más prácticas las tablas de doble entrada
que reflejan los valores y frecuencias de las variables bidimensionales.
Ejemplo: Las notas en Lengua y en Idioma de los 30 alum nos de una clase en la última evaluación han
sido:
Lengua: 3, 7, 8, 7,5, 2, 5, 9 ,5 ,4 , 3, 5, 3, 6, 3, 8, 5, 7, 7, 6, 2,4, 9,4, 9 , 7, 6, 7,1, 7
Idiom a: 2, 6,10, 6, 4, 2, 5, 9, 5, 5, 2, 4,1, 5,1,10, 4, 7, 8, 4, 2, 5, 9, 5, 9, 8, 5, 7,0,7
Para el estudio de los resultados podem os disponer las
notas en una tabla de doble entrada, en la que junto a
los distintos resultados aparezcan sus frecuencias.
Obtenemos así la distribución de frecuencias de la
variable estadística bidimensional (X,Y), donde X
representa la nota en Lengua e Y la nota en Idioma de
los alumnos de la clase.

Escribe la distribución de frecuencias de X="nota en Lengua". Calcula su media y su varianza.


Escribe la distribución de frecuencias de Y="nota en Idioma". Calcula su m edia y su varianza.

Estadística Bidimensional. -3 -
Observa esta nueva tabla en la que se ha añadido una fila y una columna más con los totales:
Y\X IQ 1 z ? A 7 § 10 I Total

| 1
i
2
2 2

3
3 2 2
1 2
3
2
3
2

0
co
o
Total lo 1 2 4 4 5 2 ■ y i

1.3.-Distribuciones marginales
Se denom ina distribución marginal de una variable bidimensional a la distribución que se obtiene al
estudiar independientem ente cada variable.
Si tomamos la prim era columna y la última columna en la tabla anterior, obtenemos la distribución

0 1 2 3 4 5 6 7 8 9 10

1 2 4 0 3 7 3 3 2 3 2
1
M
O

2 3 4 5 6 7 8 9 10
x|
n 5, 1 0 I1 2 4 4 5 2 7 2 3 0
Con estas distribuciones podem os calcular los mismos parám etros estadísticos que calculamos para
las distribuciones unidimensionales.
r

I]
Las medias marginales son: x=-L-¡-
N
Varianzas marginales son:

X (*«• ~ * ) * ni
= ( x 2) - ( x ) = b 2) - ( y f
N N

Estadística Bidimensional. -4-


Estadística Raul Corilla Melchor - Roly Quiñones Inga

UNIDAD IV:
INFERENCIA ESTADISTICA Y
PROBABILIDAD

OBJETIVO:
Reconocer y describir los eventos probabilísticas de experimentos
aleatorios representando los modelos de distribución porcentual a partir
de los datos haciendo uso en forma adecuada las diversas formas así
como el uso la tabla respecto a la distribución normal estándar, para
ejecución de prueba de hipótesis valorando en forma reflexiva su
importancia en trabajos de investigación y la vida diaria.

V _ _ _____________________ _ _ _ __________________ J

UNIVERSIDAD PERUANA LOS ANDES


f ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
Lecturas d@la semana 12:
OBLIGATORIOS

Bibliografía 1 (En impreso):


Carlos Riaño C (2011). Estadística . Tercera edición. Lima-Perú: Servicios Copias
Gráficas S.A.........

Temas de lectura d©5 libro:


e Análisis de rgresión lineal. Páginas 01-8

O b jetiv o : Construir un modelo de regresión lineal simple que describa


como influye una variable X (independiente)sobre otra variable Y
(dependiente) y Saber predecir futuros de la variable respuesta,

Preguntas:
¿Qué entiende por regresión lineal simple?
¿En un contexto social en qué casos por ejemplo se aplica estos
conceptos?.ejemplos
Proponga un ejemplo de aplicación en el contexto de tu carrera profesional

!
Jwau Carlos R ial® G.

o Generalidades

L a reg resión y los análisis de correlación n o s m uestran com o determ inar tanto la
n atu raleza com o la fu erza d e u n a relació n en tre dos variables

E n el análisis de regresión desarrollarem os u n a ecuación de estim ación, esto es, u n a


fo rm u la m atem ática que relacio n a las v ariab les conocidas co n la variable desconocida.
E n to n ces podem os ap licar el análisis d e correlación para determ inar el g ra d o d e en el
q u e están relacionadas las variables. E l an álisis de correlación, entonces, n o s dice qué
tan b ien están relacionadas las variables. E l análisis de correlación, entonces, nos d ice ,
que tan bien la ecuación d e estim ación realm ente describe la relación

© Principales técnicas utilizadas en el análisis de regresión lineal simple


;
1) Ordemamiemto y amáüisis de.!a iafonmadóm original

3) Diagrama de dispersión e interpretación

E l p rim er paso p ara determ inar si ex iste o n o u n a relación entre dos v ariables es
o b serv ar la grafica d e datos observados. E sta g rafica se llam a diagram a d e dispersión.

U n diagram a n o s puede d a dos tip o s de inform ación, visualm ente podem os b u sca r í
p atro n es que nos indiquen que las v ariables están relacionadas. E ntonces si esto sucede, j
p o d em os v er que tipo de linea, o ecuación d e estim ación, describe esta relación.
i
P rim ero tom am os los datos d e la ta b la que deseam os analizar y dependiendo de q u e se
d esea averiguar se construye la g rafica co locando la variable dependiente en el eje Y y
la independiente en el eje X, C uando vem os todos estos p untos ju n to s, p odem os
v isu alizar la relación que existe en tre estas dos variables. C om o resultado, tam bién
po d em os trazar, “ o a ju sta r” u n a lín ea recta a través de nuestro diagram a d e dispersión
p ara representar la relación. Es co m ú n intentar trazar estas líneas de fo rm a ta l que u n
'num ero ig u al d e puntos caiga a c a d a lado d e la línea.

D iagram a d e dispersión

o Esü m ació iis m ediaiaíe la Mmea de regresióm

H asta el m om ento las líneas de reg resió n se colocaron a l ajustar las líneas visualm ente
en tre lo s puntos de datos, pero p a ra g raficar estas líneas d e u n a form a m ás p recisa
p o d em os u tilizar una ecuación q u e relaciona las dos variables m atem áticam ente.

L a ecu ació n p ara una línea recta d o n d e la variable dependiente Y esta d eterm in ad a p o r
la v arian za dependiente X es:

U sando esta ecuación podem os to m a r un v alor dado en X y calcular el v alo r d e Y la a se


d en o m in a intersección en Y p or q u e su v alo r es el punto en el cual la lín ea d e regresión
cruza el eje Y p o r q u e su v alo r es ei punto en el cu a l la lín ea de regresión cruza el eje Y,
es d ecir el eje vertical. L a b es la pendiente de la línea, rep resen ta que tanto cad a cam bio
d e unidad de la variable independiente X cam b ia la variable dependiente Y . T anto a
com o b son constantes num éricas, puesto que p a ra ca d a r e tía dada, sus valores n o
cam bian.

Modelo linea! Modelo no lineal Variables no Elaóanadas


Busa ajuste Bus! ajuste Ninguna corva de EfKáon
es adecuada ®

$ $

Cuando x crece, Cuando x crece,


y decrece y desxece

R e c ta d e re g re s ió n p o r el m é to d o d e laím im os c u a d ra d o s .

A h o ra que hem os visto com o determ inar la ecuación p ara u n a línea recta, pensem os
com o podem os calcu lar una ecuación p ara u n a lín ea d ibujada en m edio d e u n conjunto
d e p u ntos en u n diagram a de dispersión. P a ra esto debem os(m inim izar el erro r entre los
p u ntos estim ados e n la línea y los verdaderos p u n to s observados que se utilizaron p ara
trazarla.

P ara esto debem os introducir un nuevo sím bolo, p a ra sim bolizar los valores
individuales d e los puntos estim ados, esto es, aq u ello s puntos q u e caen en la lín ea de
estim ación. E n co n secuencia escribirem os la ecuación p ara la línea de estim ación com o

U n a form a en que podem os m edir el error d e nu estra línea de estim ación e s sum ando
to d as las diferencias, o errores, individuales entre los puntos observados y los puntos
estim ados.

L a su m a d e las diferencias individuales p a ra calcular el erro r no es u n a fo rm a confiable


d e ju z g a r la b ondad de ajuste de u n a línea d e estim ación.
El problema al añadir los errores individuales es el efecto de cancelación de los valores
positivos y negativos, por eso usamos valores absolutos en esta diferencia a modo de
cancelar la anulación de los signos positivos y negativos, pero ya que estamos buscando
el menor error deberlos buscar un método que nos muestre la magnitud del error,
decimos que la suma de los valores absolutos no pone énfasis en la magnitud del error.

Parece razonable que mientras más lejos este un punto de la línea e estimación, mas
serio seria el error, preferiríamos tener varios errores pequeños que uno grande. En
efecto, deseamos encontrar una forma de “penalizar” errores absolutos grandes, de tal
forma que podamos evitarlos. Puede lograr esto si cuadramos los errores individuales
antes de sumarlos. Con estos se logran dos objetivos:

© penaliza los errores más grandes


i

© cancela el efecto de valores positivos y negativos

Como estamos buscando la línea de estimación que minimiza la suma de los cuadrados
de los errores a esto llamamos método de mínimos cuadrados.

Si usamos el método de mínimos cuadrados, podemos determinar si una línea de


estimación tiene un mejor ajuste que otro. Pero para un conjunto de puntos de datos a
través de los cuales podríamos trazar un numero infinito de líneas de estimación, ¿cómo
podemos saber cuando hemos encontrado la mejor línea de ajuste?

Los estadísticos han derivado dos ecuaciones que podemos utilizar para encontrar la
pendiente y ,1a intersección Y de la línea de regresión del mejor ajuste. La primera
:Sfbnnyla;^culalap^¡^CTÍe>;f ; /; '■

o b = pendiente de la línea de estimación de mejor ajuste

© X = valores de la variable independiente

o Y = valores de ¡la variable dependiente

o = media de los valores de la variable independiente


i
o = media de los valores de la variable dependiente

o n = numero dé puntos de datos

La segunda ecuación calcula la intersección en Y

o a = intersección en Y

o b —pendiente de la ecuación anterior

o = media de los valores de la variable dependiente


o = media de los valores de la variable independiente

Verificadóm d® la ecuación de estimación

Ahora que sabemos como calcular la linea de regresión, podemos verificar que tanto se
ajusta.

Tomando los errores individuales positivos y negativos deben dar cero

5) Error estándar de la estimación

El error estándar nos permite deducir la confiabilidad de la ecuación de regresión que


hemos desarrollado.

Este error se Simboliza Se y es similar á la desviación estándar en cuanto a que ambas


son medidas de dispersión.

El error estándar de la estimación mide la variabilidad, o dispersión de los valores


observados alrededor de la línea de regresión y su formula es la siguiente

® = media de los valores de la variable dependiente

o Y = valores de la variable dependiente

o n = numero de puntos de datos

■■' • ; V ■$. v’-.. V’*:) ’■ • •


Dado que utilizar la ecuación anterior reqmérè lina sèrie de cálculos tediosos, se ha
diseñado ima ecuación que puede eliminar unos de estos pasos, la ecuación es la
siguiente:

o X = valores de la variable independiente

o Y = valores de la variable dependiente

o a = intersección en Y

o b = pendiente de la ecuación de la estimación

o n = numero de puntos de datos

d e rn o r e stá n d a r d© S

Como se aplicaba en la desviación estándar, mientras más grande sea el error estándar
de estimación, mayor será la dispersión de los puntos alrededor de la línea de regresión.
De manera que inversa, si Se = 0, esperemos que la ecuación de estimación sea un
estimador perfecto de la variable dependiente. En este caso todos lo puntos deben caer
en la línea de regresión y no habría puntos dispersos.
Usaremos el error estándar como una herramienta de igual forma que la desviación
estándar. Esto suponiendo que los puntos observados están distribuidos normalmente
alrededor de la línea de regresión, podemos encontrar un 68% de los puntos en + 1 Se,
95.5% en + 2 Se y 99.7% de los puntos en + 3 Se. Otra cosa que debemos observar es
que el error estándar de la estimación se mide a lo largo del eje Y, y no
perpendicularmente de la línea de regresión.

Imtervalos de comñsmza ustílizaiadlo desviación estándar

En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce


como el nivel de confianza
a

Esta probabilidad nos indica que tanta confianza tenemos en que la estimación del
intervalo incluya al parámetro de la población. Una probabilidad mas alta significa mas
confianza. • ,

El intervalo de confianza es el alcance de la estimación que estamos haciendo pero a


menudo hacemos el intervalo de confianza en términos de errores estándar, para esto
debemos calcular el error estándar de la media así:

Donde es el error estándar de la media para una población infinita, es la desviación


estándar de la población.

Con frecuencia expresaremos los intervalos de confianza de esta forma: en la que:

f!limite superior,del.intervalo de cojrifianza yV ’ ' .SV i '¿i,-

; # .lúpai¿e»-Inferior-déíin^dqde'cGni^iuá ’■

Relacióm entre salve! de confianza ®imtervaSo de confianza

Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99% en todos
los problemas sobre estimaciones, pero en algunos casos altos niveles de confianza
producen intervalos de confianza alto por lo tanto imprecisos.

Debe tenerse un intervalo de confianza que vaya de acuerdo al tema que se este
estimando.

6) amiéntalos de predfcdó© aproximados

una forma de ver el error estándar de la estimación es concebirla como la herramienta


estadística que podemos usar para hacer un enunciado de probabilidad sobre el intervalo
alrededor del valor estimado d e, dentro del cual cae el valor real de Y.

Cuando la muestra es mayor de 30 datos, se calcula los intervalos de predicción .


aproximados de la siguiente manera,

Si queremos estar seguros en aproximadamente 65% de que e! valor real de Y caerá


dentro de ± 1 error estándar d e. Podemos calcular los limites superior e inferior de este
intervalo de predicción de la siguiente manera:
= Limite superior del intervalo de predicción

= Limite inferior del intervalo de predicción

Si, en lugar decimos que estamos seguros en aproximadamente 95.5% de que el dato
real estaré dentro de + 2 errores estándar de la estimación d e. Podríamos calcular los
limites de este intervalo de la siguiente manera:

= Limite superior del intervalo de predicción

= Limite inferior del intervalo de predicción


a
y por ultimo decimos que estamos seguros en aproximadamente el 99.7% cuando
usamos + 3 errores estándar de la estimación de Podríamos calcular los limites de éste
intervalo de la siguiente manera:

= Limite superior del intervalo de predicción

= Limite inferior del intervalo de predicción

Como ya habíamos mencionado solo se usa para grandes muestras (mayores de 30


datos) para muestras más pequeñas se usan la distribución T

Debemos poner énfasis en que los intervalos de predicción son solo aproximaciones, de
hecho los estadísticos pueden calcular el error estándar exacto para la predicción Sp,
;usi^o/tá;fbnnülá: ''/’' ‘ 1 \

Xo = valor especifico de x en el que deseamos predecir el valor de Y ;

Análisis de correladó®

El análisis de correlación es la herramienta estadística que podemos usar para describir


el grado hasta el cual una variable esta linealmente relacionada con la otra. Con
frecuencia el análisis de correlación se Utiliza junto con el análisis de regresión para
medir que tan bien la línea de regresión explica los cambio de la variable dependiente
Y. Sin embargo, la correlación también se puede usar sola para medir el grado de
asociación entre dos variables.

Los estadísticos han desarrollado dos medidas para describir la correlación entre dos
variables: el coeficiente de determinación y el coeficiente de correlación.

Coefficiemíe d©deteinmiimacBÓBii

El coeficiente de determinación es la principal forma en que podemos medir la


extensión, o fuerza de asociación que existe entre dos variables, X y Y. Puesto que
hemos desarrollado una muestra de puntos para desarrollar las líneas de regresión, nos
referimos a esta medida como el coeficiente de determinación de la muestra.
El coeficiente de determinación de la muestra se desarrolla de la relación entre dos tipos
de variación: la variación de los valores Y en conjunto de los datos alrededor de

© la línea de regresión ajustada 1

© su propia media

el termino variación en estos dos casos se refiere a “la suma de un grupo de


desviaciones cuadradas”. Al usar esta definición, entonces es razonable expresar la
variación de los valores Y alrededor de la línea de regresión con esta ecuación:

variación de los valores Y alrededor de la línea de regresión =

la segunda variación, la de los valores de Y con respecto a su propia media, esta


determinada por

variación de los valores de Y alrededor de su propia media =

uno menos la razón entre estas dos variaciones es el coeficiente de determinación de la


muestra que se simboliza r2

esta ecuación es una medida del grado de asociación lineal entre X y Y

Una correlación perfecta es aquella en que todos los valores de Y caen en la línea de
estimación, por lo tanto el coeficiente de determinación es 1

Cuando el Valor dél CQeficiehtie de detórmi^^ón es 0 ^úiéré decir qúe no liáy v •


correlación entre las dos Variable?/ ." . V: V/ S V' •

En ios problemais con q^e se topa la mayoriá de lós responsables de la tómá de


decisiones, r2 caerá en alguna parte entre estos dos extremos de 1 y 0. recuerde, no
obstante que un r2 cercano a 1 indica una fuerte correlación entre X y Y, mientras que
un r2 cercano a 0 significa que existe poca correlación entre estas dosjvariables.

Un punto que debemos subrayar fuertemente es que r2 mide solo la fuerza de una
relación lineal entre dos variables. i

©ira imterpreiaciósa de r2

Los estadísticos también interpretan el coeficiente de determinación viendo la cantidad


de variación en Y que es explicada por la línea de. regresión.

Método d©aftajj© para cakcslar el cosfademís d® defermifladé® (r2)

Hay una formula que nos ahorra muchos cálculos tediosos y esta es: , .

en la que:

o r2 = coeficiente de determ inación d e la m uestra ¡


o a = intersección en Y

o b = pendiente de la línea de estimación de mejor ajuste

o n = numero de puntos de datos

o X = valores de la variable independiente

© Y = valores de la variable dependiente

o = media de los valores observados de la variable dependiente

d coeficiente de correlaciona
\

tel coeficiente de correlación es la segunda medida que podemos usar para describir que
también una variable es explicada por la otra. Cuando tratamos con muestras, el
coeficiente de variación de muestra se denomina como r y es la raíz cuadrada del
coeficiente de determinación de muestra:

cuando la pendiente de estimación de la muestra es positiva, r es la raíz cuadrada


positiva, pero si b es negativa, r es la raíz cuadrada negativa. Por lo tanto, el signo de
indica la dirección de la relación entre las dos variables X y Y. Si existe una relación
inversa, esto e s , si y disminuye

Intersección Y .

Variable dependiente

Pendiente de la línea

Variable independiente
fy

Y -ít+ b X
* ..-#9 ■ !■
Estadística Raul Corilla Melchor - Roly Quiñones Inga |

Lecturas de ¡a semana 13:


La distribución Normai

Autor: Luis Alberto Pérez Legoas /.

Lectura obligatoria de todo el artículo.

OBJETIVO ESPECÍFICO

Identificar las características de la distribución normal y su


interpretación estadística.

CONTESTA LAS PREGUNTAS

® ¿Cuáles son las características de la distribución Normal?


© ¿Qué . procedimiento se realiza para determinar, la
distribución normal?
© ¿Cómo se presenta una distribución normal?
® Elabora en un gráfico las clases de distribución normal

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
LA DISTRIBUCIÓN NORMAL Y SU USO EN LA INFERENCIA ESTADÍSTICA

Los conceptos básicos de Probabilidad y de Distribuciones Muéstrales sirven


como introducción al método de Inferencia Estadística; esta se compone en dos
áreas:

• Estimación

• Pruebas de Hipótesis

La estimación busca evaluar los valores de los parámetros de la población (por


ejemplo la media y ía desviación estándar) basados en una muestra. Las
pruebas de Hipótesis constituyen un proceso relacionado con aceptar o rechazar
alguna afirmación acerca de los parámetros de la población.

Ejemplo.
Supóngase que un fabricante de lápices compra a un proveedor borradores
para pegarlos a los lápices. El fabricante tiene que decidir si cada lote de
borradores del proveedor es de calidad aceptable. Para ello necesita que
contenga el 15% o menos de borradores efectuosos.
Desde luego, no puede inspeccionar cada borrador del lote. Debido a esto,
obtiene una muestra de 20 borradores de cada lote y la inspecciona. Decide
que si hay 3 o menos borradores defectuosos en la muestra, aceptará un lote;
si hay más de 3 defectuoso rechazará el lote y lo de volverá al proveedor.

Sin embargo, si acepta un lote cuando éste contiene más del 15% de
borradores defectuosos, ha cometido un error. Por otra parte si rechaza un lote
cuando contiene menos del 15% de borradores defectuosos, también ha
cometido un error.

Con base en la evidencia proporcionada por la muestra, el fabricante ha


tratado de responder a la pregunta ¿tiene el lote una proporción de lápices
defectuoso tan grande que sea necesario rechazarlo?

Al responder a lo anterior, el fabricante de lápices ha tomado una decisión


acerca de la proporción de defectos en la población general, ya que la
proporción en la población es un parámetro de la población y las decisiones
acerca de los parámetros de la población constituyen el proceso de pruebas de
hipótesis, en realidad el fabricante ha realizado la tarea de probar una hipótesis

Si el fabricante está interesado en estimar la verdadera proporción de defectos


con base a su información muestral, tendrá que intentar responder a la
pregunta
Esta pregunta corresponde a lo que se llama Estimación

Con base en la muestra


¿Qué afirmación puedo hacer acerca de la proporción de la
población que es defectuosa ?
¿Porqué es normal la distribución Normal?

Al hacer mediciones de cualquier tipo y distribuir nuestros


resultados bajo algún criterio, es muy común encontrar que los datos se
agrupen de manera muy característica.
En muchos de estos casos veremos que dichas distribuciones siguen una
forma muy particular en la que tenemos un mayor número de observaciones
para cierto valor, disminuyendo la cantidad de observaciones a ambos lados de
la observación más frecuente.

Un ejemplo es al dejar caer canicas por entre una serie clavos como lo muestra
la figura, al final del experimento con muchas canicas tendremos que las
canicas se han agrupado como se ve en la figura.

A este tipo de distribución se le conoce como Distribución Gaussiana , ya que el


matemático alemán Karl F. Gauss (1799-1830) fue quien la describió de manera
analítica. La forma es parecida a la de una campana, por eso también se conoce
como “campana de Gauss”.

p -3 a |j - 2 a ( j- a p |i+ o p+2o |j+ 3 a

Los parámetros que caracterizan esta distribución son su media (p) y su


desviación estándar (o) que es una medida de qué tan ancha es la curva.

Es tan común encontrar esta distribución en tan diversas ramas del


conocimiento, que también se le da el nombre de Distribución Normal . La
aportación de Gauss se honraba en los billetes de los marcos alemanes (antes
de los Euros) como uno de sus descubrimientos más trascendentales.

La distribución Gaussiana se aplica a una gran gama de observaciones en


ramas como la biología, la geografía, la astronomía y por supuesto la
economía.

Muchos ejemplos de la naturaleza se pueden aproximar con una


distribución normal.

En general esto se puede pensar como resultado de la interacción de


muchos (o un gran número) efectos aleatorios en la variable que se
estudia.
Por ejemplo, si medimos el tamaño de las hojas de un árbol, veremos que
tienden a distribuirse en forma gaussiana.

Pero ¿a qué se debe esta aparentemente sorprendente resultado?


Estas distribuciones son el resultado del agregado
de muchos procesos azarosos o fortuitos que podrían no ser observables
individualmente.
Matemáticamente esta distribución obedece a lo que se conoce como el

Teorema del Límite Central


. Este teorema estipula que si tomamos muestras de una población que tenga
cualquier tipo de distribución , pero una media y varianza finitas, entonces, la
distribución de las
medias tiende a la distribución normal. Entre mayor sea el número de
muestras mejor será la aproximación a una distribución normaI.

Por ejemplo, si nos tiramos un dado la probabilidad de que caiga cualquier


número es 1/6. Esto implica una distribución de posibilidades de la siguiente
forma (x es el número o cara):

Esta es una Distribución de Probabilidad Uniforme que, como se ve, es la misma


probabilidad para todos los valores que toma la variable.

Ahora imaginemos que tiramos un dado 500 veces y tomamos el número total
de puntos de cada tirada, entonces decimos que N = 1, y las sumas de cada
tirada las distribuimos como en la figura. Ahora lo hacemos con 4 dados (N = 4),
y luego con 7 y con 10. Al final tendremos las siguientes distribuciones:

Notemos que conforme vamos aumentando el número de muestras la


distribución se acerca más a una distribución normal.
LA DISTRIBUCIÓN NORMAL, LA CALCULADORA
Y LAS NUEVAS TECNOLOGÍAS
A b E l M a rtín ( * ) - R o sa n a Á I v a r e z G a r c ía ( * * )

La distribución Normal tiene numerosas aplicaciones en el campo de la Probabilidad y la


Estadística, cada día más presente en los programas de ESO, Bachillerato y Universitarios.
Como ya hemos dicho en un artículo anterior, de forma clásica y tradicional, siempre hemos
resuelto este tipo de problemas con la ayuda de unas tablas que vienen incorporadas al final de
los libros de texto. En las no tan lejanas pruebas de selectividad, nos facilitaban una fotocopia
de estas tablas, mostrándonos, en realidad, una pista de la estrategia que deberíamos de seguir
a la hora de resolver el problema.
A continuación vamos a describir una nueva forma de afrontar estos pro­
blemas, suponiendo que el alumno tiene una calculadora gráfica como
herramienta habitual (en nuestro caso utilizamos la CFX 9850 GB PLUS,
la FX 9860C de CASIO y la CLASSPAD 300), como ya ocurre en las
"aulas" de la casi totalidad de los países "desarrollados", incluidas gran
parte de nuestras Comunidades Autónomas. El uso de la calculadora grá­
fica nos permite comprobar rápidamente y de forma visual, aquello que
estamos buscando, con un enfoque más investigador e innovador, dando
prioridad al razonamiento, permitiéndonos más tiempo para pensar y
analizar tanto lo que hacemos como los resultados que obtenemos, así
como poder observar la procedencia de determinadas fórmulas utilizadas
con asiduidad.
No hay queolvidar que esta distribución es la más frecuentemente utilizada y sus propiedades
son elfundamento de los procedimientos de INFERENCIA importantes ya que la mayor parte
de las variables aleatorias de los fenómenos naturales presentan un comportamiento semejante
al de esta distribución, de ahí su nombre:
• Caracteres morfológicos: tallas, pesos, diámetros,...
• Caracteres fisiológicos: efecto de antibióticos, pesticidas, dosis de un fármaco...
• Caracteres sociológicos: notas obtenidas en un grupo de alumnos...
• Caracteres psicológicos: mejoría en un tratamiento, actitudes y comportamientos en deter­
minados ambientes, cociente intelectual,...
• Valores estadísticos muéstrales: comportamiento de la media de diferentes medias
muéstrales.
• Distribuciones discretas como la Binomial o la Poisson que, al aumentar el tamaño mues-
tral, pueden aproximarse en su comportamiento a una distribución normal, ...
En el caso de distribuciones Binomiales, B(n, p) con igual parámetro p, probabilidad de que
tenga lugar el suceso A, y con valores del parámetro n, tamaño muestral, cada vez mayores,
observamos que el polígono de frecuencias se aproxima a una curva en forma de campana
semejante a la función de densidad de la Distribución Normal.

(*) Profesor de Matemáticas del IES Pérez de Ayala (Oviedo - Asturias).

( * * ) Profesora de Tecnología del CPEB Cerredo (Degaña - Asturias)

Noviembre 2005 • 2005eko Azarea 59


Abel Martin y Rosana Álvarez García

Ejemplo: Si estudiamos la altura de 40 alumnos y alumnas de una clase, observamos que vie­
nen dadas por la siguiente tabla de frecuencias con su histograma asociado:

Si disminuimos la amplitud de los intervalos, nuestro polígono de frecuencias quedará de la


forma:

A medida que disminuimos la amplitud de los intervalos los saltos en el gráfico de la distribu­
ción disminuyen y la curva asociada a la gráfica se aproxima a la función de densidad de la
distribución normal.

60 SIGMA N° 27 • SIGMA 27 zk.


La Distribución Normal, ta Calculadora y las nuevas Tecnologías

Existen distintas funciones de distribución teóricas, basadas en un modelo de comportamiento


observado en numerosas experimentos. Su aplicación a una población en estudio se puede
realizar siempre que esta cumpla las condiciones básicas planteadas en cada una.
Entre las funciones de distribución teóricas para variables aleatorias continuas tenemos la
"Distribución Normal" definida por dos parámetros, su media y su desviación típica -» N((i, a).

be uincioa de densidad viene c tornada por


s
*
n>i • 1■ . 1 * 1 /
i’iti

Su foitcicr Je dJBtrifcución vrruf cvfiresxia jxv

Mx>-PfX**)- f '— : ’ 11 1
A

La distribución normal es una curva con forma de campana que se caracteriza por:
• La distribución es simétrica respecto al valor de la media m.
• La variable puede tomar cualquier valor en el intervalo (- » , + ^).
• A medida que nos alejamos del valor de la media de la distribución m, la probabilidad de
los valores de la variable va decreciendo de igual forma a derecha e izquierda.

• La probabilidad de los valores que toma la variable van decreciendo de forma más o
menos rápida según el valor de la desviación típica o\
• Tiene dos puntos de inflexión en x,= |x - ct y x2- n. + <j .

Noviembre 2005 • 2005eko Azaroa 61


Abel Martin y Rosana Álvarez Garda

• El área total encerrada bajo la curva es 1, lo que nos permite el uso de la función de dis­
tribución para calcular las probabilidades de los diferentes valores que toma la variable.
¿Qué ocurre cuando se modifican los valores de la media m y la desviación típica s que
caracterizan una distribución normal?
La media determina la posición de la distribución:

La desviación típica (s) nos indica el grado de apuntamiento de la distribución, el mayor o


menor agrupamiento de los datos en torno a la media (m).

Tipificación de la variable
La distribución normal viene determinada por los parámetros m y s, siendo necesaria una tabla
de probabilidades para cada normal N(jjl, <x), y sólo disponemos de las probabilidades tabu­
ladas de la distribución normal N(0, 1). Rara poder calcular las probabilidades de cualquier
distribución normal de parámetros N(p., cr), debemos transformar la variable X que sigue esta
distribución en otra variable que llamamos Z que sigue una distribución normal N(0,1), a este
proceso se le conoce como tipificar la variable.

Para tipificar la variable X —* N(p., cr) lo primero que debemos hacer es conseguir que su media
(p.) sea cero.
El siguiente paso es lograr que el valor de la desviación típica sea 1, para ello debemos con­
traer o expandir la campana que representa la distribución normal.

62 SIGMA N° 27 • SIGMA 27 zfc.


Estadística Raul Corilla Melchor - Roly Quiñones Inga

Lectoras de Sa semana 14:


Valoración deS estad© nutricional
Autor: Cecilia Martínez Costa . V,.'

Lectura obligatoria de todo él artículo. : \ \

I
I ¡

OBJETIVO ESPECÍFICO j
|
Identificar la aplicación de la prueba Z, en el informe de
investigación.

CONTESTA LAS PREGUNTAS

¿Cuáles son los elementos de la prueba Z?


¿Qué procedimiento se realiza para interpretar la prueba Z?
¿Cómo se presenta un la prueba Z en la lectura?
Elabora un esquema de la resolución e interpretación de la
prueba Z

UNIVERSIDAD PERUANA LOS ANDES .


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
Valoración del estado nutricional
5 Cecilia Martínez Costa1, Consuelo Pedrón Giner3
'H o sp ital C lín ico . U niv ersid ad de V alencia. 2H ospitaI U niv ersitario N iñ o Je sú s. M ad rid .

IN T R O D U C C IÓ N a) E rrores en la alim entación p o r d e le c to d e técni­


El p e d ia tra de a te n c ió n p rim a ria m ed ia n te el ca (frecuencia d esordenada, a lim en to s hipocaló-
se g u im ie n to p e rió d ico del n iñ o en los ex á m e n e s de rico s, b ib ero n es m al p rep a ra d o s), d ieta s in ad e ­
salu d , y a través d e la e x p lo ració n an te c u alq u ier c ir­ cu ad as. vegetarian ism o , p ro lo n g ació n de la lac­
cu n stan cia pato ló g ica, resu lta ser el m ejo r co n o ced o r tan cia m ate rn a sin in tro d u cció n de la a lim en ta ­
d e su d esarro llo y esta d o de n u trició n . E n ten d ien d o ción co m p lem en taria, etc.
bien las bases fisiológicas del c recim ien to y v alo ran ­ b) A lte ra c io n e s en el e sta b le c im ie n to del v ín cu lo
d o la p rogresión individual en el tiem p o , d isp o n e de m ad reh ijo y e n el d esarro llo de la c o n d u c ta ali­
la m ejo r herram ienta para d etectar p recozm ente cu al­ m entaria del niño. El proceso de creación de hábi­
q u ier d esv iació n d e la n o rm alid ad . to s a lim en ta rio s se in ic ia en el p e rio d o d e total
E n n u estra so cied ad , d e te rm in a d o s háb ito s han d e p e n d e n c ia d e rec ié n n a c id o y se c u lm in a en
p ro p ic iad o la ten d en cia a la so b re n u tric ió n y o b e si­ la au to n o m ía de la ado lescen cia. En él, es d eter­
d ad d e la pob lació n infantil, con la co n sig u ien te p re ­ m inante la actitud de los padres p ara q ue los niños
d isposición a p adecer en la ed ad adulta e n ferm edades desarrollen correctam ente los m ecanism os de con­
n u tric io n a les (o b esid ad , h ip erten sió n arterial, atero- trol del a p e tito y. (kir tanto, d el in g re so d e e n e r­
e scle ro sis). N o o b stan te, tam b ién se su fre d e sn u tri­ gía, al se r capaces de reco n o cer sus sen sacio n es
c ió n co m o c o n secu en cia de un a a lim en tació n in ad e­ de h am b re y saciedad. Los p adres deberían en se­
c u ad a en cantidad y/o calidad (desnutrición prim aría) ñar al niño a co m e r variedad de a lim en to s sanos
o p o r e n fe rm e d a d e s q u e d e s e n c a d e n a n un b a la n c e y d ejarle en lodo m om ento el co n tro l de la ca n ti­
en erg ético n eg ativ o (d esn u trició n secu n d aria). dad.
c) La m arginación social, la p o b reza e ignorancia,
CAU S A S Di- KKTIvVSO D E L CKE C1 MI KN 1 0 aseg u ran una alim en tació n in su ficien te. E ste es
V MA l.M TK iCIO ' un p ro b lem a q u e se ha ido a c re c e n ta n d o en los
C oncep tu al m ente, se d e n o m in a r e ir á s » d el c re ­ últim os años con la inm igración d e fam ilias d es­
c im ie n to o d e s m e d ro a aq u ella situ ació n clín ica en de países sin recursos, que se in co rp o ran a n u es­
la que el niño deja de progresar respecto al ritm o espe­ tra sociedad en condiciones precarias y cuya situa­
rad o p ara su edad. C o m o c o n secu en cia su rg e la d e s ­ ción req u iere un a im plicación sa n ita ria y social
n u tric ió n c o n sid e rad a c o m o la ex p resió n clín ica de prioritaria.
un fallo del crecim ien to m an ten id o qu e se traduce en
la alteració n del tam añ o y co m p o sició n corporales. 2. C a u s a s s e c u n d a ria s
C u alq u ier en ferm ed ad qu e in cid a so b re el o rg a­
1. C a u s a s p r im a r ia s o a m b ie n ta o s n ism o va a d esen cad en ar un trasto rn o n u tricional por
O b e d e c e a la in g esta in su ficie n te o in ad ecu ad a d iv erso s m ecanism os:
de alim en to s, que g e n e ra lm e n te se asocia a c irc u n s­ a) Im posibilidad de ingestión: en cefalo p atías, pará­
ta n c ia s d e s fa v o ra b le s d el e n to rn o del n iñ o tan to lisis cerebral infantil, anorexia de las en ferm ed a­
am b ien tales co m o p sicosociales: d es c ró n icas o de las in feccio n es de rep etició n ;
I
3 14 Protocolos diagnóstico-terapéuticos de Gastroemeruli>si;i. Hepatología yNutrición Pediátrica SEGHNP-AEP •-Ü-

e n tre e lla s un a c a u sa fre c u e n te e s la h ip ertro fia d e frecuencia, reg istro de in g esta co n p esad a de
ad en o id ea. a lim en to s d u ran te varios d ía s), es p rá c tic a m e n ­
b) E n ferm ed ad es q u e cu rsa n co n m ald ig estió n m a- te inviable en la c o n su lta p o rq u e req u iere m u ch o
labsorción: fibrosis q u ística, celiaq uía, in to leran ­ liem po y n ecesita in fo rm atizació n . Sin em bargo,
cia a la proteína d e leche d e vaca, parasitosis (giar­ siem p re se p u ed e h acer un a ap ro x im ació n c o n la
d iasis). sín d ro m e d e in te stin o co rto , etc. h isto ria d ieté tic a preguntando q u é consum e habi­
c) E n ferm ed ad es cró n icas q u e c onllevan un au m en ­ tualm ente en las principales com idas del día, c a n ­
to del g a sto e n erg ético , d e las pérdidas y/o de los tid a d a p ro x im ad a , tip o y tex tu ra del a lim e n to y
req u erim ien to s: e n fe rm e d a d e s in flam ato rias del tom as entre horas, co m p letán d o lo con la frecu en ­
in testin o , e n ferm ed ad p u lm o n a r cró n ica, c a rd ió ­ cia d iaria o sem an al de los p rin cip ales g ru p o s de
p a ta s , n e fro p atías, cán cer, etc. a lim en to s, a lim en to s p re fe rid o s o rec h a z a d o s y
su p lem en to s v itam ín ico s y m in erales. A l tiem p o
V A L O R A C IÓ N D E L E S T A D O D E q u e nos inform a so b re la ingesta aproxim ada, nos
N U T R IC IÓ N d a un a idea d e la co n d u c ta alim en ta ría y p e rm i­
El uso inteligente de la anamnesis, exploracio­ te esta b lec e r reco m e n d ac io n e s dietéticas.
nes clínica y untrupométricu y ki selección de algu­
nas pruebas complementarias constituye la forma más 2 . 1-ApU iración c lín ic a
eficaz de orientar un trastorno nutricional pora poder S iem p re hay q u e in sp e c c io n a r al niño d e s n u d o ,
instaurar prurito medidas terapéuticas y determinar pniquo es lo que m ás in fo rm a so b re la c o n stitu ció n v
aquellos casos que deben ser remitidos al centro de sobre la presencia de signos de organicidad. El so b re ­
referencia para sit evaluación más completa. p eso y la o b e sid a d so n fác ilm e n te d e le c tab le s. p ero
L a valo ració n del esta d o d e nutrición tiene co m o no a sí la desn u trició n , y a q ue h asta g rad o s a v an zad o s
o b jetivos: los n iñ o s pu ed en a p aren tar “ b u en asp ecto " vestid o s,
- C o n tro lar el crecim iento y estad o d e m a n d ó n del p o rq u e la ú ltim a g ra s a q u e se m o v iliz a e s la d e las
niño s an o identificando las alteraciones p o r ex ce­ bo las de B ichat. A l d esn u d arlo s y ex p lo ra rlo s p o d re ­
so o d efecto . m os d istin g u ir lo s n iñ o s co n stitu c io n a lm en te d e lg a ­
- D is tin g u ir el o rig e n p rim a rio o se c u n d a rio del d os d e a q u e llo s q u e e stá n p e rd ie n d o m asa c o rp o ra l
tra sto rn o n u tricio n al. co n a d e lg a z a m ie n to d e e x tre m id a d e s y g lú teo s, co n
L a s is te m á tic a d e la v a lo ra c ió n in c lu irá lo s piel lax a señal de fu sió n de) p a n íc u lo ad ip o so y m asa
sig u ien tes asp ecto s: m uscular. O tro asp ec to im p o rta n te es v alo rar la p re ­
i
I sen cia d e d isten sió n ab d o m in al h a lla z g o m uy su g e s­
I . A n a m n e sis ! tiv o d e e n fe rm e d a d d ig e stiv a c o m o la celia q u ía . La
- Se obtendrán d atos a cerca de la fam ilia y d m edio ex p lo ra c ió n siste m a tiz a d a p e rm itirá d e te c ta r sig n o s
so cial (tra b a jo d e los p a d re s, p erso n a s q u e c u i­ carenciales específicos y los sosp ech o so s de en ferm e­
dan del niño, n ú m ero de herhnanos. afecciones de dad. En niños m ayores se debe valorar siem pre el esta­
los p a d re s y herm an o s). ] d io de d esarro llo p uberal.
- Antecedentes personales: S e d eb en c o n o c er c ir­
cu n stan cias o curridas duraíite la gestación, m edi­ A tiln ip u m e lria
d as al n a c im ie n to y p ro g resió n en el lie.-npo. Se Perm ite valorar el tam año (crecim iento) y la com ­
p o n d rá esp ecial a ten ció n en los d alo s su eeren tcs p osición co rp o ral del niño. Es m uy útil siem p re que
d e p a to lo g ía o rg án ica ag u d a, cró n ica o de rep e­ se recojan bien las m ed id as y se in terp reten a d e cu a ­
tición, y en la sintom atología aco m pañante, sobre dam en te.
to d o a n iv el g astro in testin al.
- Encuesta dietética: E s fundam enta) para o rien tar 3.1. M e d id a s b á s ic a s
el origen d e un trastorno nutricional. Una encues­ Incluyen: peso, talla, p e rím etro cran eal, p e rím e ­
ta d e ta lla d a (re c u e rd o de 2 4 h o ras, cu estio n ario tro braquial y p lieg u e tricipital. E s fundam ental obte-
•vB Valoración del estado nutricional 3 15
A£¡*

F VBl VI. [minis nutnuim aks dcri\,idtis dil peso \ di Ij talla C akulu \ il.isilk anon
R elació n 0 índice C álculo
Relación peso/talla1 Curva percentilada / Puntuación z

índice de m asa corporal- (IM C) Peso (kg)


Talla (m ):
Valorar resultado seaún:
Curva percentilada / Puntuación z '
'Relación pesu/tullu. Se clasifica según percentil y/o puntuación ¿'
- N orm al: P I 5 - P 8 5 ( z a - l v a + 1)
■Suhnutrición (tres niveles): a) Leve. < P15 y > P3 f/ < —I y 2 -2V.b) M oderada. / < 2 2 -3 : c) Grave.1. < -3
- Sohrenulrición (tres niveles): a) Leve (sobrepeso) > PX5 > < P97 o +1 y s +2): h) O besidad. >P97 (/. > +2
y s +3); 2) O besidad intensa, z > +3.

lIMC lOMS, Cute): Hasta 5 años se clasifica igual que la relación peso/talla. En m ayores de 5 años:
- Normal: P15—P S 5 ( z 2 —I y s s + l )
- Sobrepeso > P85 (puntuación z > + 1), equivalente a un IM C de 25 kg/m ; a los 19 años:
- O besidad > P98 (puntuación z > +2), equivalente a un IM C de 30 kg/m ! a los 19 años.
Sobrepeso y obesidad deben valorarse ju n to al perím etro braquial y pliegue tricipital para distinguir exceso
de grasa o m asa m uscular.
- Subnutrición < P3 (z < -2 )
Cálenle de la puntuación Z: Valor antropom étrico real - M ediana (Percentil 50)
desviación estándar
Desviación estándar: S e obtiene a partir de las tablas originales, o a partir de los percentiles (para valores
superiores a P50 se calcula dividiendo el valor de la distancia P97 - P50 por 1.88; y para los inferiores a P50,
dividiendo la distancia P50 - P3 por 1.88.
E quivalencias: Percentil 97 = + 1.88; Percentil 50 = 0: Percentil 3 = - 1 .88

nerlos con la técnica y el instrum ental adecuados. Una L as estudios U vales es decir, los realizados en los dis­
vez reco g id as las m edidas del niño, para in terp retar­ tintos países, son m uy úliies para co n o cer la situación
las. es n ecesario co n trastarlas con las de su s fam ilia­ ilc ese entorno determ inado, sin em bargo, su uso ¿>m o
res y con los p atro n es d e referencia, lo qu e se puede patrón com parativo no es deseable pues los dalos jesla-
h a c e r m ed ian te p e rc e n tile s o calc u lan d o p u n tu ac io ­ d íslico s o b ten id o s (p erc e n tile s, e tc.) depen d en de la
nes Z (Tabla I). situación n u tricio n al de la p o b lació n estudiada! Así.
en los países co n gran p re v a le n c ia d e d e sn u trició n ,
3 .2 . P a tro n e s d e c re c im ie n to esta se in frav alo raría y el so b re p e so se sobrcválora-
L os están d ares de crecim ien to representan la d is­ rá, y en los países con gran núm ero de niños con sobre-
tribución de una m edida antropom étrica en u n a p obla­ p eso o b esid ad . o cu rrirá lo contrario.
ción y rellejan su estado de nutrición. C onstituyen una En n u estro país en tre otro s, se han d ifu n d id o en
h erram ien ta m uy útil p ara el seg u im ien to lo n g itu d i­ los últim os añ o s las tablas de O rb eg o zo (2004) y m ás
nal d e niños y p erm iten d e te c tar in d iv id u o s y/o g ru ­ recientem ente, se ha publicado un estudio m uy am plio
p o s d e rie sg o n u tric io n a l. U n p atró n p u e d e c o n s ti­ (E stu d io esp añ o l 2 008 d e C a rra sc o sa y c o is, 2 008)
tu ir la “n o rm a” a a lcan zar si se elab o ra d e un a p o b la­ q u e p o n e en e v id e n c ia la g ra v e te n d e n c ia h a c ia la
c ió n n o rm o n u trid a o p u ed e ser solo una “referen cia" o b esid ad de los n iños e sp añ o les. S u in fo rm ació n es
del esta d o d e salu d de un a pob lació n (O M S , 1983). m uy v a lio sa pero al se r un a p o b lació n so b ren u trid a.
316 Protocolos diagnóstico-terapéuticos de Gastroenterologfa. Hepalologfa y Nutrición Pediátrica SEGHNP-AEP •

n o p arece reco m en d ab le utilizadlos para realizar co m ­ v a d a : por el co n trario , un peso y /o talla e sta c io n a rio s
p a ra c io n es. C o m o p a tró n in te rn a c io n a l, se d isp o n e d eb e d e se r m o tiv o d e alarm a a u n q u e el n iñ o aú n se
d e la versión 2 0 0 0 del C D C (C e n te r for D isease C o n ­ en cu en tre en p ercen tiles altos.
trol) d e niñ o s n o rte a m e ric a n o s. E n E uropa se ha e la ­
b o ra d o un p a tró n m u ltic é n trico p ero solo p ara niñ o s 3 .4 . C á lc u lo d e ín d ic e s
de 0 -5 añ o s (E u ro -G ro w th 2 0 0 0 ). R e c ien te m e n te la C o n las m ed id as d el p eso y talla se p u e d e n c a l­
O M S ha d e sarro llad o y p ro p u esto unos nuev o s patro ­ cu lar índices derivados que perm iten clasificar el esta­
n es d e referencia in ternacional qu e incluyen las m edi­ d o de nutrició n , ev alu arlo en el tiem p o y c u a n ü fic a r
d as d e peso, longitud/estatura, p erím etro craneal, perí­ la resp u esta a las m ed id as tera p é u tic as. E n la T abla 1
m etro d el b ra z o y p lie g u e s tric ip ita l y su b e sc a p u la r se reco g en los ín d ices d e m ay o r a p lic a ció n p ráctica,
y lo s cálcu lo s d e la relació n p e so /talla y d el ín d ice de la fó rm u la de o b ten ció n y su s lím ites.
m a s a c o rp o ral (1M C ). In clu y e n d ato s de n iñ o s d e 0 - - L a re la c ió n p e s o /ta lla . S e v alo ra m ed ia n te per­
5 a ñ o s alim en ta d o s c o n la c ta n c ia m aterna, p ro ced en ­ c en tile s o calc u lan d o p u n tu ac io n e s Z . V alo ra la
tes d e d iv e rs o s p a ís e s d e l m u n d o . L o s d a to s se p re ­ relación del p eso p ara la talla in d ep en d ien tem en ­
s e n ta n e n ta b la s o e n g rá fic o s ta n to d e p e rc e n tile s te d e la e d ad y es m uy ú til p a ra d e te c ta r p rec o z ­
c o m o d e p u n tu a c io n e s Z . P a ra el resto d e e d a d e s (5 - m en te la m aln u trició n a g u d a (Fig. 1).
19 años) h a c re a d o u n as n u ev as tablas to m an d o c o m o - ín d ic e d e m a s a c o r p o r a l (IM C ). In ic ia lm e n le
b a se lo s d a to s d e N C H S d e 1979 e n las q u e la o b e si­ se usó p a ra c la sific ar la so b re n u tric ió n y o b e si­
d ad era m u y p o c o p re v a le n te y e n las qu e se c o n o ce dad en escolares y ad o lescen tes y a ctu alm en te ya
q u e se h a a lc a n z a d o la talla m áx im a p o r el fe n ó m e ­ e stá n e s ta b le c id o s lo s lím ite s d e s u b n u tric ió n
n o d e la a c e le ra c ió n s e c u la r d el c re c im ie n to (d e b i­ (O M S , 2 0 0 6 ). E s m u y fácil d e c a lc u la r (k g /m : )
d o a las m e jo ra s n u tric io n a le s y del m ed io a m b ie n ­ p ero c o m o varía co n la ed ad , d e b e in te rp re tarse
te). In clu y en p eso , talla e 1M C. A m b o s están a c ce si­ m ed ian te percen tiles o c alc u lan d o la p u n tu ació n
b le s en http://wH w.who.int/childgroulh/en/ y d is ­ Z. Es im portante tener en cu en ta q u e c u an d o eslá
p o n en dé so ftw a re p a ra su c á lc u lo au to m ático lo q u e e lev ad o in d ica ‘ so b re p e so " q u e p u ed e ser d e b i­
lo s h ace m u y fác ile s d e ap licar. d o a e x ceso de m asa g rasa (o b esid ad ) o a e x ceso
de m asa m ag ra (co n stitu ció n atlética). P ara d ife ­
3 .3 . V e lo c id a d d e c re c im ie n to y p e rfil d e ren ciarlo resulta m uy útil el p e rím etro del b razo
d e s a rro llo y el p lie g u e tric ip ita l, c o m o se e x p lic a e n las
Es muy importante valorar los cambios de una T ablas 1 y II.
medida a b lurgu del tiempo ya que una medida ais­ - O tro s. D u ran te m ucho tiem po se han usado p ara
lada tiene poco valor. Lus mediciones seriadas nos c la s ific a r el e s ta d o d e n u tric ió n lo s ín d ic e s d e
van a permitir: a) calcular su velocidad de crecimien­ W aterlow (porcentaje d el peso e stán d ar y p orcen­
to, sobre todo de la talla y b) construir un perfil de taje d e talla p a ra la e d a d ) y lo s n u tric io n a le s de
desarrollo del niño. S h u k la y M c L a re n , p e ro a c tu a lm e n te y a n o se
L a s is te m á tic a d e re lle n a r lo s p e rc e n tile s e n la reco m ien d an p o r la d ific u lta d p a ra su cálcu lo y,
cartilla d e sa lu d con las m ed id as del peso, talla y p e rí­ so b re todo, d e in terp retació n .
m e tro c ra n e a l y h a c e r el s e g u im ie n to lo n g itu d in a l
d e c a d a n iñ o p e rm itirá e v id e n c ia r c u á l e s su can a! 4. E x p lo ra c io n e s c o m p le m e n ta ria s
de c recim ien to y d e te c tar c u á n d o d esv ía su p crcentil En la m ayor p arle d e cen tro s d e a ten ció n prim aria
habitual. E sto ap o rta una inform ación e x trao rd in aria­ se puede acceder a diversas exploraciones com plem en­
m en te im p o rta n te p a ra in te rp re ta r el c re c im ie n to y tarias para valo rar la n u trición y el crec im ie n to , bien
esta d o de n u tric ió n d e un n iñ o . A sí co m p ro b a re m o s realizadas en el m ism o, o rem itidas a o tro s c o n certa­
q u e hay n iños c o n stitu cio n alm en te p eq u eñ o s (en p er­ dos. C ad a p rofesional d eb e c o n o cer los m ecan ism o s
c e n tile s b a jo s ), q u e no d e b e n c a u sa r p re o c u p a c ió n habituales para su solicitud. U na form a esp ecialm en te
siem p re q u e la v elo cid ad de c recim ien to esté co n ser­ b en eficio sa es d isp o n e r d e c o n tacto e stre c h o co n los
■ Valoración del estado nutricional 3 17
Ai?

14- p95

12- ^ p50

11)- v-O ^ p?

£
! •-

6-

4-

2~

i i i i ■
■ i i i i
55 60 65 70 75 80 85 90
Longitud (ein)

Relación peso-talla (patrón NCHS, 1979 modificado).


El punto * se encuentra en el percenül 10, indicativo de un déficit de peso para la
talla sugestivo de una desnutrición aguda.
Para el punto • la relación se encuentra en el percentil 50. pudiendo Iraraarse de
un niño normal o bien de una desnutrición crónica, en donde se ha enlenlecido la
velocidad de crecimiento
El punto 0 traduce un exceso de peso para la lalla. lo que indica sobrepeso u
obesidad o bien un estado de recuperación nutricional. en donde ya se ha normalizado
H C I Í(A 1. R elación
el peso pero aún no se ha recuperado la talla. peso para la talla: inter­
pretación.

pediatras especialistas del hospital d e referencia, tanto


. I’A IILA II. In te r p re ta c ió n Se so b rep eso . -
para la realización d e pruebas com o para el seguim ien­
to c o n ju n to de p acien tes rem itidos para estudio. O b esid ad C o n stitu ció n
a tle tic a
4.1. Determinaciones analíticas Peso para la edad Elevado Elevado
S e deben sele c c io n a r cuid ad o sam en te. H abitual­ Talla para la edad Norm al o
Norm al o
m en te se p recisa la d e term in ació n de hem ogram a, y elevada elevada
b io q u ím ic a c o n m e ta b o lism o d el hierro, cinc, preal-
IM C Elevado Elevado
búm ina, alb ú m in a, in m unoglobulinas y función hepá­
Perím etro braquial Elevado Elevado
tica. La alb ú m in a es m uy b u en índice del estado d e la
síntesis hepática, p ero com o tiene una vida m edia m uy Pliegue tricipital Elevado Normal
larga (21 d ías) tard a en m o d ificarse con el trastorno
n u tricio n al y en recu p erarse con la terapia: por ello,
la d e term in ació n d e la p realb ú m in a al tener una vida m en te los cam b io s n u tricio n ales inform a so b re a lte­
m ed ia m ás c o rta (2 d ías) re su lta m ucho m ás eficaz racio n es del crecim iento.
p a ra e v a lu a r la d e sn u tric ió n ag u d a y la resp u esta al
tratam ien to . L a d e te rm in a c ió n de facto res d e c re c i­ 4.2. A n á lisis d e c o m p o sic ió n c o rp o ra l
m iento. p rin cip alm en te el factor de crecim iento sim i­ En la práctica clínica pediátrica se aplica la antro­
lar a la in su lin a o IG F -I. a la v ez que refleja p recoz­ p o m etría ya ex p u esta anterio rm en te, y la im p ed an cia
3 18 Protocolos diagnóstico-terapéuticos de Gastroenterología. Hepaiolosía y Nutrición Pediátrica SEGHNP-AEP • ■£3'
AEP

bioeléctrica (B IA ). L a co n d u ctiv id ad eléctrica c orpo­ habrá qu e p en sar en la enferm edad inflam atoria y so li­
ral total o T O B E C es un m étodo preciso e inocuo, pero c itar en p rim e r lu g ar reactan tes de fase aguda. O b v ia­
a c tu alm en te su a p lic a b ilid a d e stá lim itad a p o r el cos­ m ente, si se d e te c ta a lg u n o d e esto s p ro ce so s d eb erá
to. L a in te rac ta n cia p o r in fra rro jo s, m éto d o m uy sen ­ rem itirse el p aciente al cen tro de referencia p ara c o m ­
c illo y eco n ó m ic o , p recisa m a y o r valid ació n . p letar el d iag n ó stic o e in ic iar la terap éu tica.
L a d e n sito m e tría es u n a ex p lo ra c ió n q u e p erm i­
te cu an tificar el c o n ten id o m in eral óseo, p o r lo qu e es B IB L IO G R A F ÍA
d e gran interés en niños con caren cias d ietéticas inten­ 1. Carrascosa A. Fernández JM. Fernández C, et ai. Estu­
sas (trastornos d e la co n d u cta alim entaria) o co n enfer­ dio transversal español de crecimienlo 2008. Parte II:
m edades cró n icas (fibrósis qiiística; enferm edad infla­ valores de talla, peso e índice de masa corporal desde
el nacimiento a la talla adulta. An Pediatr (Bare) 2008:
m ato ria in testin al).
68: 552-69.
2. CDC. National C enter for Health Statistics 2000.
4.3. Radiografía del carpo
http://www.cdcVgrowthcharts/zscorc.
Es de p rim era im p o rta n c ia para v alo rar la m ad u ­
3. Cole TJ, el al. Establishing standard definition for child
rac ió n e sq u e lé tic a y re la c io n a rla co n la e d a d c ro n o ­ overweight and obesity worldwide: lnternalional sur­
ló g ica del n iñ o . El m éto d o m ás u tilizad o p a ra su lec­ vey. BMJ 2000; 320: 1240-3.
tura es la c om paración con el atlas de G reulich y Pyle. 4. Dibley MJ, Staehling N. Nieburg P, Trowbridge FL.
E s m u y ú til p a ra v a lo ra r n iñ o s d e ta m a ñ o c o rp o ra l Interpretation of z-scure anthropometric indicators deri­
peq u eñ o q u e n o rep re se n ta n m as q u e v arian tes de la ved from the international gmwlb reference. Am J Clin
n o rm a lid a d : a sí p o r e je m p lo , en el re tra so c o n stitu ­ Nutr 1987:46:749-62.
cional del crecí m iento, la m ad u ració n ó sea está retra­ 5. Euro-Growth. Haschke. Van't Hof MA, eds. J Pediatr
sa d a y c o rre s p o n d e a la e d a d -ta lla (e d a d a la q u e la Gastroenterol Nutr 2000:31 (.Suppl I).
talla del n iñ o e staría en el p erc e n til 50), sin em b arg o , 6. Garza C, De Onís M. An overview o f growth standards
en la talla b a ja fam iliar, v an aco rd e s la e d a d c ro n o ló ­ and indicators and their interpretation. In: B aker S,
Baker RD, Davis AM, eds. Pediatric nutrition support.
g ic a y la m ad u ració n esq u elé tic a .
Boston: Jones and Bartlett Publishers; 2007. p. 1-13.
7. Hendricks K. Anthropometric evaluation. In: En: Baker
4.4. Exploraciones de enfermedades específicas S, Baker RD. Davis AM. eds. Pediatric nutrition sup­
D u ra n te el s e g u im ie n to d el n iñ o si se so sp ec h a port. Boston: Jones and Bartlett Publishers; 2007. p.
q u e el tra sto rn o n u tricio n al es secu n d a rio se o rien ta­ 57-64.
rá el s c re e n in g d e las e n fe rm e d a d e s q u e s u g ie ra la 8. Martinez Costa C. Martínez Rodríguez L. Valoración
e x p lo ra c ió n , la e d ad y el d e te rio ro de las c u rv a s de del esladu nutricional. En: Comité de Nutrición de la
p eso y talla. S iem p re q u e se a so cie d iarrea cró n ica se AEP ed. Manual Práctico de Nutrición en Pediatría. I*
debe in v estig a r la p rese n c ia d e parásito s en las h eces ed. Madrid: Ergon; 2007. p. 31-9.
(Giurdici lambliít. Crxptosporidmm sp.)\ en niños con 9. Sobradillo B. Agirre A. Aresti U, et al. Curvas y tablas
de crecimiento I Estudio longitudinal y transversal). Ins­
e n fe rm e d a d e s resp ira to ria s d e rep etició n , d e sm e d ro
tituto de Investigación sobre Crecimiento y Desarro­
y heces m alo lie n te s se re a liz a rá tesi del su d o r p ara el llo. Bilbao: Fundación Faustino O itegozo; 2004.
despistaje d e la ftbrosis qiiística; en aquellos con deten­
10. W HO M ulticentre Growth Reference Study Group.
ción de la c u rv a p o n d o estatu ral y d isten sió n ab d o m i­ W HO Child Growth Standard based on length/height,
nal se re a liz a rá n a n tic u e rp o s a n tie n d o m is io y an ti- weight, and age. Acla Paediatrica 2(X)6; Suppl 45(): 76-
tra n sg lu ta m in a sa tisu lar p a ra d e te c ta r la e n ferm ed ad 85. Estándares disponibles en http://w w w .w ho.int/
celíaca; en esco la re s y ad o le sc e n te s con d esn u trició n childgrowth/en/.
Estadística Raul Corilla Melchor - Roly Quiñones Inga |

Lecturas de !a semana 15;


Probabilidades

Autor: Luis Alberto Pérez Legoas

Lectura obligatoria de todo el artículo.

OBJETIVO ESPECÍFICO

Identificar los elementos y procedimientos para determinar la


probabilidad de un suceso.

CONTESTA LAS PREGUNTAS


¿Cuáles son los elementos de una probabilidad?
¿Qué procedimiento se realiza para determinar • la
probabilidad?
¿Cómo se interpreta la probabilidad?
Señale la diferencia entre probabilidad condicional?.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO Y CIENCIAS POLÍTICAS
I
UNIDAD IV : PROBABILIDAD
PROPÓSITO
Que el estudiante estudie los fenómenos aleatorios, resolviendo problemas utilizando
los tres enfoques, subjetivo, frecuentista y clásico, para comprender conceptos
fundamentales que le permiten interpretar a la probabilidad y a sus reglas relacionadas
directamente con la Inferencia Estadística.

PROBABILIDAD

La probabilidad tiene un papel crucial en la aplicación de la inferencia estadística y la


toma de decisiones bajo incertidumbre. Sin una adecuada comprensión de las leyes
básicas de la probabilidad, una inferencia (q una decisión), cuyo fundamento es la
información proporcionada por una muestra aleatoria, puede estar equivocada.

Fenómenos Aleatorios y Fenómenos Determinísticos.

Todos los hechos o sucesos que ocurren se denominan fenómenos.

Fenómeno Determinista - Es el fenómeno cuyo resultado se predice con certeza,


porque obedece a una relación causa-efecto y al variar poco las causas varía poco el
efecto.
Ejemplo: cuánto costarán 35 litros de gasolina si un litro cuesta $6.10, cuándo será
visto en México el siguiente eclipse total de sol; al disparar un proyectil con el mismo
ángulo de elevación y las mismas condiciones describe la misma parábola, etc.

Fenómeno Aleatorio - Es un fenómeno que tiene varios resultados y estos no se


pueden predecir con certeza, pues obedecen las leyes del azar.

Ejemplo: el resultado probable de una rifa; cuál será el equipo ganador de fútbol en el
próximo campeonato; qué cara quedará arriba al lanzar un dado; si llueve o no llueve
mañana; el tiempo que tardará un árbol en alcanzar 3m de altura etc.

Un Experimento aleatorio es una acción que se considera con propósito de análisis y


que tiene como fin determinar la probabilidad de uno o de varios resultados. En la
práctica, un experimento es el proceso por medio del cual una observación o medición
es registrada.

Un experimento aleatorio se caracteriza por:


a) El experimento se puede repetir indefinidamente bajo las mismas condiciones
b) Cualquier mínima modificación en las condiciones iniciales pueden modificar el
resultado final
c) Se puede determinar el conjunto de los posibles resultados del experimento, pero no
se puede predecir previamente un resultado

43
Espacio Muestral es el conjunto de (todos) los posibles resultados en un
experimento aleatorio. Generalmente se denota con Q (o con S). A cada uno de estos
resultados, también se les llama puntos muestrafes.

Ejemplos:
1.- Experimento: Se lanza una moneda y se observa la cara superior (es decir, lo que
“cae”).
Í2 = {s, a }

2.- Experimento: Se lanza un dado común y se observa la cara superior


« = {1 ,2 ,3 , 4 ,5 ,6 }

Cualquier subconjunto de Q es denominado Evehto aleatorio, y se denota normalmente


con las letras mayúsculas A, B, C, ... ' '

Si un espacio muestral contiene n elementos, hay un total de 2n subconjuntos o


eventos ( y a esto se le conoce como conjunto potencia ).

Ejemplo
Experimento: Se lanza un dado común y se observa la cara superior.
= {1, 2, 3, 4, 5, 6 }
Evento A: el número que “cae” es par. A = {2, 4, 6 }
Evento B: el número que “cae” es primo. B = {1, 2, 3, 5 }

A un evento que contiene un solo elemento, se le llama evento simple o elemental.

A un evento que contiene más de un elemento, se le llama evento compuesto.

A un evento que contiene el mismo número de elementos que Q, se le llama evento


seguro.

Un evento que no tiene elementos es llamado evehto imposible.

Ejemplo: '
Experimento: Se lanza una moneda tres veces.

Q = { (S,S,S), (S,S,A), (S,A,S), (A,S,S), (A,A,S),(A,S,A),(S,A,A), (A,A,A) }

Evento elemental: C: Que salgan tres soles; C = {(S ,S ,S )}

Evento compuesto: D: Que salgan dos soles; D = { (S,S,S), (S,S,A), (S,A,S), (A ,S,S)},

Evento imposible: E: que salgan cuatro soles E=$

Evento seguro: F: Que salgan entre 0 y 3 soles F =Q

44
Operaciones Básicas con Eventos

Ya que los eventos aleatprios son subconjuntos del conjunto Q, espacio muestral, se
pueden aplicar las conocidas operaciones con conjuntos, a los eventos, como son la
unión, la intersección y la diferencia de eventos.

UNION AuB Unión de eventos originales: es el evento que sucede si y


solo si A sucede o B sucede o ambos suceden

INTERSECCION An B Intersección de los eventos originales, es el evento


que sucede si y sólo si A y B suceden simultáneamente.

DIFERENCIA A -B La diferencia de los eventos originales A y B, es el


evento que sucedo solo en A pero no en B.

Gráficamente estas operaciones se pueden representar a través de los diagramas de


Venn.

Sea Q el espacio muestral y A y B eventos tal que A , B c S gráficamente, en la figura 1


se presenta el caso donde los eventos A y B no tienen elementos del espacio muestral
en común y en la figura 2 se presenta el caso donde los eventos A y B tienen
elementos del espacio muestral en común..

Q ---------- X \

i
Dos eventos A y B son mutuamente exclusivos, cuando no pueden ocurrir
simultáneamente, es decir, A n B = 0, lo que ocurre en la fig. 1.
¡
Ejemplo: Experimento: Se lanza un dado.
Espacio muestral = total de caras en que puede caer el dado, o sea seis formas de
interés:
£2 = {1,2,3,4,5,6 }, N(Q) = 6
Sean A, B, C los eventos: A: Que caiga un número impar = { 1 , 3 , 5 } , N(A) = 3
B: Que caiga un número mayor de 2 y menor que 5 = {3, 4}, N(B) = 2
C: Que caiga un número par = { 2 , 4 , 6 } , N(C) = 3

a).- Unión:

A uB={ 1, 3, 5 }u { 3, 4 } = {1,3,4,5}, N(A uB) = 4


A u C={ 1, 3, 5 }< j { 2,4,6 } = {1,2,3,4,5,6}=S, N(A uC) = N(S) = 6

46
Enfoques de Probabilidad

La probabilidad clásica se refiere a situaciones ideales, donde todos los casos o


resultados posibles tienen la misma probabilidad de ocurrencia (son equiprobables). La
probabilidad frecuencial proporciona estimaciones de la probabilidad que pueden variar,
dependiendo del número de observaciones realizadas. La frecuencia subjetiva de un
evento es asignada por el investigador con base en su experiencia.

Probabilidad Clásica

Supongamos un espacio muestral O = {ai,...aN} de manera que los a¡ son


sucesos elementales igualmente probables y sea un suceso £ = {ai,...ai<} (k < N).
Se define la probabilidad P del evento E, como

N (0)
Ejemplo:
Experimento: Se lanza una moneda tres veces.

Q = { (S,S,S), (S,S,A), (S,A,S), (A,S,S), (A,A,S),(A,S,A),(S,A,A), (A,A,A)}

Evento C: Que salgan tres soles; P(C) = *

4
Evento D: Que salgan dos soles; P(D) =
8

Evento E que salgan cuatro soles; P(E) = P($ = 0 =0


8

g
Evento F: Que salgan entre 0 y 3 soles; P(F) = - = 1
8

Cómo puedes observar, una función de probabilidad tiene las siguientes verdades
básicas o axiomas.

1. Si £ es un evento cualquiera, entonces 0 < p (e ) < l


2. Si fío S, es el evento seguro, entonces P(fí) = l o P{S) = 1
3. Si E¡, Ei Ek son eventos mutuamente excluyentes, entonces

P(E, o E2 o .... Ek)=P(E,)+P(E2) + ...+P(Ek)

45
Probabilidad Condicional

Una situación de interés consiste en determinar la probabilidad de un evento si ha


ocurrido otro. Por ejemplo, si lanzamos un dado, ¿cuál es la probabilidad de obtener un
3 si se sabe que cayo un número impar?

La información “se sabe que es impar" condiciona la probabilidad de ocurrencia del


evento “cae 3", es decir, de las 3 posibles resultados impares solamente nos interesan
aquel que es 3 ; así, la probabilidad (//amada probabilidad condicional), es U 0.3333

Observe que si se calcula solamente P(“cae 3”), se obtiene ^- = 0.i666t pero la


influencia del evento impar modifica su probabilidad a 0.3333

Definición

Sean A y E dos eventos de un espacio muestral Q, con P(E) > 0. La probabilidad de


que ocurra el evento A dado que ha ocurrido E, es decir, la probabilidad condicional
P(Ar)E)
de A dado E, se define como: P(A E ) =
P(E)
Además, despejando a P(Ar»E), y haciendo (AnE) = (EnA), se tiene:

P(AnE) = P(EnA) = P(E) P(A/E)

Ejemplo
En cierta ciudad, las mujeres representan el 50% de la población y los hombres el otro
50%. Se sabe que el 20% de las mujeres y el 5% de hombres están sin trabajo. Un
economista estudia la situación de empleo, elige al azar una persona desempleada. Si
la población total es de 8000 personas, ¿Cuál es la probabilidad de que la persona
escogida sea?:

a) Mujer b ) Hombre c) Mujer sabiendo que está empleada


d) sin empleo dado que es hombre e) Empleada si se sabe que es mujer

Es útil construir una tabla de contingencia para el espacio muestral

Desempleados Empleados Total


Mujeres 800 3200 4000
Hombres 200 3800 4000
Total 1000 7000 8000
Sea los eventos:
E : que la persona seleccionada esté empleada
D : que la persona seleccionada esté desempleada
M : que la persona seleccionada sea mujer
H : que la persona seleccionada sea hombre

48
b).- Intersección:

A n B={ 1, 3, 5 } n {3. 4 } = {3}, N(AnB) = 1


A n C={ 1, 3, 5 } n {2,4,6 } = {O}, N(A n C) = N{<D) = 0

c).- Diferencia:
A - B = ={1,3, 5 } - { 3 , 4 } = { 1, 5} , N(A- B) = 2

d).- Complemento:
Ac = {2, 4, 6} = C N( Ac) = N(C) = 3

Probabilidad frecuencia! y regularidad estadística

Las frecuencias relativas de un evento tienden a estabilizarse cuando el número de


observaciones se hace cada vez mayor.

Ejemplo:
La regularidad estadística en el experimento del lanzamiento de monedas, indica que
las frecuencias relativas del evento: que salga sol {s }, se tiende a estabilizar
aproximadamente en 0.5= 1/2. ¡

Si un experimento se repite N veces bajo las mismas condiciones, la probabilidad de un


evento A, denotada por P(A), es el valor en el que se estabilizan las frecuencias
relativas del evento A, cuando el número de observaciones del experimento se hace
cada vez mayor.

Ejemplo:

En los últimos certámenes de belleza ha habido: 7 reinas Europeas, 1 Africana, 5


Latinoamericanas, 3 norteamericanas y 2 Asiáticas.

Calcula la probabilidad de que la reina de belleza de este año sea: •


A) Latinoamericana
B) Africana o Asiática
C) Europea
D) No norteamericana

47
Cada una de las entradas de la tabla representan:

Desempleados Empleados Total


Mujeres M nD M nE M
Hombres H nD H nE H
Total D E

Desempleados Empleados Total


Mujeres 800/8000= 1 3200/8000=4 4000/8000=.5
Hombres 200/8000=025 3800/8000=475 4000/8000=5
Total 1000/8000= 125 7000/8000=875 8000/8000=1

P(M) = 0.50 • P(H) = 0.50 P(E) = 0.875 P(D) = 0.125


P(M/E) = P(MnE)/P(E) = 0.40/0.875 = 0.4571
P(D/H) = P(DnH)/P(H) = 0.025/0.5 = 0.05
P(E/M) = P(MnE)/P(M) = 0.40/0.5 = 0.08
P(M/D) = P(MnD)/P(D) = 0.10/0.125 = 0.8
P(H/D) = P(HnD)/P(D) = 0.025/0.125 =0.2

Regresando al contexto del problema, estos números significan que:

“La probabilidad de que la persona escogida sea Mujer es del 50%”


“La probabilidad de que la persona escogida sea Hombre es del 50%”
“La probabilidad de que la persona escogida sea Mujer sabiendo que está empleada es
del 45.74 %”
“La probabilidad de que la persona escogida este sin empleo dado que es hombre es
del 5%”
“La probabilidad de que la persona escogida este Empleada si se sabe que es mujer es
del 8%”

49
Estadística Raul Corilla Melchor - Roly Quiñones Inga j

Lecturas de la Remana 16:


Prueba de Hipótesis
Autor: Samuel Signini Prado

Lectura obligatoria de todo el artículo.

I
I

OBJETIVO ESPECÍFICO
Identificar los estadígrafos de la prueba de hipótesis y su
procedimiento en la investigación jurídica.

CONTESTA LAS PREGUNTAS


¿Cuáles son los estadígrafos para i!ma prueba de hipótesis?
¿Qué procedimiento se realiza para determinar la prueba de
hipótesis? '
¿Cómo se determina o eliges la X2, Z, t de estudent?
Elabora un comentario de que éstadígrafo se utiliza en la
investigación jurídica.

UNIVERSIDAD PERUANA LOS ANDES


ESCUELA ACADÉMICO PROFESIONAL DE DERECHO V CIENCIAS POLÍTICAS
PRUEBA DE HIPÓTESIS

6.1 INTRODUCCIÓN

Los métodos estudiados en el capítulo anterior usan la información proporcionada por los
estadísticos niuestrales para estimar con cierta probabilidad el valor de un parámetro
poblacional. En éste capítulo se introducirá lá prueba de hipótesis que es un enfoque diferente.
En éste caso, se supone a priori el valor del parámetro y sobre la base de la información
obtenida en una muestra se somete a prueba la suposición, para luego tomar con cierta
probabilidad, la decisión de rechazar o no rechazar la hipótesis. En éste punto es importante
señalar que la expresión “no rechazar” pudiera ser sustituida por “aceptar”, sin embargo antes
de hacerlo es necesario atender cuidadosamente algunas explicaciones que se darán más
adelante. La prueba de hipótesis también conocida como docimasia o contrastación de
hipótesis es uno de los métodos estadísticos más usados en las ciencias naturales por ser un
procedimiento que le proporciona al investigador un criterio objetivo para tomar decisiones
con base a un número limitado de observaciones. Frecuentemente el biólogo tiene que decidir:
a) al comparar magnitudes de propiedades físicas, químicas o biológicas en dos o más
condiciones o categorías, como es el caso de confrontar el valor medio de la presión arterial en
personas pertenecientes a dos grupos etarios; b) al valorar los efectos de diferentes niveles de
algún factor ambiental como la temperatura, la humedad, el contenido de oxígeno sobre algún
proceso, característica o propiedad de un organismo; y c) al relacionar dos o más variables,
como la intensidad lumínica y la tasa fotosintética. En éste capítulo y en los siguientes se
trataran varios procedimientos para probar hipótesis que dan respuesta a este tipo de
problemas o a otros similares,
i

6.2 LA PRUÉBA DE HIPÓTESIS: UN PROCEDIMIENTO DE DECISIÓN

Antes de estudiar las distintas etapas y casos de las que consta el procedimiento para la prueba
de hipótesis, consideraremos un ejemplo que servirá para mostrar los fundamentos del proceso
de docimasia y la toma de decisiones.

E jem plo 6.1. Con el propósito de determinar el efecto de una nueva dieta sobre el desarrollo
de ratones de laboratorio un investigador necesita formar varios grupos de ratones recién
nacidos todos con un mismo peso. De manera que conforma varios lotes de 36 ratones con un
peso aproximado a los 30 g. Para verificar si los grupos son homogéneos en cuanto al peso,
vuelve a pesar cuidadosamente los 36 ratones de cada grupo y le calcula el valor promedio y la
desviación estándar. El investigador sabe que al ser el peso una variable aleatoria y por estar
trabajando con una muestra es difícil que cada grupo tenga un peso promedio exactamente
igual a 30 g, alinque si bastante aproximado a éste valor. Sin embargo el investigador se
Sam uel Segnini Fundamentos de Bioestadística Capitulo 6 109

encuentra ante una disyuntiva: a) sí el valor promedio de peso para cada grupo se considera
como una simple desviación fortuita de los 30 g dada la variabilidad característica de las
muestras aleatorias, no hay necesidad de reorganizar el grupo, y b) si el valor medido esta
verdaderamente desviado del valor esperado de 30 g es necesario reorganizar el grupo
sustituyendo los ratones causantes de la desviación.
A fin de tener un criterio objetivo que le ayude a tomar la mejor decisión, el investigador
establece como prem isa que el peso promedio p de la población de donde provienen los pesos
de los ratones es de 30 g. Si es cierto que p = 30 es de esperar que el valor promedio del grupo
o muestra x sea muy cercano a dicho valor y su probabilidad de ocurrencia sea alta. Si esto
sucede se acepta la hipótesis y se considera que la desviación del peso promedio de la muestra
con respecto a la m edia esperada, x - p, es producto de la naturaleza aleatoria de la variable
peso, siendo innecesario reorganizar el grupo de ratones. Pero aún siendo cierto que p = 30,
es posible qüe los 36 ratones-tengan un peso promedio alejado del peso esperado de 30 g, lo
cual es improbable, En éste caso, el investigador puede aceptar que p = 30 y considerar que
ocurrió un hecho poco probable o alternativamente decidir que en lugar de haber sucedido
algo poco probable considerar que el valor de la media poblacional es menor a 30 (p < 30).
Ilustremos la situación anterior en forma real y supongamos que el investigador encontró que
uno de los grupos dio como resultado un promedio de 29.3 g con una desviación de 2 g. De
acuerdo a lo dicho anteriormente, para poder tomar la decisión de reorganizar o no el grupo de
ratones, se debe proceder á determinar si 29.3 ocurre con una probabilidad alta o baja teniendo
como hipótesis que p = 30. Como el peso promedio observado es menor a 30 se debe proceder
a hallar la P ( X < 3 0 ) . Para tal fin tenemos que saber como es la distribución de la media
muestral. Aunque desconocemos la distribución de la variable peso promedio, como el tamaño
de la muestra es grande (n = 36) se puede afirmar, de acuerdo al Teorema del Límite Central,
que dicha variable sé distribuye normalmente con media igual a 30 y desviación igual a
S j = 2 / -v/36 = 0.33. Por lo tanto la probabilidad buscada será:

P { X < 29.3) = P {Z < z) = P (Z < 29;3 ~ Í ° = P (Z < -2 .1 ) = 0.0179


2/V36

Esta probabilidad tan baja (Figura 6.1),


tiene dos explicaciones: a) La hipótesis de
que p = 30 es cierta y ocurrió un hecho casi
imposible como el de obtener un peso
promedio igual a 29.3 el cuál esta muy
alejada del valor esperado de 30 g, y b) la
hipótesis anterior no es cierta y el valor
esperado es mucho menor a 30. La Figura 6.1.
explicación b resulta obviamente más
razonable.

Pero veamos que habría ocurrido si el valor de la media muestral hubiese sido más próximo a
30, por ejemplo 29.9. En éste caso la probabilidad de que ocurra un valor igual o menor a 29.9
sería:
Samuel Segnini Fundamentos de Bioestadística Capitulo 6 111

El valor de Z a la izquierda del cuái se encuentra el 0.05% del área de la distribución d e .


probabilidades de la media muestral es -1.64, por lo tanto, si se despeja x de la expresión
anterior se tiene que,
x - M x + z (0 05) [ s j J ñ ) = 3 0 + ( - 1 .64)(2 / V36) = 30 - 0 .5 4 12 = 29,46

Este valor es ahora nuestro límite para


tomar la decisión de aceptar o rechazar la
presunción de que jj. = 30. Si la media del
grupo de ratones es menor a 29.46 se
rechaza la premisa y si es mayor se acepta
(Figura 6.4). Ahora sabemos que 0.54 es la
rnáxima desviación que se puede aceptar (Zona Rechazo| Zona Aceptación t
para concluir que la diferencia entre la
media observada y la esperada es Figura 6.4
simplemente aleatoria.
Volviendo al caso de los ratones, el investigador ahora conociendo el peso promedio de cada
grupo puede tom ar rápidamente una decisión para mantener o reorganizar el grupo,
simplemente comparando la media obtenida con el valor crítico de 29.46 g.

6.3 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS

En el procedimiento usado para resolver el problema del Ejemplo 6.1 se pueden identificar
varias etapas fundamentales, las cuales se pueden reordenar e identificar en la forma siguiente:
1. Formulación de hipótesis
2. Especificación de un valor de probabilidad crítico o nivel de significación.
3. Elección de un estadístico de la muestra y de su distribución para someter a prueba las
hipótesis.
4. Establecimiento de una zona de rechazo para Ho.
5. Cómputos necesarios. ¡
6. Decisión. i

En lo que sigue nos permitiremos dos concesiones: supondremos que- todas las variables
usadas siguen una distribución normal y la mayoría de las veces usaremos la media
poblacional fi como ejemplo del parámetro a docimar.

F orm ulación de hipótesis. Por lo general toda investigación en el campo de las ciencias
naturales se inicia a partir de una hipótesis la cual es una explicación tentativa que se da a un
hecho observado. La misma puede surgir a partir de una teoría general que explica cierta
realidad a la cual pertenece el fenómeno observado, o por la experiencia propia o de otros
investigadores, o por simple intuición. Ahora bien, en la formulación de cualquier hipótesis
está implícita una hipótesis alternativa. Por ejemplo, se puede plantear como hipótesis de
investigación que el ejercicio constante disminuye el nivel de colesterol en el plasm a
sanguíneo, pero asociada a esta hipótesis existe otra premisa alterna que se opone, en éste
caso la alternativa sería que el ejercicio constante no disminuye el nivel de colesterol en el
Samuel Segnini Fundamentos de Bioestadística Capitulo 6 110

2 9 .9 -3 0
P ( X < 29.9) = P (Z < = P ( Z < - 0.3) = 0.382
2/V36

Esta es una probabilidad de ocurrencia alta


(Figura 6.2), siempre y cuando fi = 30. Por
lo tanto resulta razonable aceptar la
presunción de que el peso promedio del
grupo todavía es igual a 30 g.

Pero si la media muestral hubiese dado un 29.9


valor ni tan próximo ni tan alejado de 30 la
decisión no sería tan clara. Por ejemplo si Figura 6.2
el valor‘de la media muestral hubiese sido
29.5 ¿Cuál sería la decisión?.

P ( X < 29.6) = P{Z < = P( Z < - 1.2) = 0.1151

En este caso la probabilidad no es tan baja


(Figura 6.3) para rechazar de inmediato
que ja = 30 y tampoco es tan alta para
aceptar sin mayores consideraciones que |i
= 30. Esta situación de incertidumbre
siempre estará presente para cualquier
valor con probabilidades moderadas de
ocurrencia. Figura 6.3

La mejor manera de resolver el problema es estableciendo previamente un criterio o valor


límite para aceptar o rechazar la hipótesis y así poder tomar una decisión inmediata. Este valor
límite debe excluir los valores que ocurren con menor probabilidad. Por lo general se excluyen
aquellos valores cuya probabilidad de ocurrencia es igual o menor a 0.05. También se pueden
utilizar otros criterios como aquellos que establecen una probabilidad de ocurrencia igual o
menor a 0.01 ó 0.001. M ás adelante serán discutidas las razones que fundamentan la
escogencia de un valor límite de probabilidad como criterio para rechazar o no una hipótesis.
Por ahora es necesario concentrarse en comprender el proceso de encontrar este valor crítico.
Una vez que se elige el valor de probabilidad que sirve de criterio para tom ar una decisión, se
pueden conocer cuáles valores de la variable cumplen con ésta decisión. Si decidimos que el
valor de probabilidad crítico es 0.05, todos los valores que rechazan la hipótesis establecida
son aquellos cuya P(X < x ) = 0.05. A partir de ésta expresión se puede encontrar cuál es valor
de X a partir del cual la probabilidad de ocurrencia es menor a 0.05. Sabemos que P(X < x ) =
0.05 es equivalente a P(Z < z) = 0.05, siendo z igual a

z - x~Mx
SJ 4 ñ
Samuel Segnini Fundamentos de Bioestadistica Capitulo 6 |12

plasma sanguíneo. Estas hipótesis de investigación para poderse someter a prueba deben
concretarse en términos cuantitativos, transformándose en hipótesis estadísticas. Para el
ejemplo anterior, se puede proponer como hipótesis estadística que bajo cierto programa de
ejercicio la tasa prom edio de disminución de la concentración del colesterol será mayor a 30
unidades. Consecuentemente existe una hipótesis estadística alternativa que en este caso
plantea que con el ejercicio la tasa promedio de disminución del colesterol será igual a 30
unidades. De manera que las hipótesis de investigación se derivan de las teorías que se están
probando y las hipótesis estadísticas hacen factible su contrastación.
En forma general las hipótesis estadísticas son afirmaciones que involucran una propiedad de
la distribución probabilística de la variable aleatoria que se está estudiando, propiedades como
son la media (n), la varianza ( a 2), un valor de proporción (rc) o la forma de la distribución. De
modo que el primer paso en un proceso de decisión es formular las hipótesis estadística, las
cuales reciben el nombre de hipótesis nula (H0} e hipótesis alternativa (H |). La hipótesis nula
se dice que es una hipótesis simple, porque es una afirmación de igualdad con un valor
especifico, mientras que las hipótesis alternativa se dicen que es compuesta porque puede
asumir diferentes valores.
Si se representa un parámetro poblacional por letra griega 0 y con 0O un valor cualquiera del
parámetro, la forma genérica de la hipótesis nula sería una igualdad entre el parámetro y un
valor específico del mismo,
Ho: 0 = 0O
Por su parte la hipótesis alternativa se puede representar con una de las tres posibilidades
siguientes:
0>0O
Hf. 0 < 0O
0 ^ 0O
La expresión 0 > 0Ose interpreta como que el parámetro 0 puede asumir cualquier valor mayor
a 0Oy se dice que la prueba de hipótesis es de una cola a la derecha. Por su parte 0 < 0O indica
que el parámetro 0 puede ser cualquier valor menor a 0O y la prueba de hipótesis se llama de
una cola a la izquierda. Finalmente 0 i- 0O representa la posibilidad que el parámetro 0 asuma
cualquier valor diferente (mayor o menor) al valor 0oy la prueba de hipótesis se denomina de
dos colas. Más adelante, cuando se trate lo referente al establecimiento de la zona de decisión,
se aclarará la razón de esta nomenclatura.
Para el caso del ejemplo del programa de ejercicios y la disminución del nivel de colesterol en
la sangre, las hipótesis se pueden plantear de la manera siguiente:

Hipótesis nula H0 : |i = 30
Hipótesis alternativa : Hf. p > 30

La hipótesis nula establece que un parámetro como la tasa media de disminución de la


concentración de colesterol es igual al valor de 30, mientras que la hipótesis alternativa
predice que su valor será mayor a 30.
Aquí podemos darnos cuenta que la proposición que el investigador quiere probar, como es
que la disminución promedio de colesterol será mayor a 30 unidades, está recogida por la
hipótesis alternativa, mientras que la hipótesis nula asume la proposición que se quiere negar.
La utilidad de plantear las hipótesis de ésta manera se explica porque el rechazo de Ho es un
veredicto mucho más robusto que su no rechazo, puesto que es necesario acumular evidencia
Samuel Segniiti Fundamentos de Bioestadistíca Capitulo 6 113

científica muy fuerte para poder rechazar una hipótesis nula. Por lo tanto la consecuencia de
rechazar una hipótesis nula es un gfan apoyo a la hipótesis alternativa. Ilustremos esta
situación con la analogía siguiente: en los procesos judiciales donde hay alguien acusado de
un delito, hay dos hipótesis: inocente (Ho) y culpable (H |). El fiscal público tiene interés en
probar que el acusado es culpable. Para poder llegar a una decisión de culpable es necesario
presentar suficientes evidencias que garanticen que la decisión es correcta. De no tenerse
evidencias fuertes la hipótesis nula de inocencia no puede ser rechazada, pero esto no significa
que se comprobó la inocencia del acusado, sino que no se logró acumular suficientes
elementos para rechazar Ho. De hecho es posible que con nuevas investigaciones se determine
la culpabilidad del acusado. Por el contrario habiéndose obtenido fuertes evidencias de
culpabilidad, se acepta la hipótesis alternativa, decisión que es mucho más difícil revertir. En
otras palabras la probabilidad de cometer un error es mucho menor al rechazar Ho que al no
rechazarla, fin la práctica jurídica, si la evidencia es débil es preferible equivocarse declarando
inocente a alguien culpable que condenando a un inocente. Un razonamiento similar a éste es
el que usan los investigadores cuando plantean como hipótesis alternativa el evento que se
quiere probar. Si los datos usados para probar las hipótesis proporcionan suficiente evidencia
para rechazar la hipótesis nula, como consecuencia inmediata la hipótesis alternativa recibe un
respaldo muy fuerte. Pero si el investigador hubiese planteado el mismo evento como hipótesis
nula, su no rechazo no demuestra que el evento de interés sea verdad, sino que los datos no
proporcionaron evidencia para rechazarla, dejando abierta la posibilidad de poder ser refutada
con otro conjunto de datos o que otra hipótesis sea la verdadera. Por esta razón, es que la
sustitución del término no rechazar Ho por el término aceptar Ho, no es muy conveniente y
de hacerlo se debe estar consciente que la aceptación de Ho es sólo temporal. Veamos un
ejemplo biológico: durante mucho tiempo los taxónomos, al describir los mamíferos le
asignaban como una característica única el hecho de ser vivíparos, es decir que los individuos
se desarrollaban en el vientre de la madre y cuando nacían ya habían completado en gran parte
su desarrollo, lo cual los diferenciaba de los animales ovíparos y ovovivíparos cuyo desarrollo
se completa dentro de un huevo. Esta era una hipótesis que había recibido mucho respaldo,
puesto que cada vez que aparecía una nueva especie de mamífero recibía apoyo la hipótesis.
Pero esto fue así hasta finales del siglo XVIII cuando fueron descubiertos los ornitorrincos,
mamíferos que viven en Oceanía que junto con los equidna, descubiertos posteriormente, son
los únicos mamíferos ovíparos porque sus crías se desarrollan dentro de huevos fuera del
cuerpo de la madre. Es decir que (a hipótesis de la viviparidad que parecía un hecho
fuertemente comprobado se vino abajo cuando apareció la primera evidencia contradictoria.
En otras palabras la hipótesis alternativa implícita que era que no todos los mamíferos eran
vivíparos, quedó definitivamente comprobada al negarse la hipótesis nula. Esto demuestra lo
conveniente de probar un hecho no por el aporte directo de evidencias sino por el rechazo de
un hecho opuesto.
Volviendo al ejemplo del colesterol, si se refuta Ho: p. = 30, es porque los datos obtenidos en
la muestra fueron concluyentes, por lo cual la hipótesis alternativa Hj: ^ > 30 recibe un apoyo
muy fuerte. Por el contrario si no se rechaza Ho las implicaciones de este hecho no son
concluyentes. El no rechazo no significa que necesariamente p. = 30, porque se hubiese
llegado a la misma conclusión con cualquier otro valor de p. menor a 30, lo cual deja muchas
dudas con relación al verdadero valor de |a. También el no rechazo de Ho solo indica que la
proposición es aceptada temporalmente dado que puede ser revertida con un nuevo conjunto
de datos. El ejemplo que sigue puede aclarar la temporalidad de una “aceptación” de H q.
Samuel Segnini Fundamentos de Bioestadística Capitulo 6 115

La formulación de hipótesis no siempre es una tarea fácil debido a que no todas las
situaciones son tan obvias como las planteadas en los ejemplos anteriores. Como no existen
normas ni procedimientos que se puedan aplicar para plantear correctamente las hipótesis
estadísticas, el investigador debe apelar a la experiencia y a su conocimiento del sistema bajo
estudio. Muchas veces, se plantean las hipótesis con base a los resultados obtenidos en una
muestra. Pero esto no es correcto, porque de hacerlo, se estaría usando la información que
proporciona la muestra con el doble propósito de formular y docimar las hipótesis. Esta
manera de proceder puede llevar a cometer errores graves. Ilustremos esta situación con el
caso del Ejemplo 6.4. Como vimos se planteó una hipótesis alternativa de diferencia, lo cual
conduce a una prueba de hipótesis de dos colas. Supóngase que la hipótesis nula = 7.0) es
cierta. Si la formulación de hipótesis se hubiese hecho después de obtener los datos de una
muestra, en lugar de plantearse una hipótesis alternativa de dos colas, necesariamente se
hubiese tenido que plantear una*hipótesis de. una sola cola, hacia la derecha o la izquierda,
porque difícilmente una muestra hubiese dado un valor promedio igual a 7.0. Las
consecuencias de este proceder es que aumenta la posibilidad de rechazar la hipótesis nula
cuando de hecho es verdadera. Esto quedará más claro cuando se traten los problemas que se
derivan de la toma de decisiones estadísticas.

Especificación del nivel de significación. Cualquier decisión dentro del proceso de prueba de
hipótesis lleva asociado cierto riesgo de fallar. Es decir que siempre existe la posibilidad de
tomar una decisión equivocada, sólo que en este tipo de prueba se tiene la ventaja de conocer
de antemano la probabilidad de equivocarse. En la Tabla 6.1 se muestran las posibles
consecuencias de tom ar una decisión con relación a la hipótesis nula.

T ab la 6.1. Situaciones derivadas de una decisión estadística

DECISION
CONDICION REAL Rechazar Ho No Rechazar Ho
Ho cierta W flÊ Ê Ê ^ Acierto

Ho falsa
A c ie r i0
I

El razonamiento básico del proceso de


pfueba de hipótesis supone que si el
planteamiento de la hipótesis nula es cierto,
por ejemplo que Ho = 0,.la mayoría de las
muestras proporcionaran valores del
estadístico muestral 0 muy próximos a
0, y por lo tanto caerán dentro de la zona
de aceptación (Figura 6.5).
Figura 6.5
Samuel Segnini Fundamentos de Bioestadística Capitulo 6 114

Suponga que alguien -afirma que todos-losr granos de frijol que hay en un saco son de color
verde. Para probarlo toma un puñado de granos y observa su color. Si todos los frijoles de^l
puñado son verdes, no significa que probó su premisa, solamente le dio apoyo. Puede repetir el
ensayo muchas veces con el mismo resultado, pero mientras existan granos de frijol en el saco
su hipótesis no esta probada, porque si en alguno de los ensayos encuentra un solo grano de
otro color, la hipótesis nula queda definitivamente negada y por el contrario la hipótesis
alternativa implícita de que no todos los granos de frijol del saco son verdes queda plenamente
confirmada.
Como vimos existen tres formas distintas de planteamiento para la hipótesis alternativa. La
selección de una de ellas depende de la naturaleza del problema que se quiere dociman
Algunos ejemplos pueden ayudar a entender la lógica para seleccionar una hipótesis
alternativa.

Ejem plo‘6.2. Un biólogo sospecha que debido a la escasez de alimento que hay en un río, la
talla promedio de las truchas adultas que viven en el mismo no alcanza el tamaño mínimo de
pesca permitido que es de 25 cm. Si se comprueba la sospecha del investigador se prohibirá la
pesca de truchas en ese río. de lo contrario no se tomará ninguna medida.

Puesto que el planteamiento que quiere probar el biólogo es que la talla promedio de las
truchas es menor al valor mínimo permitido, las hipótesis a probar deben ser las siguientes:

H0 : |a = 25
H ,: fj. < 25

Ejemplo 6.3. Se quiere saber si una nueva droga es eficaz como tratamiento del SIDA. Para
lo cual a un grupo de paciente se le aplica un tratamiento con la droga.

La eficacia de la droga implica que la mayoría de los pacientes, es decir que más de la mitad
de los pacientes a los cuales se les aplicó el tratamiento con la droga, respondieron
positivamente a la enfermedad. Si se considera que n es la proporción de la población de
pacientes para los cuales la droga es eficaz, las hipótesis que se deben someter a prueba serán j
las siguientes:
Hu : n = 0.5 i
H,: n > 0.5 1

Ejemplo 6.4. Un especialista en nutrición sospecha que el contenido de proteína total en la


sangre de pacientes que están sometidos a cierto régimen de alimentación no es el mismo que
el registrado en otro grupo de pacientes sometidos a otro tratamiento, para el cual se sabe que
el contenido de proteína total tiene un valor promedio igual a 7.0 unidades.

El especialista sospecha que el contenido de proteína total no es el mismo en los dos grupos de
pacientes, lo cual implica que el valor de esta variable para el grupo problema puede ser
mayor, menor o igual al grupo de referencia, por lo tanto las hipótesis a probar deben ser las
siguientes:
H0 : (J. = 7.0 Hr. p. ^ 7.0
Samuel Segnini Fundamentos de Bioestadistìca Capitulo 6 116

Pero también una minoría de observaciones '


puede no caer en la zona de aceptación a pesar
que Ho sea cierta, provocando que se tome una
decisión errada, aunque se tiene a favor que
se conoce la magnitud de ese error. Por
ejemplo cuando se define una zona de
aceptación donde se espera caigan el 95% de
las observaciones si Ho es cierta, también se
está determinando que en un 5% de los casos
se puede cometer una equivocación al
rechazar Ho cuando de hecho es cierta. Es
decir que la probabilidad de cometer una falla
es igual a 0.05. Este tipo de error se llama
b)
Error Tipo 1 (Tabla 6.1) y su probabilidad se
identifica con la letra a (Figura 6.6a).
También se puede cometer un error si se
acepta H 0 cuando de hecho es falsa. Esto
sucede cuando una observación cae dentro de
la zona de aceptación de Ho, siendo otra
hipótesis H[ la verdadera (Figura 6.6b). En
este caso la observación muestra! 0 queda
dentro de la zona de aceptación de Ho, pero
siendo verdadera H |. Este tipo de error se Figura 6.6
conoce como Error Tipo 11 (Tabla 6.1) y su
probabilidad se identifica con la letra
p (Figura 6.6b)

En términos de probabilidad los dos tipos de errores se expresan de la forma siguiente:

P{Error Tipo 1} = P{0 eZ o n a rechazo / Ho cierta} = a


P{Error Tipo 11} = P{ 0 eZ o n a aceptación / H| cierta} = p

Como se puede notar tanto a como p son probabilidades condicionadas. Los valores de ambos
errores no pueden calcularse en un sentido absoluto. Para calcular a es necesario asumir que
Ho es cierta y para calcular p se asume que H| es cierta.

En cualquier prueba de hipótesis lo más conveniente será que ambos tipos de errores sean lo
más pequeño posible, pero esto no es fácil de lograr, porque al intentar disminuir uno el otro
aumenta proporcionalmente (Figura 6.7).

\ Aumenta a / : \ Aumenta 0 /
\ ^ Disminuye 0 / jé \ Disminuye a ^ /

ík . ^PílÍlÍh

Figura 6.7
Samuel Segnini Fundamentos de Bioestadística Capitulo 6 117

Afortunadamente al incrementar el tamaño n de la muestra es posible disminuir la


probabilidad de com eter el Error Tipo 11, manteniendo constante la probabilidad de cometer el
Error Tipo 1. En la Figura 6.8 se muestra como al aumentar el tamaño de la muestra se reduce
la varianza de las distribuciones e igualmente el valor de P, mientras que el valor de a se
mantiene en 0.05.

De acuerdo a lo visto hasta ahora, sería lógico concluir que es necesario conocer la magnitud
con la cual ambos errores operan en una prueba de hipótesis. Lamentablemente, esto sólo es
posible para el Error Tipo 1. Debido a la naturaleza del procedimiento, al formular una
hipótesis nula no sólo se supone el valor de un parámetro, sino que se presume la ubicación de
la distribución de probabilidades del estadístico de prueba. La consecuencia de esto es que
puede fijarse un valor de a y establecerse la respectiva región de rechazo de Ho. Esto no es
posible para el caso del Error Tipo II. Aun cuando se rehace Ho se desconoce el valor de la
hipótesis alternativa y por lo tanto la ubicación de la distribución probabilística del estadístico
de prueba, no pudiéndose fijar el valor de p.
Por tales razones en toda prueba de hipótesis una vez que se han formulado la hipótesis se fija
el valor de a con el cual se cuantiflca el riesgo que se esta dispuesto a correr al rechazar una
hipótesis nula cierta. El valor de a se conoce como nivel de significación, término con el cual
se quiere destacar que cualquier estadístico cuya probabilidad de ocurrencia sea igual o menor
al valor de a , mantiene una diferencia tan grande con el valor del parámetro supuesto que se
puede concluir que no pertenece a la distribución con la cual se está trabajando y por lo tanto
asegurar que H() es falsa y otra hipótesis es la verdadera.
Comúnmente los niveles de significación a usados son 0.05, 0.01 y 0.001. El grado de
importancia de la significación se califica de distintas formas dependiendo de donde se ubique
el valor de probabilidad del estadístico.

• Si 0.05 > P( 9 ) > 0.01 se dice que la prueba de hipótesis es significativa (*).
• Si 0.01 > P (0 ) > 0.001 se dice que la prueba de hipótesis es muy significativa (**).
• Si 0.001 > P ( é ) se dice que la prueba de hipótesis es altamente significativa (***).

El número de asteriscos es una forma de indicar en un texto o en una tabla de resultados el


grado de significación de los estadísticos de prueba. Tomemos como ejemplo los resultados
que se presenta en la tabla siguiente:
Samuel Segnini Fundamentos de Bioestadística Capitulo 6

I
Tabla 6.2. Densidad promedio de cuatro géneros de
Ephemeroptera (lnsecta) en dos ríos de montaña.

Género Río A Río B


***
Baetis 64.6 107.1
**
Thraulodes 22.7 38.5
Leptohyphes 40.7 57.9
Baetodes 256.8 259.4ns
* = d i f e r e n c i a s s ig n i f ic a ti v a s ( P < 0 .0 5 ) .
* * = d i f e r e n c i a s m u y s ig n i f ic a ti v a s ( P < 0 .0 1 ) .
* * * = d i f e r e n c i a s a lt a m e n t e s ig n i f ic a ti v a s ( P < 0 . 0 0 1).
n s = d i f e r e n c i a s n o s ig n i f ic a ti v a s ( P > 0 .0 5 ) .

También dentro de los textos científicos se suele presentar el resultado de una prueba
estadística indicando el nivel de significación a o el rango de probabilidad dentro del cual se
ubica el estadístico de prueba, Ejemplo: "... la densidad de insectos no mostró relación con
los valores acumulados de precipitación (rs = 0.14; p < 0.05)... ".

Selección del estadístico de pru eb a. Para poder someter a prueba las hipótesis formuladas, es
necesario usar alguna propiedad o estadístico de las muestras que esté relacionado con el
parámetro objeto de la inferencia. Estas propiedades muéstrales reciben el nombre genérico de
estadísticos de prueba. En la Tabla 6.3 se muestran algunos parámetros y sus estadísticos de
prueba correspondiente.

Tabla 6.3. Parámetros y estadísticos de prueba más comunes

P a rá m e tro _______________________E stadístico de p rueba


M edia ( jj.) X
i

Diferencia de Medias (n 2-|^i) * 2 -7 ,

Varianza ( a 2) s2

Proporción (n) p

Coeficiente de correlación (p) r

Sin embargo, por razopes prácticas, muchas veces los estadísticos de prueba no se usan en su
forma original sino con otras formas equivalentes o derivadas (Tabla 6.4)
Samuel Segnini Fundamentos de Bioestadistíca Capitulo 6 119

Tabla 6.4. Estadísticos de prueba para algunos parámetros poblacionales.

Parámetro Estadístico de prueba Estadísticos de prueba derivados

z = (x-ft)/((r/y[ñ)
M edia (|a) X
z = (x-/l)/(s/y[ñ)
t = {x-¿l)/(s/y[ñ)
»
Z = (x2 - x , ) - ( j U 2 - f i x) l +
/ \ n2 «1

Diferencia de medias Z =(x2- i 1) - ^ - / i , ) / J ^ 4


x2 - x , / ]¡n2 «,

T = (x2 - x l) - { ^ 2 -Mi) } — + —
/ \«2 n \

Varianza a2 x 1 = (w-l)J2/ °,o

Razón de varianzas 2/2


a 2/CTl
F = {s\a\')¡{s\cr})

La utilidad de estos y otros estadísticos de prueba se verá cuando se traten particularmente las
pruebas de hipótesis para algunos parámetros.

Establecer una zona de aceptación para Ho. Una vez conocido el estadístico de prueba a
utilizar, así como su distribución, es necesario definir en la distribución del estadístico
muestral una zona de aceptación y una zona de rechazo de la hipótesis nula. La zona de
aceptación de Ho está formada por todos los valores del estadístico de prueba con una
probabilidad de ocurrencia mayor al establecido en el nivel de significación.. Por el contrario
la zona de rechazo está formada por todos los valores del estadístico de prueba cuya
probabilidad de ocurrencia es igual o menor al valor establecido en el nivel de significación.
La zona de rechazo a diferencia de la zona de aceptación y dependiendo de la hipótesis
alternativa planteada puede estar orientada en diferentes direcciones a lo largo del eje de
valores de la variable aleatoria.

Zona de rechazo a la derecha: esta formada por todos los valores del estadístico de prueba
0 ubicados a la derecha del parámetro 0 cuya probabilidad de ocurrencia es menor a la del
nivel de significación. Esta zona se especifica cuando Hi: 0 > 0o y la docimasia se llama
prueba de una cola a la derecha (Figura 6.9A)

También podría gustarte