Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tabla de contenido
INTRODUCCIÓN
2.3. Comparación de las medidas de tendencia central para datos no agrupados ..............7
5. Anexos .......................................................................................................................................35
6. Conclusiones .............................................................................................................................39
REFERENCIAS...........................................................................................................................40
Pág. 1
INTRODUCCIÓN
de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término italiano statista
(estadista). La raíz remota de la palabra se halla en el término latín status, que significa
información extraída sea extendida con facilidad, existen medidas que se pueden analizar en la
estadística, estas son: medidas de tendencia central (media, mediana y moda), medidas de
típica) aprendiendo así a interpretar las variables. También se interpretan las tablas de frecuencia
para datos agrupados y datos no agrupados con su respectivas gráficas (Urias & salvador 2014,
pág. 2).
estadística descriptiva, partiendo de datos primarios que fueron obtenidos a través de una
encuesta desarrollada en google drive sobre el conocimiento de la robótica. Por ende se pudo
profundizar los conceptos como: datos primarios, variable cuantitativa y cualitativa, datos
Pág. 2
Hombre
48% Mujer
52% Mujer
Hombre
La figura muestra que los 50 datos obtenidos en la encuesta el 52% de los estudiantes de
ingeniería electrónica son del género mujer y el restante son de hombres es decir que hay un
Pág. 3
Cuando la muestra que se ha tomado de la población que se desea analizar tiene menos de
20 elementos en dicha muestra, entonces estos datos son analizados sin necesidad de formar
medidas de dispersión para así poder presentar los resultados obtenidos de la encuesta
Santander.
De los datos obtenidos de la encuesta se extrae una muestra de n = 30 los datos que
presentando mayor cantidad de estudiantes (8) con edad de 18 años y menor cantidad de
estudiantes (2) con edad de 20 años. Se obtiene como preámbulo el concepto de probabilidad con
12
10
Número de estudiantes
0
18 19 20 21
Edad
El grafico de barras presenta una mayor aclaración de los datos presentes en la Tabla 1,
Las medidas de tendencia central son aquellas que nos permiten conocer las
características de un conjunto de datos, estas miden de diferentes formas, hacía que valor tiende
Media (Promedio): se suman todos los datos y se dividen entre el número de datos
Mediana: se deben ordenar los datos de manera ascendente y se encuentra el dato central que
muestreo y sus fórmulas admiten tratamiento algebraico. Para escribir ecuaciones de este tipo de
observaciones (con n minúscula) con una media de 𝑥̅. (x barra). Recuerde que las medidas
para el grupo que contiene a todos los elementos que estamos describiendo. La media de una
Pág. 6
población se simboliza con μ, que es la letra griega mu. El número de elementos de una
población se denota con la letra mayúscula cursiva N. Por lo general, en estadística se usan letras
del alfabeto latino para simbolizar la información de las muestras y letras griegas para referirnos
Se obtiene dividiendo la suma de todos los valores que toma la variable por el número de
observaciones:
Poblacional: μ=
∑ Xi =21,49 ≈ 21 “Parametro”
N
∑ Xi =18.85 ≈19 ¿
Muestral: −¿ n
¿ “ Estimador”
X
Teniendo en cuenta que la variable edad se está analizando como cuantitativa discreta es
necesario que se aproxime el promedio poblacional y muestra en valores enteros, así se garantiza
que los valores sean homogéneos siendo la muestra valores representativos poblacionales.
También conocida como media posicional, por ocupar el centro de los datos. Más
formalmente se puede definir como el lugar de valor central de una sucesión. Los datos deben
( n+ 1)
Me= =10,5
2
universidad francisco de paula Santander tienen la edad de 18 años o menos (hasta 13 años) y el
La moda es el valor que más se repite en el conjunto de datos. Puede haber más de un
valor correspondiente a la moda si son dos datos, se considera una distribución bimodal, si son
más de dos se considera multimodal. Esta tiene un objetivo distinto que las otras medidas ya que
es el dato que más se repite. Y si la moda es diferente a la media se puede considerar que el
Para nuestra estudio Mo=18 esta información la tomamos de la Tabla 1 siendo la mayor
de paula Santander.
Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
En una distribución con sesgo positivo, la moda se halla en el punto más alto de la
En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la
izquierda de la moda y la media está a la izquierda de la mediana. Es decir, 𝑥̅< Me < Mo.
Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser
la mejor medida de posición, debido a que está siempre entre la media y la moda. La
media.
Por lo tanto, el análisis de la variable edad de los estudiantes tiene una distribución
simétrica por ser equivalente Mo = 𝑥̅. Y podemos decir que los datos están normalmente tomados
Las medidas de localización dividen los datos en partes iguales, nos sirven para clasificar
2.4.1. Cuartiles
representa gráficamente con diagrama de caja (o bigote). Podemos calcular la posición del cuartil
mediante la ecuación:
k∗n
Qk =
4
Con 1 ≤ k ≤ 4
Para Q 1
1∗20
Q 1= =5
4
Esta medida es la posición del cuartil en los datos ordenados de la muestra, al buscarla
18 años. Esto quiere decir que el 25% de los estudiantes tienen la edad de 18 años o
Para Q 2
2∗20
Q 2= =10
4
Pág. 10
Esta medida es la posición del cuartil en los datos ordenados de la muestra, al buscarla
18 años. Esto quiere decir, que el 50% de los estudiantes tienen la edad de 18 años o
menos (hasta 13 años) y el otro 50% supera esta edad hasta los 54 años
Para Q3
3∗20
Q 3= =15
4
Esta medida es la posición del cuartil en los datos ordenados de la muestra, al buscarla nos da el
Esto quiere decir, que el 75% de los estudiantes tienen edad de 19 años o menos (hasta 13
como el dato atípico representado por 3 estudiantes de ingeniería electrónica es decir se aleja del
valor promedio. Además se observa que la mayor concentración de datos está en las edades entre
18 y 19 años.
calcular para la variable cuantitativa discreta (edad). Esta medida se calcula mediante la fórmula
k∗n
Dk =
10
Donde 1 ≤ k ≤10
Para D3
3∗n
D 3= =6
10
Esta medida es la posición del decil en los datos ordenados de la muestra, al buscarla nos da el
D3= 18 𝑎ñ𝑜𝑠. El 20% de los estudiantes tienen 18 años o menos (hasta 13 años) y el otro
Para D5
5∗n
D 5= =10
10
Esta medida es la posición del decil en los datos ordenados de la muestra, procedemos a buscarla
2.4.3. Percentiles Pk
calcular para variable cuantitativa discreta (edad). Para calcular la posición de los percentiles
k∗n
Pk =
100
Donde 1 ≤ k ≤100
Para P50
50∗n
P50= =10
100
Para P80
80∗n
P 8 0= =16
100
P80= 20 años. El 80% de los estudiantes de ingeniería electrónica tienen 20 años o menos
Las medidas de dispersión sirven como indicador de la variabilidad de los datos. Las
medidas de dispersión más utilizadas son la desviación típica y la varianza. Pueden ser calculadas
Es una medida estadística que mide la dispersión de los valores respecto a un valor central
manera:
n
S2=∑ ¿ ¿¿ ¿
i =1
Pág. 14
∑ Xi =18.85 ≈19 ¿
variable cuantitativa discreta −¿
n
¿ años.
X
relacionada con el promedio de los datos. Entre más grande sea el resultado obtenido, queriendo
decir que los datos están alejados del promedio. Entre más pequeña sea la desviación los datos
n
S= √∑
i=1
¿¿ ¿ ¿ ¿
Esto quiere decir que −s ≤ −¿sX¿ ≤ para nuestra variable edad se define como: [-1.1239 -19;
1.1239+19] = [17,87; 20,1]. El rango de dispersión se encuentra dentro de las edades mínima y
máxima, se evidencia que los datos no están dispersos sino normalmente distribuidos.
Los datos agrupados son aquellos que se han clasificado en categorías o clases tomando
como criterio su frecuencia, se hace esto con la finalidad de simplificar el manejo de grandes
Para agrupar los datos y construir una tabla de distribución de frecuencia se tomara una
Paula Santander que presentaron la encuesta, la variable que se analizara es X i =dinero (dinero
N∗Z 2a∗p∗q
n=
e2∗ ( N −1 ) +Z 2a∗p∗q
Dónde:
Insertar
Parámetro valor
N 100 tamaño de la población finita
z 2,05 Lo asigna el investigador
Asignamos la misma probabilidad de que ocurra igual a la que no
P 50,00% ocurra
Q 50,00% es igual 1-P
e 20,00% Lo asigna el investigador
n = 20 estudiantes
numero grande de valores, para esto se agrupan los valores en intervalos que tengan la misma
la clase.
Según la tabla 2, se observa que 50000 es la cantidad de dinero (dólar) dispuesta a pagar
Francisco de Paula Santander y solo 3 estudiantes alcanzaron la cantidad más alta que están
dispuestos a dar. El 15% es la probabilidad de que siete estudiantes tomados al azar de una
12 120.00%
10 100.00%
8 80.00%
6 60.00%
4 40.00%
2 20.00%
0 0.00%
1 2 3 4 5 6
Frecuencia % acumulado
La figura 6 nos presenta mayor claridad a la tabla 2 donde se evidencia que los 16
estudiantes que representa la cantidad de dinero (dólar) que están dispuestos a dar es de 100000
y la gráfica de ojiva nos permite analizar que el 85% de los estudiantes están dispuestos a dar
18
16
14
12
10
0
0-100000 100000-200000 200000-300000 300000-400000 400000-500000
Pág. 19
se encuentra en 100000. El pico más alto del polígono representa la cantidad de dinero (dólar)
que están dispuestos a dar por un robot y esta es entre 0 hasta 100000 de la muestra
Santander.
Las medidas de tendencia central son la media, mediana y moda de datos agrupados, tiene
la misma interpretación que se obtuvo de los datos no agrupados pero cambia la forma de
∑ Xi∗fi
−¿ i=1 ¿
n
X ¿
−¿115000 ¿
Al aplicarla nos da X¿ es la media aritmética del promedio del dinero (dólar) que están
n
−F i−1
M e =¿ 2
x i−1+ ∗A
fi
Remplazando se obtiene:
1 0−0
M e =o+ ∗100000=62500
16
universidad francisco de paula Santander están dispuestos a pagar 625000 de dinero por un robot.
∆1
M 0=x i−1+ ∗A
∆ 1+ ∆ 2
−15
M o=o+ ∗100000=107142
−15+1
La interpretación que se puede dar es que el dinero que están dispuestos a dar por un robot
siendo el que más se repite y está representado por 16 estudiantes de ingeniera electrónica de la
Las medidas de localización son valores que permiten dividir el conjunto de datos en
partes iguales y se usan para clasificar una observación dentro de una población o muestra. Las
medidas más usuales son los cuartiles los deciles y los percentiles.
kn
−N i−1
4
Qk =x i−1 + ∗A
ni
Santander que están dispuestos a dar 31250 de dinero por un robot, es decir están
2n
−N i−1
Cuartil 2: M =Q =x + 4 ∗A = 62500 tienen la misma interpretación
e 2 i−1
ni
dispuestos a dar por un robot igual o menor cantidad de dinero (dólar) el otro 25% están
500000.00
400000.00
300000.00
200000.00
100000.00
0.00
correspondiente a la cantidad de dinero que están dispuestos a dar por un robot correspondiente a
cuantitativa continúa x i= dinero (dólar) que están dispuestos a dar los estudiantes de ingeniera
fórmula:
Pág. 23
kn
−F i−1
10
Dk = xi−1 + ∗A
fi
Santander que están dispuestos a dar 25000 de dinero por un robot o menos cantidad, el
Santander que están dispuestos a dar esa cantidad de dinero o menos por un robot, la otro
continúa x i= dinero (dólar) que están dispuestos a dar los estudiantes de ingeniería electrónica de
kn
−F i−1
100
Pk =x i−1 + ∗A
fi
Percentil 25: P25= 31250 es la cantidad de dinero que están dispuestos a pagar el 25% de
están dispuestos a pagar por un robot, el otro 75% están dispuesto a pagar mayor cantidad
de dinero.
Pág. 24
Percentil P65= 81250 igual o menos cantidad están dispuestos a pagar por un robot es
dispuestos a pagar por un robot 81250 o menos cantidad, el otro 75% están dispuesto a
entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos.
universidad francisco de paula Santander de la cantidad de dinero que están dispuestos a dar por
Las fórmulas que vamos a utilizar para las medidas de dispersión para datos agrupados son:
S2=∑ ¿ ¿¿ ¿ 2 ∑ (X i −U)2∗f i
σ =
N
Desviación estándar muestral S
Desviación estándar poblacional σ
2 100000 122500000
200000 150000 1 35000,00 1225000000 0
3 200000 300000 250000 0 135000,00 18225000000 0
4 300000 400000 350000 0 235000,00 55225000000 0
5 400000 500000 450000 3 335000,00 1,12225E+11 3,3668E+11
20 ∑fi( x i− x́ )2 =¿ 4,055E+11
Santander.
Luego:
[-S+x́−x́ +S]
Remplazando obtenemos:
Como el intervalo no se encuentra dentro del dinero de los datos agrupados esto demuestra que
existe dispersión o sesgo. Por lo tanto los datos no están normalmente distribuidos
interpretación
Pág. 26
decir se tomó la pregunta ¿Cree usted que la tecnología que maneja la inteligencia
artificial puede empezar a dominar en algunos años a todo el planeta? del cual se obtiene
la siguiente información:
66%
Figura 9. Diagrama circular de pregunta ¿Cree usted que la tecnología que maneja la inteligencia
La figura muestra que los 50 datos obtenidos en la encuesta el 66% de los estudiantes de
ingeniería electrónica piensan que la tecnología dominara el mundo, es decir que hay un 18%
que no sabe que opinar y el otro 16% dice que la tecnología no dominara el mundo. Se concluye
que los estudiantes del programa de ingeniería electrónica de la Universidad Francisco de Paula
decir se tomó la pregunta ¿En qué crees que se convertirá la inteligencia artificial en unos
6% 16%
tecnologia poderosa
12% tecnologia destructiva
tecnologia evoluciona
38%
tecnologia constructiva
otros
28%
Figura 10. Diagrama circular de pregunta ¿En qué crees que se convertirá la inteligencia
La figura muestra que los 50 datos obtenidos en la encuesta el 38% de los estudiantes de
decir que hay un 28% que dice que la tecnología se convertirá en tecnología que evoluciona
para el bienestar de todo el mundo. Y el otro 16% dice que la tecnología poderosa, un 12% piensa
que la tecnología podrá convertirse en tecnología destructiva, el resto tiene otra opinión sobre en
lo que se convertirá la tecnología. Se concluye que los estudiantes del programa de ingeniería
decir se tomó la pregunta ¿Qué tanto sabe usted de robótica? del cual se obtiene la
siguiente información:
poco
74%
Figura 11. Diagrama circular de pregunta ¿Qué tanto sabe usted de robótica?
La figura muestra que los 50 datos obtenidos en la encuesta el 74% de los estudiantes de
ingeniería electrónica piensan que saben poco de la robótica, es decir que hay un 18% que no
sabe nada de la robótica y el otro 8% sabe mucho de robótica. Se concluye que la mayoría de
decir se tomó la pregunta ¿Cuál es su opinión general acerca de los robots? del cual se
son juguetes
2%
Figura 12. Diagrama circular de pregunta ¿Cuál es su opinión general acerca de los robots?
La figura muestra que los 50 datos obtenidos en la encuesta el 66% de los estudiantes de
ingeniería electrónica piensan que los robots son útiles, es decir que hay un 2% que piensan que
son juguetes y hay un porcentaje que piensan que los robots poder una amenaza o no tienen
opinión, ambos tienen el mismo porcentaje, es decir ambos tienen un 16%. Se concluye que la
decir se tomó la pregunta ¿Cree usted que los robots piensan por si solos? del cual se
no
88%
Figura 13. Diagrama circular de pregunta ¿Cree usted que los robots piensan por si solos?
La figura muestra que los 50 datos obtenidos en la encuesta el 88% de los estudiantes de
ingeniería electrónica piensan los robots no piensan por si solos, en cambio el otro 12% dice que
no pueden pensar por sí solos. Se concluye que la mayoría de estudiantes del programa de
ingeniería electrónica de la Universidad Francisco de Paula Santander opinan que los robos no
decir se tomó la pregunta ¿ Cree usted que la inteligencia artificial está basada en la
si no tal vez
28%
2%
70%
Figura 14. Diagrama circular de pregunta ¿Cree usted que la inteligencia artificial está basada
en la tecnología y su evolución?
La figura muestra que los 50 datos obtenidos en la encuesta el 70% de los estudiantes de
ingeniería electrónica piensan que la inteligencia está basada en tecnología y evolución, es decir
que hay un 2% que piensa eso y el otro 28% opina que tal vez si puede estar basada en
decir se tomó la pregunta ¿ De qué trata para usted la inteligencia artificial? del cual se
robots
18%
evolucion
36%
tecnologia
46%
Figura 15. Diagrama circular de pregunta ¿De qué trata para usted la inteligencia artificial?
La figura muestra que los 50 datos obtenidos en la encuesta el 46% de los estudiantes de
ingeniería electrónica opinan que la inteligencia artificial es tecnología, es decir que hay un 36%
que la inteligencia artificial es evolución y el otro 18% opina que la inteligencia artificial son
no
8%
si
92%
Figura 16. Diagrama circular de pregunta ¿Estaría usted interesado en saber sobre el
funcionamiento de un robot?
La figura muestra que los 92% datos obtenidos en la encuesta el 88% de los estudiantes
decir se tomó la pregunta ¿Cómo cree usted que razona un robot? Del cual se obtiene la
siguiente información:
Pág. 34
73%
Figura 17. Diagrama circular de pregunta ¿Cómo cree usted que razona un robot?
La figura muestra que los 50 datos obtenidos en la encuesta el 73% de los estudiantes de
ingeniería electrónica opinan que un robot razona por medio de circuitos, es decir que hay un
25% que opina que los robots tienen cerebro y el otro 2% opina que los robots responden a
Universidad Francisco de Paula Santander opinan que los robots razonan por medio de circuitos.
decir se tomó la pregunta ¿cree usted que un cerebro artificial puede superar al humano?
54%
Figura 18. Diagrama circular de pregunta ¿cree usted que un cerebro artificial puede superar al
humano?
La figura muestra que los 50 datos obtenidos en la encuesta el 54% de los estudiantes de
ingeniería electrónica opinan que un cerebro artificial puede similar al de un humano, es decir
que hay un 30% que opina que los cerebros artificiales si puede superar al humano y el otro 16%
opina que no puede superar al cerebro humano. Se concluye que la mayoría de estudiantes del
5. Anexo
robots).
Edad: ___________________________________________________________________
Genero
o Mujer
o Hombre
¿Cree usted que la tecnología que maneja la inteligencia artificial puede empezar a dominar en
o Si
o No
o No sabe
o Otro : ______________________________________
o Mucho
o Poco
o Nada
o Los robots pueden ser muy útiles/ elevan la calidad de vida/ Disminuyen trabajos.
o Si
o No
Pág. 38
o Si
o No
o Tal vez
o Robots
o Tecnología
o Evolución
o Si
o No
o Respondiendo a estímulos.
Según los descubrimientos más recientes ¿cree usted que un cerebro artificial puede superar al
humano?
o Por supuesto.
o No se puede.
6. Conclusiones
Las estadísticas según la asociación americana de estadística (asa) sigla en inglés “es la ciencia de
aprender a medir, trabajar, controlar y comunicar la incertidumbre (wild, utts et al, 2018)
lo anterior la estadística ha tenido gran desarrollo en la aplicación, puede analizarse con ella lo
estudia las funciones decisorias estadísticas, fenómenos conjuntos para revelar los fundamentos
de su desarrollo y para tal estudio se sirve de índices generalizadores (valores, medios, relaciones,
porcentajes, etc.). Es decir la estadística difiere procesos matemáticos, que a su vez son utilizados
universidad francisco de paula Santander. De esta se pudo analizar con la toma de muestras de
robótica. De la primera variable cualitativa (genero) se tomó una muestra de 50 datos para
analizar el género de los estudiantes de ingeniería electrónica dando mayor porcentaje el género
mujer. Después se proceden analizar otras preguntas en la cual se desea visualizar los
Pág. 41
pensamientos los estudiantes, todo para indagar conocimiento previo sobre robótica e inteligencia
artificial.
Para la variable cuantitativa discreta se tomó la edad, en la que procede a realizar un proceso
conceptual para datos no agrupados, se analizar una muestra de 20 datos en la cual muestra que
En la variable cuantitativa continua se toma el dinero dispuesto a pagar por un robot, en la cual se
procede a realizar un proceso conceptual para datos agrupados, todo esto evidencia que existe
dispersión o sesgo, por lo que quiere decir que los datos no están normalmente distribuidos.
Referencias
Urías et al. (2014) Estadística para ingeniería y ciencias. México: grupo editorial patria.