Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com
Conferencia internacional de 2018 sobre técnicas computacionales y de caracterización en ingeniería y ciencias (CCTES) Universidad
Integral, Lucknow, India, 14 y 15 de septiembre de 2018
y visualización
Uttar Pradesh, Lucknow, India Uttar Pradesh, Lucknow, India Uttar Pradesh, Lucknow, India
funcionarioshubh@outlook.com ndhanda@lko.amity.edu prncpnd94@gmail.com
Abstracto—En este artículo, iluminamos la investigación en el campo de El análisis de datos oscuros y tácticos es confuso. El título del trabajo
experiencia en análisis estadístico, es decir, la ciencia de datos, todo un mundo se ha vuelto muy conocido. En uno de los sitios de empleo más
tecnológico en sí mismo que hoy en día se ha convertido en una palabra de moda utilizados, el número de ofertas de trabajo inclinadas a "científicos de
entre los geeks. Otorgamos la extracción de conjuntos de datos, el modelado y la datos" fue de más del 100 por ciento entre enero de 2010 y julio de
visualización del marcado de big data con la biblioteca de código abierto fácil de 2012. La existencia de científicos de datos ayuda a las empresas a
usar del lenguaje Python experimentando la hoja de datos en tiempo real
tomar decisiones comerciales más sólidas e inteligentes.
enfocándonos en el trabajo de profecía y los tecnicismos que son necesariamente
necesarios para la organización. del mundo de hoypara el alimento de futuras
decisiones y estrategias comerciales. Elaborar las palabras clave proporcionadas, Los datos de Amazon Prime y Netflix extraen patrones de
desde su instalación en caso de ser necesario hasta su importación y su interés de películas para analizar qué tarjetas de películas le
aplicabilidad. Como la ciencia de datos es el quid de la metodología estadística y interesan a un usuario y luego utilizan toda la información para
de análisis de big data, tiene un papel importante en el campo de los datos, predecir y generar las listas de películas.
donde la información de Internet ha tenido una inclinación repentina en los
últimos cuatro años hasta muestras de zettabytes y petabytes, donde se necesita Se dirige a las características, es decir, cuál es el rango
cada vez más investigación para hacer que el mundo se destaque paralelamente principal de clientes dentro de su base y los intereses de
en el campo de mucha información. compra únicos dentro del rango de ese grupo. Esto les
ayuda a guiar el mensaje a diferentes grupos de audiencias
del mercado.
Palabras clave: ciencia de datos, Pandas, seaborn, Numpy, minería de
datos, visualización de datos, modelado de hojas de datos, educación. Gamble and Proctor utiliza modelos de series de tiempo para obtener
estadísticas de necesidades futuras de manera más lúcida e
inteligible, lo que ayuda a planificar niveles de producción óptimos.
yo yoNTRODUCCIÓN
Amazon y Flipkart utilizan motores de recomendación para
La moda del término "Ciencia de datos" ha bombardeado el ámbito detectar los productos, de modo que puedan poner el
técnico, académico y empresarial, como lo indica el aumento en las producto permanezca en la visión del usuario, utilizando
vacantes. Sin embargo, muchos académicos y periodistas críticos no ven algoritmos. Spotify utiliza algoritmos para recomendar
distinciones entre la ciencia de datos y la implementación de estadísticas. canciones al usuario.
Manejando datos estructurados y no estructurados, la ciencia de datos es
El filtro de spam de Gmail funciona con el algoritmo para los
un campo que abarca todo lo relacionado con la limpieza, preparación y
correos basura y coloca en consecuencia el spam, los correos
análisis de datos. Los datos están en todas partes y aumentan a un ritmo
basura y los no basura en carpetas distintas.
infinito. De hecho, la cantidad de datos digitales que existen está
creciendo a un ritmo rápido; de hecho, existen más de 2,7 zettabytes de Los vehículos autónomos utilizan visión por computadora, que también es
datos enuniverso digital de hoy, y que se proyecta que florecer a 180 un producto de datos: el código de aprendizaje automático le permite aprender
zettabytesen 2025. Por eso más organizaciones del nuevo mundo buscan y alertar según los peatones, los semáforos y los automóviles en la carretera,
trabajadores profesionales quién puede dar sentido a todos los datos. es etc., para evitar accidentes. Estos son los requisitos para los científicos de datos
el futuro de desarrollo y presente para el desarrollo sostenible. Para la industriales profesionales.
sostenibilidad y la opulencia del campo de la ciencia de datos, Donoho
proyecta un dominio cada vez mayor para la ciencia abierta donde los A. Experiencia matemática
conjuntos de información cósmica utilizados para publicaciones
Extraer datos y analizarlos estáticamente es el principal
académicas sean accesibles para todos los investigadores académicos e
desafío para los científicos de datos para ver los datos a través
industriales. El Instituto Nacional de Salud de EE.UU. ya ha publicado
de un óculo lógico y cuantitativo. Hay varios atributos de los
planes para ampliar la reproducibilidad y la claridad de los datos de la
datos, como su delicadeza, dimensión y correlación, en los datos
investigación. La ciencia de datos tiene una conformidad que incorpora
que se pueden expresar gráficamente con algunas aplicaciones
grados distintivos de información, método científico, estadística,
matemáticas. Encontrar la panacea analizando los datos,
informática avanzada, visualización, mentalidad de hacker y experiencia
dándoles sentido y prediciendo la próxima audiencia objetivo y la
en el dominio. Una persona con experiencia profesional en el campo de la
estrategia es una técnica desconcertante. La principal solución
ciencia de datos se llama científico de datos. Los científicos de datos
para los problemas relacionados con el negocio involucra
resuelven
técnicas basadas en matemáticas duras, donde poder ver y
2
capacidades de números aleatorios, herramientas para integrar Hoja_de_datos.Nacionalidad.valor_cuentas()
código C/C++ y FORTRAN. NumPy también se puede utilizar como un
> > a = Top10país.cabeza(10)
contenedor multidimensional eficaz y eficiente de datos genéricos. Se
pueden definir tipos de datos arbitrarios. Esto permite que NumPy se > > a.plot(tipo = 'pastel', leyenda = Verdadero, tamaño de figura =
integre rápida y fácilmente con una amplia variedad de bases de (7,7), sombra = Verdadero, explotar = [0,0.7,0,0,0.3,0,0,0,0,0 ])
datos.
> > matplotlib.pyplot.show() Y la
NumPy tiene la licencia BSD, lo que permite la reutilización con
pocas restricciones. Numpy proporciona funciones beneficiosas para
salida se muestra en la Fig. 2.
los juegos numéricos de alteración y visualización de la información
del conjunto de datos.
3
Una representación gráfica más de los partidos disputados por los
equipos yd 'ganar por carreras' y el total de partidos puede ser
representado de la siguiente manera en la Fig. 5 -
Figura 5. GRAMOrepresentación gráfica de los partidos jugados por los equipos y 'ganancias
Fig. 3. Representación gráfica de la proporcionalidad de la 'Edad' y el 'Potencial
por carreras' y partidos totales
general' del jugador
VI. CONCLUSIÓN
C. Total de partidos de FIFA jugados por un país desde que se utilizó el
gráfico de conteo de Seaborn.
Estos son solo una muestra de lo que puede hacer un campo de la
ciencia de datos, está más allá de nuestra imaginación, en el que los
A partir del año de ignición, el número total de coincidencias se
científicos y expertos en datos están trabajando y se están llevando a cabo
traza con la ayuda de la biblioteca Python Seaborn titulada,
más investigaciones que definitivamente ayudarán mucho al mundo en
'Nacionalidad' como etiqueta X- y 'contar' como Y-La etiqueta se
celeridad. Todos los datos cósmicos almacenados se pueden utilizar para
puede visualizar mediante el código.
el estudio general y para planificar el desarrollo y las estrategias para
> > matplotlib.pyplot.figure(tamaño de figura = (40, 30)) fines futuros. Este mundo lleno de datos es realmente enorme, el Lo que
> > seaborn.countplot(x = 'Nacionalidad', datos = importa es cómo lo abordamos y diseñamos estrategias, eso es Por qué la
[3] https://www.simplilearn.com/data-science-vs-big-data-vs-
dataanalytics-article.
[4] Baker, Ryan SJD y Kalina Yacef. "El estado de la minería de datos educativos
en 2009: una revisión y visiones de futuro". JEDM| Revista de minería de
datos educativos 1.1 (2009).
[5] https://en.wikipedia.org/wiki/Data_scienceI.S. Jacobs y CP Bean, “Partículas
finas, películas delgadas y anisotropía de intercambio”, en Magnetismo,
vol. III, GT Rado y H. Suhl, Eds. Nueva York: Academic, 1963, págs.
271-350.
[6] https://datajobs.com/what-is-data-science
[7] https://pandas.pydata.org/
Fig. 4. Partidos de FIFA jugados por un país desde que se utilizó el diagrama de conteo de
[8] http://www.numpy.org/
Seaborn
[9] https://seaborn.pydata.org/
Este gráfico proporciona los datos en serie comenzando desde la parte [10] https://en.wikipedia.org/wiki/Data_science
superior, es decir, la primera fila, y avanzando hacia la parte inferior. El número [11] https://docs.python.org/3/tutorial/