Está en la página 1de 7

Investigación sobre la aplicación del algoritmo de reglas de asociación en la información logística de la

enseñanza del inglés

Recibido: 20 de enero de 2018 / Revisado: 3 de febrero de 2018 / Aceptado: 7 de febrero de 2018


Springer Science + Business Media, LLC, parte de Springer Nature 2018

Resumen
Hoy en día, la aplicación común y el desarrollo de la tecnología informática hace que la tecnología de minería
de datos juegue un papel extremadamente crucial en la educación del inglés de los estudiantes. En este
trabajo, el aprendizaje de inglés de los estudiantes se toma como punto de entrada y se analiza la tecnología
educativa de los estudiantes de inglés en la formación de minería de datos basada en el algoritmo Apriori. Este
artículo analiza las reglas que pueden despertar nuestro interés al introducir el método independiente de
interés de medida de elevación. Para mejorar la eficiencia del algoritmo Apriori clásico y mejorar la eficiencia
del algoritmo Apriori que extrae conjuntos de elementos frecuentes teniendo en cuenta las características de
exclusividad contenidas en los datos de minería, el algoritmo AD-a priori optimizado puede realizar la
complejidad del proceso de minería en tiempo y espacio.

Palabras clave: Algoritmo a priori, Capacidad técnica, Minería de datos

1. Introducción apropiados y traer las sugerencias


correspondientes para la toma de decisiones.
El método de minería de datos puede adquirir
mucha información interesante Estado del arte
existente en los datos y las reglas de asociación Debido a los atributos de la herramienta de
pueden adquirir la información y el conocimiento minería de datos, es más eficiente
asociados potenciales. El sistema de minería de obtener información que pueda satisfacer la
datos de aprendizaje de inglés, que puede demanda entre numerosos datos (Guo et al.,
obtenerse del impacto del aprendizaje de los 2017). Desde la década de 1980, la minería de
estudiantes, los factores de inglés proporcionan datos se ha seguido desarrollando. Hoy en día, la
evidencia efectiva para explorar y promover el tecnología de minería de datos se ha convertido
aprendizaje de inglés de los estudiantes (Wang gradualmente en el foco de investigación en
et al., 2015). Es como la posibilidad de concluir que campos relacionados. Específicamente, la minería
existe una gran relación entre la información del de datos consiste en extraer información
estilo de vida de los estudiantes y el nivel de desconocida en una gran base de datos y obtener
aprendizaje del inglés, lo cual puede servir de la decisión comercial de Nakamura utilizando esta
referencia para la toma de decisiones mediante la parte de la información. Schoeman y Johan H
asociación entre conjuntos de ítems (Wu & Sakai, proponen la aplicación de herramientas de minería
2015). Para el modelo de regla de asociación de datos en el campo del inglés (Cios et al., 2007).
tradicional, la influencia de que el valor En la Asociación Nacional de Baloncesto, los
antecedente de la regla anterior no se ha tenido entrenadores de la NBA utilizan herramientas de
en cuenta sobre la influencia del consecuente de la minería de datos diseñadas y desarrolladas por
regla, por lo que no se puede proporcionar al IBM Advanced Scout para ayudar en la preparación
usuario una sugerencia científica y racional para la de tácticas (Jia et al., 2017). En el contexto de la
toma de decisiones (Research and Application of aparición continua de tecnologías de red y una
Apriori Algorithm for Mining Association Rules, escala en constante expansión, los riesgos
s. f.). Solo en virtud del apoyo de las reglas de asociados con las intrusiones en la red y las
asociación y el grado de confianza para explorar oportunidades correspondientes también están
cómo optimizar el estilo de vida de los estudiantes aumentando (Voronina & Tretyakova, 2016). Con
para mejorar las restricciones correspondientes en aplicación de tecnología de minería de datos en
el nivel del sistema estudiantil (Sethi & Ramesh, detección de intrusiones en la red, Wang Fusheng
2017). La nueva idea es aprovechar la construyó un modelo de sistema
'transferencia estatal' concepto para optimizar el de detección de intrusiones en la red basado en la
modo de minería de reglas de asociación y minería de datos (Kimmelman, 2019). La
asegurar que los cambios de los atributos competencia cada vez más feroz de muchas
antecedentes de la regla traen consigo cambios de empresas inmobiliarias permite adoptar tecnología
la regla. Asegúrese de que las reglas de la de minería de datos para ejecutar y optimizar el
asociación puedan mostrar los cambios más sistema de "gestión de relaciones con el cliente" y
se ha convertido en el foco de atención de muchos asociación es generar reglas de asociación
desarrolladores inmobiliarios (Mao, 2017). En el (Investigation on application of association rule
área del comercio electrónico, Zhang Dongqing algorithm in English teaching logistics information
propuso patrones de minería de datos para | SpringerLink, s. f.). La generación de reglas de
analizar científica y racionalmente para ayudar a asociación a partir de un equipo de proyecto de
los trabajadores relevantes a preparar decisiones alta frecuencia genera reglas utilizando el equipo
de marketing comercial específicas bajo la de proyecto k de alta frecuencia del paso anterior.
circunstancia de aumentar la información Bajo la condición del umbral mínimo de confianza,
comercial y los datos comerciales. La tecnología de si el nivel de confianza determinado por una regla
minería de datos tiene un gran potencial de satisface el Grado mínimo de confianza, decir que
aplicación en el sistema educativo, transforma los esta regla son las reglas de asociación. Por
datos en conocimiento con el análisis de todas las ejemplo, la regla AB generada por el grupo de
partes de los datos, optimiza la educación y el elementos k de alta frecuencia {A, B} se puede
método de gestión puede mejorar obtener mediante la fórmula, y AB es la regla de
significativamente el trabajo de gestión y la calidad asociación si la confiabilidad es mayor o igual que
de la educación (Thoughts on reform in teaching la confiabilidad mínima (Investigation on
model of Russian literature of Russian major in application of association rule algorithm in English
colleges and universities in new situations-- teaching logistics information | SpringerLink, s. f.).
《 Foreign Language Learning Theory and Los datos del conjunto de elementos en las reglas
Practice》2016 年 01 期, s. f.). de asociación tradicionales son estáticos y no
cambiarán. Con la introducción del modo de
2. Metodología "transferencia de estado", los cambios de "estado"
pueden ocurrir tanto en el antecedente como en el
3.1 La introducción de la medición de interés de consecuente de las reglas de asociación. Los
medida de elevación siguientes ejemplos se utilizan para explorar cómo
introducir el concepto de transferencia de estado.
El proceso de minería de reglas de asociación El comienzo es la unión del concepto de medida de
consta principalmente de dos etapas: la primera elevación con un conjunto de datos relacionales D
etapa debe encontrar primero todo el grupo de como se muestra en la
proyectos de alta frecuencia del conjunto de Tabla 1 , asumiendo que diferentes valores de
datos, la segunda etapa y luego de estas reglas de atributo en el atributo F pueden causar diferentes
asociación generadas por el grupo de proyectos de resultados del atributo R. Entre ellos, el atributo F
alta frecuencia. La primera fase de la minería de se considera como '' razón '' y el atributo R como ''
reglas de asociación debe encontrar del conjunto resultado '', es decir, el resultado es diferente
de datos original todos los conjuntos de elementos debido a razones inconsistentes. Se entiende que
grandes(Randma & Venesaar, 2016). Alta hay tres tipos de valores para el atributo F, a, b, c
frecuencia significa que la frecuencia de ocurrencia (el atributo F solo puede seleccionar uno de los
de un grupo de proyecto en particular debe tres valores en algún momento). Hay dos tipos de
alcanzar un cierto nivel en relación con todos los atributo R, x, y (puede ser xoy en algún momento).
registros. La frecuencia de aparición de un grupo En primer lugar, extraer las reglas asociadas con la
de proyectos se denomina grado de apoyo (Li, condición x del atributo R para adquirir las reglas
2019). Tomando un conjunto de 2 elementos que 1-3. En el caso de alcanzar el umbral especificado,
contiene dos elementos A y B como ejemplo, la Regla 1 muestra que existe una fuerte
podemos obtener el grado de apoyo del grupo de correlación entre el valor del atributo a del
proyectos {A, B} a través de la fórmula. Si el grado atributo F y el valor del atributo x del atributo R. Si
de soporte es mayor o igual a Establecer el valor el atributo de valor de atributo R es x en esta base
de umbral de soporte mínimo, entonces {A, B} se de datos y se puede reducir tanto como sea
denomina grupo de proyecto de alta frecuencia. posible, ¿qué métodos tomar? Dado que solo hay
Un conjunto de k elementos que satisface el tres factores para los cuales el valor del atributo R
soporte mínimo se denomina conjunto de k es x, es decir, a, b, c del atributo F. Si se reduce la
elementos de alta frecuencia, generalmente tasa de ocurrencia de x, las conexiones cambiarán
expresado como k grande o k frecuente. El la razón de aab o de a a C.
algoritmo recrea Large k + 1 del grupo de proyecto
de Large k hasta que ya no pueda encontrar un Al comparar las reglas 1-3 anteriores, se puede
equipo de proyecto de alta frecuencia más largo. concluir que el atributo F
La segunda etapa de la minería de reglas de
es 1 del grado de elevación del atributo R a X; y el igual que el atributo '' género ''. En un registro, el
atributo F es 2/3 del grado valor de este atributo solo pertenece a hombre o
de elevación del atributo R a X. Se puede entender mujer, todos los tipos de situación de valor de
que en comparación con atributo en atributo se definen como mutuamente
el atributo es b con el atributo R es x, el grado de excluyentes; en la base de datos de transacciones,
elevación del atributo F es los elementos mutuamente excluyentes es la
c es relativamente pequeño, es decir, la apariencia transformación de elementos con el mismo
tiene el impacto más atributo. El tamaño de los conjuntos de elementos
bajo en la elevación de x. En virtud de que el valor mutuamente excluyentes pertenece al número de
del atributo F se valores de atributo de este atributo.
transforma de A a C, se reduce el porcentaje del En el mismo conjunto de elementos mutuamente
atributo R que pertenece a X excluyentes, cada elemento es un elemento
en la base de datos general. Se muestra mutuamente excluyente del otro. El tamaño del
formalmente que: conjunto mutuamente excluyente pertenece al
número de valores de atributo para este atributo.
Suponga que el conjunto de atributos de razón
específica del usuario y el conjunto de atributos de
resultado en el conjunto de datos relacionales D
es:

Después de transformar la base de datos relacional


en una base de datos transaccional, los conjuntos
de elementos construidos a partir de varios
Regla r1: factores en los conjuntos de atributos de causa se
denotan como F, y los conjuntos de elementos
construidos a partir de cada resultado de los
conjuntos de atributos de resultado se definen
como sigue. Si hay un conjunto de elementos
La regla r1 refleja que el atributo F es a y el
frecuentes L' entonces L' ⊆ F el tamaño del
atributo R es la cantidad de datos de x
contabilizando 2/8 en la cantidad total. El atributo conjunto de elementos frecuentes es ¿ L∨¿ ; para
F es a en comparación con el atributo F es c excede todos los artículosF 'i en el conjunto de elementos
2/3 del atributo R es x. La proporción de exceso en ' ' '
frecuentes, hay L ⊆ F i ahí está un artículo F q en
el atributo F es 1/2 del grado de elevación del
atributo R a X. El significado de F ( a → c ) en la el conjunto de atributos de resultado, hay F 'i ⊆ R;
regla rl es "cambiar el La regla de asociación se concluye como:
valor del atributo F de A a C". En el ejemplo
anterior, podemos ver que al
agregar un concepto de cambio bajo la premisa de
las reglas de asociación, definamos la validez de la Ecuación ( 4 ) pertenece a la regla de asociación
regla por f la variación del grado de elevación. Sup, fuerte, la grado de apoyo de la regla r ' es
Hft-medida y conf en la regla traen
¿ ⁡(r ¿¿ ')¿ y el grado de elevación es
recomendaciones exactas.
Definimos la medida de interés de la medida de lift ⁡(r ¿¿ ' )¿ Frente a cada artículo F 'i de
elevación. Para la base de datos relacional, cada conjuntos de elementos frecuentes L' ,
atributo tiene una probabilidad con múltiples Supongamos que el elemento de la base de datos
valores de atributo. Al asociar una base de datos
relacional coincide con el la razón establece los
relacional con una base de datos transaccional,
cada atributo de cada situación de valor de atributos y el valor es a i el elemento mutuamente
atributo puede corresponder a un artículo. Para un excluyente de F 'i es F ''i , el valor del atributo es a j
atributo particular, no puede tomar dos o más la regla de asociación es
valores de atributo en un momento específico, al '' '' '' '' '
r =F ∧ F ∧ ⋯ ∧ F ⇒ F el grado de apoyo
1 2 L' q
es ¿ ⁡(r ¿¿ ' ' )¿ , el grado de sustentación es minería, y se debe implementar el procesamiento
lift ⁡(r ¿¿ ' ' )¿. El objeto F i( ai →a j ) se previo correspondiente para los datos (Fig. 2 ). La
m ' limpieza de datos elimina el ruido de los datos y
representa como F i suponer F q el atributo de regula la inconsistencia de los datos. El período
resultado es Rk y el valor atributivo es d a la base necesario para implementar el análisis de datos de
de datos relacional, el elemento Rk (d → ∽ d) es alta complejidad y la minería es relativamente
m largo y la viabilidad es relativamente baja. Las
representado como F q entonces
técnicas de reducción de datos pueden
r m =Fm1 ∧ F m2 ∧⋯ ∧ F 'L' ⇒ F 'q'∗F'i Pertenece al
'

estado antes de cambiar F ''i pertenece a la estado


después de cambiar. En este caso, el grado de
apoyo ¿ ⁡(r ) y lift−measure ( r ) y grado de
confianza conf (r) de la regla r son los siguientes:

El grado de apoyo en la regla representa el alcance


de la influencia, que muestra la utilidad de la regla;
la cantidad de elevación muestra el grado de
cambio, cuanto mayor sea El grado de elevación
representa el atributo de resultado R más bajo k es
d después de transformar atributivo F yo desde
una yo a una j; el nivel de confianza muestra la
certeza del cambio.

3.2 Mejora del algoritmo de minería de conjuntos


de elementos frecuentes A priori

Análisis y discusión de resultados


comprime eficazmente los conjuntos de datos y
Los datos experimentales son proporcionados por sigue garantizando la integridad de los datos
el Instituto de Inglés de Wuhan, que cubre la originales. Después de la convencionalización del
información de la encuesta de los elementos de las conjunto de datos, el análisis no tendrá ningún
pruebas de inglés y los métodos de aprendizaje impacto en la minería y obviamente mejorará la
relacionados de estudiantes universitarios de eficiencia. Desde el principio tenemos que aplicar
varios colegios y universidades en Wuhan de 2015 compresión a los datos del proyecto de prueba de
a 2017. Antes del experimento, en vista de los aprendizaje de inglés en los datos experimentales
datos experimentales inconsistentes y la mala basados en el cuadro de mando de producción y
situación general, algunos datos deben ser fusionar esta parte del proyecto de prueba en una
tratados para que se puedan alcanzar los jerarquía institucional de los mismos atributos.
requisitos reales de la minería. Luego, realizamos Como:
el preprocesamiento de datos. Hay relativamente
Los datos de coeficiente se transforman en datos
muchos factores de evaluación para la calidad de
transaccionales y preparan la lista enlazada
los datos, incluidos los tres factores más críticos:
mutuamente excluyente y luego implementan el
precisión, integridad y consistencia Fig. 1 . Hay
procesamiento de minería frecuente de conjuntos
muchos datos erróneos e incorrectos en muchas
de elementos, y toman un derivado del llamado
bases de datos y almacenamiento de datos
método booleano para transformar los datos de la
grandes. Los datos de baja calidad darán como
relación en datos transaccionales, el proceso
resultado una mala calidad de los resultados de la
específico es como siguiente: En vista de cada la confianza mínima (min_conf) es 0.3000, el
propiedad con una serie de valores diferentes, conjunto máximo de conjuntos de elementos era
llevamos a cabo el procesamiento de datos de conjuntos de 2 elementos, los conjuntos de
cada dato. Todos los valores de cada atributo elementos frecuentes requieren que la minería
reflejan una serie de números enteros al debe incluir elementos de aprendizaje de inglés
correlacionar diferentes valores de un atributo y como '' malo '' (donde clasificamos '' aprobado '' y
un número entero, y usan este número entero '' fallado ' 'como' 'malo' ',' 'bueno' 'y' 'excelencia'
para sustituir el valor de este tipo de atributo. Si 'como' 'bueno''). Algunos de los resultados de la
hay q categorías, entonces cualquier valor original extracción de conjuntos de elementos son los
se asigna unívocamente a un número entero en el siguientes: Se generan los resultados de algunas
intervalo [0, q-1]. Luego considere esta parte del reglas y se utiliza el algoritmo AD-a priori para
número entero como un término, use el valor extraer los conjuntos de elementos frecuentes
booleano para mostrar si éste aparece Fig. 3 . para descubrir los hábitos de aprendizaje que
Usamos el caso que se muestra en la tabla a están estrechamente relacionados con el bajo
continuación para tomar prestado el proceso de rendimiento en el aprendizaje del inglés. Debido a
conversión booleano. En el caso de los datos las diferencias en los atributos, la estanqueidad
relacionales en la tabla, primero necesitamos también es diferente. La tabla muestra que la
mapear los valores de los atributos F y R en una situación de "revisión poco frecuente" tendrá un
serie de números enteros consecutivos. Los impacto más obvio en el bajo rendimiento de los
detalles se muestran en la tabla 2 . estudiantes. La regla 1 muestra que, en
condiciones de menos de 6 h de estudio, los
Luego, para cada atributo, considere el número
estudiantes tienen un porcentaje relativamente
entero correspondiente de cada valor de atributo
bajo de rendimiento académico. Por lo que se
como elemento y use el valor booleano para
recomienda asegurar de 6 a 9 h de tiempo de
representar el término (1 significa ocurrencia y 0
estudio. La regla 3 muestra que cambiar la
significa no ocurrencia). Como se muestra en la
situación de aprendizaje de poco frecuente a
tabla 3 .Según el método anterior, el resultado del
regular (es decir, asegurarse de que haya más de 3
ejemplo anterior después de la conversión
sesiones semanales, más de 30 min cada uno, y
booleana es como se muestra en la Fig. 4 . T1, T2 y
niveles intermedios de estudio) garantizarán
T3 en la Fig. 4 representan tres tipos de estados de
buenas calificaciones.
a, b y c respectivamente, y T4 y T5 representan dos
tipos de estados de x e y respectivamente. En la
misma transacción, hay como máximo uno
verdadero entre T1, T2, T3 y solo uno es verdadero
entre T4 y T5. Maneje los elementos de la tabla de
manera adecuada para que pueda generar una
base de datos de transacciones como se muestra
en la Tabla 4 .

El grado de cambio mínimo (min_sup) se establece


en 0,0050, la medida de elevación mínima (medida
de elevación mínima) es 0,0100, la

5. Conclusión

El artículo comienza a analizar y resumir


meticulosamente los conceptos relacionados de
las reglas de asociación tradicionales. Aunque las Recuperado 13 de noviembre de 2020, de
reglas de asociación tradicionales pueden adquirir
la información de correlación potencial entre los https://link.springer.com/article/10.1007/
datos, la diferencia entre los valores de todos los
tipos de atributos antecedentes de reglas no tiene s10586-018-2075-5
en cuenta el grado de influencia sobre los
Jia, K., Li, H., & Yuan, Y. (2017). Application of Data
atributos de las reglas. Por lo tanto, a partir del
análisis del '' modelo de minería '' de apoyo a las
Mining in Mobile Health System Based on
reglas de asociación tradicionales, este trabajo
optimiza y ajusta las reglas de asociación con Apriori Algorithm. Beijing Gongye Daxue
referencia al modelo de '' transferencia de estado
'' e introduce el principio de interés de medida de Xuebao/Journal of Beijing University of
elevación. para la minería. Y optimice y mejore los
defectos del algoritmo Aprirori clásico que Technology, 43, 394-401.
enfrenta características mutuamente excluyentes
en la extracción de conjuntos de elementos https://doi.org/10.11936/bjutxb2016120
frecuentes, y la baja eficiencia en la extracción de
conjuntos de elementos frecuentes en estos datos. 059

que utilizamos pertenece a la construcción de Kimmelman, V. (2019). Information Structure in


map_exctran y map_assist para mejorar la e fi
ciencia del algoritmo Apriori en la minería de Sign Languages: Evidence from Russian
conjuntos de elementos frecuentes. El algoritmo
AD-apriori después del ajuste puede reducir Sign Language and Sign Language of the
efectivamente el tiempo en el proceso de minería,
Netherlands. En Information Structure in
así como la complejidad espacial.

Referencias: Sign Languages.

Cios, K. J., Pedrycz, W., Swiniarski, R. W., & Kurgan, https://doi.org/10.1515/9781501510045

L. A. (2007). Data Mining: A Knowledge Li, M. (2019). Investigation on application of

Discovery Approach. Springer Science & association rule algorithm in English

Business Media. teaching logistics information. Cluster

Guo, Y., Wang, M., & Li, X. (2017). Application of Computing, 22(6), 13703-13709.

an improved Apriori algorithm in a mobile https://doi.org/10.1007/s10586-018-

e-commerce recommendation system. 2075-5

Industrial Management & Data Systems, Mao, Y. (2017). Russian Language Teaching in

117(2), 287-303. College under the New Situation. OALib,

https://doi.org/10.1108/IMDS-03-2016- 04, 1-7.

0094 https://doi.org/10.4236/oalib.1103471

Investigation on application of association rule Randma, T., & Venesaar, U. (2016). Does the

algorithm in English teaching logistics general education school curriculum

information | SpringerLink. (s. f.). support the development of enterprising


people? Baltic Journal of Management, Russian language as a foreign language.

11, 142-166. 11, 12983-12993.

https://doi.org/10.1108/BJM-02-2015- Wang, M., Chen, L., Huang, Y., Zhang, L., Zhang, Z.,

0029 Ding, J., & Shang, H. (2015). The

Research and Application of Apriori Algorithm for application characteristics of traditional

Mining Association Rules. (s. f.). Chinese medical science treatment on

Recuperado 13 de noviembre de 2020, de vertigo based on data mining Apriori

https://www.researchgate.net/publicatio algorithm. International Journal of

n/286801047_Research_and_Application Wireless and Mobile Computing, 9(4),

_of_Apriori_Algorithm_for_Mining_Assoc 349-354.

iation_Rules https://doi.org/10.1504/IJWMC.2015.074

Sethi, K., & Ramesh, D. (2017). HFIM: A Spark- 041

based hybrid frequent itemset mining Wu, M., & Sakai, H. (2015). On Parallelization of

algorithm for big data processing. The the NIS-apriori Algorithm for Data Mining.

Journal of Supercomputing, 73. Procedia Computer Science, 60, 623-631.

https://doi.org/10.1007/s11227-017- https://doi.org/10.1016/j.procs.2015.08.1

1963-4 98

Thoughts on reform in teaching model of Russian

literature of Russian major in colleges and

universities in new situations— 《 Foreign

Language Learning Theory and

Practice 》 2016 年 01 期 . (s. f.).

Recuperado 13 de noviembre de 2020, de

https://en.cnki.com.cn/Article_en/CJFDTo

tal-GWJX201601008.htm

Voronina, M., & Tretyakova, Z. (2016). The Mujer, Jishui, Jiangxi, Vocacional de salud de
Jiangxi Colegio, profesor asociado, Máster, área
experience of teaching of descriptive de investigación: Enseñanza de lengua inglesa.

geometry and engineering graphics in

También podría gustarte