365
| C | V. XXVII | N. 34 | - | 2022 | | ISSN (): - | ISSN ( ): - |
Revisión de la implementación del machine learning
en la seguridad de la información
resumen
La presente revisión tiene como objetivo dar a conocer cómo
se está implementando el machine learning en la seguridad
de la información. Por tal motivo se optó por la metodología
PRISMA para identicar artículos en diferentes bases de
datos en los últimos cinco años. Se utilizó las siguientes bases
de datos: Scopus, Science Direct, Research Gate y Google
Académico. Posteriormente, se aplicaron los criterios de
inclusión y exclusión, dando un resultado de 16 artículos
donde se implementa el machine learning en la seguridad de
la información para dar respuesta a las preguntas planteadas.
De esta manera, las diversas técnicas y/o algoritmos del
machine learning aplicados en la seguridad de la información
es una necesidad de las organizaciones en la actualidad para la
protección de la información, siendo unos de los algoritmos
más usados las redes neuronales articiales y el área donde
mayormente se implementa el machine learning para la
seguridad de la información es internet de las cosas.
Palabras clave: Aprendizaje Automático; Seguridad de la
Información; Aprendizaje Profundo; Inteligencia Articial
absTracT
is review aims to make known how machine learning is
being implemented in information security. For this reason,
the PRISMA methodology was chosen to identify articles in
dierent databases in the last 5 years. e following databases
were obtained: Scopus, Science Direct, Research Gate and
Google Scholar. Subsequently, the inclusion and exclusion
criteria will be applied, giving a result of 16 articles where
machine learning is implemented in information security
to answer the questions raised. In conclusion, the various
techniques and/or algorithms of machine learning applied in
information security is a need for organizations today for the
protection of information, one of the most used algorithms
being articial neural networks. and the area where machine
learning is most widely deployed for information security is
the internet of things.
Keywords: Machine Learning; Security of the information;
Deep Learning; Articial intelligence
C A
C P
A M
1 Escuela de Ingeniería de Sistemas, Universidad
Nacional de Trujillo, Trujillo, Perú
2 Escuela de Ingeniería de Sistemas, Universidad
Nacional de Trujillo, Trujillo, Perú
3 Escuela de Ingeniería de Sistemas, Universidad
Nacional de Trujillo, Trujillo, Perú
Autor de correspondencia:
cfalvarado@unitru.edu.pe
Review of the implementation of machine learning in information
security
Recibido: noviembre 23 de 2022 | Revisado: noviembre 26 de 2022 | Aceptado: noviembre 29 de 2022
| C | V. XX IV | N. 28 | PP. - | - |  || C | V. XX IV | N. 28 | PP. - | - |  |
© Los autores. Este artículo es publicado por la Revista Campus de la Facultad de Ingeniería y Arquitectura de la Universidad
de San Martín de Porres. Este artículo se distribuye en los términos de la Licencia Creative Commons Atribución No-comercial
– Compartir-Igual 4.0 Internacional (https://creativecommons.org/licenses/ CC-BY), que permite el uso no comercial,
distribución y reproducción en cualquier medio siempre que la obra original sea debidamente citada. Para uso comercial
contactar a: revistacampus@usmp.pe.
https://doi.org/10.24265/campus.2022.v27n34.13
| C | V. XX VII | N. 34 | PP. - | - |  |
366
| C | V. XXVII | N. 34 | - | 2022 | | ISSN (): - | ISSN ( ): - |
Introducción
Actualmente, la mayoría de la población
conoce las tecnologías de la información,
dado que fueron involucradas en mayor
porcentaje durante y después de la
pandemia que azotó al mundo. Es un
hecho que la tecnología nos ayuda a ser
más productivos y nos permite acceder
a una gran cantidad y volúmenes de
información con tan solo un clic, pero a
la vez esto conlleva a una gran cantidad
de problemas de seguridad porque no
sabemos si en cualquier momento nuestra
información puede ser expuesta por
ciberdelincuentes. (Vega Briceño, 2021)
La sociedad actual se encuentra en
el proceso de desarrollar un sentido de
responsabilidad y seguridad corporativas,
lo cual es imprescindible para las
organizaciones donde se deben disponer
de servicios avanzados de consultoría
para lograr una completa seguridad
corporativa. Asimismo, adoptar buenas
prácticas y políticas de seguridad que
garanticen la seguridad de la información.
(Shrivastava & Kumar, 2019).
En ese contexto, una de las últimas
técnicas para garantizar la seguridad
de la información que están usando las
organizaciones es el machine learning,
dónde se implementan diferentes
algoritmos, métodos, teorías de
aprendizaje automático para solucionar
los problemas de seguridad de la
información y prevenirlos. El machine
learning cada vez está siendo muy popular
en las organizaciones ya que nos ofrece
una “inteligencia” similar a la del humano
y está siendo aplicado en diferentes
sectores, áreas y actividades relacionadas
a la encriptación, autenticación,
reconocimiento, visión computacional,
prevención, entre otras. (Iqbal H. Sarker,
2022).
Según (Shrivastava & Kumar, 2019),
machine learning” está enfocado en
los diversos cambios en los sistemas
de ejecución de tareas asociadas con
inteligencia articial que se reere a la
capacidad de una máquina para poseer
inteligencia como la humana. Las diversas
tareas mencionadas, anteriormente,
implican el diagnóstico, planicación,
reconocimiento, control de robots,
previsión y predicción. Estos cambios
implican la evolución de nuevos sistemas
o mejora en los sistemas existentes.
Así mismo, según ISO/IEC 27001, la
seguridad de la información” consiste en
mantener la condencialidad, integridad
y disponibilidad de la información. Son
buenas prácticas y metodologías que
buscan proteger la información y los
sistemas de información del acceso, uso,
divulgación, interrupción, modicación
o eliminación no autorizada; en otras
palabras, proteger los datos y recursos
de infraestructura tecnológica de una
organización. Además, otras cualidades
están involucradas como la autenticidad,
responsabilidad, conabilidad y el no
repudio. (Vega Briceño, 2021)
El objetivo principal de esta revisión
fue analizar la implementación del
machine learning en la seguridad de
la información en los últimos cinco
años. Para ello, se desarrollaron algunas
preguntas previas: ¿Qué importancia
tiene el machine learning en la seguridad
de la información?, ¿Qué algoritmos
de machine learning son usados para la
seguridad de la información?, ¿En qué
áreas se usa el machine learning para
la seguridad de la información de las
organizaciones?
C A - C P - A M
367
| C | V. XXVII | N. 34 | - | 2022 | | ISSN (): - | ISSN ( ): - |
Método
Para la investigación realizada se
hizo una revisión sistemática en base
a la metodología PRISMA (Preferred
Reporting Items for Systematic Review
and Meta-Analyses). La pregunta de
investigación establecida para esta revisión
sistemática fue la siguiente: ¿Cómo se
está implementando el machine learning
en la seguridad de la información en los
últimos cinco años?
Según (Quispe et al., 2021) una revisión
sistémica es una revisión de la literatura
cientíca donde se lleva a cabo un proceso
planicado, con el objetivo de analizar
artículos publicados anteriormente para
responder a una pregunta especíca. La
literatura encontrada debe ser relevante y
se debe ajustar a los criterios de inclusión/
exclusión establecidos posteriormente.
Los hallazgos son de conabilidad,
las conclusiones ayudan a la toma de
decisiones a los próximos investigadores.
Adicionalmente, para Blanco Gómez
et al., 2020 el objetivo de la metodología
PRISMA es reducir el riesgo de sesgo
tanto en la fase que selecciona la
literatura cientíca relevante para incluir
en la revisión sistemática, como en la
fase de análisis posterior. Para ellos se
deben establecer criterios de inclusión
y exclusión que se aplican en la fase de
selección nal.
Para el proceso de búsqueda de
información hemos extraído las palabras
claves de nuestro tema de investigación,
que son las siguientes: “Aprendizaje
Automatizado”, “Algoritmos del
Aprendizaje Automatizado” y “Seguridad
de la Información”. Asimismo, una
vez identicadas las palabras claves, se
buscaron por su traducción al inglés:
“Machine Learning”, “Machine Learning
Algorithms” y “Security of Information”.
Se realizó la indagación en
diferentes bases de datos cientícos.
Para segmentarla, limitamos las
publicaciones hasta hace cinco años
(2018-2022) con la nalidad de
conocer cómo está la situación actual
del machine learning aplicado a la
seguridad de la información.
La combinación de términos en
español que usamos para la búsqueda
de publicaciones fue la siguiente:
[(“aprendizaje automatizado) AND
(“seguridad de la información”) AND
(LIMIT-TO (PUBYEAR, 2022) OR
LIMIT-TO (PUBYEAR, 2021) OR
LIMIT-TO (PUBYEAR, 2020) OR
LIMIT-TO (PUBYEAR, 2019) OR
LIMIT-TO (PUBYEAR, 2018))].
Además, la combinación de términos
en inglés que usamos para la búsqueda
de publicaciones fue la siguiente:
[(“machine learning”) AND (“security
of information”) AND (LIMIT-TO
(PUBYEAR, 2022) OR LIMIT-TO
(PUBYEAR, 2021) OR LIMIT-TO
(PUBYEAR, 2020) OR LIMIT-TO
(PUBYEAR, 2019) OR LIMIT-TO
(PUBYEAR, 2018))].
Para el desarrollo de esta investigación
se hizo una búsqueda en las bases de
datos como Scopus, Science Direct,
ResearchGate y Google Académico
donde se pudo encontrar diversos
tipos de publicaciones como: artículos,
conferencias y libros entre los años
2018-2022 relacionados al tema de
investigación.
R            
368
| C | V. XXVII | N. 34 | - | 2022 | | ISSN (): - | ISSN ( ): - |
En cuanto a los criterios de
exclusión e inclusión, se consideraron
los siguientes como se muestra en la
Tabla 1.
Tabla 1
Criterios de exclusión e inclusión
Exclusión Inclusión
No tiene relación el machine learning con la
seguridad de la información
Publicaciones con información del machine learning
aplicados a la seguridad de la información
Publicaciones con más de cinco años de antigüedad Publicaciones dentro del rango del año 2018 al 2022
Por duplicidad Artículos publicados en los idiomas español e inglés
Por falta de acceso
Resultados y Discusión
En la búsqueda de publicaciones se
estableció un intervalo de tiempo desde
hace cinco años atrás en las bases de datos
seleccionadas que arrojaron un total de
63 artículos entre el año 2018 – 2022
distribuidos de la siguiente manera:
Scopus: 23 artículos, Science Direct 27
artículos, Research Gate cinco artículos y
Google Académico 18 artículos.
Figura 2
Flujograma del proceso de selección de artículos
C A - C P - A M
Figura 1
Resultados por tipo de publicación
4
Se reali la búsqueda en diferentes
bases de datos científicos, para segmentar
nuestra búsqueda, limitamos las
publicaciones de hasta hace cinco años
(2018-2022) con la finalidad de conocer
mo está la situación actual del machine
learning aplicado a la seguridad de la
información.
La combinación de términos en español
que usamos para la búsqueda de
publicaciones fue la siguiente:
[(“aprendizaje automatizado) AND
(“seguridad de la información”) AND
(LIMIT-TO (PUBYEAR, 2022) OR
LIMIT-TO (PUBYEAR, 2021) OR
LIMIT-TO (PUBYEAR, 2020) OR
LIMIT-TO (PUBYEAR, 2019) OR
LIMIT-TO (PUBYEAR, 2018))].
Además, la combinación de términos en
inglés que usamos para la búsqueda de
publicaciones fue la siguiente: [(machine
learning”) AND (“security of
information) AND (LIMIT-TO
(PUBYEAR, 2022) OR LIMIT-TO
(PUBYEAR, 2021) OR LIMIT-TO
(PUBYEAR, 2020) OR LIMIT-TO
(PUBYEAR, 2019) OR LIMIT-TO
(PUBYEAR, 2018))].
Para el desarrollo de esta investigación
se hizo una búsqueda en las bases de datos
como Scopus, Science Direct,
ResearchGate y Google Académico donde
se pudo encontrar diversos tipos de
publicaciones como: artículos,
conferencias y libros entre los años 2018-
2022 relacionados al tema de
investigación.
Figura 1
Resultados por tipo de publicación
En cuanto a los criterios de exclusión e
inclusión, se consideró lo siguiente como
se muestra en la Tabla 1.
Tabla 1
Resultados
encontrados
73
Articulos
44
Conferencias
25
Libros
4
369
| C | V. XXVII | N. 34 | - | 2022 | | ISSN (): - | ISSN ( ): - |
De 63 artículos seleccionados,
aplicando la metodología PRISMA
y haciendo uso del ujograma para
la selección de artículos en base a los
criterios de inclusión y exclusión, se
escogieron 16 artículos, de los cuales
seis pertenecen a Google Académico,
que signica el 37,50% como mayoría
de los artículos seleccionados, lo cual se
evidencia en la Figura 3.
Figura 3
Cantidad de artículos por base de datos
Se obtuvieron los siguientes artículos
según la base de datos: Scopus, tres
artículos; Science Direct, cinco artículos;
Research Gate, dos artículos y Google
Académico, seis artículos. Posteriormente,
de los 16 artículos seleccionados, se
procedió a hacer la identicación de la
situación actual del machine learning en
la seguridad de la información, lo cual se
puede evidenciar en la Tabla 2.
Tabla 2
Resultado de búsqueda nal
Nro. Autor Título de Investigación País Año
01
(Naseer et al.,
2018)
Enhanced network anomaly detection based on deep
neural networks
Pakistán 2018
02
(Sokolov et al.,
2019)
Applying of digital signal processing techniques to
improve the performance of machine learning-based
cyber-attack detection in industrial control system
India 2019
03
(Ikrissi & Mazri,
2021)
IOT-BASED SMART ENVIRONMENTS: STATE of
the ART, SECURITY THREATS and SOLUTIONS
Marruecos 2021
04
(Zapechnikov,
2020)
Privacy-Preserving Machine Learning as a Tool for
Secure Personalized Information Services
Rusia 2020
05
(Applebaum et
al., 2021)
Signature-based and Machine-Learning-based Web
Application Firewalls: A Short Survey
Reino Unido 2021
06
(Domashova &
Kripak, 2021)
Identication of non-typical international transactions
on bank cards of individuals using machine learning
methods
Rusia 2021
07
(orat et al.,
2021)
TaxoDaCML: Taxonomy based Divide and Conquer
using machine learning approach for DDoS attack
classication
India 2021
08
(Bahassi et al.,
2022)
Toward an exhaustive review on Machine Learning for
Cybersecurity
Marruecos 2022
R            
370
| C | V. XXVII | N. 34 | - | 2022 | | ISSN (): - | ISSN ( ): - |
09
(Hazratifard et
al., 2022)
Using Machine Learning for Dynamic Authentication
in Telehealth: A Tutorial
Canadá 2022
10
(Iqbal H. Sarker,
2022)
Machine Learning for Intelligent Data Analysis and
Automation in Cybersecurity: Current and Future
Prospects
Australia 2022
11
(ADETUNMBI
A.O. et al.,
2018)
A Machine Learning Approach for Information System
Security
Nigeria 2018
12
(Tolubko et al.,
2018)
Method for Determination of Cyber reats Based on
Machine Learning for Real-Time Information System
Ucrania 2018
13
(Zhang et al.,
2020)
Multicriteria Decision and Machine Learning
Algorithms for Component Security Evaluation:
Library-Based Overview
China 2020
14
(Raviteja et al.,
2020)
Implementation Of Machine Learning Algorithms for
Detection Of Network Intrusion
India 2020
15
(Butt et al.,
2020)
A Review of Machine Learning Algorithms for Cloud
Computing Security
Corea 2020
16
(Damaševičius et
al., 2021)
Ensemble-Based Classication Using Neural Networks
and Machine Learning Models for Windows PE
Malware Detection
Lituania 2021
Tomando en
cuenta los artículos
seleccionados, se procedió a revisar
cómo se está implementando el machine
learning para mejorar la seguridad de
la información. Con respecto a los
países que lideran las publicaciones se
obtuvo que el país con más artículos es
Rusia con tres publicaciones, seguido
por la India y Marruecos con dos
publicaciones. El resto de los países
tiene una publicación, lo cual se puede
evidenciar en la Figura 4.
Figura 4
Cantidad de artículos por países
A continuación, se muestra la
ubicación geográca de los países donde
se encontraron los artículos en los cuales
se está aplicando el machine learning para
mejorar la seguridad de la información
que se puede evidenciar en la Figura 5.
C A - C P - A M