Unsupervised classification of medical images and data mining: S3 algorithm vs. k-means
Keywords:
means, algorithm, medical images, unsupervised classification, representatives, data mining.Abstract
One of the challenges to be faced by programmers is the large dimensions of data groups. The process of pattern recognition in images and data mining for great volumes of information is an example. Optimizing the number of times that the set of data is run saves processing time. The purpose of the study was to characterize the three-step (S3) algorithm, parallel to k-means, as an alternative to cope with the large dimension of the data set in unsupervised image classification. Concurrence analysis is based on data flow and the single instruction multiple data scheme. The result obtained confirms that concurrence of both is possible. S3 does not depend on initial selection of representatives, and may be the process for selection of the first central vectors in k-means. S3 is an alternative to be considered in the unsupervised classification of medical images and data mining processes.
Downloads
References
1. Espínola M. Clasificación de imágenes de satéli; 2014.
2. Hernández Reséndiz , J. D., Marin Castro , H. M., & Tello Leal , E. A Comparative Study of Clustering Validation Indices and Maximum Entropy for Sintonization of Automatic Segmentation Techniques. IEEE LATIN AMERICA TRANSACTIONS. 2019 august; 17( 8).
3. Chuvieco E. Teledetección Ambiental. La observación de la tierra desde el espacio Barcelona: Editorial Planeta S.A; 2010.
4. Gómez S AJ. Análisis comparativo de diferentes métodos de agrupamiento de datos de expresión genética. Tonos Digitales. 2018 Julio.
5. Pacheco P. Parallel programing with MPI. ; 2011.
6. Satyanarayana A, Davidson I. Speeding up K-Means clustering using bootstrap averaging. In International Conference on Data Mining Workshop on Clustering Large Data Sets; 2003; Melbourne: FL USA. p. 19-22.
7. Castillo Reyes , G. Técnicas de programación paralela aplicadas al procesamiento de datos ráster mediante la biblioteca GDAL. Revista Cubana de Ciencias Informáticas. 2016 enero-marzo; 10(1).
8. Ochoa R A. Componente Web para el análisis de información clínica usando la técnica de minería de datos. Informática Médica. 2014 enero-junio; 6(1).
9. Barba L AR, Guerrero H H, Salazar G J. Análisis de Clúster para la clasificación de datos económicos. Publicando. 2016; 3(7).
10. Leyva Vázquez , M., González Benitez , N., Hechavarria Hernández , J., Rivero Peña , Y., & Daher Nader , J. E. El diagnóstico de enfermedades desde el Análisis Inteligente de los Datos. Espacios.2018; 39(28), 16.
11. Pérez Ortega, J., Hidalgo Reyes, M., Castro Sánchez, N. A., Pazos Rangel, R., Díaz Parra, O., Olivares Peregrino, V., & Almanza Ortega, N. Una heurística eficiente aplicada al algoritmo K-means para el agrupamiento de grandes instancias altamente agrupadas. Computación y Sistemas, 2018; 22(2).
12. T Pham, T., A. Lobos, G., & Vidal Silva, C. L. Innovación en Minería de Datos para el Tratamiento de Imágenes: Agrupamiento K-media para Conjuntos de Datos de Forma Alargada y su Aplicación en la Agroindustria. Innovación Tecnológica. 2019; 30(2), 135-142.
13. Medina Veloz, G., Luna Rosas,, F. J., Tavarez Avendaño, J. F., & Narvaez Murillo , R. U. Calibración y selección del modelo de aprendizaje no supervisado K-Medias, de una encuesta sobre factores de riesgo en el consumo de drogas entre estudiantes. Revista de Análisis Cuantitativo y Estadístico. 2016 junio;3(7), 1-9.
14. Chavarría M, J., & Fallas M, J. J. El algoritmo PSO aplicado al problema de particionamientode datos cuantitativos. Matemática, Educación e Interne. 2019 marzo; 19(1).
15. Camejo Corona , J., González Diez , H., & Morell , C. Los principales algoritmos para regresión con salidas múltiples. Una revisión para Big Data. Revista Cubana de Ciencias Informáticas.2019 diciembre;13(4).
16. Rodríguez Alvarez , Y., Bello Pérez , R., Caballero Mota , Y., Filiberto Cabrera, Y., Fernández Hernández, Y., & Frías Hernández, M. (2017). Estudio del comportamiento de métodos basados prototipos y en relaciones de similitud ante “hubness”. Revista Cubana de Ciencias Informáticas. 2017 enero; 11(2).
17. Giménez Palomares, F., Monsoriu Serrá, J. A., & Alemany Martínez , E. Aplicación de la convolución de matrices al filtrado de imágenes. Modelling in Science Education and Learning. 2016;9(2).
18. López D, Fernández. Aplicación en los medios de prensa de un Agrupamiento K-Means. Economía y Sociedad. 2018; 12(12).
19. Soto, A. J., Ponzonia, I., & Vazquez, G. E. Análisis numérico de diferentes criterios de similitud en algoritmos de clustering. Mecánica Computacional. 2006 noviembre; XXV, 993-1011.
20. Pérez Verona , I. C., & Arco García, L. Una revisión sobre aprendizaje no supervisado de métricas de distancia. Revista Cubana de Ciencias Informáticas. 2016 octubre-diciembre; 10(4).
Downloads
Published
How to Cite
Issue
Section
License
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes: Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cuál estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons (CC-BY-NC 4.0) que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista. Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista. Se permite y recomienda a los autores/as difundir su obra a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada. (Véase El efecto del acceso abierto).
Como Revista Cubana de Investigaciones Biomédicas forma parte de la red SciELO, una vez los artículos sean aceptados para entrar al proceso editorial (revisión), estos pueden ser depositados por parte de los autores, si estan de acuerdo, en SciELO preprints, siendo actualizados por los autores al concluir el proceso de revisión y las pruebas de maquetación.