Unsupervised classification of medical images and data mining: S3 algorithm vs. k-means

Authors

Keywords:

means, algorithm, medical images, unsupervised classification, representatives, data mining.

Abstract

One of the challenges to be faced by programmers is the large dimensions of data groups. The process of pattern recognition in images and data mining for great volumes of information is an example. Optimizing the number of times that the set of data is run saves processing time. The purpose of the study was to characterize the three-step (S3) algorithm, parallel to k-means, as an alternative to cope with the large dimension of the data set in unsupervised image classification. Concurrence analysis is based on data flow and the single instruction multiple data scheme. The result obtained confirms that concurrence of both is possible. S3 does not depend on initial selection of representatives, and may be the process for selection of the first central vectors in k-means. S3 is an alternative to be considered in the unsupervised classification of medical images and data mining processes.

Downloads

Download data is not yet available.

Author Biography

Reinaldo Sánchez Álvarez, Universidad de Guantánamo

Lic. en Cibernética Matemática 1980, Master en computación aplicada, modalidad programación 2000. Línea de investigación Reconocimiento de patrones en imagen utilizando modelos estadísticos y redes neuronales artificiales. Profesor asistente  de la facultad FICT de la universidad de Guantánamo, Jefe de departamento de Informática.

References

1. Espínola M. Clasificación de imágenes de satéli; 2014.

2. Hernández Reséndiz , J. D., Marin Castro , H. M., & Tello Leal , E. A Comparative Study of Clustering Validation Indices and Maximum Entropy for Sintonization of Automatic Segmentation Techniques. IEEE LATIN AMERICA TRANSACTIONS. 2019 august; 17( 8).

3. Chuvieco E. Teledetección Ambiental. La observación de la tierra desde el espacio Barcelona: Editorial Planeta S.A; 2010.

4. Gómez S AJ. Análisis comparativo de diferentes métodos de agrupamiento de datos de expresión genética. Tonos Digitales. 2018 Julio.

5. Pacheco P. Parallel programing with MPI. ; 2011.

6. Satyanarayana A, Davidson I. Speeding up K-Means clustering using bootstrap averaging. In International Conference on Data Mining Workshop on Clustering Large Data Sets; 2003; Melbourne: FL USA. p. 19-22.

7. Castillo Reyes , G. Técnicas de programación paralela aplicadas al procesamiento de datos ráster mediante la biblioteca GDAL. Revista Cubana de Ciencias Informáticas. 2016 enero-marzo; 10(1).

8. Ochoa R A. Componente Web para el análisis de información clínica usando la técnica de minería de datos. Informática Médica. 2014 enero-junio; 6(1).

9. Barba L AR, Guerrero H H, Salazar G J. Análisis de Clúster para la clasificación de datos económicos. Publicando. 2016; 3(7).

10. Leyva Vázquez , M., González Benitez , N., Hechavarria Hernández , J., Rivero Peña , Y., & Daher Nader , J. E. El diagnóstico de enfermedades desde el Análisis Inteligente de los Datos. Espacios.2018; 39(28), 16.

11. Pérez Ortega, J., Hidalgo Reyes, M., Castro Sánchez, N. A., Pazos Rangel, R., Díaz Parra, O., Olivares Peregrino, V., & Almanza Ortega, N. Una heurística eficiente aplicada al algoritmo K-means para el agrupamiento de grandes instancias altamente agrupadas. Computación y Sistemas, 2018; 22(2).

12. T Pham, T., A. Lobos, G., & Vidal Silva, C. L. Innovación en Minería de Datos para el Tratamiento de Imágenes: Agrupamiento K-media para Conjuntos de Datos de Forma Alargada y su Aplicación en la Agroindustria. Innovación Tecnológica. 2019; 30(2), 135-142.

13. Medina Veloz, G., Luna Rosas,, F. J., Tavarez Avendaño, J. F., & Narvaez Murillo , R. U. Calibración y selección del modelo de aprendizaje no supervisado K-Medias, de una encuesta sobre factores de riesgo en el consumo de drogas entre estudiantes. Revista de Análisis Cuantitativo y Estadístico. 2016 junio;3(7), 1-9.

14. Chavarría M, J., & Fallas M, J. J. El algoritmo PSO aplicado al problema de particionamientode datos cuantitativos. Matemática, Educación e Interne. 2019 marzo; 19(1).

15. Camejo Corona , J., González Diez , H., & Morell , C. Los principales algoritmos para regresión con salidas múltiples. Una revisión para Big Data. Revista Cubana de Ciencias Informáticas.2019 diciembre;13(4).

16. Rodríguez Alvarez , Y., Bello Pérez , R., Caballero Mota , Y., Filiberto Cabrera, Y., Fernández Hernández, Y., & Frías Hernández, M. (2017). Estudio del comportamiento de métodos basados prototipos y en relaciones de similitud ante “hubness”. Revista Cubana de Ciencias Informáticas. 2017 enero; 11(2).

17. Giménez Palomares, F., Monsoriu Serrá, J. A., & Alemany Martínez , E. Aplicación de la convolución de matrices al filtrado de imágenes. Modelling in Science Education and Learning. 2016;9(2).

18. López D, Fernández. Aplicación en los medios de prensa de un Agrupamiento K-Means. Economía y Sociedad. 2018; 12(12).

19. Soto, A. J., Ponzonia, I., & Vazquez, G. E. Análisis numérico de diferentes criterios de similitud en algoritmos de clustering. Mecánica Computacional. 2006 noviembre; XXV, 993-1011.

20. Pérez Verona , I. C., & Arco García, L. Una revisión sobre aprendizaje no supervisado de métricas de distancia. Revista Cubana de Ciencias Informáticas. 2016 octubre-diciembre; 10(4).

Published

2021-05-28

How to Cite

1.
Sánchez Álvarez R. Unsupervised classification of medical images and data mining: S3 algorithm vs. k-means. Rev Cubana Inv Bioméd [Internet]. 2021 May 28 [cited 2025 Jul. 12];40(5). Available from: https://revibiomedica.sld.cu/index.php/ibi/article/view/1614