Analisis Cluster Hasil Try Out Siswa MTS AlHuda Gorontalo dengan Chi-Sim Cosimilarity dan K-Means Clustering

Authors

  • Fahrezal Zubedi Universitas Negeri Gorontalo

DOI:

https://doi.org/10.26594/jmpm.v4i2.1706

Keywords:

Clustering, chi-sim co-similarity, K-means Clustering.

Abstract

Tujuan penelitian ini yaitu menemukan kelompok siswa dan kelompok
mata pelajaran yang homogen sehingga bisa memantau atau
mengetahui kinerja akademik siswa. Langkah pertama yaitu
mentransformasi data dengan menggunakan normalisasi min-max.
Setelah itu, diterapkan ? -Sim co-similarity untuk menghasilkan
matriks similaritas siswa (SS) dan similaritas pelajaran (SP). Masingmasing
SS dan SP dikelompokan menggunakan algoritma k-means
clustering dan menggunakan Silhouette untuk menentukan banyaknya
kelompok yang terbaik. Pada pengelompokkan SS diperoleh nilai
Silhouette terbesar yaitu 0,9755781 pada iterasi keempat yang
mempartisi menjadi 4 cluster sebagai berikut 67 siswa pada cluster 1, 9
siswa pada cluster 2, 45 siswa pada cluster 3 dan 43 siswa pada cluster
4. Pada SP diperoleh nilai Silhouette terbesar yaitu 0,5756133 pada
iterasi keempat yang mempartisi menjadi 2 cluster sebagai berikut
Bahasa Indonesia dan Bahasa Inggris pada cluster 1 dan Matematika
dan IPA pada cluster 2.

References

Bergeron, B. (2002). Bioinformatics Computing. In Prentice Hall PTR (Vol. 36). https://doi.org/10.1109/IJCBS.2009.8

Bustamam, A., Zubedi, F., & Siswantining, T. (2018). Implementation χ -sim co-similarity and agglomerative hierarchical to cluster gene expression data of lymphoma by gene and condition. AIP Conference Proceedings, 2023. https://doi.org/10.1063/1.5064218

Chin, A. J., Mirzal, A., & Harona, H. (2015). Review FS clustering. 8, 1–5.

Han, J. (2011). Data Mining: Concepts and Techniques (The Morgan Kaufmann Series in Data Management Systems). Retrieved from http://www.amazon.co.uk/Data-Mining-Concepts-Techniques-Management/dp/0123814790

Hussain, S. F., Bisson, G., & Grimal, C. (2010). An improved co-similarity measure for document clustering. Proceedings - 9th International Conference on Machine Learning and Applications, ICMLA 2010, 190–197. https://doi.org/10.1109/ICMLA.2010.35

Hussain, S. F., & Ramazan, M. (2016). Biclustering of human cancer microarray data using co-similarity based co-clustering. Expert Systems with Applications, 55(February 2016), 520–531. https://doi.org/10.1016/j.eswa.2016.02.029

Kaufman, L., & Rousseeuw, P. J. (2005). Finding groups in data : an introduction to cluster analysis / Leonard Kaufman, Peter J. Rousseeuw. Retrieved from http://login.ezproxy.library.ualberta.ca/login?url=http://search.ebscohost.com/login.aspx?direct=true&db=cat00362a&AN=neos.5309634&site=eds-live&scope=site;%5Cnhttp://www.loc.gov/catdir/enhancements/fy0626/2005278659-t.html;%5Cnhttp://www.loc.gov/catdir/e

Liu, B., Xin, Y., Cheung, R. C. C., & Yan, H. (2014). GPU-based biclustering for microarray data analysis in neurocomputing. Neurocomputing, 134, 239–246. https://doi.org/10.1016/j.neucom.2013.06.049

Mohamad, I. Bin, & Usman, D. (2013). Standardization and its effects on K-means clustering algorithm. Research Journal of Applied Sciences, Engineering and Technology, 6(17), 3299–3303. https://doi.org/10.19026/rjaset.6.3638

Mondal, B., & Paul Choudhury, J. (2013). A Comparative Study on K Means and PAM Algorithm using Physical Characters of Different Varieties of Mango in India. International Journal of Computer Applications, 78(5), 21–24. https://doi.org/10.5120/13485-1189

Nicolaus, Sulistianingsih, E., & Perdana, H. (2016). Penentuan jumlah cluster optimal pada median linkage dengan indeks validitas silhouette menggunakan himpunan variabel yang ditentukan untuk mengelompokkan objek. Buletin Ilmiah Math. Stat. Dan Terapannya (Bimaster), 05(2), 97–102.

Patro, S. G. K., & sahu, K. K. (2015). Normalization: A Preprocessing Stage. Iarjset, 20–22. https://doi.org/10.17148/iarjset.2015.2305

Starczewski, A. (2017). A new validity index for crisp clusters. Pattern Analysis and Applications, 20(3), 687–700. https://doi.org/10.1007/s10044-015-0525-8

X. Wu and VKumar. (2009). Top 10 Algorithms in Data Mining. Chapman & Hall/CRC.

Zaki, M. J., & Meira, Jr, W. (2018). Clustering Validation. In Data Mining and Analysis. https://doi.org/10.1017/cbo9780511810114.018

Downloads

Published

2020-03-16