k均值聚类算法python实现(k均值聚类算法)

华枝淑
导读 大家好,小信来为大家解答以上问题。k均值聚类算法python实现,k均值聚类算法很多人还不知道,现在让我们一起来看看吧!1、首先需要用一个

大家好,小信来为大家解答以上问题。k均值聚类算法python实现,k均值聚类算法很多人还不知道,现在让我们一起来看看吧!

1、 首先需要用一个软件,matlab,2010以上版本都可以用。我将用matlabR2014a演示这个方法过程。这个软件在网上是免费的,你可以根据方法参考别人的经验。

2、 数据准备:一般我们办公室所有的数据都是矩阵数据,行代表样本,列代表属性,比如姓名,学号等。如果是财务数据,行可以代表上市公司,列可以是每股收益、净资产收益率等属性。从而形成一个数据矩阵,可以txt、dat、MAT等格式保存在matLAB的工作文件夹中。我用2.txt来表示我要处理的数据。

3、 然后,这个数据可以用matlab自带的函数进行处理,IDX=kmeans(X,k),其中X是数据矩阵,k是指定的类数。我们暂时将其指定为3类,即我们将2.txt中的数据分为3类。使用下面的语句,我们达到了将数据分为三类的目的。我们得到一个列向量IDX,这是最后一个类标签。第一个数字2表示第一个样本属于第二类,依此类推。我们得到一系列样本的所属序列。这样就实现了数据的聚类处理。要想获得实际应用意义,需要具体问题具体分析。聚类算法是我们从未知标签数据中获取信息的重要手段。

本文到此结束,希望对大家有所帮助。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!