Skip to content

Commit 2b04c6b

Browse files
authored
Merge pull request #142 from wangyangting/master
更新: KMeans 聚类文档以及代码
2 parents 8409c42 + 5ebab39 commit 2b04c6b

3 files changed

Lines changed: 7 additions & 2 deletions

File tree

docs/10.k-means聚类.md

Lines changed: 5 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -131,8 +131,11 @@ def kMeans(dataSet, k, distMeas=distEclud, createCent=randCent):
131131
> 在 kMeans 的函数测试中,可能偶尔会陷入局部最小值(局部最优的结果,但不是全局最优的结果).
132132
133133
### K-Means 聚类算法的缺陷
134-
在 kMeans 的函数测试中,可能偶尔会陷入局部最小值(局部最优的结果,但不是全局最优的结果).
135-
所以为了克服 KMeans 算法收敛于局部最小值的问题,有更厉害的大佬提出了另一个称为二分K-均值(bisecting K-Means)的算法.
134+
在 kMeans 的函数测试中,可能偶尔会陷入局部最小值(局部最优的结果,但不是全局最优的结果).
135+
局部最小值的的情况如下:
136+
![K-Means 局部最小值1](../images/10.KMeans/apachecn-kmeans-partial-best-result-1.jpg)
137+
138+
所以为了克服 KMeans 算法收敛于局部最小值的问题,有更厉害的大佬提出了另一个称之为二分K-均值(bisecting K-Means)的算法.
136139

137140
### 二分 K-Means 聚类算法
138141
该算法首先将所有点作为一个簇,然后将该簇一分为二。
56.2 KB
Loading

src/python/10.kmeans/kMeans.py

Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -129,6 +129,8 @@ def testBiKMeans():
129129

130130
centList, myNewAssments = biKMeans(datMat, 3)
131131

132+
print 'centList=', centList
133+
132134
if __name__ == "__main__":
133135

134136
# 测试基础的函数

0 commit comments

Comments
 (0)