哈尔滨网站设计公司地址_房地产公司名称大全_制作网页需要多少钱_西地那非片多少钱一盒

时间:2025/7/11 18:36:08来源：https://blog.csdn.net/hawk2014bj/article/details/144013189 浏览次数:0次

K 均值算法是聚类分析的一种机器学习算法，通过相似度或者数据之间的距离进行分类，将样本划分成 N 个分类。相似度的算法使用闵可夫斯基距离，公式如下:
在这里插入图片描述

p=1 时为曼哈顿距离

d(x, y) = $\sum_{i=1}^n |x_i - y_i|$

p=2 时为欧氏距离

d(x, y) = $\sum_{i=1}^n |x_i - y_i|$

聚类算法主要可以通过距离、密度等算法进行分类，本文主要实现按距离进行分类的 KMean 算法。

首先初始化质心
将样本分配到距离最近的质心，并创建 k 个聚类
根据每个聚类，从新计算质心并分配样本，直到质心的变化不大

Sklearn 实现K Mean

import numpy as np
from sklearn.cluster import KMeansX = np.array([[0,2],[0,0],[1,0],[5,0],[5,2]])from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
print(kmeans.labels_)
# 预测分类
kmeans.predict([[0, 0], [12, 3]])
# 或者中心点 质心
kmeans.cluster_centers_

在这里插入图片描述

总结

K 均值算法很好理解，通过算法找到最优中心点，从而将样本进行分类。

关键字：哈尔滨网站设计公司地址_房地产公司名称大全_制作网页需要多少钱_西地那非片多少钱一盒

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：