当前位置: 首页> 房产> 政策 > 哈尔滨网站设计公司地址_房地产公司名称大全_制作网页需要多少钱_西地那非片多少钱一盒

哈尔滨网站设计公司地址_房地产公司名称大全_制作网页需要多少钱_西地那非片多少钱一盒

时间:2025/7/11 18:36:08来源:https://blog.csdn.net/hawk2014bj/article/details/144013189 浏览次数:0次
哈尔滨网站设计公司地址_房地产公司名称大全_制作网页需要多少钱_西地那非片多少钱一盒

K 均值算法是聚类分析的一种机器学习算法,通过相似度或者数据之间的距离进行分类,将样本划分成 N 个分类。相似度的算法使用闵可夫斯基距离,公式如下:
在这里插入图片描述

  • p=1 时为曼哈顿距离

d(x, y) = ∑ i = 1 n ∣ x i − y i ∣ \sum_{i=1}^n |x_i - y_i| i=1nxiyi

  • p=2 时为欧氏距离

d(x, y) = ∑ i = 1 n ∣ x i − y i ∣ \sum_{i=1}^n |x_i - y_i| i=1nxiyi

聚类算法主要可以通过距离、密度等算法进行分类,本文主要实现按距离进行分类的 KMean 算法。

  1. 首先初始化质心
  2. 将样本分配到距离最近的质心,并创建 k 个聚类
  3. 根据每个聚类,从新计算质心并分配样本,直到质心的变化不大

Sklearn 实现K Mean

import numpy as np
from sklearn.cluster import KMeansX = np.array([[0,2],[0,0],[1,0],[5,0],[5,2]])from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
print(kmeans.labels_)
# 预测分类
kmeans.predict([[0, 0], [12, 3]])
# 或者中心点 质心
kmeans.cluster_centers_

在这里插入图片描述

总结

K 均值算法很好理解,通过算法找到最优中心点,从而将样本进行分类。

关键字:哈尔滨网站设计公司地址_房地产公司名称大全_制作网页需要多少钱_西地那非片多少钱一盒

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: