成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

基于凸集上投影(POCS)的聚類算法

開發 前端
在數學中,凸集是指其中任意兩點間的線段均在該集合內的集合。而投影則是將某個點映射到另一個空間中的某個子空間上的操作。給定一個凸集合和一個點,可以通過找到該點在該凸集合上的投影來進行操作。

POCS:Projections  onto Convex Sets。在數學中,凸集是指其中任意兩點間的線段均在該集合內的集合。而投影則是將某個點映射到另一個空間中的某個子空間上的操作。給定一個凸集合和一個點,可以通過找到該點在該凸集合上的投影來進行操作。該投影是離該點最近的凸集內的點,可以通過最小化該點和凸集內任何其他點之間的距離來計算。既然是投影,那么我們就可以將特征映射到另一個空間中的凸集合上,這樣就可以進行聚類或降維等操作。

本文綜述了一種基于凸集投影法的聚類算法,即基于POCS的聚類算法。原始論文發布在IWIS2022上。

凸集

凸集定義為一個數據點集合,其中連接集合中任意兩點x1和x2的線段完全包含在這個集合中。根據凸集的定義,認為空集?、單集、線段、超平面、歐氏球都被認為是凸集。數據點也被認為是凸集,因為它是單例集(只有一個元素的集合)。這為 POCS 的概念應用于聚類數據點開辟了一條新路徑。

凸集投影(POCS)

POCS方法大致可分為交替式和并行式兩種。

1、交替式poc

從數據空間中的任意一點開始,從該點到兩個(或多個)相交凸集的交替投影將收斂到集合交點內的一點,例如下圖:

當凸集不相交時,交替投影將收斂到依賴于投影階數的greedy limit cycles。

圖片

2、并行式 POCS

與交替形式不同,并行的POCS 是從數據點到所有凸集同時進行投影,并且每個投影都有一個重要性權重。對于兩個非空相交凸集,類似于交替式版本,平行投影會收斂到集相交處的一個點。

圖片

在凸集不相交的情況下,投影將收斂到一個最小解。基于pocs的聚類算法的主要思想來源于這一特性。

圖片

有關POCS的更多細節,可以查看原論文

基于pocs的聚類算法

利用并行POCS方法的收斂性,論文作者提出了一種非常簡單但在一定程度上有效的聚類算法。該算法的工作原理與經典的K-Means算法類似,但在處理每個數據點的方式上存在差異:K-Means算法對每個數據點的重要性加權相同,但是基于pocs的聚類算法對每個數據點的重要性加權不同,這與數據點到聚類原型的距離成正比。

算法的偽代碼如下所示:

實驗結果

作者在一些公共基準數據集上測試了基于pocs的聚類算法的性能。下表總結了這些數據集的描述。

圖片

作者比較了基于pocs的聚類算法與其他傳統聚類方法的性能,包括k均值和模糊c均值算法。下表總結了執行時間和聚類錯誤方面的評估。

圖片

圖片

聚類結果如下圖所示:

圖片

示例代碼

我們在一個非常簡單的數據集上使用這個算法。作者已經發布了直接使用的包,對于應用我們可以直接使用:

pip install pocs-based-clustering

創建一個以10個簇為中心的5000個數據點的簡單數據集:

# Import packages
import time
import matplotlib.pyplot as plt

from sklearn.datasets import make_blobs
from pocs_based_clustering.tools import clustering


# Generate a simple dataset
num_clusters = 10
X, y = make_blobs(n_samples=5000, centers=num_clusters, \
cluster_std=0.5, random_state=0)

plt.figure(figsize=(8,8))
plt.scatter(X[:, 0], X[:, 1], s=50)
plt.show()

圖片

執行聚類并顯示結果:

# POSC-based Clustering Algorithm
centroids, labels = clustering(X, num_clusters, 100)

# Display results
plt.figure(figsize=(8,8))
plt.scatter(X[:, 0], X[:, 1], c=labels, s=50, cmap='viridis')
plt.scatter(centroids[:, 0], centroids[:, 1], s=100, c='red')
plt.show()

圖片

總結

我們簡要回顧了一種簡單而有效的基于投影到凸集(POCS)方法的聚類技術,稱為基于POCS的聚類算法。該算法利用POCS的收斂特性應用于聚類任務,并在一定程度上實現了可行的改進。在一些基準數據集上驗證了該算法的有效性。

論文的地址如下:https://arxiv.org/abs/2208.08888

作者發布的源代碼在這里:https://github.com/tranleanh/pocs-based-clustering

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2023-05-10 08:00:00

聚類分析數據分析聚類算法

2019-10-12 10:11:02

數據集聚類算法

2023-10-31 09:00:00

2025-03-31 08:28:24

大型語言模型LLMDeepSeek

2014-07-02 10:34:08

聚類算法算法

2025-05-22 10:06:49

2017-05-15 11:10:10

大數據聚類算法

2020-07-09 15:26:18

Python聚類算法語言

2024-10-18 17:14:13

2020-05-13 15:57:59

聚類分析算法監督學習

2011-07-26 10:16:14

SQL Server數據挖掘

2011-07-25 15:39:49

SQL SERVER數聚類算法順序聚類算法

2022-07-29 10:31:33

算法Python

2017-04-05 09:20:14

聚類算法機器學習大數據

2017-04-07 13:00:49

機器學習大數據聚類算法

2022-05-17 09:14:50

聚類算法python

2022-03-03 19:52:25

聚類算法D2CDBSCAN

2022-09-07 23:54:17

機器學習無監督學習算法

2018-05-28 15:33:09

無監督學習算法Python

2023-12-01 16:27:05

機器學習無監督學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 黄在线免费观看 | 午夜免费电影院 | 一级毛片色一级 | 国产激情偷乱视频一区二区三区 | 国产成人亚洲精品自产在线 | 荷兰欧美一级毛片 | 精品久久久久久久久久久久久久久久久 | 久久久久久久久久一区 | 四虎影院新网址 | 成人av免费 | 亚洲日韩中文字幕一区 | 国产在线激情视频 | 国产在线观看不卡一区二区三区 | 久久躁日日躁aaaaxxxx | 北条麻妃99精品青青久久 | 精品国产一二三区 | 青青草综合网 | 婷婷久久五月天 | 日韩视频一级 | 欧美日韩精品在线免费观看 | 久久久婷婷 | 久久国产精品一区二区三区 | 国产精品久久毛片av大全日韩 | 亚洲一区 中文字幕 | 精久久久 | 精品一区电影 | 亚洲小视频在线播放 | 久久精品日产第一区二区三区 | 亚洲国产成人精品女人久久久 | 久久高清亚洲 | 国产视频一区二区在线观看 | 国精品一区 | 国产欧美精品一区二区三区 | 我要看免费一级毛片 | 水蜜桃亚洲一二三四在线 | 黄色播放 | 日韩一区二区在线观看 | 国产乱码精品一区二区三区五月婷 | 亚洲精品视频免费看 | 日韩成人中文字幕 | 日韩av在线一区 |