版塊導(dǎo)航: 正在加載中...

登錄注冊

應(yīng)《網(wǎng)絡(luò)安全法》要求，自2017年10月1日起，未進行實名認證將不得使用互聯(lián)網(wǎng)跟帖服務(wù)。為保障您的帳號能夠正常使用，請盡快對帳號進行手機號驗證，感謝您的理解與支持！

24小時熱門版塊排行榜

北京石油化工學(xué)院2026年研究生招生接收調(diào)劑公告

返回列表

【獎勵】本帖被評價5次，作者stephenliu89增加金幣 4 個

當(dāng)前只顯示滿足指定條件的回帖，點擊這里查看本話題的所有回帖

stephenliu89

銀蟲 (小有名氣)

應(yīng)助: 3 (幼兒園)
金幣: 448.7
帖子: 183
在線: 25.7小時
蟲號: 953342

[資源] 【原創(chuàng)】一個簡單的kNN分類算法 (k-Nearest Neighbor algorithm) 的C++實現(xiàn)（附源碼）

鄰近算法

KNN算法的決策過程

　　k-Nearest Neighbor algorithm

是K最鄰近結(jié)點算法（k-Nearest Neighbor algorithm）的縮寫形式，是電子信息分類器算法的一種

該算法[5]的基本思路是[6]：在給定新文本后，考慮在訓(xùn)練文本集中與該新文本距離最近（最相似）的 K 篇文本，根據(jù)這 K 篇文本所屬的類別判定新文本所屬的類別

　　左圖中，綠色圓要被決定賦予哪個類，是紅色三角形還是藍色四方形？如果K=3，由于紅色三角形所占比例為2/3，綠色圓將被賦予紅色三角形那個類，如果K=5，由于藍色四方形比例為3/5，因此綠色圓被賦予藍色四方形類。

　　K最近鄰(k-Nearest Neighbor，KNN)分類算法，是一個理論上比較成熟的方法，也是最簡單的機器學(xué)習(xí)算法之一。該方法的思路是：如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別，則該樣本也屬于這個類別。KNN算法中，所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在定類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。 KNN方法雖然從原理上也依賴于極限定理，但在類別決策時，只與極少量的相鄰樣本有關(guān)。由于KNN方法主要靠周圍有限的鄰近的樣本，而不是靠判別類域的方法來確定所屬類別的，因此對于類域的交叉或重疊較多的待分樣本集來說，KNN方法較其他方法更為適合。

　　KNN算法不僅可以用于分類，還可以用于回歸。通過找出一個樣本的k個最近鄰居，將這些鄰居的屬性的平均值賦給該樣本，就可以得到該樣本的屬性。更有用的方法是將不同距離的鄰居對該樣本產(chǎn)生的影響給予不同的權(quán)值(weight)，如權(quán)值與距離成正比。

　　該算法在分類時有個主要的不足是，當(dāng)樣本不平衡時，如一個類的樣本容量很大，而其他類樣本容量很小時，有可能導(dǎo)致當(dāng)輸入一個新樣本時，該樣本的K個鄰居中大容量類的樣本占多數(shù)。因此可以采用權(quán)值的方法（和該樣本距離小的鄰居權(quán)值大）來改進。該方法的另一個不足之處是計算量較大，因為對每一個待分類的文本都要計算它到全體已知樣本的距離，才能求得它的K個最近鄰點。目前常用的解決方法是事先對已知樣本點進行剪輯，事先去除對分類作用不大的樣本。該算法比較適用于樣本容量比較大的類域的自動分類，而那些樣本容量較小的類域采用這種算法比較容易產(chǎn)生誤分。

KNN-主要應(yīng)用領(lǐng)域
·文本分類·聚類分析·數(shù)據(jù)挖掘·機器學(xué)習(xí)·預(yù)測分析·減少維度·模式識別·圖像處理

我的kNN分類算法程序：

------------------- Code written by Stephen Liu -----------------------

#include
#include
#define MAX 1000
using namespace std;
int m, i, j;
int types[100];
class str
{
public:
  float x;
  float y;
  float distance;
  int type;
};
str data[ MAX ];//輸入的已知類別的數(shù)據(jù)
str point;//需要根據(jù)kNN判斷類別的未知數(shù)據(jù)
str temp;

void input_data()
{
cout << "請輸入已知點的個數(shù)：";
cin >> m;
for ( i = 1; i <= m; i++)
{
  cout <<"請輸入點 " << i  <<"  的坐標(biāo)x , y 和所屬類別：" ;
  cin >> data.x >> data.y >> data.type;
}
}

void Distance()//計算未知類別點與所有已知類別點的距離
{
for ( i = 1; i <= m; i++ )
  data.distance = sqrt  (  (data.x - point.x) * (data.x - point.x) + (data.y - point.y) * (data.y - point.y) );
}

void sort()//對距離進行從小到大排序
{
for( i = 1; i <= m; i++)
  for(j = m; j > i; j--)
  {
if(data[ j ].distance  < data[ j - 1 ].distance)
{
temp=data[ j ];
data[ j ]=data[ j - 1 ];
data[ j - 1]=temp;
}
  }
}

int kNN( )
{
int the_type,num = 0, k;
cout <<"請輸入kNN的k值：";
cin >> k;
for ( i = 1; i <= 99; i++)
  types[ i ] = 0;
for ( i = 1; i <= k; i++)//對已排序的前k位距離類別進行統(tǒng)計
  types[ data.type ] ++;
for ( i = 1; i <= 99; i++)//找出未知類別點屬于的類別
{
  if (types > num )
  {
num = types;
the_type = i;
  }
}
return ( the_type);
}

int main()
{
input_data();
cout <<"請輸入未知類別點的坐標(biāo)x,y（輸入0 0退出)：";
cin >> point.x >> point.y;
do
{
  Distance();
  sort();
  cout <<"點( " << point.x << " , " << point.y <<" )屬于類"<<  kNN() << endl;
  cout <<"請輸入未知類別點的坐標(biāo)x,y（輸入0 0退出)：";
  cin >> point.x >> point.y;
}
while ( point.x != 0 && point.y != 0);
cout <<"======= kNN分類算法 Stephen Liu  E-mail:stephenliu1989@163.com 2010.8 ======= ";
system("pause";
return 0;
}

------------------------- Code end ---------------------------------

我的評價：

這是kNN分類算法的最簡單的一種情況，當(dāng)k取不同值時分類可能會出現(xiàn)不同。樣本過大時，由于要比較的次數(shù)增多，效率降低。

回復(fù)此樓

1樓 2010-09-05 11:15:37

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

twmhillary

新蟲 (初入文壇)

應(yīng)助: 0 (幼兒園)
金幣: 296.4
帖子: 10
在線: 4.9小時
蟲號: 810740

★★★★★ 五星級,優(yōu)秀推薦

謝謝分享！
請問，knn分類前需要做正態(tài)化處理嗎？謝謝！

贊一下

回復(fù)此樓

7樓2012-04-13 16:22:29

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

查看全部 10 個回答

yalefield

金蟲 (文壇精英)

★★★★★ 五星級,優(yōu)秀推薦

★ ★ ★
余澤成(金幣+3):一條建議一分！ 2010-09-05 17:07:32

（1）float似乎不夠，改double吧，比較放心
（2）歐式距離，太慢。換其他算法吧，或者配備多種預(yù)選
（3）輸入太麻煩，改文件讀入吧。

俺10年前玩kNN的時候，是對美國癌癥研究院NCI的數(shù)據(jù)庫中2百萬個分子結(jié)構(gòu)進行分類。效率啊......剛分好，就911了。

贊一下(1人)

回復(fù)此樓

2樓2010-09-05 11:27:26

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

stephenliu89

銀蟲 (小有名氣)

應(yīng)助: 3 (幼兒園)
金幣: 448.7
帖子: 183
在線: 25.7小時
蟲號: 953342

引用回帖:

Originally posted by yalefield at 2010-09-05 11:27:26:
（1）float似乎不夠，改double吧，比較放心
（2）歐式距離，太慢。換其他算法吧，或者配備多種預(yù)選
（3）輸入太麻煩，改文件讀入吧。

俺10年前玩kNN的時候，是對美國癌癥研究院NCI的數(shù)據(jù)庫中2百萬個分子結(jié)構(gòu) ...

謝謝前輩指點，這個只是我寫的粗略算法，正在改進中
我也查了不少關(guān)于kNN改進算法的論文，等考完研了再認真看看，總覺得精力太有限~~~~(>_<

~~~~ 。模式識別挺有意思的哈

[ Last edited by stephenliu89 on 2010-9-5 at 12:02 ]

贊一下

回復(fù)此樓

3樓2010-09-05 12:00:14

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

stephenliu89

銀蟲 (小有名氣)

應(yīng)助: 3 (幼兒園)
金幣: 448.7
帖子: 183
在線: 25.7小時
蟲號: 953342

引用回帖:

Originally posted by stephenliu89 at 2010-09-05 11:15:37:
鄰近算法

KNN算法的決策過程

　　k-Nearest Neighbor algorithm

是K最鄰近結(jié)點算法（k-Nearest Neighbor ...

我也查了不少關(guān)于kNN改進算法的論文，等考完研了再認真看看，總覺得精力太有限~~~~(>_<

~~~~ 。模式識別挺有意思的哈

贊一下

回復(fù)此樓

4樓2010-09-05 12:01:46

已閱回復(fù)此樓關(guān)注TA 給TA發(fā)消息送TA紅花 TA的回帖

查看全部 10 個回答

☆ 無星級 ★ 一星級 ★★★ 三星級 ★★★★★ 五星級

普通表情龍兔虎貓高級回復(fù) (可上傳附件)

最具人氣熱帖推薦 [查看全部]		作者	回/看	最后發(fā)表

[考研] 一志愿北京理工大學(xué)本科211材料工程294求調(diào)劑 +6	mikasa的圍巾 2026-03-28	6/300	2026-03-29 01:32 by fmesaito
[考研] 本科新能源科學(xué)與工程，一志愿華理能動285求調(diào)劑 +3	AZMK 2026-03-27	5/250	2026-03-28 16:19 by xxxsssccc
[考研] 275求調(diào)劑 +10	Micky11223 2026-03-25	14/700	2026-03-28 15:48 by Micky11223
[考研] 0703化學(xué) +10	妮妮ninicgb 2026-03-27	10/500	2026-03-28 14:07 by 噠噠噠呱呱呱
[考研] 藥學(xué)105500求調(diào)劑 +3	Ssun。。 2026-03-28	3/150	2026-03-28 11:24 by lxf170613
[考研] 315分求調(diào)劑 +7	26考研上岸版26 2026-03-26	7/350	2026-03-28 04:05 by fmesaito
[有機交流] 高溫高壓反應(yīng)求助 10+4	chibby 2026-03-25	4/200	2026-03-27 21:08 by BT20230424
[考研] 274求調(diào)劑 +17	顧九笙要謙虛 2026-03-24	23/1150	2026-03-27 15:16 by caszguilin
[考研] 求調(diào)劑，一志愿南京航空航天大學(xué)大學(xué) ，080500材料科學(xué)與工程學(xué)碩 +4	@taotao 2026-03-26	5/250	2026-03-27 08:10 by hypershenger
[考研] 調(diào)劑求收留 +7	果然有我 2026-03-26	7/350	2026-03-27 00:26 by wxiongid
[考研] 349求調(diào)劑 +4	李木子啊哈哈 2026-03-25	4/200	2026-03-26 22:49 by fmesaito
[考研] 調(diào)劑 +4	柚柚yoyo 2026-03-26	4/200	2026-03-26 20:43 by fmesaito
[考研] 289求調(diào)劑 +17	碩星赴 2026-03-23	17/850	2026-03-26 16:18 by 不吃魚的貓
[考研] 334分一志愿武理材料求調(diào)劑 +4	李李不服輸 2026-03-26	4/200	2026-03-26 16:00 by 不吃魚的貓
[考研] 282求調(diào)劑 +3	wcq131415 2026-03-24	3/150	2026-03-25 12:16 by userper
[考研] 289材料與化工（085600）B區(qū)求調(diào)劑 +4	這么名字咋樣 2026-03-22	5/250	2026-03-25 08:20 by mx.yue
[考研] 一志愿武理085500機械專業(yè)總分300求調(diào)劑 +3	an10101 2026-03-24	7/350	2026-03-25 00:00 by 山鬼0-
[考研] 材料專碩找調(diào)劑 +5	哈哈哈吼吼吼哈 2026-03-23	5/250	2026-03-24 19:07 by 了了了了。。
[考研] 化工專碩求調(diào)劑 +3	question挽風(fēng) 2026-03-24	3/150	2026-03-24 18:48 by jhhcooi
[考研] 材料專碩331求調(diào)劑 +4	鮮當(dāng)牛 2026-03-24	4/200	2026-03-24 15:58 by JourneyLucky

亭亭五月天在线观看,亭亭五月天在线观看,国产最新av一区二区,国产 高清 中文字幕,99re热久久亚洲综合精品成人,熟妇 一区二区三区,一级做a爰片性色毛片武则天,美女的骚穴视频播放,国产美女午夜免费视频

24小時熱門版塊排行榜

stephenliu89

[資源] 【原創(chuàng)】一個簡單的kNN分類算法 (k-Nearest Neighbor algorithm) 的C++實現(xiàn)（附源碼）

» 收錄本帖的淘帖專輯推薦

» 猜你喜歡

» 本主題相關(guān)價值貼推薦，對您同樣有幫助:

twmhillary

★★★★★ 五星級,優(yōu)秀推薦

yalefield

★★★★★ 五星級,優(yōu)秀推薦

stephenliu89

stephenliu89

亭亭五月天在线观看,亭亭五月天在线观看,国产最新av一区二区,国产高清中文字幕,99re热久久亚洲综合精品成人,熟妇一区二区三区,一级做a爰片性色毛片武则天,美女的骚穴视频播放,国产美女午夜免费视频

» 本主題相關(guān)價值貼推薦，對您同樣有幫助: