KNNクラシファイアにおける次元の呪い

KNNクラシファイヤーにおける次元の呪縛

クラスタリングアルゴリズムにおける「高次元性」の問題の影響を探求する

出典: https://scipy-lectures.org/packages/scikit-learn/auto_examples/plot_iris_knn.html

この記事では、KNNアルゴリズムにおける次元の呪いの影響を探求していきます。KNNアルゴリズムの概要と、その呪い自体の適切な理解から始めます。

この記事は誰に役立つのでしょうか? 機械学習やクラスタリングアルゴリズムに精通している方、またそこに向かっている全ての方に役立ちます。

この記事はどの程度高度な内容ですか? この記事は主に経験豊富なエンジニアを対象としています。

前提条件: この記事ではKNNアルゴリズムについて簡単に説明しますが、詳細な情報は以下の記事を参照してください。

KNNアルゴリズム: 何をするのか?いつ使うのか?なぜ使うのか?どのように使うのか?

KNN: K最近傍法は、機械学習を始めるための基本的なアルゴリズムの一つです。機械学習モデルは、…

towardsdatascience.com

KNNの簡単な紹介

次元の呪いに入る前に、KNNアルゴリズムを簡単に説明します。基本的な意味で、KNNアルゴリズムは似たアイテムを一緒にまとめ、文字通り「最近の隣人」を見つけます。

以下のように機能します:ラベル付きのデータセットが与えられた場合、新しいデータポイントを分類する場合、KNNは特徴空間でK個の最近傍点を特定します。新しいポイントに割り当てられるクラスまたは値は、これらのK個の隣人からの多数派投票(分類の場合)または平均(回帰の場合)によって決定されます。通常、距離尺度によって「最近」が定義されますが、一般的にはユークリッド距離が使用されます。

画像の著者

KNNは、特徴空間内の類似したインスタンスが類似した結果を持つ傾向があるという仮定の下で動作します。これは、非パラメトリックかつインスタンスベースのアルゴリズムであり、基礎となるデータ分布に関しては仮定しないため、予測にはデータセット全体を利用します。このシンプルさが人気の一因ですが、次元の呪いに敏感になることがあります…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

ジョシュ・フィースト、CogitoのCEO兼共同創業者 - インタビューシリーズ

ジョシュ・フィーストは、CogitoのCEO兼共同創業者であり、感情と会話AIを組み合わせた革新的なプラットフォームを提供するエ...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...