特徴変換:PCAとLDAのチュートリアル

特徴変換のチュートリアル:PCAとLDA

PCAを使用したデータセットの次元削減

写真:Nicole Cagnina氏撮影、Unsplashより

イントロダクション

高次元データを扱う際には、Principal Component Analysis (PCA)などの手法を使用してデータの次元を削減することが一般的です。これにより、データは異なる(低次元)の特徴セットに変換されます。これは、元の特徴のサブセットを選択する特徴選択とは対照的です(特徴選択のチュートリアルについては[1]を参照)。

PCAはデータを低次元空間に対して線形変換します。この記事では、まず線形変換とは何かを説明し、次にPythonの例を使用してPCAの動作を示します。記事の最後には、教師あり線形変換法であるLinear Discriminant Analysis(LDA)の説明があります。この論文で紹介された手法のPythonコードはGitHubで入手できます。

線形変換

例えば、休暇後にBillがMaryに£5と$15の借金があり、それをユーロ(€)で支払わなければなりません。為替レートは、£1 = €1.15および$1 = €0.93です。したがって、€での借金額は次のようになります:

ここでは、借金を2次元(£、$)から1次元(€)に変換しています。このうち3つの例を図1に示します。オリジナルの借金(£5、$15)と他の2つの借金(£15、$20)および(£20、$35)です。緑の点はオリジナルの借金で、赤の点は1次元に射影された借金です。赤い線はこの新しい次元を表します。

図1。£、$の借金を€に変換する方法のイラスト。著者による画像。

図の左側では、これを行列の乗算として表現する方法が示されています。オリジナルのデータセットは3行2列の行列(3つのサンプル、2つの特徴)であり、為替レートは2つの要素からなる1次元の行列であり、出力は3つの要素からなる1次元の行列です。為替レート行列は変換です。為替レートが変更されると、変換も変更されます。

以下のPythonコードを使用して、この行列の乗算を実行できます。行列はnumpy配列として表されます。最後の行は、行列の乗算(内積)を実行するためにcur行列にdotメソッドを呼び出しています。これ…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「アナコンダのCEO兼共同創業者、ピーターウォングによるインタビューシリーズ」

ピーター・ワンはAnacondaのCEO兼共同創設者ですAnaconda(以前はContinuum Analyticsとして知られる)を設立する前は、ピー...

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

人工知能

Aaron Lee、Smith.aiの共同設立者兼CEO - インタビューシリーズ

アーロン・リーさんは、Smith.aiの共同創業者兼CEOであり、AIと人間の知性を組み合わせて、24時間365日の顧客エンゲージメン...

人工知能

「ジンディのCEO兼共同創設者、セリーナ・リー― インタビューシリーズ」

「Celina Leeは、ZindiのCEO兼共同創設者であり、アフリカのデータサイエンティスト向けの最大の専門ネットワークです Celina...

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...