分類器のアンサンブル:投票分類器

分類器のアンサンブル:投票分類器

さまざまなモデルを組み合わせてより良い予測を行う

決定境界と投票分類器(画像:著者による、参考文献内のコード)

MLの文脈でのアンサンブルとは、同じタスクのために訓練された有限な数のMLモデル(ANNを含む場合もあります)のコレクションを指します。通常、モデルは独立して訓練され、その予測が組み合わされます。

異なるモデルの予測が異なる場合、個々の分類器よりもアンサンブルを使用して分類する方が有用な場合があります。ここでは、異なる分類器を組み合わせてアンサンブルを作成し、そのアンサンブルを予測タスクに使用したいと思います。この記事では以下が議論されます。

  • SklearnのVotingClassifierを使用してアンサンブルを構築する。
  • VotingClassifierのハードボーティングとソフトボーティングとは何か。
  • VotingClassifierで個々のモデルの性能をチェックする。
  • 最終的には、GridSearchCV + VotingClassifierを使用して個々のモデルの最適なパラメータを見つける。

さあ、始めましょう!

データの準備:

VotingClassifierの実際の例を見るために、心不全予測データセット(オープンデータベースライセンスで利用可能)を使用しています。ここでは、特定の属性を持つ患者が心臓疾患を持っているかどうかを予測するための2値分類が課題です。データセットには、900人以上の患者の年齢、性別、安静時血圧など、10の属性が含まれています。さまざまなパラメータのいくつかの分布をチェックしてみましょう。’ClassLabel’の数(1は心臓疾患を示し、0は健康を示します)を、性別の関数としてチェックします。

図1:参加者の性別を関数とするClassLabelの分布(画像:著者による、参考文献内のコード)

一般的には、男性の方が女性よりも病気の割合が高いことがわかります。また、コレステロールと安静時血圧のような個々の特徴もチェックできます。以下に示すように、コレステロールと安静時血圧は病気の患者では高く、特に女性の場合に顕著です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

AIテクノロジー

「LXTのテクノロジーバイスプレジデント、アムル・ヌール・エルディン - インタビューシリーズ」

アムル・ヌール・エルディンは、LXTのテクノロジー担当副社長ですアムルは、自動音声認識(ASR)の文脈での音声/音響処理と機...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...