XGBoost 最終ガイド(パート1)

XGBoost 最終ガイド(パート1)

Photo by Sam Battaglieri on Unsplash

XGBoost(eXtreme Gradient Boostingの略)は、勾配ブースティング決定木の最適化された拡張可能な実装を提供するオープンソースのライブラリです。さまざまなソフトウェアおよびハードウェアの最適化技術を組み込んでおり、大量のデータに対処することができます。

XGBoostは、Tianqi ChenとCarlos Guestrinによって2016年に研究プロジェクトとして開発されました[1]。XGBoostは、構造化(表形式)データ上の教師あり学習タスクを解決するためのソリューションとして広く使用されています。多くの標準的な回帰および分類タスクで最先端の結果を提供し、多くのKaggleコンペティションの勝者は、勝利のソリューションの一部としてXGBoostを使用しています。

表形式のデータに対しては、深層ニューラルネットワークを使用しても大きな進歩がなされていますが、多くの標準ベンチマークではXGBoostや他のツリーベースのモデルにまだ劣っています[2, 3]。さらに、XGBoostはディープモデルよりもチューニングが少なくて済みます。

XGBoostの主なイノベーションは次のとおりです:

  1. 決定木の巧妙な正則化。
  2. 目的関数の最適化のための2次近似(Newtonブースティング)。
  3. 効率的な計算のための加重分位数スケッチ手順。
  4. 疎なデータを処理するための新しいツリー学習アルゴリズム。
  5. データの並列および分散処理のサポート。
  6. 外部メモリでのツリー学習のためのキャッシュアウェアブロック構造。

このシリーズの記事では、XGBoostを詳しく説明します。アルゴリズムの数学的な詳細、Pythonでのアルゴリズムの実装、XGBoostライブラリの概要、および実際の使用方法についても説明します。

このシリーズの初めの記事では、XGBoostアルゴリズムのステップバイステップの導出、疑似コードによるアルゴリズムの実装、そしておもちゃのデータセット上での動作の説明を行います。

この記事で説明されているアルゴリズムの説明は、XGBoostのオリジナル論文[1]と…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「Ami Hever、UVeyeの共同創設者兼CEO - インタビューシリーズ」

עמיר חבר הוא המנכל והמייסד של UVeye, סטארט-אפ ראיה ממוחשבת בלמידה עמוקה, המציבה את התקן הגלובלי לבדיקת רכבים עם זיהוי...

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

人工知能

ギル・ジェロン、Orca SecurityのCEO&共同創設者-インタビューシリーズ

ギル・ゲロンは、オルカ・セキュリティのCEO兼共同設立者ですギルは20年以上にわたりサイバーセキュリティ製品をリードし、提...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...

人工知能

「ジンディのCEO兼共同創設者、セリーナ・リー― インタビューシリーズ」

「Celina Leeは、ZindiのCEO兼共同創設者であり、アフリカのデータサイエンティスト向けの最大の専門ネットワークです Celina...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...