「3年間の経験から厳選された130の機械学習のテクニックとリソース(さらに無料のeBookも含む)」

130 selected machine learning techniques and resources from 3 years of experience (including a free eBook)

それぞれの記事はあなたの時間に値する

Midjourneyで作成した私の画像。他のすべての画像とGIFは、別に指定しない限り私が作成しました。

イントロダクション

データサイエンスと機械学習には、二種類のトリックがあります。一つは珍しくてとてもクールなトリックです。それらはあなたの注意を引くために設計されていますが、最終的には使用しないでしょう。なぜなら、それらの使用ケースがあまりにも狭いからです。可読性の点でひどいPythonの1行コードを思い浮かべてください。

二つ目のカテゴリには、珍しくてクールで非常に有用なトリックがあります。これらはすぐにあなたの仕事で使い始めるでしょう。

私はデータに関する3年間の旅を通じて、二つ目のカテゴリに属する100以上のトリックとリソースを収集し、オンラインブック「Tricking Data Science」にまとめました(一部は時々一つ目のカテゴリと重なるかもしれません)。

オンラインブックには200以上のアイテムがあり、きちんと整理されていますが、VoAGIではより良い読書体験を提供するために、その中から最も優れた130を一つの記事にまとめました。

お楽しみください!

もしもフル記事を読むことなく、オンラインブックにジャンプしたい場合には、50回拍手してから私をフォローしてください 🙂

トリック

1. ELI5を使った順列重要度

順列重要度は、モデル内の重要な特徴を見るための最も信頼性の高い方法の一つです。

その利点:

  1. どのようなモデル構造でも動作します
  2. 解釈と実装が容易です
  3. 一貫性があり信頼性があります

特徴の順列重要度は、その特徴をランダムにシャッフルした場合のモデルの性能の変化として定義されます。

順列重要度はeli5パッケージを介して利用できます。以下はXGBoost Regressorモデルの順列重要度スコアです👇

show_weights関数は、シャッフル後にモデルの性能に最も影響を与える特徴を表示します。つまり、最も重要な特徴です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ジャスティン・マクギル、Content at Scaleの創設者兼CEO - インタビューシリーズ」

ジャスティンは2008年以来、起業家、イノベーター、マーケターとして活動しています彼は15年以上にわたりSEOマーケティングを...

人工知能

「サティスファイラボのCEO兼共同創設者、ドニー・ホワイト- インタビューシリーズ」

2016年に設立されたSatisfi Labsは、会話型AI企業のリーディングカンパニーです早期の成功は、ニューヨーク・メッツ、メイシ...

人工知能

「Zenの共同創設者兼CTO、イオン・アレクサンドル・セカラ氏によるインタビューシリーズ」

創業者兼CTOであるIon-Alexandru Secaraは、Zen(PostureHealth Inc.)の開発を牽引しており、画期的な姿勢矯正ソフトウェア...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

データサイエンス

「2023年にデータサイエンスFAANGの仕事をゲットする方法は?」

データサイエンスは非常に求められる分野となり、FAANG(Facebook、Amazon、Apple、Netflix、Google)企業での就職は大きな成...