「3年間の経験から厳選された130の機械学習のテクニックとリソース(さらに無料のeBookも含む)」

130 selected machine learning techniques and resources from 3 years of experience (including a free eBook)

それぞれの記事はあなたの時間に値する

Midjourneyで作成した私の画像。他のすべての画像とGIFは、別に指定しない限り私が作成しました。

イントロダクション

データサイエンスと機械学習には、二種類のトリックがあります。一つは珍しくてとてもクールなトリックです。それらはあなたの注意を引くために設計されていますが、最終的には使用しないでしょう。なぜなら、それらの使用ケースがあまりにも狭いからです。可読性の点でひどいPythonの1行コードを思い浮かべてください。

二つ目のカテゴリには、珍しくてクールで非常に有用なトリックがあります。これらはすぐにあなたの仕事で使い始めるでしょう。

私はデータに関する3年間の旅を通じて、二つ目のカテゴリに属する100以上のトリックとリソースを収集し、オンラインブック「Tricking Data Science」にまとめました(一部は時々一つ目のカテゴリと重なるかもしれません)。

オンラインブックには200以上のアイテムがあり、きちんと整理されていますが、VoAGIではより良い読書体験を提供するために、その中から最も優れた130を一つの記事にまとめました。

お楽しみください!

もしもフル記事を読むことなく、オンラインブックにジャンプしたい場合には、50回拍手してから私をフォローしてください 🙂

トリック

1. ELI5を使った順列重要度

順列重要度は、モデル内の重要な特徴を見るための最も信頼性の高い方法の一つです。

その利点:

  1. どのようなモデル構造でも動作します
  2. 解釈と実装が容易です
  3. 一貫性があり信頼性があります

特徴の順列重要度は、その特徴をランダムにシャッフルした場合のモデルの性能の変化として定義されます。

順列重要度はeli5パッケージを介して利用できます。以下はXGBoost Regressorモデルの順列重要度スコアです👇

show_weights関数は、シャッフル後にモデルの性能に最も影響を与える特徴を表示します。つまり、最も重要な特徴です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

AIニュース

OpenAIのCEOであるSam Altman氏:AIの力が証明されるにつれて、仕事に関するリスクが生じる

OpenAIのCEOであるSam Altmanは、特に彼の作品であるChatGPTに関するAIの潜在的な危険性について公言してきました。最近のイ...

人工知能

「aiOlaのCEO兼共同創設者、アミール・ハラマティによるインタビューシリーズ」

アミール・ハラマティは、aiOlaのCEO兼共同創業者であり、スピーチを作業可能にし、どこでも完全な正確さで業界固有のプロセ...

人工知能

Diginiのスマートセンスの社長、ガイ・イエヒアブによるインタビューシリーズ

ガイ・イハイアヴ氏は、ビジネスの成功に最も重要な資産を保護するためにインターネット・オブ・シングス(IoT)の力を活用す...