「3年間の経験から厳選された130の機械学習のテクニックとリソース(さらに無料のeBookも含む)」

130 selected machine learning techniques and resources from 3 years of experience (including a free eBook)

それぞれの記事はあなたの時間に値する

Midjourneyで作成した私の画像。他のすべての画像とGIFは、別に指定しない限り私が作成しました。

イントロダクション

データサイエンスと機械学習には、二種類のトリックがあります。一つは珍しくてとてもクールなトリックです。それらはあなたの注意を引くために設計されていますが、最終的には使用しないでしょう。なぜなら、それらの使用ケースがあまりにも狭いからです。可読性の点でひどいPythonの1行コードを思い浮かべてください。

二つ目のカテゴリには、珍しくてクールで非常に有用なトリックがあります。これらはすぐにあなたの仕事で使い始めるでしょう。

私はデータに関する3年間の旅を通じて、二つ目のカテゴリに属する100以上のトリックとリソースを収集し、オンラインブック「Tricking Data Science」にまとめました(一部は時々一つ目のカテゴリと重なるかもしれません)。

オンラインブックには200以上のアイテムがあり、きちんと整理されていますが、VoAGIではより良い読書体験を提供するために、その中から最も優れた130を一つの記事にまとめました。

お楽しみください!

もしもフル記事を読むことなく、オンラインブックにジャンプしたい場合には、50回拍手してから私をフォローしてください 🙂

トリック

1. ELI5を使った順列重要度

順列重要度は、モデル内の重要な特徴を見るための最も信頼性の高い方法の一つです。

その利点:

  1. どのようなモデル構造でも動作します
  2. 解釈と実装が容易です
  3. 一貫性があり信頼性があります

特徴の順列重要度は、その特徴をランダムにシャッフルした場合のモデルの性能の変化として定義されます。

順列重要度はeli5パッケージを介して利用できます。以下はXGBoost Regressorモデルの順列重要度スコアです👇

show_weights関数は、シャッフル後にモデルの性能に最も影響を与える特徴を表示します。つまり、最も重要な特徴です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

アステラソフトウェアのCOO、ジェイ・ミシュラ - インタビューシリーズ

ジェイ・ミシュラは、急速に成長しているエンタープライズ向けデータソリューションの提供企業であるAstera Softwareの最高執...

人工知能

スコット・スティーブンソン、スペルブックの共同創設者兼CEO- インタビューシリーズ

スコット・スティーブンソンは、Spellbookの共同創設者兼CEOであり、OpenAIのGPT-4および他の大規模な言語モデル(LLM)に基...

人工知能

「マーシャンの共同創設者であるイータン・ギンスバーグについてのインタビューシリーズ」

エタン・ギンズバーグは、マーシャンの共同創業者であり、すべてのプロンプトを最適なLLMに動的にルーティングするプラットフ...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...