「本当にあのキノコを食べるべきか?」

「あのキノコを食べるべきか?」

CatBoost勾配ブースティング決定木を使った食用と有毒なキノコの分類

ほとんどの教育および実世界のデータセットにはカテゴリカルな特徴が含まれています。今日は、カテゴリカルデータのネイティブサポートを提供するCatBoostライブラリから勾配ブースティング決定木を取り上げます。食用または有毒なキノコのデータセットを使用します。キノコは色、匂い、形状などのカテゴリカルな特徴で説明されており、私たちが答えたい質問は次のとおりです:

このキノコは安全に食べられるでしょうか — カテゴリカルな特徴に基づいて?

ご覧の通り、賭けは大きいです。私たちは機械学習モデルを正しく作成して、キノコオムレツが災害に終わらないようにしたいのです。 ボーナスとして、最後にカテゴリカルな特徴の重要度ランキングを提供します。これにより、キノコの安全性の最も強力な予測子がわかります。

Andrew Ridley氏による写真

キノコデータセットの紹介

キノコデータセットはこちらで入手できます:https://archive.ics.uci.edu/dataset/73/mushroom [1]。プレゼンテーションの明確さのために、元の難解な省略形の変数からpandasのDataFrameを作成し、適切な列名と長い形式の変数で注釈を付けます。データセットの説明から取得した長い形式の変数をpandasのreplace関数に使用します。ターゲット変数はTrueとFalseの値のみを取ることができます — データセット作成者は疑問のあるキノコを食べられないと分類しました。

欠損値のあるデータセットをチェックした結果、1つの列、stalk_rootだけが影響を受けていることがわかりました。この列を削除します。

データセットの探索により、データがかなりバランスしていることがわかります:8124個のキノコのうち、4208個は…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「マーシャンの共同創設者であるイータン・ギンスバーグについてのインタビューシリーズ」

エタン・ギンズバーグは、マーシャンの共同創業者であり、すべてのプロンプトを最適なLLMに動的にルーティングするプラットフ...

人工知能

ギル・ジェロン、Orca SecurityのCEO&共同創設者-インタビューシリーズ

ギル・ゲロンは、オルカ・セキュリティのCEO兼共同設立者ですギルは20年以上にわたりサイバーセキュリティ製品をリードし、提...

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...