ヒストグラムに対する3つの最良の(しばしばより良い)代替方法

ヒストグラムの最良の代替方法3つ

ヒストグラムの最も危険な落とし穴を避ける方法

Leonardo AIによるイメージ

ビニングバイアス、ヒストグラムの最大の欠点

ヒストグラムは、データサイエンティストとしての旅立ちにおいて、おそらく最初に使用したプロットです。彼らは直感的で、分布の形状を理解するのに簡単なプロットです。

しかし、旅を進めるにつれて、ヒストグラムがそんなに理想的ではないことがわかるでしょう。ヒストグラムは値をビンと呼ばれる区間にグループ化し、ヒストグラム内の各ビンの高さはそのビン内の点の数を示します。以下の例を考えてみましょう:

著者によるイメージ

このヒストグラムから、ほとんどのスコアが60から80の間にあることがすぐにわかります。では、ビンの数を10から20に変更した場合はどうなるでしょう:

著者によるイメージ

それでも、前の傾向は明らかです。では、今度は20から40に変更してみましょう:

著者によるイメージ

これで、分布が見かけほどスムーズではないことがわかります。40のビンでは、40、62、68、80周辺に小さなピークが見られます。したがって、ビンの数は実際には分布に関する重要な洞察を隠す可能性があります。

ただし、ビンの数をあまりにも変更しすぎると、ランダムなノイズが導入されて重要な発見のように見えるかもしれません。これがヒストグラムの最大の欠点であるビニングバイアスです。

ビニングバイアスは、プロットのためのビンの数を変更すると同じデータの異なる表現が得られるヒストグラムの落とし穴です。

後のセクションでは、ビニングバイアスを回避し、分布を比較するためにより良い結果を提供する3つのヒストグラムの代替手段を見ていきます。

離散データと連続データの復習

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

「マーシャンの共同創設者であるイータン・ギンスバーグについてのインタビューシリーズ」

エタン・ギンズバーグは、マーシャンの共同創業者であり、すべてのプロンプトを最適なLLMに動的にルーティングするプラットフ...

人工知能

『ジュリエット・パウエル&アート・クライナー、The AI Dilemma – インタビューシリーズの著者』

『AIのジレンマ』は、ジュリエット・パウエルとアート・クライナーによって書かれましたジュリエット・パウエルは、著者であ...

機械学習

「機械学習 vs AI vs ディープラーニング vs ニューラルネットワーク:違いは何ですか?」

テクノロジーの急速な進化は、ビジネスが効率化のために洗練されたアルゴリズムにますます頼ることで、私たちの日常生活を形...

人工知能

「Zenの共同創設者兼CTO、イオン・アレクサンドル・セカラ氏によるインタビューシリーズ」

創業者兼CTOであるIon-Alexandru Secaraは、Zen(PostureHealth Inc.)の開発を牽引しており、画期的な姿勢矯正ソフトウェア...

人工知能

「マーク・A・レムリー教授による生成AIと法律について」

データサイエンス内で新しい分野が現れ、研究内容が理解しにくい場合は、専門家やパイオニアと話すことが最善です最近、私た...