「IID 初心者のための意味と解釈」

IID初心者の意味と解釈

独立かつ同一分布

写真:Yu Kato on Unsplash

統計学、データ分析、および機械学習のトピックでは、IID(Independent and Identically Distributed)という概念が頻繁に基本的な仮定または条件として現れます。IIDは「独立かつ同一分布」を意味します。IIDのランダム変数またはシーケンスは、統計モデルや機械学習モデルの重要な要素であり、時系列解析にも役割を果たします。

この投稿では、直感的な方法で、サンプリング、モデリング、および予測性の3つの異なる文脈でIIDの概念を説明します。時系列解析と予測性の文脈でRコードを使用したアプリケーションが紹介されます。

サンプリングにおけるIID

表記X ~ IID(μ,σ²)は、平均μと分散σ²を持つ母集団から(X1、…、Xn)を純粋にランダムにサンプリングしていることを表します。

  • Xの各連続する実現値は、前の値や後の値と関連性を示さず、独立しています。
  • Xの各連続する実現値は、同じ分布から同一の平均と分散を持つように得られます。

ある国の個人の年収の分布からサンプル(X1、…、Xn)を収集したとします。

  1. 研究者がX1に男性の収入、X2に女性の収入、X3に男性の収入、そしてX4に女性の収入を選択し、このパターンがXnまで続くとします。これはIIDのサンプリングではありません。なぜなら、サンプリングに予測可能なパターンやシステマティックなパターンが存在するため、独立性の条件に違反しているからです。
  2. 研究者が(X1、…、X500)を最も貧しいグループから選び、次に(X501、…、X1000)を最も裕福なグループから選んだとします。これもIIDのサンプリングではありません。なぜなら、2つのグループが異なる収入分布を持ち、異なる平均と分散を持っているため、同一性の条件に違反しているからです。

モデリングにおけるIID

Yがモデル化または説明したい興味のある変数であるとします。それを次の2つの要素に分解できます。

Y = システマティックな要素 + ノイズ要素

システマティックな要素は、他の要素との基本的な関係によって推進されるYの一部です。それは…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「クリス・サレンス氏、CentralReachのCEO - インタビューシリーズ」

クリス・サレンズはCentralReachの最高経営責任者であり、同社を率いて、自閉症や関連する障害を持つ人々のために優れたクラ...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

ギル・ジェロン、Orca SecurityのCEO&共同創設者-インタビューシリーズ

ギル・ゲロンは、オルカ・セキュリティのCEO兼共同設立者ですギルは20年以上にわたりサイバーセキュリティ製品をリードし、提...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...

人工知能

「シフトのCEOであるクリス・ナーゲル – インタビューシリーズ」

クリスはSiftの最高経営責任者です彼は、Ping Identityを含むベンチャー支援および公開SaaS企業のシニアリーダーシップポジシ...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...