「教師付き機械学習と集合論を通じた現実世界の時系列異常検出」

Real-world time series anomaly detection through supervised machine learning and set theory

シアトルバーク・ギルマン・トレイル

シアトル市のオープンデータを探索する

目次:

I. 問題の設定

II. 時系列データの監視型問題へのリモデリング

III. 監視型モデリングと分析

I. 問題の設定

データはこちらからダウンロードできます: シアトルバーク・ギルマン・トレイル | Kaggle

この問題の本質は、3時間後にトレイル上の総人数が500人を超える異常を検出する必要があるということです。異常は、ペデストリアンと自転車のトレイルの1時間ごとのデータが与えられているため、解決するためには3時間後のデータを予測する必要があります。

II. 時系列データの監視型問題へのリモデリング

では、データの2つのコピーを作成し、データを結合して、0時のデータが同じ行の3時にマッピングされるようにすることができます。

これはどのように行われるのでしょうか。

まず、データを取り込みます:

import pandas as pddf = pd.read_csv(r’/content/burke-gilman-trail-north-of-ne-70th-st-bike-and-ped-counter.csv’)

次に:

# dfをdataframeに変更df = pd.DataFrame(df)

df = df.fillna(0)

これを行った後、4行目から始まるデータのコピーを作成します:

# 4行目から始まるdf2を作成df2 = df[df.index >= 3]df2.head()

次に、両方のデータフレームに1から始まるインデックス列を追加します:

# df1とdf2の両方に番号の列を追加します。最初の行は1、2番目の行は2、以降の行も同様ですdf['index'] = list(range(1, len(df) + 1))df2['index'] = list(range(1, len(df2) + 1))

これを行う理由は、インデックス列で結合するためです。インデックス1はdf2のインデックス1に結合されますが、その行では左側には0時、右側には3時が表示されます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

中国における大量生産自動運転の課題

自律走行は、世界でも最も困難な運転の一つが既に存在する中国では、特に難しい課題です主に3つの要因が関係しています:動的...

AIニュース

生成AIにおけるプロンプトエンジニアリングの基本原則

導入 この記事では、生成型AIにおけるChatGPTプロンプトエンジニアリングについて説明します。ChatGPTは2022年11月以来、技術...

AI研究

このAI研究論文は、視覚の位置推定とマッピングのための深層学習に関する包括的な調査を提供しています

もし私があなたに「今どこにいるの?」または「周りの様子はどうですか?」と尋ねたら、人間の多感覚知覚という独特な能力の...

データサイエンス

十年生のためのニューラルネットワークの簡略化

複雑なニューラルネットワークの概念を、コスト関数、ニューロン、バックプロパゲーション、重みとバイアスを非技術的で楽し...

機械学習

インドのOla CEO、ブハビッシュ・アガルワルがAI開発に進出します

ダイナミックなテックの風景の中で、インドはAI分野で野心的な新興企業を生み出しています。Ola CEOのBhavish Aggarwalが率い...

機械学習

「FastEmbedをご紹介:高速かつ軽量なテキスト埋め込み生成のためのPythonライブラリ」

言葉やフレーズは、埋め込みを使用して高次元空間で効果的に表現することができます。これは、自然言語処理(NLP)の分野で重...