Airbnbの研究者がChrononを開発:機械学習モデルの本番用機能を開発するためのフレームワーク

Airbnbの研究者がChrononを開発

機械学習の絶え間なく進化する風景において、特徴管理はAirbnbのMLエンジニアにとって重要な課題となっています。彼らはさまざまな製品のための革新的なモデルを作成することを目指していますが、モデルにすべての焦点を当てる代わりに、インフラの複雑さに時間を費やすことがしばしばあります。Airbnbは、特徴データの管理を効率化し、リアルタイムの更新を提供し、トレーニングと本番環境の整合性を確保する解決策の必要性を認識しました。

そこで登場するのがChrononです。Airbnbチームによって設計された強力なAPIで、これらの課題に対処することを目指しています。Chrononは、MLプラクティショナーが特徴を定義し、モデルのトレーニングと本番推論のためのデータ計算を一元化することを可能にし、プロセス全体での正確性と一貫性を保証します。

さまざまなソースからのデータの取り込み

Chrononは、イベントストリーム、データウェアハウスの事実/寸法テーブル、テーブルのスナップショット、変更データストリームなど、さまざまなソースからデータを取り込むことができます。リアルタイムのイベントデータや履歴のスナップショットなど、Chrononはすべてのデータをシームレスに処理します。

柔軟性を持ってデータを変換する

ChrononのSQLのような変換と時間ベースの集計により、MLプラクティショナーは簡単にデータを処理することができます。標準の集計や高度なウィンドウ処理技術など、ChrononのPython APIは、複雑な計算を実行する能力をユーザーに与えながら、完全な柔軟性と組み合わせ性を保証します。

オンラインおよびオフラインの結果生成

Chrononは、オンラインおよびオフラインのデータ生成の要件の両方に対応しています。Chrononは、特徴データを提供する低レイテンシのエンドポイントやトレーニングデータのためのHiveテーブルなど、さまざまなユースケースに適した「Accuracy」パラメータを提供します。これにより、リアルタイムの更新からデイリーのリフレッシュまで、幅広い用途に対応できます。

正確性とデータソースの理解

Chrononの正確性へのユニークなアプローチにより、派生データの望ましい更新頻度を表現することができます。ほぼリアルタイムまたはデイリーの間隔であるかどうかに関係なく、Chrononの「Temporal」または「Snapshot」の正確性モデルは、各ユースケースの特定の要件に合わせて計算が整合することを保証します。

データソースはChrononエコシステムの重要なコンポーネントです。Chrononは、次の3つの主要なデータ取り込みパターンをサポートしています:

  • タイムスタンプ付きアクティビティのためのイベントデータソース
  • ビジネスエンティティに関連する属性メタデータのためのエンティティデータソース
  • 遅変化次元での履歴的な変更を追跡するための累積イベントソース

計算コンテキストとタイプ

Chrononは、オンラインとオフラインの2つの異なるコンテキストで動作します。オンラインの計算は低レイテンシのアプリケーションに提供され、オフラインの計算はバッチジョブを使用してデータウェアハウスのデータセットで実行されます。すべてのChrononの定義は、集計のためのGroupBy、さまざまなGroupBy計算からのデータの組み合わせのためのJoin、およびカスタムのSpark SQL計算のためのStagingQueryの3つのカテゴリに分類されます。

強力な洞察を得るための集計の理解

ChrononのGroupBy集計は、従来のSQLのgroup-by機能にさまざまな拡張機能を提供します。ユーザーは、時間に基づいた集計のためのウィンドウ、追加の粒度のバケット、および配列内のネストデータを処理するための自動展開を活用することができます。さらに、時間ベースの集計は、MLモデルのための洞察に富んだ特徴を作成するためのさらなる柔軟性を提供します。

AirbnbのMLプラクティショナーにとってのシームレスな統合

Chrononは、AirbnbのMLプラクティショナーにとって画期的な変革をもたらしました。Chrononは、特徴エンジニアリングを簡素化することで、MLモデルのパワーを引き出すために数千もの特徴を生成することができるようにユーザーに提供します。この革命的なソリューションにより、MLエンジニアは手動のパイプラインの実装の負担から解放され、常に変化するユーザーの行動と製品の需要に対応する革新的なモデルの構築に集中することができます。

まとめると、ChrononはAirbnbの機械学習の武器庫に欠かせないツールとなりました。包括的な特徴管理ソリューションを提供することで、特徴エンジニアリングの生産性と拡張性を引き上げ、MLプラクティショナーによる最先端のモデルの提供と数百万人のユーザーのAirbnb体験の向上を実現しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

中国からの新しいAI研究は、機械学習の手法と質問を組み合わせることで、指導者と学生の関係のつながりに新たな次元を明らかにします

学生と指導教員の関係は創造性に深い影響を与えます。調和の取れた学生と指導教員の関係は知識の伝達とイノベーションの基盤...

AI研究

「ATLAS研究者は、教師なし機械学習を通じて異常検出を行い、新しい現象を探求しています」

2009年の創設以来、大型ハドロン衝突型加速器(LHC)は、標準模型の限界を超える粒子や現象を明らかにするための先駆的なツー...

データサイエンス

初心者向けの生成AIの優しい紹介

ここ数ヶ月間、いわゆる「生成AI」の台頭が見られますその基礎を理解する時が来ました

AIニュース

「トップAIランダム顔生成アプリ(2023年)」

ランダムフェースジェネレーターは、最先端の画像処理技術を使用してランダムな顔を生成します。ビッグデータ技術によって、...

機械学習

もし、口頭および書面によるコミュニケーションが人間の知能を発展させたのであれば... 言語モデルは一体どうなっているのでしょうか?

人間の知能は、その非凡な認知能力によって、他の種に比べて比類のない存在ですこの知的優位性の原動力は、言語の出現に遡る...

AI研究

ネゲヴのベン・グリオン大学の研究者たちは、社会的規範の違反を特定するAIシステムを設計しました

社会心理学辞典によれば、社会的規範は特定の社会的文脈内で典型的かつ適切な行動を示す社会的に決定された基準です。これら...