ドキュメントAIの加速

ドキュメントAIの進化

企業は、デジタルワークフローではアクセスできない知識を含むドキュメントで溢れています。これらのドキュメントには、手紙、請求書、フォーム、レポート、領収書などさまざまなものがあります。テキスト、ビジョン、マルチモーダルAIの改善により、その情報を解放することが可能になりました。この投稿では、チームがオープンソースのモデルを使用してカスタムソリューションを無償で構築する方法を紹介します!

ドキュメントAIには、イメージ分類、イメージからテキストへの変換、ドキュメントの質問応答、表の質問応答、ビジュアルの質問応答など、多くのデータサイエンスのタスクが含まれています。この投稿では、Document AI内のユースケースのタクソノミーとそれに対する最適なオープンソースモデルに焦点を当てています。次に、ライセンス、データの準備、モデリングについて説明します。この投稿では、Webデモ、ドキュメンテーション、モデルへのリンクがあります。

ユースケース

ドキュメントAIソリューションを構築するための一般的なユースケースは少なくとも6つあります。これらのユースケースは、ドキュメントの入力と出力の種類が異なります。企業のドキュメントAIの問題を解決する際には、しばしばアプローチの組み合わせが必要です。

DiTを使用したドキュメントのレイアウト分析。

ドキュメントのレイアウト分析では、一般的にオブジェクト検出モデルの評価によく使用されるmAP(平均適合率)メトリックが使用されます。レイアウト分析の重要なベンチマークはPubLayNetデータセットです。最新の状態のLayoutLMv3は、全体的なmAPスコアが0.951(ソース)を達成しています。

次のステップ

Document AIの可能性を見ていますか?私たちは日々、最先端のビジョンと言語モデルを使用して、企業と一緒に貴重なデータを解放するために取り組んでいます。この投稿では、さまざまなデモへのリンクを含めたので、それらを出発点として活用してください。投稿の最後のセクションには、ビジュアルの質問応答など、独自のモデルをコーディングし始めるためのリソースが含まれています。ソリューションの構築を開始する準備ができたら、Hugging Faceパブリックハブは素晴らしい出発点です。さまざまなDocument AIモデルがホストされています。

Document AIの取り組みを加速させたい場合、Hugging Faceがお手伝いします。エンタープライズアクセラレーションプログラムを通じて、AIのユースケースに関するガイダンスを提供するために企業と提携しています。Document AIの場合、事前学習モデルの構築、ファインチューニングタスクの精度向上、最初のDocument AIユースケースに取り組むための総合的なガイダンスなどを支援することができます。

また、トレーニング(AutoTrain)や推論(SpacesまたはInference Endpoints)製品の大規模な使用に対して、計算クレジットのバンドルを提供することもできます。

リソース

多くのDocument AIモデルのノートブックとチュートリアルは以下で見つけることができます:

  • NielsのTransformers-Tutorials
  • PhilippのHugging Face TransformersによるDocument AI

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

「Ntropyの共同創設者兼CEO、ナレ・ヴァルダニアンについて - インタビューシリーズ」

「Ntropyの共同創設者兼CEOであるナレ・ヴァルダニアンは、超人的な精度で100ミリ秒以下で金融取引を解析することを可能にす...

人工知能

エンテラソリューションズの創設者兼CEO、スティーブン・デアンジェリス- インタビューシリーズ

スティーブン・デアンジェリスは、エンタラソリューションズの創設者兼CEOであり、自律的な意思決定科学(ADS®)技術を用いて...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

「Kognitosの創設者兼CEO、ビニー・ギル- インタビューシリーズ」

ビニー・ギルは、複数の役職と企業を横断する多様で幅広い業務経験を持っていますビニーは現在、Kognitosの創設者兼CEOであり...