「GoogleのDeblur AI:画像を鮮明にする」

Google's Deblur AI Enhancing Image Clarity

ぼやけた画像とおさらばしましょう。Googleの新しい手法は、あなたのスマートフォンのカメラの真の可能性を引き出します。

作者による画像

イントロダクション

私たちの進化し続けるデジタル時代において、写真を通じて瞬間を捉え、共有することが私たちの生活の一部となっています。しかし、ぼやけた画像に悩まされることは心を痛めるものです。大切な家族の写真、息をのむような風景、特別な場面のスナップショットなど、ぼやけた画像は視覚的なインパクトを損ない、私たちが望む明瞭さを奪ってしまいます。

しかし、心配しないでください。Googleの新しい手法を使えば、スマートフォンから直接クリアな画像をキャプチャする方法が提供されます。最近のほとんどのスマートフォンには複数のカメラが搭載されています。Googleは、2つの異なるカメラからの単一のキャプチャを使用し、学習可能な事後処理を使ってぼやけた画像をリフォーカスします。広角(W)カメラと超広角(UW)カメラを同時に使用して同じシーンをキャプチャし、両者を組み合わせてより鮮明な結果を得ることを目指しています。

アーキテクチャ

論文からの画像

DFNetモデルは、同じシーンの広角画像と超広角画像を入力として受け取り、それぞれのアウトフォーカスマップと共に処理します。入力とターゲットのアウトフォーカスマップは、元の画像と出力画像のぼやけ具合を表現しており、各ピクセルの値は対応する画像ピクセルのぼやけ具合に比例しています。

超広角画像と広角画像は非常に異なるため、被写界深度、対称性、焦点、色合いが異なります。これらの画像を組み合わせることは簡単な作業ではありません。そのため、Googleはこれらの画像を繋ぎ合わせるための学習ベースの手法を導入しています。

モデルは広角画像をベースとし、超広角画像を高周波詳細の参照として使用します。モデルは、提供されたアウトフォーカスマップに従って両方の画像をブレンドし、出力がぼやけていない画像になるようにします。

テスト時には、必要に応じてターゲットのアウトフォーカスマップを簡単に変更できます。

論文からの画像

上記のように、完全にクリアな画像を生成するためには、アウトフォーカスマップをすべてゼロに設定することができます。これにより、モデルは画像のすべての部分をぼやけていない状態にすることができます。その他の場合では、テスト時に提供されたアウトフォーカスマップに従って、画像の特定の部分をぼやけさせることも可能です。

結果

PSNRスコアが29.78、SSIMスコアが0.898となり、この事後処理手法は、定性的および定量的な分析の両方で以前の手法を凌駕しています。

論文からの画像
論文からの画像

結果は、以前の手法とGoogleのDFNetとの比較で示され、DFNetの方がより鮮明さと詳細を備えています。

このモデルは、画像のリフォーカス、被写界深度(DoF)制御と再レンダリング、ぼやけ除去といった領域での潜在的な利用があります。

制限事項

複数のカメラが必要

このモデルは、高周波詳細の参照となる広角および超広角カメラを使用しています。両方の画像は、異なる被写界深度であり、シーンの異なる部分に焦点を合わせています。同一のカメラからキャプチャされた画像では、このような結果を再現することはできません。また、デュアルカメラを搭載したスマートフォンに大きく依存しており、単一の画像入力では画像の復元はできません。

データセットの生成

広角および超広角の画像データセットを広く利用できるようにすることは困難です。また、実世界のシナリオでノイズを再現できる画像にガウシアンブラーを追加して合成することも不可能です。ドメインのギャップを減らすために、著者はこの手法のために100の画像スタックをキャプチャしました。

既存の手法への依存

データの前処理部分では、デフォーカスマップ、深度、および遮蔽マスクを生成するために必要です。前処理では、重大なアーティファクトを生成することで知られる既存のオプティカルフローとステレオ深度アルゴリズムを使用しています。これにより、出力画像の劣化が引き起こされます。

結論

ぼやけた画像に終止符を打ちましょう。Googleの最新の画像復元技術により、ぼやけた画像を解消することができます。これがスマートフォンのカメラのAIに組み込まれれば、毎日完璧な写真を見ることができます。

詳細な理解のために論文を読むことをお勧めします。

論文: https://defocus-control.github.io/static/dc2_paper.pdf

この記事が気に入った場合、そして機械学習や最新の研究コミュニティの進歩についてもっと学びたい場合は、フォローしてください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

ビジネス戦略において機械学習を使用する時と使用しない時の選択

それは明らかな質問ではありません初心者のデータサイエンティストにとっては、すぐに機械学習モデルを推進することは間違い...

機械学習

AIキャリアのトレンド:人工知能の世界で注目されているものは何ですか?

急速に成長しているAI分野でのキャリアをお探しですか?エキサイティングな機会を提供するAIキャリアのトップ6つを発見してく...

AI研究

UC San Diegoの研究者たちは、EUGENeという使いやすいディープラーニングゲノミクスソフトウェアを紹介します

ディープラーニングは生活のあらゆる分野で使用されています。あらゆる領域でその有用性があります。バイオメディカル研究に...

AI研究

東京理科大学の研究者は、材料科学におけるこれまで知られていなかった準結晶相を検出する深層学習モデルを開発しました

物質における新しい結晶構造を発見する探求は、電子から製薬まで幅広い産業において重要な意味を持ち、科学的な探求の中核と...

AIニュース

「アマゾン対アリババ:会話型AI巨大企業の戦い」

テクノロジーの絶え間ない進化の中で、2つのグローバル企業が会話型AIの領域で真っ向勝負を繰り広げる。eコマースの巨人であ...

人工知能

「もしスローガンが真実だったら(ChatGPTによると)」

「私たちはChatGPTに、世界最大の企業のスローガンを再現するように依頼しました今回は、彼らは真実を伝えなければなりません...