2024.4.16
Estimating Physically-Based Reflectance Parameters From a Single Image With GAN-Guided CNN
CHI-HYOUNG RHEE AND CHANG HA LEE
IEEE ACCESS.2022.3147483
物理ベースの反射モデルのパラメータには非直交空間があるという問題があり,物理的に意味のある結果を推定することが困難である.そこで新たな手法として,単一の画像から物理ベースの BRDF モデルのパラメータを推定する方法を提案する.cGAN アーキテクチャを用いて入力画像の補助マップを生成し、それを用いてCNNアーキテクチャから正確なBRDFパラメータの推定を行う.我々の結果は,提案手法が合成画像と実際の画像の両方でBRDFパラメータを推定するのに効果的であることを示した.
(発表者:神取 歩)
2024.4.30
ViTPose: Simple Vision Transformer Baselines for HumanPose Estimation
Yufei Xu, Jing Zhang, Qiming Zhang, Dacheng Tao
36th Conference on Neural Information Processing Systems (NeurIPS 2022).
人間の動作の特性を定量的に測定・理解することは健康面や社会的にも重要であると言われている。間接的に測定する方法としてカメラを用いた映像から姿勢推定する方法が考えられた。本研究はVitを用いたシンプルな構造でありながら、2022年時点で最高精度を示している。また単なる予測精度だけでなく、転移性や拡張性においても優れていることを示した。
(発表者:村井 利成)
2024.5.21
3D Gaussian Splatting for Real-Time Radiance Field Rendering
Bernhard Kerbl Georgios Kopanas Thomas Leinkuhler George Drettakis
Computer Vision and Pattern Recognition 2023
Radiance Fields法は、近年複数の写真やビデオで撮影されたシーンの自由視点合成に革命をもたらした。しかし、高い視覚的品質を達成するには学習とレンダリングにコストのかかるニューラルネットワークが依然として必要である。我々は3次元ガウシアンを用いることで、最も高速な手法と同様のトレーニング速度と品質を達成することができ、自由視点合成のための高品質な初のリアルタイムレンダリングを提供した。
(発表者:山﨑 奎典)
2024.5.28
Simple Baselines for Image Restoration
Liangyu Chen, Xiaojie Chu, Xiangyu Zhang, and Jian Sun
European Conference on Computer Vision 2022
近年、画像復元の分野では著しい進歩が見られるが、最先端の(SOTA)手法のシステムは複雑性も増加しており、手法の簡便な解析や比較の妨げになっている可能性がある。本論文では、SOTA法を凌駕し、計算効率の良いシンプルなベースラインを提案する。ベースラインをさらに単純化するために、非線形活性化関数は必要ないことを明らかにする。ベースラインから非線形活性化フリーネットワーク、すなわちNAFNetを導出する。GoPro(画像デブラーリング)において、33.69dBのPSNRを達成し従来のSOTAをわずか8.4%の計算コストで上回った。
(発表者:杵渕 雅也)
2024.6.4
Estimation of blood pressure waveform from facial video using a deep U-shaped network and the wavelet representation of imaging photoplethysmographic signals
Frédéric Bousefsaf, Théo Desquins, Djamaleddine Djeldjli, Yassine Ouzar, Choubeila Maaoui, Alain Pruski
Biomedical Signal Processing and Control
動画像からの生理学的信号の遠隔測定は、ここ数年特に注目を集めている。 酸素飽和度や動脈血圧(BP)などの心血管パラメータの推定は、限られた量の研究でカバーされており、依然として非常に困難な問題である。 本研究では、対応するiPPG信号から血圧波形を回復するために、深い U 字型ニューラル ネットワークを開発およびトレーニングした。 このモデルは、BP 信号の連続ウェーブレット変換 (CWT) 表現を iPPG 信号の CWT から予測する。
提案されたフレームワークは、AAMI と BHS によって開発された国際標準を使用して 57 人の参加者を対象に評価された。 結果は、正解の BP 値とほぼ一致している。 この方法は、平均血圧と拡張期血圧の推定におけるすべての基準を満たし、収縮期血圧の推定におけるほぼすべての基準を満たした。
(発表者:外山 幸太)
2024.6.11
Real-Time Deep Learning-Based Drowsiness Detection: Leveraging Computer-Vision and Eye-Blink Analyses for Enhanced Road Safety.
Furkat Safarov, Farkhod Akhmedov, Akmalbek Bobomirzaevich Abdusalomov, Rashid Nasimov, Young Im Cho
Sensors 2023, 23, 6459
居眠り運転は周囲の安全性に悪影響を与える.主な原因は運転者の注意力と警戒心の低下である.CNNやRNN,画像処理を組み合わせた居眠り検出システムは特に目の瞬きパターンを分析する方法で効果的である.この研究ではカスタムデータを用いてモデルを訓練し,目と口のランドマークを分析した.結果的に,欠伸と閉じた瞼の動きには相関があり居眠り検出モデルの性能は高く,居眠り検出で95.8%,開いた眼の検出で97%の精度を示した.
(発表者:石黒 理雄)
2024.6.25
Multi-View Cross-Fusion Transformer Based on Kinetic Features for Non-Invasive Blood Glucose Measurement Using PPG Signal
Shisen Chen, Fen Qin, Xuesheng Ma, Jie Wei, Yuan-Ting Zhang, Yuan Zhang
IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS, VOL. 28, NO. 4, APRIL 2024
本論文では,糖尿病の予防と管理に大きく貢献する可能性のある非侵襲的な血糖値(BG)測定のための新たなアプローチとして,フォトプレチスモグラフィー(PPG)信号の分析に基づいた信号前処理の最適化とMulti-View Cross-Fusion Transformer(MvCFT)ネットワークを提案する.具体的には,空間位置エンコーディングに基づく運動学的特徴を構築し,生理学的パターンを識別するための事前知識として組み込む.さらに、異なるビュー間のペアワイズ相互情報を取り入れるcross-view feature fusion(CVFF)モジュールを設計し、生理学的シーケンスの潜在的な補完的特徴を捉える.結果として,血糖値測定のRMSEは1.129 mmol/L,MAEは0.659 mmol/Lであり,クラークエラーグリッドのゾーンA(臨床リスクなし)は87.89%という結果が得られ,この方法が血糖値モニタリングに大きな可能性を持つことが示された.
(発表者:今井 良祐)
2024.7.2
PPG-based blood pressure estimation can benefit from scalable multi-scale fusion neural networks and multi-task learning
Qihan Hu, Daomiao Wang, Cuiwei Yang
Biomedical Signal Processing and Control Volume 78, September 2022, 103891
血圧の連続測定は、心血管疾患の予防に重要な役割を果たすが,一般的なカフベースのデバイスでは、連続的なBPモニタリングを実現することは困難である.そこで,本研究ではエンドツーエンドのマルチスケール融合およびマルチタスク学習ニューラルネットワーク(MSF-MTLNet)に基づく連続BP推定方法を提案した.8秒間のPPGセグメントとその派生物を入力として使用し、マルチスケール機能を自動的に学習することで,推定精度を向上させることができる.推定した収縮期血圧と拡張期血圧の推定誤差の平均と標準偏差は,それぞれ 0.97 ± 8.87 mmHg と 0.55 ± 4.23 mmHg で,現在の最先端の方法よりも優れており,医療機器開発協会の基準をほぼ満たす結果が得られた.
(発表者:川嵜 彩恵)