2025.10.17
Remote blood pressure estimation using BVP signal features from facial videos
Xiujuan Zheng, Binghang Zou, Chang Zhang, Haiyan Tu
Pattern Recognition Letters
本研究では、顔のビデオから非接触で脈波信号を取得し、連続的な血圧推定を行うための新しいrPPG手法を提案している。rPPG信号は血圧推定に有用な心血管情報を多く含むが、環境光や動きなど外乱の影響を受けやすく、信号品質の低下が精度に直結するという課題がある。そこで本研究では、信号処理と特徴選択を組み合わせた高精度化手法を構築した。まず、適応チャープモード分解を用いてノイズを抑制し、相関係数に基づく波形品質分析によって高品質な脈波セグメントを抽出した。次に、平均影響値(MIV)アルゴリズムにより血圧推定に有効な特徴を選択し、BPニューラルネットワークで血圧を推定。さらに、スズメ探索アルゴリズムによりネットワークパラメータを最適化した。自作データセットによる検証の結果、提案手法は標準的な血圧測定基準を満たし、非接触かつ高精度な血圧推定を実現した。
(発表者:杵渕 雅也)
2025.10.17
Real-time driver drowsiness detection using transformer architectures: a novel deep learning approach
Hassan, Osama F., Ahmed F. Ibrahim, Ahmed Gomaa, M. A. Makhlouf, and B. Hafiz.
*Scientific Reports* 15, no. 1 (2025): 17493.
本研究は、Transformerアーキテクチャと転移学習を活用したリアルタイムドライバー眠気検出フレームワークを提案する。MRL Eyeデータセットを用いた目の開閉分類では、ViTとSwin Transformerがそれぞれ99%以上の高精度を達成し、既存手法を上回った。NTHU-DDDやCEWなど多様なデータセットでの評価により、モデルの汎化性と堅牢性も確認された。Haar Cascadeによる顔・目検出やリアルタイム眠気スコアリング、CAMによる解釈性向上も統合され、事故防止に寄与する信頼性の高いシステムとなっている。今後は、マルチモーダル入力や組込み環境への最適化などにより、実運用性と安全性のさらなる向上が期待される。
(発表者:村井 利成)
2025.10.24
In-the-wild Material Appearance Editing using Perceptual Attributes
J. Daniel Subias, and M. Lagunas
EUROGRAPHICS 2023
本研究では、単一画像に基づく外観編集フレームワークを提案する。この手法では、「光沢がある」「金属的である」といった高レベルの知覚的属性を増減させることで、物体のマテリアル外観を直感的に変更することができる。入力として使用するのは、形状・材質・照明が制御されていない「自然環境下で撮影された1枚の物体画像」であり、逆レンダリングを必要としない。我々の手法は生成モデルに基づいており、入力画像の高周波ディテールを保持しつつ編集結果に反映させるために、新しいアーキテクチャ「Selective Transfer Unit(STU)」セルを考案した。学習には、物理ベースレンダリングで生成された合成画像ペアと、それに対応するクラウドソースによる高レベル知覚属性の評価データセットを用いた。実験の結果、提案するマテリアル編集フレームワークは既存手法を上回る性能を示し、合成画像、実際の自然画像、さらに動画シーケンスへの応用可能性を実証した。
(発表者:神取 歩)
2025.10.24
AnySplat: Feed-forward 3D Gaussian Splatting from Unconstrained Views
Lihan Jiang, Yucheng Mao, Linning Xu, Tao Lu, Kerui Ren, Yichen Jin, Xudong Xu, Mulin Yu, Jiangmiao Pang, Feng Zhao, Dahua Lin, Bo Dai
SIGGRAPH Asia 2025 (ACM TOG)
本研究では、カメラパラメータを持たない任意の画像群から、1回の順伝播で3Dガウシアン表現を生成する新しい手法を提案する。従来の3Dガウシアンスプラッティングは、SfMによるカメラ情報や多段階の最適化を必要とするため、汎用性や計算効率に課題があった。そこで本研究では、Geometry Transformerにより画像特徴からカメラ姿勢と深度を同時推定し、各ピクセルごとにガウシアンの形状・色・信頼度を回帰するガウシアンヘッドを組み合わせた。さらに、Differentiable Voxelizationによりピクセル単位ガウシアンを信頼度重み付きで統合し、冗長性を削減した。VGGTからの擬似ラベル蒸留と幾何一貫性損失により3D構造の破綻を抑制し、RGB画像のみで高品質な3D再構成を実現した。評価の結果、AnySplatは既存手法と同等の精度で、数千倍高速な3D生成を達成した。
(発表者:山﨑 奎典)
2025.10.31
(発表者:遠藤 響)
2025.11.7
(発表者:板谷 優輝)
2025.11.7
(発表者:清原 大稀)
2025.11.14
2025.11.14
2025.11.21
2025.11.21
2025.12.5
(発表者:外山 幸太)
2025.12.5