2021.4.16

Point Cloud Registration Based on One-Point RANSAC and Scale-Annealing Biweight Estimation

Jiayuan Li , Qingwu Hu , and Mingyao Ai

IEEE Transactions on Geoscience and Remote Sensing. 2021 Jan 8 ; Pages(1-14)

近年,3次元データの需要が増加しており,3次元データの作成には点群の位置合わせが必要となる.しかし,従来の位置合わせ手法には,位置合わせを行う2つの点群の座標の初期値に精度が依存していることや,スケールの違いへの対応が難しいといった問題点が存在する.
そこで,本提案手法では,one-point random sample consensus (1-point RANSAC)アルゴリズムとTukey's biweight法を用いて位置合わせを行う.実験では,スケールが等しい2つの点群間で位置合わせした時と異なる点群間で位置合わせした結果を提案手法 と従来手法で比較した.結果として提案した手法は,99%以上の外れ値に対してロバストであり,処理速度も従来手法より速いことが示された.

(発表者:小野 可夢偉)


2021.4.23

Inverse Rendering for Complex Indoor Scenes: Shape, Spatially-Varying Lighting and SVBRDF from a Single Image

Zhengqin Li, Mohammad Shafiei, Ravi Ramamoorthi, Kalyan Sunkavalli, Manmohan Chandraker

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (2020)

本 研究では,屋内シーンにおける単一のRGB画像から,物体形状,空間的に変化する照明,およびSVBRDFを推定するための逆レンダリング手法を提案す る.ネットワークには,シーンの外観をモデル化するためのレンダリングレイヤー,予測を繰り返し洗練するためのカスケード構造などが組み込まれている.ま た,複雑なマテリアルを既存の屋内シーンデータセットにマッピングする新たな手法と物理ベースのGPUレンダラーを提案し,大規模でフォトリアリスティッ クなデータセットを作成した.これによってAR(拡張現実)における仮想オブジェクトの挿入やマテリアルの編集など,様々なアプリケーションが可能とな る.

(発表者:廣瀬 郁美)


2021.4.30

Intelligent Recognition of Fatigue and Sleepiness Based on InceptionV3-LSTM via Multi-Feature Fusion

Yifei Zhao, Kai Xie, Zizhuang Zou, Jian-Biao He

IEEE Access ( Volume: 8) (2020)

疲労は、意識レベルや覚醒度の低下を特徴とする人間に とって、共通の状態である。そのため,公道での自動車の運転,職場での過酷な作業,集中治療室での患者の監視など,覚醒度に左右される多くの場面で,疲労 や眠気の認識が不可欠となっている.本研究では,従来の画像処理と心拍変動(HRV)を用いて疲労や眠気を検出するために,新しい多要素融合に基づく手法 を提案する.運転者の疲労を正常に認識する能力をテストすることで,この手法の実現可能性を検証した.また、提案した手法のさまざまなステップを既存の手 法と比較した.その結果、最先端の手法と比較した場合,本手法は精度と安定性の両面で平均5%の向上を達成した.


(発表者:足田 幸一)


2021.5.7

Towards Spatially Varying Gloss Reproduction for 3D Printing

MICHAL PIOVARČI, MICHAEL FOSHEY, VAHID BABAEI, SZYMON RUSINKIEWICZ, WOJCIECH MATUSIK, PIOTR DIDYK

ACM Transactions on Graphics (TOG) 39.6 (2020): 1-13

3Dプリン ト技術を用いた外観再現において,光沢は色や形に次いで重要な側面の1つである.造形物の光沢特性を調整するためにワニスを塗る方法があるが,現在のカ ラーインクジェット3Dプリンタは解像度が高く,ノズルが小さいため大きな粒子を持つワニスを使用することはできない.そこで本論文では,カラー2.5D 造形物にワニスを塗布するためのハードウェアを作成し,空間変化を持つ任意の反射特性を再現するための完全なパイプラインを提案する.本手法は市販のワニ スから最適なものを選択するプロセス及び特性の異なるワニスの混合比率を求めるプロセスを含む.また,色・形状再現と光沢再現が分離しておりプロセスに柔 軟性をもたらしている.提案手法を用いた印刷実験の結果,通常の造形では実現できなかった空間変化を持つ光沢の再現が可能であることが示された.

(発表者:永沢 和輝)


2021.5.21

Local Temporal Pattern and Data Augmentation for Micro-Expression Spotting

Jingting Li; Catherine Soladie; Renaud Seguier

IEEE Transactions on Affective Computing (Early Access)

微細 表情(ME -Micro Expression)は,非言語コミュニケーションにおいて非常に重要な指標として近年注目を集めている.しかし,微細表情は,非常に局所的で短い変化 であるという性質から,検出は困難である.本論文では,顔の動きに対して専用の局所的・時間的パターン(LTP)を使用することで,MEを他の顔の動きと 区別する.また,顔全体を対象とした全体最終融合解析を提案し、ME(局所的変化)と頭部の動き(全体的変化)の区別を向上させる.CASMEと CASMEで行われたスポッティングの結果,我々の提案するLTPは,F1スコアの点で最も一般的な従来のスポッティング手法を上回ることが示された.ま た,融合処理やデータの増強を加えることで、スポッティング性能はさらに向上する.

(発表者:長澤 拓海)


2021.6.11

Deep High-Resolution Representation Learning for Visual Recognition

Jingdong Wang, Ke Sun, Tianheng Cheng, Borui Jiang, Chaorui Deng et al.

IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, AUGUST 2019

コンピュータでの自動画像認識において,画像内の人間の姿勢の推定や,細分化された物体認識といった高度なタスクを行うためには,非常に高精細な認識能力が必要となる.
既存のフレームワークでは,入力画像を一度低解像度にエンコードした後に,高解像度へと戻しているのに対し,本論文で提案するHRNetでは,プロセス全体を通して高解像度の表現を維持して処理を行う.
これにより,意味的に豊かかつ,空間的に正確な画像認識が可能となる.
提案されたHRNetは,高精細な認識能力を必要とする幅広いタスクにおいて,従来手法と比べ高い優位性を持つことが示された.


(発表者:小池 黎明)


2021.6.18

Deep Learning for Drug Discovery and Cancer Research: Automated Analysis of Vascularization Images

Gregor Urban, Kevin Bache, Duc T.T. Phan, Agua Sobrino, Alexander K. Shmakov, Stephanie J. Hachey, Christopher C.W. Hughes, and Pierre Baldi

IEEE/ACM Transactions on Computational Biology and Bioinformatics(2019)

従 来の前臨床試験で特定された医薬品候補は、患者試験において失敗することが多く、創薬の社会的負担が増大してしている.この要因は,従来のin vitroの薬物反応モデルが、ヒトの生物学の複雑な特性の多くを正確に模倣できていないことにある.著者はヒトの生理学をより正確にモデル化した新しい 微小生理学的システムを導入しており,本研究ではin vitroでの薬剤適用前後に撮影した画像から,血管ネットワークを効果的に破壊する化合物を迅速かつ正確にフラグを立てることができる機械学習モデルを 開発した.このシステムは,創薬において費用がかかる可能性の高い偽陰性を出さずに,ほぼ完璧な精度を達成した.

(発表者:角村 真里)


2021.6.25

Origin of photoplethysmographic waveform at green light

Alexei A. Kamshilin, Nikita B. Margaryants

Physics Procedia 86 (2017) 72 – 80

PPGにおける、心血管活動による光の変調現象の 背後にある詳細なメカニズムは、いまだに議論の対象となっている。これまでに提案されているメカニズムは、血液量の変化、血圧の変化などがある。この論文 では、従来のモデルでは説明が困難な実験結果について、説明可能な新しいモデルを提案した。

本論文における提案モデル
 動脈が脈動する → 拍動による圧力が、 真皮内の毛細血管の密度を圧縮/減圧する → 毛細血管床の血液量を調節する → 血液量の変化の影響で、G信号の吸収が変化する。

(発表者:高橋 雅人)


2021.7.2

Attention is all you need

Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez y, Łukasz Kaiser

In Advances in Neural Information Pro- cessing Systems, pages 6000–6010.

従 来のニューラルネットワーク機械翻訳技術は、エンコーダとデコーダに複雑なRNNかCNNを用いていたが、Google BrainのVaswaniらは、RNNもCNNも全く用いない、シンプルなニューラルネットワーク機械翻訳技術を提案した。Attentionでエン コーダーとデコーダを構成したTransformerである。2つの機械語翻訳実験において、従来のRNN型と比較した結果、並列化(論文中に、いくつか ある個々のAttention:headを並列に繋げて、Multi-head Attention としてパフォーマンス向上を果たしたとある)に、学習時間を大幅に短縮しながら、高い翻訳精度を実現した。
①WMT2014 英語⇒ドイツ語28.4BLEUで2BLEU改善。
②WMT2014 英語⇒フランス語41.8 BLEUを達成。
Transformerは、学習データの規模によらず文章構造の解析に適用できるので、他の翻訳タスクに一般的に使用できる。

(発表者:齋藤 茂樹)