2020.10.9

StarGAN v2: Diverse Image Synthesis for Multiple Domains

Yunjey Cho, Youngjung Uh, Jaejun Yoo, Jung-Woo Ha

In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (2020)

敵対的生成ネットワーク(GAN)を用いた画像変換手法のうち,データセット間のドメイン関係を学習して画像変換を行うドメイン変換手法が提案されている.
現在,①多種多様なスタイル画像の生成,②複数のドメイン変換への簡易的な拡張性が課題であるが,従来手法では,いずれかの問題を解決出来ていない.
本手法では,従来手法を元に両方の問題を解決するためのStarGAN v2を提案する.
既存のCelebA-HQデータセットと,新たに作成した動物の顔画像のデータセット(AFHQ)を用いて本手法の性能を検証した結果,見栄え,スタイルの多様性,モデルの拡張性において従来手法との優位性が示された.

(発表者:須藤 寛斗)


2020.10.16

Non-contact measurement of oxygen saturation with an RGB camera

Alessandolo R. Gauzzi, Mauricio Villaroel, Joao Jorge, Jonathan Daly, Matthew C. Frise, Peter A. Robbins, and Lionel Tarassenko

Biomedical Optics Express. 2015 Sep 1; 6(9): 3320–3338.

本研 究では,RGBカメラを用いた,新たな酸素飽和度推定の手法を提案する.本手法では,カメラにより取得された脈波のSN比に応じて,ROIを選択し高精度 に酸素飽和度の変化を追跡することができる.5名の被験者に対して,酸素飽和度を100%から80%まで変化させて実験を行ったところ,接触式のパルスオ キシメーターに近い精度で酸素飽和度を追跡可能であることが分かった.

(発表者:高橋 凌 )

Study on Iris Segmentation Algorithm Based on Dense U-Net

Wu, Xiaoqiang, and Long Zhao.

IEEE Access 2019

虹彩セグメンテーションは,虹彩認識において重要な役割を果たす.正確な虹彩セグメンテーションは,虹彩認識の効率を大幅に向上させることができる.
本研究は,Dense U-Net(DensenetとU-netの組み合わせ)に基づく虹彩セグメンテーション手法を提案する.
最終的なセグメンテーションの精度は98.36%となる.実験結果は、提案された手法がエラー率を減らし,そして医師が虹彩疾患を診断するのを効果的に助けることができることを示している.

(発表者:林 夢瑶)


2020.10.23

3D Point Cloud Denoising Using Graph Laplacian Regularization of a Low Dimensional Manifold Model

J, Zeng., G, Cheung., M, Ng., J, Pang., & C, Yang.

IEEE Transactions on Image Processing ,2019, 29, 3474-3489.

3次元点群はMicrosoft KinectやLiDARなどの低コストな深度センサを使用し取得することができる.しかし,その出力点群にはノイズが存在することが分かっており,点群のノイズ除去に対するいくつかのアプローチが提案されている.
本研究では,以前に提案された画像処理のための低次元マニホールドモデル(LDMM)を点群処理に拡張し,点群の表面パッチ間の自己類似特性を用いて非局所的なノイズ除去を行う.
実験では既存の方法との比較を行い,結果として特に対象の輪郭部分におけるノイズ除去が既存の方法より良い結果が得られた.


(発表者:小野 可夢偉)

An Adaptive Method for Image Dynamic Range Adjustment

Kai-Fu Yang , Hui Li, Hulin Kuang, Chao-Yi Li, and Yong-Jie Li

IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 29, NO. 3, MARCH 2019

画像のダイナミックレンジ調整はデジタル画像の強調に広く使用されている.
しかしダイナミックレンジ調整後も画像の詳細を保持し,シーンの可視性を向上させることが課題である.
本論文では,暗い領域と明るい領域をそれぞれ補正するための2つのガンマ曲線を適応的に選択する手法の設計と,
ダイナミックレンジ調整の前後で画像間の一貫した彩度を得るための色復元の手法の設計を行う.
提案手法は,HDR画像のダイナミックレンジを効率的に圧縮し,元の画像の外観のコントラストや鮮明な詳細,および高い忠実度を実現できることが示された.
また,LDR夜間画像の強調にも有望な効果が得られ,夜間画像においてより精度よく物体を検出することが可能となった.

(発表者:廣瀬 郁美)


2020.10.30

Pupillary Response as an Age-Specific Measure of Sexual Interest

Janice Attard-Johnson,Markus Bindemann,Caoilte O´ Ciardha

Archives of Sexual Behavior volume 46, pages155–165(2017)

性 的コンテンツの視覚処理において,瞳孔拡張は観察者の性的指向に関連している覚醒の指標である.本研究では,この尺度を拡張して年齢別の性的関心を判断で きるかどうかを調査した.2つの実験では,さまざまな年齢の男性と女性の画像に対する異性愛者の成人の瞳孔反応は,自己申告による性的関心,刺激に対する 性的魅力,および児童性的虐待傾向の尺度に関連した.両方の実験で,男性の観察者の瞳孔は女性の写真に拡張したが,男性,子供,また中立的な刺激には拡張 しなかった.これらの瞳孔反応は,観察者の自己申告による性的関心および刺激の性的魅力の評価に対応していた.女性の観察者は,子供ではなく男性と女性の 写真に瞳孔の拡張を示した.女性は,瞳孔反応は刺激の性的魅力の評価とはあまり相関を示さなかった.本実験は視線追跡が男性の観察者の性別固有の関心の尺 度として,および男性と女性の観察者の年齢別の指標として使用できるということを示す.

(発表者:旭 潤司)


2020.11.6

Multiview Multitask Gaze Estimation With Deep Convolutional Neural Networks

Dongze Lian, Lina Hu, Weixin Luo, Yanyu Xu, Lixin Duan, Jingyi Yu, Shenghua Gao

IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS

過去数十年の間に,視線推定技術は多くの研究者によって研究されてきた.しかし,既存の手法の多くは単一のカメラを用いたものであり,注意点の推定と注視方向の推定のどちらかにしか焦点をあてていない.
本論文では,マルチビューカメラを用いた注視点推定のための新しいマルチタスク手法を提案する.具体的には,注視点推定と注視方向推定の密接な関係を解析 し,部分共有型畳み込みニューラルネットワークアーキテクチャを用いて注視方向と注視点を同時に推定する.さらに、異なる被験者の多視点視線画像からなる 多視点視線追跡データセットを新たに導入する.実験の結果,提案した多視点多タスク視線点推定ソリューションが既存の手法を一貫して凌駕することが実証さ れた.

(発表者:小池 黎明)

Towards Automatic Real-Time Estimation of Observed Learner’s Attention Using Psychophysiological and Affective Signals: The Touch-Typing Study Case

Marko MežA; Janja KošIr; Gregor Strle; Andrej KošIr

IEEE Access ( Volume: 5)

本論文では, 学習者の心理生理学的・感情的信号に基づいて, 人間の評価者から収集した注意力の推定値をリアルタイムで計算機的にモデル化できるかどうかを検討することを目的とし, タッチタイピングという課題を与えられた学習者の注意力を, アイトラッカーから取得した心理生理学的および感情的信号(視線、瞳孔の拡張、価数と覚醒等)を用いてリアルタイムに推定する実験的研究を行った.
本論文では, 生体情報より作成した重回帰モデルが、評価者により観察された注意力の5段階レベルを比較的高精度に識別可能である事を示している.


(発表者:長澤 拓海)


2020.11.13

DeepIGeoS: A Deep Interactive Geodesic Framework for Medical Image Segmentation

Guotai Wang, Maria A. Zuluaga, Wenqi Li, Rosalind Pratt, Premal A. Patel, Michael Aertsen, Tom Doel, Anna L. David, Jan Deprest, Sebastien Ourselin, and Tom Vercauteren

IEEE Transactions on Pattern Analysis and Machine Intelligence (2019)

臨 床現場における診断、手術計画、その他の多くのアプリケーションでは,正確な医療画像のセグメンテーションが不可欠である.近年の研究でCNNは最先端の 自動セグメンテーション手法となってきたが,臨床で使用するためには,十分な精度やロバスト性を実現するために更なる改良を行う必要がある.
そこで本論文では,2Dおよび3D医療画像セグメンテーションのためのディープラーニングベースのインタラクティブなフレームワークを提案した.その結 果,胎児MRI画像からの2D胎盤セグメンテーションとFLAIR画像からの3D脳腫瘍セグメンテーションについて,本論文の提案手法が従来手法と比較し て高精度な結果を達成した.


(発表者:角村 真里)

Autoencoder node saliency : Selecting relevant latent representations

Ya Ju Fan

Pattern Recognition (2018)

AE(Auto-Encoder)は,教師なしでデータの非線形な次元圧縮を実現するニューラルネットワークである.
次元圧縮を行うという点で,AEは主成分分析(Principal Component Analysis, PCA)と似ている.
しかしながら,PCAの主成分は固有ベクトルであり,それらは分散性と直交性を有するという点でAEと異なる.
本研究では,AEの圧縮ノードにおける出力ヒストグラムからノードの分散性と直交性を計算し,
PCAの主成分のようなノードを選択することを実現する.
この手法により,MNISTやMETABRICデータセットにおける2値分類において,
1つの顕著なノードのみで2値分類可能であることを示した.

(発表者:田中 伶実)


2020.11.20

A Pilot Study for Estimating the Cardiopulmonary Signals of Diverse Exotic Animals Using a Digital Camera

Ali Al-Naji, Yiting Tao, Ian Smith and Javaan Chahl

Sensors 19.24 (2019): 5445.

獣医師が、動物の心肺信号を監視する際の課題として、意識がある動物との接触 にはリスクが伴います。
この予備的研究では、RGBカメラを用い、エキゾチック で飼いならされていない種の例を使用して、心肺信号を抽出する手段を示しま す。
対象動物は、ジャイアントパンダ、アフリカライオン、スマトラトラなど9 種類です。
実験は、被験動物の日常生活に影響を与えない状態で行いました。
具体的には、 RGBカメラを使用し、心肺活動が見える可能性が最も高い腹部胸部から信号を抽 出しました。
結果は、心肺活動の特徴であり、物理的な接触なしに動物の生理学 的パラメータ(脈拍数と呼吸数)を推定するのに役立つ可能性が高い被験動物の 体表面の動きが観察出来ました。
研究の結果は、非接触生理学的モニタリングおよびリモートセンシングによる動 物の健康評価への新しいアプローチにつながる可能性があります。
この方法は、獣医の診療、保護とゲームの管理、動物福祉、動物学と行動の研究 への応用が期待されています。


(発表者:高橋 雅人 )


2020.11.27

3D Printing Spatially Varying Color and Translucency

ALAN BRUNTON, CAN ATES ARIKAN, TEJAS MADAN TANKSALE and PHILIPP URBAN

ACM Transaction on Graphics, Vol. 37, No. 4, pp1-13. (2018)

3D プリント技術の普及により様々なマテリアルを用いることができるようになり,半透明なオブジェクトの造形が可能になっている.アルベドカラーや半透明性の 再現のみに焦点を当てたこれまでのアプローチとは対照的に,本研究では正確な色再現と半透明性の再現を同時に行うパイプラインを提案する.半透明性の再現 に一般的に用いられるモデルであるBSSRDFは,パラメータ量が膨大であり計測と再現のコストが高いという点や,人間の半透明性の知覚はより低次元な情 報を基にしているという点に注目して再現を行う.使用されるフォーマットはRGBA信号であり,既存の3Dモデリングアプリケーションによるアクセスが可 能であるという利点を持つ.このフレームワークによって空間的に変化する色と半透明性を持つ3D印刷が可能になる.

(発表者:永沢 和輝)