2007.4.13
Space-Time Super-Resolution
Eli Shechtman, Yaron Caspi, Michal Irani
IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol 27, No. 4, 2005
低解像度画像からの情報を複数用いて,より高解像度な画像を生成する超解像と呼ばれる手法が存在する.
従来の超解像問題では主に空間解像度の増加を目標としていた.
本論文では同一シーンを撮影した複数の低(時空間)解像度ビデオシーケンスからの情報を組み合わせることで,時間軸の超解像も可能とし,高い時間・空間解像度を持つビデオシーケンスを構成する手法を述べ,またその性能に関して議論する.
(発表者:上村 健二)
Moving-image simulation for high-quality LCD TVs
Tin-Wei Su, Jenn-Jia Su, Ting-Jui Chang, Po-Lun Chen, Kun-Yu Lin and C. T. Liu
Journal of SID 15/1, 2007
LCDのようなホールド表示型のディスプレイで問題となっているmotion blurを減らす為の研究が盛んである.本論文では,画素構造と平行に一定速度で移動する静止画像を目で完璧に追従した際の見えを再現するシミュレータを構築し,overdrivingやblack-stripe insertion等いくつかのmotion blur reduction手法の効果をシミュレータを用いて評価し,そのぞれの利点や欠点についてまとめている.
(発表者:中川 慎司)
2007.4.20
Distinctive Image Features from Scale-Invariant Keypoints
David G. Lowe
International Journal of Computer Vision, 60, 2 (2004), pp. 91-110.
コンピュータビジョンにおける基本的かつ最も重要な問題のひとつに、画像間の対応付けとそれに伴う特徴検出がある。本論文では、スケール・方向・位置に対して不変であり、かつ照明変化・3次元物体の回転に対してもロバストな特徴検出および対応決定を行うアルゴリズムを提案する。本手法は、比較的計算コストが小さいにも関わらず高いロバスト性を持つことから注目を集めており、様々なアプリケーションに用いられている。
(発表者:小石 毅)
Face Transfer with Multilinear Models
Daniel Vlasic, Matthew Brand, Hanspeter Pfister, Jovan Popović
ACM Transactions on Graphics, 2005 (SIGGRAPH 2005 Conference
3次元顔モデルのアニメーションは映画産業などにおいて用いられる有用な技術である.本論文では多重線形モデルを用いて顔モデルのパラメータを独立に制御することにより,安価・実用的な顔のアニメーションが可能な手法を提案している.また,顔追跡技術との併用により,ある人物の顔の動きを他の人物の顔に対して適用することも可能である.
(発表者:牧野 貴雄)
2007.4.27
Reflectance and transmittance model for recto-verso halftone prints
Mathieu Hebert and Roger David Hersch
J. Opt. Soc. Am. A 23 (10) October 2006
両面印刷されたハーフトーンプリント画像の分光反射率と分光透過率を予測するモデルを提案する.両面印刷ハーフトーンプリント画像は,空気と接触する2つのインク層とそれらに囲まれた紙層でモデル化される.伝統的な分光予測モデルであるWilliams-ClapperモデルとClapper-Yuleモデルは,提案モデルの特別なケースであり,これを示す.また,拡張されたKubelka-Munk理論が提案モデルに使用される.最後に提案モデルを用いて予測評価実験を行う.
(発表者:浮島 正之)
Software-processed edge- and level-adaptive overdrive (SELAO) method for high-quality motion pictures
Masahiro Baba, Goh Itoh, Haruhiko Okumura
Journal of the SID, Vol.15, Issue.3, 2007
LCDなどのホールド型ディスプレイでは液晶の応答速度とホールド表示により,CRTに比べ動きぼけを生じる.従来,液晶の応答速度を改善する方法としてはoverdrivingなどが用いられてきた.筆者らはこれらの手法を発展させたlevel-adaptive overdrive (LAO) methodを提案してきたが,この手法はソフトウェアでのリアルタイム処理は困難であった.そこで本論文では,この技術を改善したSoftware-processed edge- and level-adaptive overdrive (SELAO) methodを提案する.本手法を用いることで動画性能が改善するとともに,従来手法では困難であったリアルタイム処理をソフトウェアで行うことを可能にした.
(発表者:平井 経太)
2007.5.18
Real-Time Volume Rendering Visualization of Dual-Modality PET/CT Images With Interactive Fuzzy Thresholding Segmentation
Jinman Kim, Weidong Cai, Stefan Eberl, and Dagan Feng
IEEE Transactions on Information Technology in Bbiomedicine, Vol. 11, NO. 2, March 2007
PET,CTの2つのモダリティによる3次元画像を同時に可視化することは計算負荷の高い処理となる.よって,さらにインタラクティブかつリアルタイムにセグメンテーションを行うことは非常に困難である.本論文ではファジィクラスター解析による,ファジィ閾値セグメンテーションを提案する.これにより,PET/CT画像の可視化と平行してセグメンテーションのウィンドウレベルの調整等を行うことが可能となる.
(発表者:館 真吾)
Removal of signal-dependent noise for a digital camera
Takahiro Saito, Yuki Ishii,Reina Nosaka, Takashi Komatsu
Digital Photofraphy , proc. of SPIE-IS&T Electronic Imaging, SPIE Vol. 6502, 65020E, 2007
デジタルカメラでは,いくつかの原因により加法ノイズの信号依存性が引き起こされる.
本論文では,total-variationに基づく非線形画像分解を用いたノイズ除去手法を紹介する.これは,入力画像をノイズフリーなstructure成分とノイズ成分の多いtexture成分に分解した上で,ノイズ除去をtexture成分に適用していく手法で,シャープエッジや視覚的に重要なテクスチャを保持したままのノイズ除去が可能となる.
(発表者:伊東 ひとみ)
2007.6.8
Symmetric Photography:Exploiting Data-sparseness in Reflectance Field
Gaurav Gang , Eino-Ville Talvala , Marc Levoy , Hendrik P.A.Lensch
Eurographics Syposium on Rendering (2006)
近年,ヘルムホルツの相反定理に基づいて4次元のIncident Light FieldとExitant Light Fieldの間の関係を示す8次元のReflectance Field(light transport matrix)をモデル化するDual Photographyという手法が提案されている.一端transport matrixが求まれば,別視点からの画像生成やReligtingへの応用を容易に行うことができる.しかし,このtransport matrixは膨大な大きさであるため,取得が困難であった.
そこで,本論文ではtransport matrixが対称行列かつ,data-sparsenessであることに着目し,より効率的なSymmetric Photographyという手法を紹介する.本手法によって高速なreflectance fieldの取得とレンダリングを行い,Dual Photographyとの比較を行っている.
(発表者:矢野 菜津三)
Flexible Needle Steering and Optimal Trajectory Planning for Percutaneous Therapies
Daniel Glozman and Moshe Shoham
MICCAI 2004, LNCS 3217, pp.137-144
治療の低侵襲化が進む現代の医療現場において,経皮的な生検やカテーテルの挿入などでは,患者への負担の軽い細く柔軟な針を用いることが求められている.しかし,柔軟な針の操作は非常に困難であることが問題となっている.本論文では,リアルタイムに穿刺のシミュレーションや経路プランニングを行うことが可能な仮想バネモデルを用いて,柔軟な針の軌道の計算を行った.これにより,組織内の針体にかかる圧力を小さく最適化することができる.また,ロボットによる柔軟針の穿刺の支援を行い,障害物を回避できるという結果を得た.
(発表者:森田 慎也)
2007.6.15
Edge-Based Color Constancy
J.van de Weijer, A.Gijsenij and Th.Gevers
IEEE Transactions on Image Processing, 2007
色恒常性とは光源色に依存せず,物体の色を識別する能力のことである.本論文ではディジタルカメラの色恒常性について検討する.
有名な色恒常性の手法としては実世界の物体の平均反射率はグレーの反射率に一致するというGray-World assumptionが挙げられる.本論文では,画像のエッジ部における色の差の平均はグレーになるというGray-Edge hypothesisを提案し,さらに本手法と従来手法を複数のパラメータをもった1つの式によって統合する.そしてパラメータを様々に変化させることによって各手法の精度比較を行う.
(発表者:瀧 圭亮)
Visual Equivalence: Towards a New Standard for Image Fidely
Ganesh Ramanarayanan, James Ferwerda, Bruce Walter, Kaveta Bala
ACM SIGGRAPH 2007
コンピュータグラフィックスの発展に伴い,複雑なシーンでのよりリアルなレンダリングが行われている.人の視覚モデルに基づくレンダリングではこれまで視覚によって認識できる画像の差の予測を行ってきた.しかし,ある種の画像の差は観測者にとっては重要ではない.そこで,画像の再現の忠実性を表す新しい評価指標としてvisual equivalence predictors (VEPs)を提案し,その有効性を証明する.
(発表者:大川 亜希子)
2007.6.22
Real-Time Face Detection Using Six-Segmented Rectangular Filter
Oraya Sawettanusorn, Yasutaka Senda, Shinjiro Kawato
Proceedings of the IEEE International Symposium on Intelligent Signal Processing and Communications, December 2003
本論文では、Six-Segmented Rectanglar(SSR) filterを用いて、距離情報やテンプレートマッチングにより、
実時間の顔の検出・追跡を行う。本手法では、顔の方向によらず、人による個人差の少ない両目間の検出が
広い範囲で簡単に検出可能である。
(発表者:木下 逸人)
Efficient Estimation of Spatially Varying Subsurface Scattering Parameters
Sarah Tariq, Andrew Gardner, Ignacio Llamas, Andrew Jones, Paul Debevec and Greg Turk
11th Int'l Fall Workshop on Vision, Modeling, and Visualization 2006, Aachen, Germany
本論文では,人間の顔における内部散乱の空間分布特性を効率よく取得するためのイメージベース手法を提案している.推定された特性は空間分布を持った顔のレンダリングに使えるだけでなく,ロバストな平均を近似することにも使える.空間分布を持った光源などの任意の環境下でのレンダリング結果を用いて,他の手法と比較を行う.推定に用いられるデータは,プロジェクタを用いて,2種類のパターン(縞模様)を顔に投影し,ある固定の視点から顔の2枚の画像である.本手法は既存の手法よりも数倍早く,顔全体の特性を取得する初めての手法となる.
(発表者:Soh Chih Jen)
2007.6.29
Scale-Invariant Registration of Monocular Endoscopic Images to CT-Scans for Sinus Surgery
Darius Burschka, Ming Li, Russell Taylor, and Gregory D. Hager
MICCAI 2004, LNCS 3217, pp. 413-421, 2004
内視鏡下副鼻腔手術では,脳や目などの重要な部位の近辺まで手術器具が達するため,器具の位置推定が重要となる.そのため,術前に取得したCTデータを参照しながら手技を行うことが一般的であり,これまで位置センサを用いたナビゲーションシステムが提案されている.本論文では,Monocular SLAM systemを応用することで,位置センサを用いずに内視鏡の動きを推定し,復元した三次元情報とCTデータとのレジストレーションを行う.
(発表者:岡田 義道)
Rapid Acquisition of Specular and Diffuse Normal Maps from Polarized Spherical Gradient Illumination
W. C. Ma, T. Hawkins, P. Peers, C. F. Chabert, M. Weiss and P. Debevec
Eurographics Symposium on Rendering 2007
コンピュータグラフィックスの分野において,近年の物体の形状や反射特性の取得方法は,物体のよりリアルなレンダリングを可能としている.本論文は,物体の表面反射と拡散反射の法線を四種類の照明パターンを用いて推定する手法を提案する.また,表面反射と拡散反射を分離する方法として偏光を用いた二つの方法をあげ,表面反射から得られる法線マップと3Dスキャニングを合わせて顔の高解像度な表面形状を取得する.最後に,表面反射と拡散反射別々に推定された法線マップを用いて表面下散乱効果の再現を行う.
(発表者:横山 真紀)
2007.7.6
Retinal Vessel Centerline Extraction Using Multiscale Matched Filters, Confidence and Edge Measures
Michal Sofka and Charles V. Stewart
IEEE Transactions on Medical Imaging, Vol.25, No.12, December 2006
眼底画像処理において血管構造の抽出は広く行われているが,低コントラストかつ微細な構造の抽出や誤抽出が問題であった.本論文ではこれらを改善する新手法を提案する.本手法では血管抽出法のひとつである”matched filter response”に加え,”confidence”,および”edge measure”を定義し,それらから「血管らしさ」を表した尤度比”Likelihood Ratio Vesselness (LRV)”を算出する.多様な血管幅に対応する為,本手法では尺度空間表現を応用した”multiscale matched filter“を用いる.最終的に算出されたLRVを血管追跡のフレームワークに組み込むことで,効率的かつ効果的な血管中心線抽出アルゴリズムを得る.
(発表者:川崎 将吾)
Post-production Facial Performance Relighting using Reflectance Transfer
Pieter Peers, Naoki Tamura, Wojciech Matusik and Paul Debevec
ACM Transactions on Graphics (Proceedings of SIGGRAPH 2007)
映画における照明の役割りは単に俳優やセットを照らすだけでなく,そのムードや演技を際立たせるという役割りがある。本論文ではポストプロダクションにおいて,俳優の演技と照明の設計を完全に分離するシステムを提案する.Light Stageを用いて事前に撮影したstatic reflectance fieldとグリーンバック,均一照明下での動画を用いて任意照明下の画像を再現する.両者のデータを組み合わせるためimage-based warp functionとoptical flowを用い,reflectanceの転写(transfer)を実現する.
(発表者:落合 桂一)
2007.7.13
Stable Real-Time Deformations
M. Müler, J. Dorsey, L. McMillan, R. Jagnow, B. Cutler
Proceedings of ACM SIGGRAPH Symposium on Computer Animation (SCA) 2002
オブジェクトの変形を再現する手法として,線形モデルや非線形モデルなど数多くのモデルが提案されているが,これらのモデルでは安定性と計算コストがトレードオフの関係にある.
本論文では,安定性と計算コストを両立した,線形モデルを用いた変形再現手法を提案する.一般に線形モデルでは,回転を伴うオブジェクトの変形によって,オブジェクトの体積が不自然に増加する問題がある.
そこで,本論文では,オブジェクトに局所的な回転を加えることで,体積増加の原因となっていた回転成分を打ち消し,安定性と計算コストを両立した変形シミュレーションを実現する.
(発表者:牛木 卓)
2007.7.20
Imaging Facial Physiology for the Detection of Deceit
P. TSIAMYRTZIS, J. DOWDALL, D. SHASTRI , I.T. PAVLIDIS, M.G. FRANK, P. EKMAN
International Journal of Computer Vision 71(2), 197214, 2007
眼窩領域のサーマルビデオ画像によって,血液潅流の増加と人のストレス度を定量化できる.この概念の証明実験として,ポリグラフを用いた模擬犯罪尋問がある.しかし,ポリグラフ尋問では尋問の流れが過度に簡略化され,被験者を非常に束縛するため,現実の尋問とは大きく異なっている.そこで,本論文では,サーマルビデオを用いて,尋問の進め方に時間的な制限はなく,被験者は肉体的な束縛を受けない大規模で現実的な模擬犯罪尋問を行った.その結果,犯人かそうでないかを判別する成功率は,精神生理学の専門家による成功率と同等となった.
(発表者:小森 麻由)
A Survey of Haptic Rendering Techniques
S. D. Laycock and A. M. Day
Computer Graphics Forum, Vol.26, No.1, pp.50-65, 2007
仮想環境へのインタラクションにおいて,ハプティックは没入感を強化する上で重要な要素として研究されてきました.
そして,仮想環境を構築するCGやハプティックデバイスの発展と共に,ハプティックアルゴリズムも発展していきました.
ハプティックは,仮想物体を触れたりする感覚から,表面の硬さやテクスチャの触覚再現,手術器具などのツールの操作という様に進化してきました.
本論文は,過去のハプティックレンダリング・アルゴリズムの調査を報告します.
(発表者:川口 泰弘)
2007.7.27
Multi-Scale Capture of Facial Geometry and Motion
Bernd Bickel, Mario Botsch, Roland Angst, Wojciech Matusik, Miguel Otaduy, Hanspeter Pfister and Markus Gross
ACM Transactions on Graphics (Proceedings of SIGGRAPH 2007), to appear
近年映画産業を中心に,任意照明,視点下における俳優の顔の見え(表情変化を含む)を再現するため,顔にマーカーを取り付けて取得した3次元データと,CGによって再現した顔との融合が行われてきている.ここで,正確に表情変化後の顔形状を復元するための適切な表情変化のモデルが必要である.
表情変化後の顔を復元する方法として,形状データベースの線形結合による手法や,あらかじめ取得した顔の骨格や筋肉から物理的に形状を変化させる手法などが提案されているが,全ての手法において表情変化によってできる顔の細かな変化,特に「しわ」を再現することが困難であった.
そこで本論文では,従来の表情変化を記録するためのマーカーの他に,「しわ」の変化を記録するための専用マーカーを塗布して撮影を行い,細かな変化まで再現した表情変化後の顔形状復元手法を提案している.また論文では,反射率のデータを加えた表情変化後の顔の見えの再現や,新たな「しわ」の追加などの「しわ」エディッティングも行っている.
(発表者:本間 隆介)
Image statistics and the perception of surface qualities
I. Motoyoshi, S. Nishida, L. Sharan & E.H. Adelson
Nature, 447, 206-209(2007)
一枚の画像から表面の反射特性を推定することは非常に困難な問題ですが,人間は表面の光の反射特性を光沢感や明るさなどの質感の違いとして簡単に見分けることができます.一方,コンピュータグラフィクスでの多くの研究は,質感が非常に複雑な光学現象の産物であることを示してきました.本論文では,人間の質感知覚が画像の輝度分布の歪みの情報を利用した比較的単純な脳の情報処理に基づいていることを示している.
(発表者:長久保 哲朗)
Around "(Quest for) A Stochastic Grammar of Images"
”有るの映像確率文方”の辺り
Song-Chon Zhu - David Mumford
Not yet published / Related published paper : Bottom-Up/Top-down Image Parsing with Attribute Grammar : IEEE transactions on PAMI and short version in ICCV05
Song・Chon・Zhu先生とDavid・Mumford先生達はコンピュータ・ビジョン分野やパターン理論分野や統計的な映像分析では研究先駆者として世界で有名になった。本書では、同人は最近時代で見つけらた映像分析の考えを集めているモデルを詳しく表現しているように低級ビジョンと高級ビジョンのパラダイムを説明上げていたし、それに同人は数々の数学的な映像解析で生成しったの科学的な意見と問題の形を記述していた。本講演で色々な説よるに相対的に就いてパラダイムを発表するつもりでしょう。
Song-Chon Zhu and David Mumford have been worldwide known pioneers in research Computer Vision, Pattern Theory, and Statistical Vision. In this article, they depict paradigms of low-level vision and high-level vision to specify a model which combines different ideas that have emerged in the field image analysis within last decades especially in the quest of semantic decoding, moreover they depict and analyze a certain number of questions, scientific opinions that have emerged in mathematical analysis of image. In this talk, we will present the paradigm of the authors and locate it relatively to other theory of vision and or image analysis.
(発表者:Bertrand Nouvel )