深層学習・ニューラルネットワークによる視覚表現学習

Visual Representation Learning Using Deep Learning and Neural Networks

アピールポイント

  • 数理的なアイデアに基づいた深層学習・ニューラルネットワーク技術の研究をしています.
  • 最近は効率的な学習・推論に向けた画像認識・画像生成の研究に興味があります.

 
研究者のねらい
深層学習は,大量のデータからパターンを自動で学習する機械学習の一分野であり,ニューラルネットワークを用いて段階的に特徴表現を獲得します.予測と正解の誤差をもとに重みを最適化することで,画像認識・生成や生成AIなど多様なタスクを実現します.
 
研究の興味
汎化性能に優れたニューラルネットワークを学習するためにはどうすれば良いか?

 
ニューラルネットワークによる認識

  • データ数に偏りがあっても安定して性能が出る画像認識技術

製品や工程によってデータ数に大きな差がある場合でも,少数データを活かして学習できる手法を研究しています
→ 製品Aと製品Bで検査画像数に差がある外観検査,クラス不均衡な品質判定への応用が可能
https://arxiv.org/abs/2508.18723

 

  • 重要な部分だけに注目することで高速・省資源な認識を実現

画像中の不要な領域を自動的に無視し,本当に見るべき部分に集中して認識する仕組みを開発しています
→ 計算資源が限られた装置,動画像や高解像度画像を扱う検査・監視システムに応用可能

 

  • 「知らないものは分からない」と判断できる安全な認識技術

学習時に見たことのない対象を,誤って正常と判断せず「未知」と検出する技術を研究しています
→ 外観検査や映像監視における異常検知,見逃しリスクの低減に貢献

 

  • 学習の順序を工夫して未知データに強いモデルを作る技術

簡単なデータから難しいデータへ段階的に学習させることで,実運用での性能低下を抑えます
→ データの難易度に偏りがある場合や,現場データが徐々に変化する環境で有効
https://arxiv.org/abs/2508.18726

 

  • 異常を「理由付き」で説明できる大規模画像言語モデル

画像だけでなく言語情報も用いて,異常を説明できる外観検査向け生成AIを開発しています
→ 画像と言語による異常の説明を実現 + 大規模画像言語モデルの学習ノウハウの提供
https://arxiv.org/abs/2502.09057

 
ニューラルネットワークによる生成

 

  • 3次元形状を高精度に表現・復元する技術

形状の密度だけでなく「距離」の概念も学習することで,より正確な3次元表現を実現します
→ 3次元形状復元,3次元姿勢推定,製品形状のデジタル化に応用可能
https://ueda0319.github.io/neddf/

 

  • 形状と動きを同時に扱う時空間モデリング技術

物体の形状変化や動作をまとめて学習し,時間的な変化を含む構造を捉えます
→ 動作解析のためのデータ拡張,時系列3次元データの再構成への応用
https://ieeexplore.ieee.org/document/11228866

 

  • [ホンダとの共同研究] 把持動作を学習するロボット制御のための3次元表現学習の技術

ロボットハンドの「つかみ方」をモデル化し,柔軟な把持動作の学習に向けた3次元表現学習を実現しています
→ ロボティクス応用

 

  • 深層学習・ニューラルネットワークの基礎から応用までの講義

MLP から Vision Transformer(ViT)まで,学部・修士向けに講義をしています
→ ニューラルネットワークの仕組みからプログラミングまで学術指導も可能です

 
その他の取り組み

  • [ヤマハとの共同研究] 生成モデルを用いた官能検査支援

人の感覚に依存しやすい検査を,生成モデルによって支援する技術を研究しています
→ 正常・異常の判断・定義が困難な検査工程,異常データを生成したい場合に活用可能

 

  • 国際会議(CVPR など)の最新動向サーベイ

人の感覚に依存しやすい検査を,生成モデルによって支援する技術を研究しています
→ 正常・異常の判断・定義が困難な検査工程,異常データを生成したい場合に活用可能

 
研究者
相澤 宏旭 AIZAWA HIROAKI
広島大学
大学院先進理工系科学研究科
助教