深層学習・ニューラルネットワークによる視覚表現学習

Visual Representation Learning Using Deep Learning and Neural Networks

アピールポイント

数理的なアイデアに基づいた深層学習・ニューラルネットワーク技術の研究をしています．
最近は効率的な学習・推論に向けた画像認識・画像生成の研究に興味があります．

研究者のねらい
深層学習は，大量のデータからパターンを自動で学習する機械学習の一分野であり，ニューラルネットワークを用いて段階的に特徴表現を獲得します．予測と正解の誤差をもとに重みを最適化することで，画像認識・生成や生成AIなど多様なタスクを実現します．

研究の興味
汎化性能に優れたニューラルネットワークを学習するためにはどうすれば良いか？

ニューラルネットワークによる認識

データ数に偏りがあっても安定して性能が出る画像認識技術

製品や工程によってデータ数に大きな差がある場合でも，少数データを活かして学習できる手法を研究しています
→ 製品Aと製品Bで検査画像数に差がある外観検査，クラス不均衡な品質判定への応用が可能
https://arxiv.org/abs/2508.18723

重要な部分だけに注目することで高速・省資源な認識を実現

画像中の不要な領域を自動的に無視し，本当に見るべき部分に集中して認識する仕組みを開発しています
→ 計算資源が限られた装置，動画像や高解像度画像を扱う検査・監視システムに応用可能

「知らないものは分からない」と判断できる安全な認識技術

学習時に見たことのない対象を，誤って正常と判断せず「未知」と検出する技術を研究しています
→ 外観検査や映像監視における異常検知，見逃しリスクの低減に貢献

学習の順序を工夫して未知データに強いモデルを作る技術

簡単なデータから難しいデータへ段階的に学習させることで，実運用での性能低下を抑えます
→ データの難易度に偏りがある場合や，現場データが徐々に変化する環境で有効
https://arxiv.org/abs/2508.18726

異常を「理由付き」で説明できる大規模画像言語モデル

画像だけでなく言語情報も用いて，異常を説明できる外観検査向け生成AIを開発しています
→ 画像と言語による異常の説明を実現 + 大規模画像言語モデルの学習ノウハウの提供
https://arxiv.org/abs/2502.09057

ニューラルネットワークによる生成

3次元形状を高精度に表現・復元する技術

形状の密度だけでなく「距離」の概念も学習することで，より正確な3次元表現を実現します
→ 3次元形状復元，3次元姿勢推定，製品形状のデジタル化に応用可能
https://ueda0319.github.io/neddf/

形状と動きを同時に扱う時空間モデリング技術

物体の形状変化や動作をまとめて学習し，時間的な変化を含む構造を捉えます
→ 動作解析のためのデータ拡張，時系列3次元データの再構成への応用
https://ieeexplore.ieee.org/document/11228866

[ホンダとの共同研究] 把持動作を学習するロボット制御のための3次元表現学習の技術

ロボットハンドの「つかみ方」をモデル化し，柔軟な把持動作の学習に向けた3次元表現学習を実現しています
→ ロボティクス応用

深層学習・ニューラルネットワークの基礎から応用までの講義

MLP から Vision Transformer（ViT）まで，学部・修士向けに講義をしています
→ ニューラルネットワークの仕組みからプログラミングまで学術指導も可能です

その他の取り組み

[ヤマハとの共同研究] 生成モデルを用いた官能検査支援

人の感覚に依存しやすい検査を，生成モデルによって支援する技術を研究しています
→ 正常・異常の判断・定義が困難な検査工程，異常データを生成したい場合に活用可能

国際会議（CVPR など）の最新動向サーベイ

研究者
相澤　宏旭　AIZAWA HIROAKI
広島大学
大学院先進理工系科学研究科
助教

研究成果紹介

研究成果を検索いただけます

Category

─ 研究成果をカテゴリー別に集約 ─

キーワード検索

─ 研究成果をキーワードで探す ─

深層学習・ニューラルネットワークによる視覚表現学習