DL 综述

多模态学习 Multi-Modality-Learning

真正的Sensor Fusion

Posted by tianchen on September 26, 2019

⌛ 多模态 Multi-Modality

⌛ 表示待补充

模态：信息的来源或者是形式
分类 Taxonomy
- 多模态表示学习(Multimodal Representation)
  - Representation意指的将输入数据的Feature映射为高维度向量
- 模态之间转化 (Translation)
  - 映射关系的转化
  - Example：语言翻译，Caption，
- 模态对齐 (Alignmnet)
  - 主要是寻找不同模态之间的对应关系
  - Example 视频处理中的Temporal Sequence Alignment
    - 甚至语义分割也是?（没理解）
- 多模态融合 (Multimodal Fusion)
  - 常分为不同的层次
    - Pixel Level
    - Feature Level
    - Decision Level
  - Example最终一般是分类预测或者是回归
    - 情感分析
    - 生物特征识别
- 协同学习(Co-Learning)
  - 各个模态之间的信息互相补充
  - 引申到迁移学习，以及One/Zero Shot

待补充 ⛏

Refs