多模态学习 Multi-Modality-Learning

真正的Sensor Fusion

Posted by tianchen on September 26, 2019

⌛ 多模态 Multi-Modality

⌛ 表示待补充

  • 模态: 信息的来源或者是形式
  • 分类 Taxonomy
    • 多模态表示学习(Multimodal Representation)
      • Representation意指的将输入数据的Feature映射为高维度向量
    • 模态之间转化 (Translation)
      • 映射关系的转化
      • Example:语言翻译,Caption,
    • 模态对齐 (Alignmnet)
      • 主要是寻找不同模态之间的对应关系
      • Example 视频处理中的Temporal Sequence Alignment
        • 甚至语义分割也是?(没理解)
    • 多模态融合 (Multimodal Fusion)
      • 常分为不同的层次
        • Pixel Level
        • Feature Level
        • Decision Level
      • Example最终一般是分类预测或者是回归
        • 情感分析
        • 生物特征识别
    • 协同学习(Co-Learning)
      • 各个模态之间的信息互相补充
      • 引申到迁移学习,以及One/Zero Shot

待补充 ⛏

Refs