1.3.4 基于文本的多模态