技术介绍
多模态理解与生成技术是指充分利用视觉、文本、语音等模态的数据,通过多模态特征提取与融合技术,实现多维度的理解(视频理解、关系抽取、情绪识别等)与拟人化生成(图像生成、可控文本生成、个性化语音合成等)。
认知规划与决策是认知智能的核心环节之一,旨在帮助机器更好地理解复杂的认知任务,并通过确定最优行动计划来实现预期目标。认知规划是根据资源、时间、能力和条件等因素构建行动方案,以实现特定任务目标。决策则是在不确定性情况下,通过对信息的处理和分析确定最优化的行动路线,以达到预期的成效。认知规划和决策能够对复杂任务进行全局分析,将复杂问题拆解为可管理的子问题,并分析它们之间的相互作用关系,从而建立全局认知并逐步解决小问题,最终实现复杂问题的优化求解。
研究目的
通过对多模态信息的有效提取与融合,可以充分利用数据中的多维度特征,从而实现更高效、更自然的信息理解与拟人化生成。
通过研究认知规划与决策,旨在提高机器在复杂任务中的决策能力和解决问题的效率,完成人工智能从感知智能到认知智能的转型。