近日,上海智能谷产业园迎来了一场科技与未来交汇的盛会——中国人形机器人生态大会(CHREC 2024)。科大讯飞作为参与者,也是推动者,携其精心打造的机器人超脑平台,向世界展示了其基于星火大模型的多模态交互系统。这一系统的亮相,无疑为大会增添了浓厚的科技色彩,也进一步彰显了科大讯飞在人工智能领域的领先地位。
科大讯飞开放平台研发总监刘可为在会上发表了题为“多模态+大模型,构建人形机器人新交互”的主题演讲。他表示,科大讯飞机器人超脑平台是以讯飞超脑2030技术为底座,面向物理世界、虚拟世界和元宇宙,以AI能力星云、多模态交互、大模型、模型训练、资产生成和软硬件接入为核心的机器人开发平台,不仅能够帮助开发者快速搭建多场景适配,并且具备深厚知识底蕴、擅长自我进化。
随着大模型技术的发展,以具身智能为代表的人形机器人成为发展的新趋势。面对功能更多样、任务更专业、交互更自然、决策更智能的挑战,讯飞机器人超脑平台从终端多模态交互和大模型理解决策两个方面出发,构建人形机器人的新交互模式。首先,通过视听融合的感知交互,实现了包含开启交互、保持交互、切换交互权和结束交互在内的机器人交互新范式。其次,基于大模型的机器人交互大脑,实现了控制级指令、官方技能、核心业务功能、快速知识问答、闲聊陪伴等多交互场景的统一。最后,开放了虚拟人驱动协议,满足不同数字人的接入需求。讯飞机器人超脑平台的愿景是,利用AI推动机器人产业的发展,让机器人走进千家万户。
在活动现场,科大讯飞展示的机器人超脑平台多模态人机交互系统吸引了众多参观者的目光。该系统解决了机器人在嘈杂环境下听、说、理解和思考的难题,展示了科大讯飞先进的多模态算法。借助这套系统,机器人不仅能实现语音识别、自然语言处理等基础功能,还具备人像识别、唇形识别等多种感知能力。更令人称赞的是,这套系统能够在人流密集、环境嘈杂的服务场景中精准捕捉到用户的声音,并运用讯飞星火大模型深入分析客户的自然语言语义,精确理解用户意图。
同时,讯飞拟人的语音技术使得机器人回复语言更具人性化,能够与用户进行更加亲切自然的交流。目前,科大讯飞的多模态交互系统已被广泛应用于数字人一体机、商用及家用服务机器人等多种设备中,其在智能家居、智慧零售、教育等领域的赋能作用尤为突出。
展望未来,科大讯飞将继续深耕人工智能领域,不断推动技术创新和应用。我们有理由相信,随着技术的不断进步和应用的不断扩展,机器人将在更多领域发挥更大的作用,为人类创造更加美好的未来。而科大讯飞,作为人工智能领域的佼佼者,将携手众多合作伙伴,共同推动机器人产业的蓬勃发展,让科技的力量更好地服务人类社会。