阿里 “扫地僧” 入职腾讯三个月便跳槽京东,通义AI人才频频被挖
据媒体报道,原阿里通义千问语音团队负责人、前腾讯AI Lab副主任鄢志杰,已于近期正式加盟京东探索研究院,出任语音实验室负责人,向京东集团副总裁、探索研究院院长何晓冬汇报。
鄢志杰于今年2月15日从阿里离职,职级为P10,其作为达摩院的十三位“扫地僧”之一,仅仅在加入腾讯三个月后就再次改换门庭也引发了市场的关注。
而除了鄢志杰,阿里AI业务在今年已有多位高管离职前往其他大厂。随着AI发展进入深水区,国内的高级AI人才也开始了新一轮的流动。
鄢志杰2008年在中国科学技术大学语音实验室获博士学位之后,至2015年在微软亚洲研究院语音组任主管研究员。研究领域主要包括语音识别、语音合成、声纹、语音交互、手写及光学字符识别等。
鄢志杰曾在语音及文本识别领域顶级学术期刊及会议发表多篇论文,长期担任语音领域顶级学术会议及期刊的专家评审,并拥有多项美国及PCT专利。
2015年加入阿里巴巴后,鄢志杰曾担任阿里IDST智能语音交互团队总监。“IDST”也被外界称为阿里最神秘的部门之一,它是达摩院下一代颠覆性人机交互技术和用户体验方面的核心团队,其研究成果被转化并应用于阿里集团、蚂蚁集团及微软公司多项语音相关产品中。
随着2023年大模型的时代到来,鄢志杰开始担任通义听悟技术负责人,负责聚焦音视频内容的工作学习AI助手“听悟”,这款产品也成为阿里在国内首个开放公测的大模型应用产品。2024年,鄢志杰以通义实验室语音团队负责人的身份出席外界活动。
不过随着腾讯在4月进行了TEG架构重组,原AI Lab与多个研究团队被拆解并整合为“大语言模型部”和“多模态模型部”,改由副总裁蒋杰直接统领。这或许是其再次离职的核心原因。
语音交互作为京东AI领域最重点的发力领域,2024年“采销东哥数字人”曾经凭着惟妙惟肖的仿真度火爆全网,然而随着今年6月百度推出罗永浩数字人分身后,其媲美超级头部主播的技术实力让市场意识到,语音AI赛道依然存在激烈的技术竞争。
随着目前AI发展到深水区,如何解决多模态大模型,尤其是以语音为底座完成交互的AI能力,一直是京东战略的核心。鄢志杰的加入,或许将为京东带来一次真正意义上的语音技术“系统升级”。
诸多高管出走
阿里通义实验室应用视觉团队负责人薄列峰(P10)于今年4月30日离职,其一度被爆出加入美国某互联网巨头负责多模态业务。不过现在其已被证实加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。
薄列峰在阿里期间,带领团队推出了多项具有行业影响力的生成式 AI 成果,包括支撑“全民舞王”功能的人体动作生成框架 Animate Anyone、换装模型 Outfit Anyone,以及基于语音驱动的人像生成系统 EMO(Emote Portrait Alive)。
有各种渠道消息传说,字节为其提供了阿里的5倍薪资及4-2的职级(相当于阿里的P12+),总包达到了千万年薪。 随着 AI 竞争进入深水区,核心技术人才的流向往往折射企业战略重心变化。阿里在频繁人事变动后如何填补关键岗位、稳定研发节奏,仍需时间给出答案。在其 CEO 吴泳铭的推动下,阿里明确提出要在现有业务中全面实现 “AI 化”,并且宣布未来三年将投入超过 3800 亿元用于建设云和 AI 硬件基础设施。
1、猛士35mm弹炮防空系统,可有效拦截多种类型无人机巡飞弹!,猛士122mm榴弹炮