探索新质生产力:人大创业者勇闯人工智能无人区

发布时间:2024-04-08

导语

在当前新质生产力发展浪潮中,以ChatGPT、Sora为代表的大模型技术引发了新一轮人工智能革命,一批年轻人大人,秉承“有人类情怀的人工智能理念”,正勇闯无人区。他们中的杰出代表有中国人民大学信息学院校友董天智(创办曲线机器人公司)、黄真(创办数论科技公司),以及高瓴人工智能学院博士生高一钊(创办智子引擎公司)。现推出首期创新创业报道,期待更多“复兴栋梁、强国先锋”勇走新路。

01 董天智与曲线机器人

中国人民大学信息学院校友董天智,作为技术合伙人与团队共同创立了曲线机器人公司(CurveRobot),该公司专注于智能喷涂机器人的研发和应用。

董天智校友在信息学院完成了本科与硕士阶段的学习,接受了扎实的计算机科学与技术教育,在高瓴人工智能学院窦志成教授的指导下,深入实验室参与多个跨学科项目。在校期间,他对机器学习、深度学习、机器视觉等泛人工智能技术的工业应用产生了浓厚的兴趣,并在“有人类情怀的人工智能”的感召下,将前沿技术从实验室带入工业界,研发智能喷涂机器人,改善高危职业工人工作环境,带动产业升级与新质生产力发展。

董天智带领曲线机器人研发团队,专注于核心技术突破,为汽车、家具、门窗、钣金等多个行业提供智能化喷涂解决方案。团队自主研发了包括AI视觉定位、深度相机、高精度相机标定、运动控制、曲面路径规划、高速碰撞检测、喷涂流体建模等多项关键技术与产品,在多个细分领域实现从原型开发到产品推广的跨越。

曲线机器人公司的发展得到了市场认可,获得多轮融资,投资方包括远望资本、前海母基金、雅瑞资本、欧瑞基金等知名投资机构。2023年,曲线机器人成功落地浙江台州,成为当地发展新质生产力的标杆企业。

做“有人类情怀的人工智能”是人大技术人所秉持的理念,曲线团队从人文关怀角度出发,以科技创新为驱动,有效改善了高危职业工人工作环境。随着智能喷涂机器人在国内外市场的不断拓展,董天智和他的团队深耕新质生产力,努力为实现人类高品质生活做出贡献。


02 黄真与数论科技

作为人大信息学院计算机与数学双学位毕业生,大学期间,黄真师从窦志成与文继荣教授,参与多模态大模型文澜的研究。2022年,黄真创办数论科技,将研究重心转向多模态大模型与机器人控制领域,致力于打造通用化一体式智能工业机器人。

团队依托于大模型方向的长期研发积累,力图打造工业领域全球领先的垂直多模态大模型。在机器人自主作业技术方面,团队构建手眼自动标定、三维环境建图技术、6Dof位姿估计算法、关节约束与避障约束的自动轨迹规划算法、视觉伺服控制、零力拖拽与柔顺控制等核心算法,使得大模型能在任务级别更好地控制机器人完成各类物理操控。团队经过两年自主研发,基于多模态大模型和机器人自主作业技术,创新性地研发出了工业机器人智能操控大脑"RoboPrompt"。

RoboPrompt赋予了机器人理解自然语言并自动完成复杂任务的能力。工人只需用普通语言描述工艺要求,RoboPrompt便能智能生成机器人运动轨迹,并自动操控末端执行器完成各类产品加工工序,实现高质高效的作业执行。这一突破性创新不仅打破了传统的复杂编程模式,还大幅提升了工业机器人的使用体验。测试数据显示,基于RoboPrompt的智能机器人投产周期由过去的数月缩短至仅需几个小时,集成效率飞跃式提升超过30倍。

短短一年时间,RoboPrompt便已在食品、金属、印刷、电路板等多个传统制造业领域获得广泛应用,公司实现了300%以上的收入增长,产品项目覆盖华南、华中、华东等多个城市,并获得原微软全球执行副总裁陆奇博士创办的奇绩创坛投资孵化。

黄真与数论科技公司这支年轻力量,正不断攀登科技高峰,引领智能制造新风向,为践行有人类情怀的人工智能贡献卓越智慧!

03 高一钊与智子引擎

Sora横空出世,带火了中关村一家叫“智子引擎”的创业公司。只因Sora背后的架构,与这支团队1年前提出基于Transformer的Video统一生成框架出奇相似。

该创业团队由中国人民大学高瓴人工智能学院90后博士生高一钊创立。公司成立之际大语言模型依旧是主流,却早早打入多模态这条“无人区”的赛道。而团队此前发布的论文也与Sora“撞车”,论文是团队在卢志武教授的指导下,联合UC伯克利、港大等单位于2023年5月发表在arXiv上的VDT。

智子引擎前身团队早在数年前便已经和OpenAI在多模态大模型的研究和进展上保持了近乎相同甚至超前的节奏。文澜多模态预训练成果论文还在2022年被Nature Communications接收,成为世界首个被Nature子刊接收的多模态领域论文,该论文下载量在当年社会科学与人类行为类别达到前10位。

2023年3月8日,智子引擎正式发布了自己的第一个多模态产品——ChatImg,是世界首个公开评测的通用多模态对话应用。ChatImg在技术上是基于多模态融合模块和语言解码器,参数量大约为150亿,主打让AI学会看图说话。

智子引擎的多模态技术与商业化并驾齐驱,应用于电网、电力、化工、巡检等多个场景。基于大模型的泛化能力和涌现特性,智子引擎已经利用一个多模态大模型,满足了过去十几乃至几十个小模型才能解决的实际需求。“我们对2024年收入实现爆发性增长非常有信心。” 创始人高一钊如是说。

结语

发展新质生产力,教育是基础,人才是关键。正如中国人民大学张东刚书记所言:“惟改革者进,惟创新者强”,年轻的人大青年,始终秉承为国为民的人类情怀,在创新创业精神的指引下,在人工智能的蓝海中,开疆拓土,勇走新路。

文章来源:人大高瓴人工智能学院