CSDN | 岳麓对话OpenCV之父
2024-10-29 09:30:41
站在2024年的技术浪潮之巅,我们见证着一个前所未有的变革时代:具身智能让机器有了“躯体”,大模型则为软件塑造了真正的“大脑”,开源创新持续释放着技术红利。在这场波澜壮阔的智能革命中,开发者正扮演着关键角色,用代码构筑着人类社会的智能未来。
顺应这一历史机遇,第五届1024程序员节于10月24日在世界计算·长沙智谷盛大启幕。这场由湖南省工业和信息化厅、湖南湘江新区管理委员会、长沙市工业和信息化局、长沙信息产业园管委会和CSDN联合打造的年度技术盛会,已然成为观察全球技术创新趋势的重要窗口。作为“IT技术与产业发展的创新风向标”,本届大会联动北京、上海、深圳、杭州、成都、济南、西安、武汉等八大城市,共同打造一场覆盖全国的技术盛宴。
2024 1024程序员节以“智能应用新生态”为主题,构建岳麓对话、技术英雄会、十多场主题峰会以及赛事、展览、开发者之夜等版块,盛邀200+位国内外技术翘楚共话创新未来,探寻智能时代的发展密码,协力打造中国研发技术的新范式。
岳麓对话作为每届大会的开幕重头戏,此次选定了两大前沿主题:一场由计算机视觉传奇人物、OpenCV创始人Gary Bradski领衔的机器人领域专家天团,以《十问具身智能与机器人》为题剖析智能交互新格局;另一场则邀请到产学研三界的人工智能技术专家,共同围绕大模型技术能力进化、应用场景及产业未来,展开了一场引人深思的《十问 AI 大模型》对话。
聚焦智能新未来,岳麓对话重磅开启
在大模型如火如荼发展的今天,应用落地成为了推动行业进步的关键命题。长沙作为拥有着丰富的产业集群的城市,更是在科技创新方面走在了时代的前沿。北京的大模型生态,则以其强大的研发能力和创新精神,引领着国内乃至国际的人工智能发展趋势。
首先,中国工程院外籍院士、德国国家工程院院士张建伟进行了视频连线。紧接着,CSDN创始人&董事长、开放原子开源基金会理事蒋涛在题为《AGI时代的软件生态》的演讲中指出,我们正在从确定性计算、人工编码、传统交互转向概率计算、机器生成代码和自然语言交互的大模型时代。蒋涛以现场编程演示的方式,展示了新时代程序员的软件开发范式。通过 InsCode 工具,他完全使用自然语言进行编程,体现了从”写代码“到”描述需求“的开发模式革新,不仅让80-90%的代码可由AI生成,更有望让人人都能开发个性化应用,形成新的”全民应用“生态。
蒋涛 CSDN 创始人、董事长,开放原子开源基金会理事
OpenCV创始人Gary Bradski带来"OpenCV5 and Spatial Intelligence" (OpenCV5和空间智能)的前沿分享,揭示空间智能的发展前景,以及他对 AGI的前瞻见解。他提出,空间智能应对标人脑的"WHAT(识别)"、"WHERE(定位)"和"WHY(因果)"三大系统,这三个系统在人脑中是分开但又相互配合的。例如,看到一个杯子倒下(WHAT),我们能判断它的运动轨迹(WHERE),并预测它会摔碎(WHY)。
Gary强调,OpenCV将从简单的3D对象检测和定位开始,逐步构建支持物理和因果推理的完整空间智能框架。他期望先实现WHAT和WHERE的结合,比如让安防系统既能检测到异常物体,又能定位其在3D空间中的位置。而更复杂的WHY系统,即对物理规律和因果关系的理解,则留待未来发展。
Gary Bradski OpenCV 创始人
十问具身智能与机器人,共探人机新交互
从艾伦·图灵(Alan Turing)、罗德尼·布鲁克斯(Rodney A. Brooks)到李飞飞,人类始终在探索着一个根本性的命题:如何赋予机器以类人的感知与认知能力。如今,随着计算机视觉、多模态交互等技术的突破性进展,具身智能正从实验室的理论构想逐步走向现实应用,在工业制造、社会服务等广泛领域展现出革命性的应用前景。这不仅是一场技术创新的浪潮,更预示着人机协作范式的根本性转变,开辟了通向通用人工智能的关键路径。
在南京清湛人工智能研究院执行院长、清湛智造总经理杨磊的主持下,本届岳麓对话汇聚了计算机视觉与机器人领域的顶尖专家,以《十问具身智能和机器人》为题,围绕具身智能的本质定义、人形机器人发展路径、多模态感知机制、数据采集与仿真、长期任务规划,以及人机协作的伦理边界展开深度探讨。
作为2024年人工智能领域的焦点概念,具身智能的定义在对话开始便引发了与会专家的思想交锋。与过去的机器人进行对比,工信部人形机器人专家组组长、国地共建人形机器人创新中心首席科学家江磊认为具身智能最明显的三个作用是感知、思考与进化:“过去的机器人主要依赖控制理论,通过代码执行固定任务,局限性明显。具身智能则很有想象空间,具备感知、思考和进化的能力,通过学习才实现对这个世界的探索,这正是具身智能带给我们最大的解决方案,也给未来带来了广阔的应用前景和展现空间。”
中科慧灵CTO马世奎对具身智能进行了本质的系统性思考:“具身智能重点在于'具身',强调智能行为和物理实体间的紧密关系。在完成任务目标的导向下,要将感知、理解、记忆、决策、行动形成闭环。机器人应该成为人类的伙伴和助手,能适应复杂环境变化,理解人类意图并实现默契协作,但也要保持在特定领域、可控范围内发展,而不是追求在各方面超越人类。”
Roboraction.AI CEO黄浴指出了具身智能和ChatGPT等大语言模型的核心差别:“具身智能的核心在于环境交互能力,它能主动影响环境并从环境获取反馈,通过这种双向互动来理解动态环境并积累智能。这种方式类似于人类婴儿的成长过程,也可能是通向通用人工智能的必由之路。”
OpenCV创始人Gary Bradski则从概念本源出发,细致区分了空间智能与具身智能的关系:“空间智能关注定位和三维建模,而具身智能的核心是感知。人类即便在睡眠中也保持着身体感知与思考,清醒时能自然连接外部感知与内存信息,通过持续迭代认知模型来构建理解。” 他还引用了柏拉图的名言:「人类内部精神与外部世界的相对隔离,恰使我们建立了独立认知。」由此,Gary指出具身智能的关键在于实现类人的模型迭代与持续学习,在内外世界间建立起韧性认知桥梁。
随后,专家们就人形机器人发展前景、多模态学习机制、伦理规范等议题展开了深入探讨。马世奎从技术实现角度指出,“在相应场景里,工业机器人机械臂仍是较好的选择,人形机器人是工业机器人的补充而非替代。”
面对具身智能复杂的数据问题,黄浴强调:“具身智能的数据挑战比视觉要难得多,因为其维度、多样性和演化空间都远超图像或语音。”
江磊从进化和认知的角度,提出了关于人形机器人的系统化思考:“具身智能应该分为三层:视觉的具身智能、手的具身智能和脚的具身智能。就像人类一样,双腿直立行走,大脑思考,双手操作,形成一个能交流对话、创造文明的整体。” 他特别强调,这种分层架构源于对人类智能发展的深入观察,“就像人类婴儿预置了基础行为模型,却需要在与环境互动中实现智能进化。”
然而,Gary Bradski却对人形机器人的必要性提出了深刻思考。他指出:“在进化过程中,复杂形态是为了解决复杂问题,而现实生活中的大多数问题并未复杂到需要人形机器人的程度。”他建议从更基础的角度理解具身智能和空间智能——首先要明确WHAT(识别)以及WHERE(定位)这两个根本问题。Gary认为,通过设计适应世界的基础模型并进行仿真训练,也许能创造出形态更简单但依然有效的机器人。
最后,每位专家展望了具身智能在未来 5-10 年的发展愿景,纷纷送出寄语:
黄浴:“借助大模型和视觉语言大模型的突破,期待在未来几年看到护士机器人、家务机器人等真正的产品落地,成为人类工作生活的好助手。”
马世奎:“通过解决通用性和适应性这两个关键问题,让具身智能真正走进生活,在特定领域承担基础性工作,实现人机共融的社会。”
Gary Bradski:“人工智能和机器人是应对人口减少、环境恶化、气候变化等全球挑战的必要工具。它既可能帮助创造美好世界,也可能带来破坏,所以关键在于如何在道德伦理框架下发展。”
江磊:“我们即将推出类似无人驾驶L1到L4的分级分类标准,让具有有限自主能力的人形机器人在人类监督下逐步落地。我相信这是一个充满前景的产业,需要更多厂家共同参与标准制定,推动产业快速发展。”