"Science of AI 人工智能的科学基础研讨会"在上海交通大学举行
http://www.huaue.com  2026年4月24日  来源:上海交通大学

  人工智能浪潮奔涌向前,技术应用日新月异,但其背后的科学根基与理论本源亟待系统探寻。4月22日,由上海交通大学人工智能学院主办的“Science of AI:人工智能的科学基础研讨会”在上海交大徐汇校区人工智能学院一楼报告厅举行。

  本次论坛以“人工智能的科学基础”为主题,点明多年来人工智能成果显著,但科学基础的薄弱导致学科发展多次出现大起大落的现象,所以亟需推动人工智能学科从工程化走向科学化,促使相关技术从凭经验、靠试错的低效模式,转向由基本原理指导的发展方向,期待未来5至10年人工智能能建立起坚实的科学基础,实现更高质量的发展。

  中国科学院院士、国家自然科学基金委员会交叉科学部主任汤超,中国科学院院士、上海交通大学人工智能学院首席顾问鄂维南,中国科学院院士、清华大学计算机科学与技术系教授胡事民,上海交通大学副校长蒋兴浩,北京大学博雅特聘教授、北京中关村学院常务副院长董彬,中国科学技术大学人工智能与数据科学学院执行院长张燕咏,浙江大学计算机学院人工智能系系主任杨洋,上海未来产业基金总经理魏凡杰,上海交通大学人工智能学院党委书记杨一帆、执行院长王延峰及来自高校院所、科研机构的专家学者齐聚一堂,聚焦人工智能数理基础、理论框架与人才培养等核心议题,共探智能科学底层逻辑,共筑人工智能可持续发展的坚实科学根基。

  蒋兴浩向与会嘉宾表示热烈的欢迎,向长期以来关心支持学校人工智能学科发展的社会各界表示衷心感谢!他指出,人工智能的发展既要重视应用实践、释放技术创新价值,更要夯实自身科学体系、筑牢发展根基。站在建校130周年与人工智能学院成立两周年的交汇点上,深入探讨人工智能的科学基础,既是回应国家战略、培育新质生产力的必然要求,也是破解技术瓶颈的核心命题,期待各位专家畅所欲言、碰撞智慧,共同加强跨学科协同攻关,产出更多原创性引领性理论成果,为我国人工智能事业发展和中国式现代化建设贡献力量。

  在主旨报告环节,胡事民院士作《大模型的评测基准和自主生态》报告。他表示,我国大模型研究取得进展,开源领域已领先国际,但多模态推理能力仍有短板。在自主生态方面,其团队研发的“计图”框架具备速度快、适配国产芯片效率高的优势,通过元算子机制可快速适配芯片,还能实现生态迁移,大幅提升国产芯片在大模型推理等场景的性能。在大模型评测上,团队构建了多学科评测基准,发现模型存在多模态能力不足、几何推理受尺度率影响小、模型“偷懒”等问题。为此,他们开源多模态数据集与8B参数模型,为国产大模型发展提供基础资源与技术支撑。

  北京大学智能学院信息科学中心教授王立威作《大模型时代机器学习理论》报告。他表示,当前大模型理论研究主要围绕样本效率、任务泛化、知识学习与发现三大核心方向展开。思维链提示(CoT)为何能大幅提升大模型的推理能力:大模型的Transformer结构在不使用思维链时,很难直接一步给出数学题、逻辑推理等任务的正确答案。而加入思维链后,模型可以按步骤分步推导、逐词生成答案,即便参数规模固定,也能完成复杂推理,甚至可以解决 P 完全类问题。这从理论上解释了思维链的核心价值,也为理解与优化大模型的推理能力提供了关键依据。

  在主题报告环节,上海交通大学人工智能学院教授严骏驰分享了团队大模型优化研究成果JTok模块。针对当前大模型“堆参数”导致算力、显存成本飙升的问题,该模块像给词汇token配备“智能调节器”,通过查表和逐元素调制,在不增加主干参数、不稀疏计算路径的前提下提升模型容量。它可像插件挂载在Transformer每一层,分静态和动态两种模式,实现“轻量化扩容”,几乎不增加开销却能稳定提升性能,开辟了大模型高效Scaling新路径。

  上海交通大学人工智能学院副教授谢伟迪分享了OmniStream 4D流式视觉基础模型,破解视觉领域“一个任务一个模型”的碎片化困境。该模型将语义、三维空间位置、时间动态三大核心维度统一,采用因果时序注意力与3D旋转位置编码,经2亿帧全模态数据预训练,实现“全能表现”,在图像语义、视频时序理解上媲美顶尖模型,三维几何、空间问答等领域达到行业领先,完成从“专科专家”到“全能选手”的跨越。

  上海算法创新研究院研究员杨泓康分享了大模型“慢思考”与“主动感知”的前沿研究。他借鉴第一性原理“直击本质”的思路,提出“主动提升”理论,可将复杂数据分布转化为更易建模的隐序列分布,并将“慢思考”定义为主动感知的特殊形式。该理论为大模型“慢思考”设计提供完整框架,明确两大核心维度,能推导出最优模型方案,为打造具备深度思考能力的AI提供坚实理论支撑。

  上海交通大学人工智能学院助理教授夏纫秋分享了高可信AI领域的研究成果,聚焦自主探索的形式化数学推理。针对大模型数学推理的“逻辑黑盒”和“幻觉”瓶颈,团队利用形式化方法确保推理可验证,通过创新等价性度量标准与层次化推理机制,实现高可靠端到端求解。同时开发演绎探索智能体,验证其自主推导新知的潜力,为高可信AI奠定数理底座,提供从“命题验证”到“自主科学发现”的新范式。

  “人工智能时代的人才培养”圆桌论坛环节由严骏驰主持。魏凡杰、董彬、张燕咏、杨洋探讨了AI研究从“作坊式”向“工业化”转变的趋势、校企及国家实验室协同育人的模式,以及如何有效平衡科研、教学与创业。当前,风险投资正向前沿基础领域前置,高校需破除常规,鼓励学生探索与试错,培养冒险精神,注重跨学科能力,在课程与论文评价体系需革新以适应快速变革的时代,真正做到解决真实问题,塑造精神内核。

  “Science of AI”圆桌论坛环节由鄂维南主持。汤超、董彬、中国科学技术大学数学科学学院教授陈景润、中国科学院理论物理研究所副研究员陈锟、上海交通大学自然科学研究院/数学科学学院教授许志钦围绕训练模型的参数统计分布、智能与意识的涌现机制、物理智能的实现以及大模型机制可解释性等方面进行探讨,在方法论上需要发展新的理论框架,甚至可能引发物理学基础的革新,在解决路径上应结合严谨的科学训练,通过设计可控实验、观察现象、提出假设再验证的实证科学方法,逐步构建理解智能的新科学。

  会议最后,鄂维南院士作总结发言时指出,人工智能在理论层面已取得巨大进步,只是相关成果尚未被普遍了解,但从另一个角度来说,这恰恰是一个可以深入界定研究方向、组建相关研究的宝贵机会,但从根本而言,这项事业的推进最终必须依靠年轻人,需要年轻人主动作为、引领前行。
 关于上海交通大学更多的相关文章请点击查看 

特别说明:由于各方面情况的不断调整与变化,华禹教育网(Www.Huaue.Com)所提供的信息为非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性,仅供参考,相关信息敬请以权威部门公布的正式信息为准。