网站地图
中国首家网上媒体 1995年 1 月 12 日创办
社内媒体
官方微信
官方微博
当前位置: 首页 > 深度 > 正文
DeepSeek横空出世,全新的人才观下,教育如何变革?
发布时间: 来源: 上观新闻

  ■人工智能发展最需要的是跨学科和原创性,Deepseek的成功提醒我们,未来的教育模式将会更注重跨学科的融合,培养具备数学、计算机科学、心理学等多学科背景的复合型人才

  ■当AI能够传授知识、解决问题,那么学校和教师的存在价值和存在意义在何处?大学的管理制度,乃至大学的存在也将面临更多挑战

  刚刚过去的蛇年春节,杭州深度求索公司上线的深度思考大模型Deep Seek日流量持续增长,表现抢眼。特别是,DeepSeek在多头潜在注意力(Multi-Head Latent Attention,MLA)等关键技术上的表现十分突出,大幅度降低了推理成本,能在市场上以极具竞争力的价格提供服务。

  DeepSeek的出现降低了高性能AI模型的使用门槛,拓展了人工智能应用的新边界。与此同时,教育与科研领域也因为DeepSeek的出现而迎来适应性变革。就教育而言,将面临深度与广度的双重拓展,教师的职能面临重塑,教育体制也将迎来变革;就科研而言,在DeepSeek等AI技术的赋能下,小型化、高密度的科研团队将成为可能。这类团队不仅汇聚顶尖人才,更强调成员背景的多元化,由此形成跨学科、跨领域的创新生态。这种新型科研组织形态,将更好地适应未来科技发展的需求,推动重大科学突破的诞生。

  为什么DeepSeek会诞生在量化公司

  深度求索公司是由幻方量化公司的核心团队孵化成立,甚至有观点认为,深度求索是幻方量化在AI前沿领域的“技术溢出”。DeepSeek诞生在量化公司,固然是因为其本身的一些独特优势,但幻方的前瞻布局和对人才的重视,才是DeepSeek诞生的原因。

  让我们先来谈谈量化投资。一般来说,量化投资具有较高的收益潜力,所以不少量化公司都有足够的经济条件,围绕软硬件提供支持。除此之外,量化公司在技术栈和人才技能方面,与大模型技术高度契合。因为量化投资需要大量具备数学、计算机科学等学科背景的高级人才,这些人才也正是当前大模型技术研发所需要的,所以,可以直接利用现有的技术栈和人才资源,就地开展研发工作。更重要的是,这种技术优势也使得很多刚刚毕业的年轻人能够在真实的技术环境中学习和成长。

  在众多量化公司中,幻方的表现尤为突出,一个主要原因是这家企业在深度学习方面的积累非常早。早在大模型技术兴起之前,幻方就已积极购买算力,并招募AI研究领域的实习生。要知道,这种做法即便在量化圈中也很少见——通常而言,量化投资行业较为务实,倾向于追求立竿见影的收益,对于与核心业务关联度不高的研发工作投入相对有限。此外,量化投资行业圈内不少人,对缺乏明确解释性的深度学习方法持怀疑态度。

  但从现在来看,正是这种前瞻性布局,使得幻方在大模型技术兴起时,就能迅速占据有利位置。企业不仅拥有丰富的深度学习经验,还积累了大量的算力资源,这些资源使得它能够在大模型技术的研发中迅速实现突破。

  同时,幻方在人才引进和保留方面也表现出色。在量化投资领域,人才是最宝贵的资源。幻方通过“高薪养人”策略,不仅提高了公司的研发能力,还使得这些人才能够长期留在公司,增强了公司的竞争力。这种策略在量化圈子里也并不常见,因为量化公司大多倾向于通过短期激励来吸引人才,相对忽视长期的人才保留。而恰好是这种“高薪养人”的策略,使得优秀研究人员得以长期保留,推动教育创新和技术进步。

  另一方面,就技术而言,底层系统框架的重要性在DeepSeek中充分显示,这也是量化公司原本的优势所在。底层系统框架是支撑所有交易策略和数据分析的基础架构。在量化投资领域,底层系统框架的成功与否往往决定了其稳健性保障策略执行与风险控制,决定了整个项目的成败。优秀的框架促成高效交易与精准分析,缺陷则可能导致重大损失。

  幻方的技术报告中有大量篇幅涉及底层系统框架,而非算法层面的太多创新。在大模型中,底层框架指模型训练和推理的支撑平台,负责高效管理计算资源,优化数据处理流程,确保模型能够稳定、快速学习和执行任务。强大的底层系统框架能提升模型性能,缩短训练时间,降低资源消耗,从而加速模型迭代和部署。事实上,底层系统是DeepSeek成功的关键因素之一,它保证一些创新想法快速试错、验证和迭代。

  通过优化底层系统框架,幻方不仅降低了研发成本,还提高了迭代效率。这种高效的研发模式,使得企业能在激烈的市场竞争中保持领先。相比之下,许多AI初创公司过于关注算法层面的创新,而忽视了底层系统的重要性,最终导致研发效率低下,难以取得突破。

  跨学科人才,是创新成为可能的重要因素

  DeepSeek的成功再一次说明了跨学科人才在创新发展中所起到的作用。据笔者所知,不少在量化公司工作的人员,他们在学生时代都曾是数学竞赛、计算机竞赛的金银牌得主。这些人才不仅具备扎实的数理基础,还拥有出色的编程能力。这实际上也给我们带来一些启发:高校在人才培养方面,应更大胆地鼓励学生打破学科界限、勇于尝试,同时提供更多创新竞赛和创业支持,在课程设置方面也应更注重实践性和前沿性。当然,高校也可以通过与企业建立合作关系,建立联合实验室、实习项目等方式,让学生尽早接触实际产业问题,提升实践能力。

  当前,大模型技术需要的恰恰是跨学科的原创性。DeepSeek在中国招聘人才,不考虑以往的资历,重点关注人才自身的能力。许多员工都毕业于国内高校,职位不一定事先被确定,应聘者也可以灵活选择。在一篇对DeepSeek创始人梁文锋采访的报道中提到过,团队中没有什么高深莫测的奇才,很多成员中有不少是本土的新人、或来自顶尖高校的应届毕业生,尚未毕业的博四博五实习生等。幻方给他们实习机会与硬件支持,为他们提供了一个平台,努力发挥这些青年人才在科学技术研究中的最大潜力,通过充分发挥不同学科的优势,使得DeepSeek大模型在短期内焕发出光彩。

  这也进一步提醒我们,未来的教育模式将会更注重跨学科的融合,培养具备数学、计算机科学、心理学等多学科背景的复合型人才。

  再以笔者所在的团队为例。多年科研实践的经验,使得我们在选拔成员时,会关注学生的基础学科水平和竞赛水平。因为,基础学科的表现出色证明其具备扎实的理论基础,这是深入研究和创新的基石。而竞赛水平高的学生,通常展现出较强的逻辑思维、创新能力和解决问题的能力。这些能力是科研和技术发展的关键。

  当然,并非只有计算机学科或者数学学科才是必需。事实上,不同学科的潜力型人才学习能力和适应能力通常都更强,能够更快地掌握新知识,更高效地实现科研突破和技术创新。

  AI的未来已来,教育和科研能否跟上

  DeepSeek的开源,使得业界不少人发出感叹:AI的未来已来,那么,当下的教育和科研能否跟上?如何跟上?

  就在2月6日,谷歌发布了《利用AI构建科学未来政策框架》文件,对政府发展AI提出了一系列建议,其中包括,政府应在STEM领域积极争夺人才,想方设法争夺来自世界各地的STEM领域的学生、研究人员和科学家;政府应加大力度支持培养下一代精通AI的科学家;通过各类新的规划,培养教育工作者的AI素养;高等教育机构要将AI整合到课程中,并且通过提供专门的AI项目和跨学科课程,将AI与其他科学学科相结合,为下一代科学家提供驾驭AI驱动未来所需的技能。由此可见,教育和人才是影响AI发展乃至科技未来发展的重要因素。

  事实上,信息技术的迅猛发展,也已经在逐步改变教师和教育机构的“角色”。传统教学中,教师主要是知识的传授者,AI的引入使得教师更多转向引导者和辅导者的角色。从短期来看,AI在教学中提升了互动性和效率。教师需要帮助学生理解AI工具的使用,并培养他们的批判性思维和创新能力。而从长期来看,AI将推动教育更加个性化和灵活,AI不仅是学习工具,还可能成为学生创新和研究的合作伙伴,教育将更加注重跨学科的创新能力和解决复杂问题的能力。

  自从大模型出现后,学生已经越来越多地在学习中使用AI工具,不少学生会根据自己的学习进度和需求,向AI“学伴”寻求支持,以解决学习中的难点;通过自动整理文献综述的AI工具快速筛选并总结相关文献,节省大量时间,高效构建研究框架;在编程方面,AI工具的利用率更高,也可以根据简单的描述自动生成代码,避免学生在重复性任务上浪费时间,让他们集中精力解决更具挑战性的问题。

  此外,在科研上,AI帮助简化了数据处理和分析,节省了大量时间,让研究者得以更专注于创新和问题解决。在科研中,AI的真正力量在于其能够极大地加速科学研究的过程。特别是在某些领域,如新药研发、材料科学和疾病诊断,AI甚至能将传统实验和研究所需的数百年乃至上千年的工作压缩至几个月甚至几天内完成。

  那么,当AI能够做到传授知识、解决问题时,教师的存在价值和存在意义在何处?这些都是我们必须思考的问题,而大学的管理制度,乃至大学的存在也将面临更多挑战。

责任编辑:施惠文

文章中观点仅代表作者个人观点,不代表本网站的观点和看法。

神州学人杂志及神州学人网原创文章转载说明:如需转载,务必注明出处,违者本网将依法追究。