手机版

海若讲堂第九期丨浪潮云姚超:DeepSeek爆火的思考与行动

时间:2025-04-01 12:54:46作者:马慧思来源:互联网

2025年春节,DeepSeek凭借高性能、低成本的优势,迅速在全球范围内引发关注。DeepSeek的爆火,不仅推动了AI技术的普惠化,还对全球AI产业格局产生了深远影响。

2月17日,由浪潮云主办的「海若讲堂」第九场直播特别邀请到浪潮海若大模型首席架构师姚超,与我们深度聚焦热门案例,以爆火的DeepSeek为讨论对象,详细剖析其发展历程、创新技术、应用场景,让听众深入了解这一热门AI案例,紧跟行业前沿趋势。

Q : 为什么DeepSeek会突然爆火?

姚超:这一成绩的取得并非偶然,背后有着多方面的关键因素。

模型性能好:DeepSeek-V3在多项评测中超越一众开源模型和闭源模型。尤其DeepSeek-R1 在数学、代码、自然语言推理等任务上,具备显著优势。

模型开源开放:DeepSeek通过开放模型权重文件,允许商业机构免费使用、修改和二次分发。这一举措不仅推动了人工智能技术的开源生态发展,也让更多开发者和企业能够基于DeepSeek的模型进行创新,降低了技术门槛,加速了AI技术在各个领域的应用和普及。

使用成本低:DeepSeek-V3的完整训练成本仅为557.6万美元,远低于业界平均水平。此外,DeepSeek的网页和APP免费使用,注册流程简便,无需复杂验证,用户能够即时注册并使用。

Q : 在行业应用DeepSeek落地的过程中碰到了哪些问题?

姚超:在使用DeepSeek进行行业应用落地时,也碰到了一些挑战:

模型与数据安全:政府的应用场景对安全性要求极高,开源模型漏洞若未及时修补,可能会被攻击者利用,政务数据上传至政务网以外也存在安全风险。

运营与运维问题:开源模型下载完并不能直接使用,需要考虑模型部署和运维人员投入,包括联网等功能需要另外开发,可参考“谁建设谁运维”的模式,由云厂商来承担相关工作。

软件与硬件适配:DeepSeek在英伟达GPU上完成了训练,在国产GPU上需要进行适配,以满足国产化需求。

模型幻觉问题:DeepSeek虽然在大部分任务中表现优异,但由于其开源性质和广泛的适用性,它可能没有针对某些特定领域(如政务领域)进行深度学习。R1目前提供的上下文长度为64K token,在对话时可以通过检索增强(RAG)的方式读取部分文档内容来增强回答,以弥补模型幻觉问题。

Q : 浪潮云积极拥抱DeepSeek做了哪些工作?

姚超:浪潮云以“云上MaaS+一体机+行业智能体”为抓手,软硬结合。推出基于DeepSeek的MaaS服务、海若一体机及智能体应用,叠加端到端模型安全服务保障,为政府用户提供基于DeepSeek大模型智能应用落地的一体化解决方案。

基于DeepSeek的Maas服务

云上MaaS:依托政务云上线DeepSeek R1等模型,提供模型微调、推理等服务。

专享MaaS:基于DeepSeek的智能体创新平台,提供预装DeepSeek大模型和海若智能体平台的一站式交付服务。

预装DeepSeek的海若一体机

基于DeepSeek的海若一体机主要包括硬件、模型、海若智能体操作系统 AgentOS和智能体应用4个部分。

硬件适配了海若睿智610、海若灵智310、晟腾910B、L20、H20等10余款GPU芯片,满足不同算力需求;预装AgentOS(智能体操作系统),帮助用户快速创建智能体,并且可以接入海若大模型和DeepSeek等主流模型,可依据需求灵活选配行业应用。

针对组织用户的多样场景需求,海若一体机面向DeepSeek模型推出四种规格,预装14B、32B,70B,671B四种参数的DeepSeek大模型,用户可根据业务场景灵活选型,实现精度与效率的最佳平衡。

智能体应用增强:

智能体创新应用:基于DeepSeek的模型能力,结合硬件终端,打造新型智能体终端。

智能体应用增强:借助 DeepSeek 先进的推理机制,优化智能体的推理算法,提高响应速度;对智能体的对话策略进行重新训练,提升智能体服务质量。

Q : 浪潮海若大模型有哪些技术服务可以让组织用户更好地使用DeepSeek

姚超:通过预装DeepSeek大模型,为用户提供海若智能体操作系统 (AgentOS)来帮助其生成和管理智能体。同时,还为用户提供通用智能体应用和行业智能体应用。

海若智能体操作系统 (AgentOS

海若智能体操作系统 AgentOS是定位为智能体生产、管理的操作系统级产品,能提升智能体开发效率,异构兼容且允许多模型接入,内置模型池适配多种算力架构。开放易用,支持零代码/低代码构建,内置多种典型行业智能体。提供40余种工具,支持自定义工具接入。在安全可靠方面,有知识库细粒度权限管控,提供私有化部署方案。

海若智能体

海若智能体是为用户交付切实可用且具备高价值的智能化应用。

通用智能体应用:主要面向多样化的办公场景,提供综合性的办公工具。不仅具备联网搜索、知识问答、文档处理等基础且实用的办公能力,还支持Web、H5、APP 等多种不同终端的用户访问,极大地提升用户使用的便捷性。此外,能够无缝集成主流办公平台,实现办公生态的深度融合。

行业智能体应用:这是专门针对垂直领域专有场景而设计的智能化应用。涵盖了政务、水利、应急等多个关键领域场景,为各行业的智能化升级提供强大的驱动力。

在行业智能体的开发过程中,我们首先基于具体的行业场景,精准选择合适的模型(基于场景选模型),确保模型与场景的高度适配;其次,基于 AgentOS 对相应的工作流进行合理编排,以此构建出功能完备、性能卓越的智能体;最后,将构建好的智能体集成到系统之中,或者作为独立应用向用户提供服务,为用户带来更优质、更智能的体验。

Q : 浪潮海若大模型的产品有哪些?

姚超:浪潮海若大模型的产品包括海若大模型工厂、模型层、海若智能体。

海若大模型工厂:从明确需求、数据汇集、数据清洗、模型训练、模型调优、模型评测,最终成为大模型产品并提供推理服务。

模型层:支持多种大模型,包括海若大模型,DeepSeek等开源大模型以及第三方商业大模型。

海若智能体:包括智能体操作系统(AgentOS)和基于AgentOS开发出来的智能体应用。AgentOS 具备模型接入管理、工作流编排、知识库、工具调用、技能融合等多方面能力,其涵盖智能体开发的全流程关键功能模块。AgentOS支撑起众多智能体应用,像通用领域的知识问答、智能创作,行业领域的应急指挥调度、景区智能导览,还有不同终端的应用,如智能会议终端、应急智能终端等。

Q : 浪潮海若大模型的整体业务架构是什么?

姚超:浪潮海若大模型的整体业务是构建“1 + N”智能引擎生态,通过融入DeepSeek等多种大模型能力,为用户提供MaaS服务 +云资源服务、行业智能应用和本地可运营智能体云服务。基于海若智能体来实现边端协同管理,提供行业级智能体终端产品、通用智能体终端和智能体一体机等解决方案,涵盖政务、应急、水利、农业等多个领域等,为组织用户的智能化发展提供支持。

推荐阅读

  • 海若讲堂第九期丨浪潮云姚超:DeepSeek爆火的思考与行动

    2025年春节,DeepSeek凭借高性能、低成本的优势,迅速在全球范围内引发关注。DeepSeek的爆火,不仅推动了AI技术的普惠化,还对全球AI产业格局产生了深远影响。 2月17日,由浪潮云主办的「海若讲堂」第九场直……

    时间:2025-04-01 12:54:46
  • 数智赋能,“渝”见电商高质量发展

    2023年,重庆网络零售额实现2066.8亿,同比增长22.8%,蓬勃发展的电子商务,正加速成为数字经济增长的新引擎。由重庆市商务委主办的6·18电商节历经8年发展,也成为具有全国影响力的重庆专属电商节IP。 6月5日……

    时间:2024-06-11 17:00:06
  • 喜报!浪潮卓数大数据获批无锡市重点实验室建设立项

    近日,无锡市科技局发布《2024年度无锡市重点实验室拟建设项目公示名单》,浪潮卓数大数据申报的“无锡市可信数智融合技术重点实验室”名列其中。 公示页面 本年度无锡市重点实验室主要围绕“465”现代产业集……

    时间:2025-02-11 16:29:51
  • 浪潮海岳大模型智能填单助手:人机协作,加速实现智能自动化

    随着新一轮科技革命和产业变革深入发展,以大模型为代表的新一代人工智能技术在企业中的应用逐渐深化,通过“大模型”与“应用”融合,加速智能化自动化场景落地,成为企业数智化转型升级的重要方向。 业务数据录……

    时间:2024-11-12 14:13:54
  • 山东章鼓新一代智能工厂正式启用,跑出制造业发展加速度

    9月19日,浪潮通软基于海岳工业软件为山东章鼓打造的710新一代智能工厂正式启用,塑造了智能制造山东新样板,标志着山东章鼓进入了以新型数字基础设施与智能工厂推动企业发展的新阶段,书写制造业智改数转新篇章……

    时间:2023-09-21 09:44:21
  • 招商观颐:搭建认知症医养结合照护交流平台

    近日,由招商观颐主办的“认知症医养结合照护沙龙”在盐田招商观颐之家成功举行。此次活动汇聚了来自各大医院、行业协会以及相关企业的专家与机构负责人,共同参与本次的专业沙龙交流。 本次沙龙共邀请了7位认知……

    时间:2023-11-23 08:10:40
  • 杜淳女朋友杨璐(杜淳的女朋友)

    老婆怀孕的时候老公应该怎么办?相信在备孕阶段大家就已经看了无数的书籍、咨询了无数的过来人了吧,但是今天愚记君不是要和大家讨论育儿经,而是想和大家分享一下《妻子的浪漫旅行》中的几位老公的做法杜淳杨璐。……

    时间:2023-01-06 22:36:48
  • 王龙飞:探亲时间表

    探亲时间表   宿迁/王龙飞     前几天,领导要去东北出差,考虑到我是东北人,到那边对接业务会比较方便,便让我一同前往。 我赶紧打电话把这个消息告诉我妈,隔着电话能听得……

    时间:2024-05-10 11:18:36
  • 第十届中国国际服务贸易交易会2023国际金融创新与合作论坛成功举办

    2023年9月6日,以“金融创新驱动,数字引领未来”为主题的2023国际金融创新与合作论坛在第十届中国国际服务贸易交易会期间成功举办。 本次论坛由中国对外经济贸易会计学会、北京市商务局、北京市“两区”建设工作……

    时间:2023-09-15 15:42:20
  • 浪潮卓数大模型通过国家网信办深度合成服务算法备案

    近日,国家互联网信息办公室发布第九批深度合成服务算法备案信息公告,浪潮卓数大模型在算法透明、数据安全、法律合规、隐私保护等方面已经满足国家相关法律法规要求,正式通过备案,为接下来实现“Data+AI”一体……

    时间:2024-12-24 14:18:06
随机推荐