手机版

海若讲堂第九期丨浪潮云姚超:DeepSeek爆火的思考与行动

时间:2025-04-01 12:54:46作者:马慧思来源:互联网

2025年春节,DeepSeek凭借高性能、低成本的优势,迅速在全球范围内引发关注。DeepSeek的爆火,不仅推动了AI技术的普惠化,还对全球AI产业格局产生了深远影响。

2月17日,由浪潮云主办的「海若讲堂」第九场直播特别邀请到浪潮海若大模型首席架构师姚超,与我们深度聚焦热门案例,以爆火的DeepSeek为讨论对象,详细剖析其发展历程、创新技术、应用场景,让听众深入了解这一热门AI案例,紧跟行业前沿趋势。

Q : 为什么DeepSeek会突然爆火?

姚超:这一成绩的取得并非偶然,背后有着多方面的关键因素。

模型性能好:DeepSeek-V3在多项评测中超越一众开源模型和闭源模型。尤其DeepSeek-R1 在数学、代码、自然语言推理等任务上,具备显著优势。

模型开源开放:DeepSeek通过开放模型权重文件,允许商业机构免费使用、修改和二次分发。这一举措不仅推动了人工智能技术的开源生态发展,也让更多开发者和企业能够基于DeepSeek的模型进行创新,降低了技术门槛,加速了AI技术在各个领域的应用和普及。

使用成本低:DeepSeek-V3的完整训练成本仅为557.6万美元,远低于业界平均水平。此外,DeepSeek的网页和APP免费使用,注册流程简便,无需复杂验证,用户能够即时注册并使用。

Q : 在行业应用DeepSeek落地的过程中碰到了哪些问题?

姚超:在使用DeepSeek进行行业应用落地时,也碰到了一些挑战:

模型与数据安全:政府的应用场景对安全性要求极高,开源模型漏洞若未及时修补,可能会被攻击者利用,政务数据上传至政务网以外也存在安全风险。

运营与运维问题:开源模型下载完并不能直接使用,需要考虑模型部署和运维人员投入,包括联网等功能需要另外开发,可参考“谁建设谁运维”的模式,由云厂商来承担相关工作。

软件与硬件适配:DeepSeek在英伟达GPU上完成了训练,在国产GPU上需要进行适配,以满足国产化需求。

模型幻觉问题:DeepSeek虽然在大部分任务中表现优异,但由于其开源性质和广泛的适用性,它可能没有针对某些特定领域(如政务领域)进行深度学习。R1目前提供的上下文长度为64K token,在对话时可以通过检索增强(RAG)的方式读取部分文档内容来增强回答,以弥补模型幻觉问题。

Q : 浪潮云积极拥抱DeepSeek做了哪些工作?

姚超:浪潮云以“云上MaaS+一体机+行业智能体”为抓手,软硬结合。推出基于DeepSeek的MaaS服务、海若一体机及智能体应用,叠加端到端模型安全服务保障,为政府用户提供基于DeepSeek大模型智能应用落地的一体化解决方案。

基于DeepSeek的Maas服务

云上MaaS:依托政务云上线DeepSeek R1等模型,提供模型微调、推理等服务。

专享MaaS:基于DeepSeek的智能体创新平台,提供预装DeepSeek大模型和海若智能体平台的一站式交付服务。

预装DeepSeek的海若一体机

基于DeepSeek的海若一体机主要包括硬件、模型、海若智能体操作系统 AgentOS和智能体应用4个部分。

硬件适配了海若睿智610、海若灵智310、晟腾910B、L20、H20等10余款GPU芯片,满足不同算力需求;预装AgentOS(智能体操作系统),帮助用户快速创建智能体,并且可以接入海若大模型和DeepSeek等主流模型,可依据需求灵活选配行业应用。

针对组织用户的多样场景需求,海若一体机面向DeepSeek模型推出四种规格,预装14B、32B,70B,671B四种参数的DeepSeek大模型,用户可根据业务场景灵活选型,实现精度与效率的最佳平衡。

智能体应用增强:

智能体创新应用:基于DeepSeek的模型能力,结合硬件终端,打造新型智能体终端。

智能体应用增强:借助 DeepSeek 先进的推理机制,优化智能体的推理算法,提高响应速度;对智能体的对话策略进行重新训练,提升智能体服务质量。

Q : 浪潮海若大模型有哪些技术服务可以让组织用户更好地使用DeepSeek

姚超:通过预装DeepSeek大模型,为用户提供海若智能体操作系统 (AgentOS)来帮助其生成和管理智能体。同时,还为用户提供通用智能体应用和行业智能体应用。

海若智能体操作系统 (AgentOS

海若智能体操作系统 AgentOS是定位为智能体生产、管理的操作系统级产品,能提升智能体开发效率,异构兼容且允许多模型接入,内置模型池适配多种算力架构。开放易用,支持零代码/低代码构建,内置多种典型行业智能体。提供40余种工具,支持自定义工具接入。在安全可靠方面,有知识库细粒度权限管控,提供私有化部署方案。

海若智能体

海若智能体是为用户交付切实可用且具备高价值的智能化应用。

通用智能体应用:主要面向多样化的办公场景,提供综合性的办公工具。不仅具备联网搜索、知识问答、文档处理等基础且实用的办公能力,还支持Web、H5、APP 等多种不同终端的用户访问,极大地提升用户使用的便捷性。此外,能够无缝集成主流办公平台,实现办公生态的深度融合。

行业智能体应用:这是专门针对垂直领域专有场景而设计的智能化应用。涵盖了政务、水利、应急等多个关键领域场景,为各行业的智能化升级提供强大的驱动力。

在行业智能体的开发过程中,我们首先基于具体的行业场景,精准选择合适的模型(基于场景选模型),确保模型与场景的高度适配;其次,基于 AgentOS 对相应的工作流进行合理编排,以此构建出功能完备、性能卓越的智能体;最后,将构建好的智能体集成到系统之中,或者作为独立应用向用户提供服务,为用户带来更优质、更智能的体验。

Q : 浪潮海若大模型的产品有哪些?

姚超:浪潮海若大模型的产品包括海若大模型工厂、模型层、海若智能体。

海若大模型工厂:从明确需求、数据汇集、数据清洗、模型训练、模型调优、模型评测,最终成为大模型产品并提供推理服务。

模型层:支持多种大模型,包括海若大模型,DeepSeek等开源大模型以及第三方商业大模型。

海若智能体:包括智能体操作系统(AgentOS)和基于AgentOS开发出来的智能体应用。AgentOS 具备模型接入管理、工作流编排、知识库、工具调用、技能融合等多方面能力,其涵盖智能体开发的全流程关键功能模块。AgentOS支撑起众多智能体应用,像通用领域的知识问答、智能创作,行业领域的应急指挥调度、景区智能导览,还有不同终端的应用,如智能会议终端、应急智能终端等。

Q : 浪潮海若大模型的整体业务架构是什么?

姚超:浪潮海若大模型的整体业务是构建“1 + N”智能引擎生态,通过融入DeepSeek等多种大模型能力,为用户提供MaaS服务 +云资源服务、行业智能应用和本地可运营智能体云服务。基于海若智能体来实现边端协同管理,提供行业级智能体终端产品、通用智能体终端和智能体一体机等解决方案,涵盖政务、应急、水利、农业等多个领域等,为组织用户的智能化发展提供支持。

推荐阅读

  • 长宁县委书记徐创军调研民营经济重点项目建设

    7月25日,长宁县委书记徐创军带领长宁经开区、自规局、企服中心等相关部门负责同志深入民营经济一线调研重点项目建设推进情况。 徐创军一行前往和乐门业、星光坝储能产业园等地,通过实地查看、听取汇报……

    时间:2023-07-26 14:32:53
  • 浪潮卓数大数据入选江苏省“2024年度省级专精特新中小企业”

          近日,江苏省工业和信息化厅公布2024年度省级专精特新中小企业(第二批)名单,浪潮卓数大数据凭借深厚的技术实力与持续的创新能力成功入选。 江苏省按照“专精特新企业培育……

    时间:2025-01-03 15:53:01
  • 浪潮云数字化转型之路—— 算力协同业务 计费精准高效

    伴随新一轮技术革命和产业变革的加速推进,基于算力的数字应用已开始广泛深入各领域,不断催生着新技术、新模式、新业态,助力各行各业加快数字化、智能化转型。2024年政府工作报告中提出:适度超前建设数字基础……

    时间:2024-08-30 11:23:21
  • “积众之力无所不成,聚众之智无所不能” ——沐爱镇项目推进工作纪实

    2023年,沐爱镇紧扣县委、县政府“项目竞进年”主题,坚持把抓项目促投资工作放在更加突出位置,围绕“四化同步 城乡融合”项目发展思路,结合全域春风乡村振兴示范村创建工作,从全局谋划一域、以一域服务全局,坚……

    时间:2023-06-19 10:05:36
  • 浪潮企业云亮相第63届高等教育博览会,云端赋能教育变革

    5月23日-25日,第63届高等教育博览会在吉林长春盛大召开,本届博览会由中国高等教育学会主办,主题为“融合·创新·引领:服务高等教育强国建设”。浪潮企业云携校园智能云、数字病人智能体实训机与云帆一体机精彩亮……

    时间:2025-05-27 08:09:08
  • 浪潮云亮相中国阿拉伯国家博览会

    8月28日,中国阿拉伯国家博览会在宁夏银川正式开幕,浪潮云精彩亮相。本届展会以“创新、绿色、繁荣”为主题,聚焦中阿经贸务实合作,旨在推动中阿双方在数字经济、人工智能等新兴领域的合作。作为中阿交流合作的……

    时间:2025-09-19 09:05:00
  • 数据力量闪耀香港!浪潮卓数大数据亮相2025香港国际创科展

    4月13-16日,由香港特别行政区政府、香港贸发局主办的2025香港国际创科展(InnoEX)在香港会议展览中心举办,来自17个国家和地区超500家顶尖科技企业、科研机构及行业先锋参展。作为数字经济领域的重要参展商,……

    时间:2025-04-17 10:18:13
  • 中华福茶文化交流活动暨第二届中非文化促进会颁发聘书成功举办

    当地时间7月22日,万里“茶”道,伴“福”同行文化活动暨第二届中非文化促进会颁发聘书, 在莫桑比克马普托孔子学院内一楼报告厅隆重举行, 在中国驻莫桑比克大使馆的大力支持下,中非文化促进会、莫桑比克蒙德拉内大……

    时间:2023-07-26 15:31:45
  • 数据云说 | 边缘云助力数据云算力基础设施创新应用

    2022年,中共中央、国务院印发了《关于构建数据基础制度更好发挥数据要素作用的意见》,旨在充分促进激活数据要素的价值。2023年数字中国建设“2522”框架,要求夯实数字基础设施和数据资源体系两大基础,数据已成……

    时间:2023-05-25 11:39:59
  • 2023中国开放树林指数发布!无锡市位列全省第一

    11月1日,复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院正式发布“2023中国开放数林指数”和《中国地方公共数据开放利用报告——省域》、《中国地方公共数据开放利用报告——城市》。其中,无锡市在202……

    时间:2023-11-27 09:25:46
随机推荐