手机版

海若讲堂第九期丨浪潮云姚超:DeepSeek爆火的思考与行动

时间:2025-04-01 12:54:46作者:马慧思来源:互联网

2025年春节,DeepSeek凭借高性能、低成本的优势,迅速在全球范围内引发关注。DeepSeek的爆火,不仅推动了AI技术的普惠化,还对全球AI产业格局产生了深远影响。

2月17日,由浪潮云主办的「海若讲堂」第九场直播特别邀请到浪潮海若大模型首席架构师姚超,与我们深度聚焦热门案例,以爆火的DeepSeek为讨论对象,详细剖析其发展历程、创新技术、应用场景,让听众深入了解这一热门AI案例,紧跟行业前沿趋势。

Q : 为什么DeepSeek会突然爆火?

姚超:这一成绩的取得并非偶然,背后有着多方面的关键因素。

模型性能好:DeepSeek-V3在多项评测中超越一众开源模型和闭源模型。尤其DeepSeek-R1 在数学、代码、自然语言推理等任务上,具备显著优势。

模型开源开放:DeepSeek通过开放模型权重文件,允许商业机构免费使用、修改和二次分发。这一举措不仅推动了人工智能技术的开源生态发展,也让更多开发者和企业能够基于DeepSeek的模型进行创新,降低了技术门槛,加速了AI技术在各个领域的应用和普及。

使用成本低:DeepSeek-V3的完整训练成本仅为557.6万美元,远低于业界平均水平。此外,DeepSeek的网页和APP免费使用,注册流程简便,无需复杂验证,用户能够即时注册并使用。

Q : 在行业应用DeepSeek落地的过程中碰到了哪些问题?

姚超:在使用DeepSeek进行行业应用落地时,也碰到了一些挑战:

模型与数据安全:政府的应用场景对安全性要求极高,开源模型漏洞若未及时修补,可能会被攻击者利用,政务数据上传至政务网以外也存在安全风险。

运营与运维问题:开源模型下载完并不能直接使用,需要考虑模型部署和运维人员投入,包括联网等功能需要另外开发,可参考“谁建设谁运维”的模式,由云厂商来承担相关工作。

软件与硬件适配:DeepSeek在英伟达GPU上完成了训练,在国产GPU上需要进行适配,以满足国产化需求。

模型幻觉问题:DeepSeek虽然在大部分任务中表现优异,但由于其开源性质和广泛的适用性,它可能没有针对某些特定领域(如政务领域)进行深度学习。R1目前提供的上下文长度为64K token,在对话时可以通过检索增强(RAG)的方式读取部分文档内容来增强回答,以弥补模型幻觉问题。

Q : 浪潮云积极拥抱DeepSeek做了哪些工作?

姚超:浪潮云以“云上MaaS+一体机+行业智能体”为抓手,软硬结合。推出基于DeepSeek的MaaS服务、海若一体机及智能体应用,叠加端到端模型安全服务保障,为政府用户提供基于DeepSeek大模型智能应用落地的一体化解决方案。

基于DeepSeek的Maas服务

云上MaaS:依托政务云上线DeepSeek R1等模型,提供模型微调、推理等服务。

专享MaaS:基于DeepSeek的智能体创新平台,提供预装DeepSeek大模型和海若智能体平台的一站式交付服务。

预装DeepSeek的海若一体机

基于DeepSeek的海若一体机主要包括硬件、模型、海若智能体操作系统 AgentOS和智能体应用4个部分。

硬件适配了海若睿智610、海若灵智310、晟腾910B、L20、H20等10余款GPU芯片,满足不同算力需求;预装AgentOS(智能体操作系统),帮助用户快速创建智能体,并且可以接入海若大模型和DeepSeek等主流模型,可依据需求灵活选配行业应用。

针对组织用户的多样场景需求,海若一体机面向DeepSeek模型推出四种规格,预装14B、32B,70B,671B四种参数的DeepSeek大模型,用户可根据业务场景灵活选型,实现精度与效率的最佳平衡。

智能体应用增强:

智能体创新应用:基于DeepSeek的模型能力,结合硬件终端,打造新型智能体终端。

智能体应用增强:借助 DeepSeek 先进的推理机制,优化智能体的推理算法,提高响应速度;对智能体的对话策略进行重新训练,提升智能体服务质量。

Q : 浪潮海若大模型有哪些技术服务可以让组织用户更好地使用DeepSeek

姚超:通过预装DeepSeek大模型,为用户提供海若智能体操作系统 (AgentOS)来帮助其生成和管理智能体。同时,还为用户提供通用智能体应用和行业智能体应用。

海若智能体操作系统 (AgentOS

海若智能体操作系统 AgentOS是定位为智能体生产、管理的操作系统级产品,能提升智能体开发效率,异构兼容且允许多模型接入,内置模型池适配多种算力架构。开放易用,支持零代码/低代码构建,内置多种典型行业智能体。提供40余种工具,支持自定义工具接入。在安全可靠方面,有知识库细粒度权限管控,提供私有化部署方案。

海若智能体

海若智能体是为用户交付切实可用且具备高价值的智能化应用。

通用智能体应用:主要面向多样化的办公场景,提供综合性的办公工具。不仅具备联网搜索、知识问答、文档处理等基础且实用的办公能力,还支持Web、H5、APP 等多种不同终端的用户访问,极大地提升用户使用的便捷性。此外,能够无缝集成主流办公平台,实现办公生态的深度融合。

行业智能体应用:这是专门针对垂直领域专有场景而设计的智能化应用。涵盖了政务、水利、应急等多个关键领域场景,为各行业的智能化升级提供强大的驱动力。

在行业智能体的开发过程中,我们首先基于具体的行业场景,精准选择合适的模型(基于场景选模型),确保模型与场景的高度适配;其次,基于 AgentOS 对相应的工作流进行合理编排,以此构建出功能完备、性能卓越的智能体;最后,将构建好的智能体集成到系统之中,或者作为独立应用向用户提供服务,为用户带来更优质、更智能的体验。

Q : 浪潮海若大模型的产品有哪些?

姚超:浪潮海若大模型的产品包括海若大模型工厂、模型层、海若智能体。

海若大模型工厂:从明确需求、数据汇集、数据清洗、模型训练、模型调优、模型评测,最终成为大模型产品并提供推理服务。

模型层:支持多种大模型,包括海若大模型,DeepSeek等开源大模型以及第三方商业大模型。

海若智能体:包括智能体操作系统(AgentOS)和基于AgentOS开发出来的智能体应用。AgentOS 具备模型接入管理、工作流编排、知识库、工具调用、技能融合等多方面能力,其涵盖智能体开发的全流程关键功能模块。AgentOS支撑起众多智能体应用,像通用领域的知识问答、智能创作,行业领域的应急指挥调度、景区智能导览,还有不同终端的应用,如智能会议终端、应急智能终端等。

Q : 浪潮海若大模型的整体业务架构是什么?

姚超:浪潮海若大模型的整体业务是构建“1 + N”智能引擎生态,通过融入DeepSeek等多种大模型能力,为用户提供MaaS服务 +云资源服务、行业智能应用和本地可运营智能体云服务。基于海若智能体来实现边端协同管理,提供行业级智能体终端产品、通用智能体终端和智能体一体机等解决方案,涵盖政务、应急、水利、农业等多个领域等,为组织用户的智能化发展提供支持。

推荐阅读

  • ​ 亮城集团开展“迎中秋 庆教师节”节前清洗行动

    2023年中秋节、教师节假期即将来临,为营造良好的城市环境面貌,保持扬尘污染治理成果,确保为广大市民和全体教师及游客提供一个干净整洁、舒适靓丽、文明和谐的节日环境,河北亮城集团在保定市执法局的统一领导下组……

    时间:2023-09-11 14:32:20
  • 发展能力第一!浪潮云跻身中国智能体市场领导者象限

    近日,赛迪顾问正式发布《2025中国智能体市场发展研究报告》(以下简称“报告”)。报告显示,浪潮云跻身中国智能体市场领导者象限,并以市场地位和发展能力双料第一的成绩,稳居政务智能体市场第一位。 ……

    时间:2025-12-12 10:30:41
  • 斩获2025IT市场年会两大奖项,浪潮卓数大数据行业能力再获权威认可

    4月24日,由工信部直属研究机构赛迪顾问主办的2025IT市场年会(第26届)在北京召开,浪潮卓数大数据凭借卓越的技术创新能力和产品实践成果,荣膺“新一代信息技术创新企业”称号,其自主研发的卓数工坊平台同时斩……

    时间:2025-04-25 16:51:49
  • 浪潮通软获评2023年度软件和信息技术服务“名牌企业”

    10月13日,由中国工业互联网研究院、中国电子信息行业联合会、中国电子学会等联合浙江省经信厅、宁波市政府共同主办的2023世界数字经济大会暨第十三届智博会召开。会上颁布2023年度软件和信息技术服务“名牌企业”……

    时间:2023-10-19 15:44:03
  • 浪潮云三大项目入选2025年山东省数据要素市场化配置改革“揭榜挂帅”名单

    为扎实开展国家数据要素综合试验区建设,加快推进数据要素市场化配置改革,充分释放数据要素价值,近日,山东省大数据局正式公布2025年全省数据要素市场化配置改革“揭榜挂帅”名单,浪潮云牵头的“城市可信数据空……

    时间:2025-03-25 11:57:45
  • 张帆应邀出席2024数博会“大数据统计”交流活动

    8月28日,2024中国国际大数据产业博览会在贵州省贵阳市开幕。浪潮卓数大数据董事长张帆应邀参会,同时出席由中国统计学会指导,国家统计局统计科学研究所、贵州省统计局、贵州财经大学主办的2024数博会“大数据统……

    时间:2024-08-29 17:32:33
  • 第七届“一带一路”青少年创客营与教师 研讨活动(中国—中亚板块)在新疆 正式开营

    11月6日,第七届“一带一路”青少年创客营与教师研讨活动(中国—中亚板块)在新疆乌鲁木齐正式启动。来自“一带一路”共建国家的青少年与教师代表通过“体验式互动式交流”深度感受中国新疆魅力,促进科技文化交流共享……

    时间:2023-11-09 17:27:12
  • AI赋能粮食安全,2025华粮科技数智化创新峰会在京召开

    4月18日,2025华粮科技数智化创新峰会在北京召开,会议以“AI+粮食·智领未来”为主题,由华粮科技主办,邀请知名专家、央国企高管、权威机构、企业代表等百余人汇聚一堂,围绕AI大模型、智能体、机器人等热点议题……

    时间:2025-04-21 15:31:44
  • 浪潮云连续两年荣获“openEuler领先商业实践”奖项

    近日,以“智跃无界 开源致远”为主题的操作系统大会&openEuler Summit 2025在北京成功举办,浪潮云提报的“基于浪潮云启操作系统InLinux的人工智能工厂”项目,凭借在技术创新、生态适配及行业规模化落地中的卓……

    时间:2025-11-25 08:52:31
  • 市场地位声明:百年医仁荣膺“中国高端非遗膏滋第一品牌”

    引言:膏滋是以中医“药食同源”理论为指导,结合个体体质与病症特点,将可食用中药材与食材通过特定工艺制成的食疗产品。作为中医药非遗技艺的重要载体,膏滋承载着“治未病”、 “药食同源”的中华养生智慧。湖南百……

    时间:2025-05-29 11:59:44
随机推荐