手机版

高质量数据供给,让行业大模型应用落地更“有料”

时间:2024-07-24 09:44:10作者:马慧思来源:互联网

《数字中国发展报告(2023年)》显示,我国数据生产总量达到32.85ZB,为国产大模型的爆发提供了丰富的“底层原料”。算力、数据、算法、场景,是决定大模型能力的核心要素,随着大模型发展逐渐由“通用”走向“垂直”,数据的质量和规模越发重要。业内专家认为,未来一个模型的好坏,20%由算法决定,80%由数据质量决定。高质量数据是提升模型性能和专业性的关键。

建设高水平行业数据集、加速行业数据流通交易,增强高质量数据供给的必由之路。浪潮卓数大数据董事长张帆指出,当前高质量中文语料资源短缺问题初现端倪,且随着时间推移,优质数据的获取难度将进一步加大。《数据要素×三年行动计划(2024-2026年)》实施后,国家鼓励科研机构、龙头企业开展行业共性数据资源库建设,打造高质量大模型训练数据集,提升数据供给水平。

“我们一直强调以数据治理为突破提升数据质量”张帆表示,工欲善其事必先利其器,浪潮卓数大数据基于完善的数据资源体系,通过自主研发的标注工厂系统,结合自有的数据治理模型工具,智能化提升数据治理的质量和效率,形成高质量语料训练数据集,支撑多模态融合的数字化场景。

行业大模型术业有专攻”,在面向行业的“封闭场景”中,大模型所需的多场景优质数据集不容易获得。解决了高质量数据“供得出”后,还要确保“流得通”,引导企业开放数据,鼓励市场力量挖掘商业数据价值,为行业大模型成长提供充足养料

尽管我国拥有海量数据资源,但是数据孤岛烟囱问题依然严峻。像浪潮卓数大数据这样本身拥有丰富数据资源又通过平台开放的企业,在打破数据壁垒中起到的作用日益明显。依托天元数据网和各地签约的数据交易所,浪潮卓数大数据可提供电商、生活服务、企业、农业、资源能化等10大类数据API数据集数据报告数据应用等的购买和个性化定制服务,旨在解决供需不匹配、数据难获得等制约大模型进一步发挥赋能效用的痛点

随着底座能力的提升,浪潮卓数大数据还依托自主研发的公共数据授权运营平台、数据资产服务平台,在确保全流程数据安全可靠、可信、可控的前提下,构建上下游合作的数据流通产业链,为数据要素市场建设积极贡献力量。

例如此前助力德州财金集团打造的“玻璃温室番茄生产数据集”数据产品,不只完成数据资产入表、盘活了企业数据资源,还利用数商身份进行供需撮合,实现首笔数据交易。越来越多沉淀在企业内、产业端的高质量数据,逐渐“浮出水面”,推动大模型迭代升级。

知易行难,加速破局尚需多方合力。据张帆介绍,让更多企业拥有高质量的数据,打造行业或特定领域、任务的专用大模型,实现生产力革新和产业升级,已成为目前浪潮卓数大数据聚焦的重要方向。

推荐阅读

  • 浪潮云斩获2024年“数据要素×”大赛全国总决赛三等奖

    近日,由国家数据局组织开展的2024年“数据要素×”大赛全国总决赛获奖名单正式揭晓,浪潮云从全国666支队伍中成功突围,斩获现代农业赛道三等奖。 2024年“数据要素×”大赛是由国家数据局牵头,会同其他相关……

    时间:2024-10-30 10:48:44
  • 400米跑道8221圈:首届宁德超马公益赛创造3天3夜奔跑新境界

    “宁静致远,跑出光芒”4月30日至5月3日“2023首届宁德3天3夜超级马拉松公益赛暨宁德超马五一长跑节”以场地定时赛的竞赛模式在美丽幽静的宁德师院老校区400米跑道成功举办。 据宁德电视台报道并综合赛事……

    时间:2023-05-07 07:49:25
  • 山能新矿内蒙古能源给机电管理装上“智慧脑”

    “根据矿井排水设备实时电流电压在线监测和排水流量分析,当前排水效率低于70%,系统发出预警信息,自动派发检修任务单,请及时跟进落实……”在山东能源新矿内蒙古能源榆树井煤矿生产调度指挥中心,工作人员白建波……

    时间:2023-03-23 11:46:11
  • 山东数据交易流通协会2025年度工作会议在浪潮召开

    2月21日,山东数据交易流通协会2025年度工作会议在浪潮科技园召开,全体理事会成员、部分会员单位代表及秘书处人员参会。山东数据交易流通协会会长、浪潮卓数大数据董事长张帆出席会议并致辞。 张帆在致……

    时间:2025-02-27 15:58:42
  • 浪潮海岳商业AI现金流预测智能体:动态预测、智能决策,助力企业告别资金焦虑

    现金流对企业的生存发展至关重要。面对风云变幻的市场环境,付款周期不定、成本不断攀升等动态变化因素相互叠加,导致企业难以及时掌握资金动态、精准预测现金流,影响战略决策。 浪潮海岳商业AI基于对企业痛……

    时间:2025-07-30 15:26:12
  • 再获权威认可!浪潮数字企业入选IDC财务智能体标杆厂商

    近日,国际数据公司(IDC)发布《IDC Market Perspective: 基于AGENT的企业流程优化市场成熟度分析及厂商推荐》报告,揭示AGENT从单点工具到流程重构的价值跃迁,重点推荐五家标杆厂商及其核心产品,为企业提供选……

    时间:2025-07-30 16:11:17
  • “中关村数智人工智能产业联盟—青少年人工智能素质提升计划”正式启动

    在新一代信息技术飞速发展的浪潮下,人工智能已成为全球科技竞争的关键领域。党的二十大、二十届三中全会明确提出一体推进教育科技人才发展的重要战略部署,北京市委积极响应,率先整合设立教育科技人才工作领导……

    时间:2025-04-24 09:19:20
  • 天元征信两款产品入选第八批山东省首版次高端软件产品

    近期,山东省工业和信息化厅公示第八批山东省首版次高端软件产品名单,经企业申报、地市推荐、专家组审核,天元大数据信用管理有限公司(简称天元征信)自研的金融营销及风控管家V2.0和产业大脑V1.0两款产品成功……

    时间:2024-10-12 09:33:35
  • 浪潮企业云亮相2025东盟人工智能峰会,加速布局东盟市场

    8月12至13日,2025东盟人工智能峰会(AAIMS2025)在吉隆坡举办,马来西亚首相拿督斯里安瓦尔·易卜拉欣,马来西亚数字部部长哥宾星出席并致辞。此次峰会作为东盟唯一的AI国家级峰会,由马来西亚数字部主办,吸引……

    时间:2025-08-14 18:17:32
  • 宜宾 筠连县西部计划志愿者开展“寻美苗乡”主题团日活动

    2023年5月12日,筠连县西部计划志愿者到联合苗族乡革新村开展“寻美苗乡”主题团日活动。 各志愿者赴革新村,心情格外激动,充满期待。活动的第一个环节是“茶话会”,大家围坐在一起,自我介绍,分享工作经……

    时间:2023-05-31 14:48:08
随机推荐