手机版

高质量数据供给,让行业大模型应用落地更“有料”

时间:2024-07-24 09:44:10作者:马慧思来源:互联网

《数字中国发展报告(2023年)》显示,我国数据生产总量达到32.85ZB,为国产大模型的爆发提供了丰富的“底层原料”。算力、数据、算法、场景,是决定大模型能力的核心要素,随着大模型发展逐渐由“通用”走向“垂直”,数据的质量和规模越发重要。业内专家认为,未来一个模型的好坏,20%由算法决定,80%由数据质量决定。高质量数据是提升模型性能和专业性的关键。

建设高水平行业数据集、加速行业数据流通交易,增强高质量数据供给的必由之路。浪潮卓数大数据董事长张帆指出,当前高质量中文语料资源短缺问题初现端倪,且随着时间推移,优质数据的获取难度将进一步加大。《数据要素×三年行动计划(2024-2026年)》实施后,国家鼓励科研机构、龙头企业开展行业共性数据资源库建设,打造高质量大模型训练数据集,提升数据供给水平。

“我们一直强调以数据治理为突破提升数据质量”张帆表示,工欲善其事必先利其器,浪潮卓数大数据基于完善的数据资源体系,通过自主研发的标注工厂系统,结合自有的数据治理模型工具,智能化提升数据治理的质量和效率,形成高质量语料训练数据集,支撑多模态融合的数字化场景。

行业大模型术业有专攻”,在面向行业的“封闭场景”中,大模型所需的多场景优质数据集不容易获得。解决了高质量数据“供得出”后,还要确保“流得通”,引导企业开放数据,鼓励市场力量挖掘商业数据价值,为行业大模型成长提供充足养料

尽管我国拥有海量数据资源,但是数据孤岛烟囱问题依然严峻。像浪潮卓数大数据这样本身拥有丰富数据资源又通过平台开放的企业,在打破数据壁垒中起到的作用日益明显。依托天元数据网和各地签约的数据交易所,浪潮卓数大数据可提供电商、生活服务、企业、农业、资源能化等10大类数据API数据集数据报告数据应用等的购买和个性化定制服务,旨在解决供需不匹配、数据难获得等制约大模型进一步发挥赋能效用的痛点

随着底座能力的提升,浪潮卓数大数据还依托自主研发的公共数据授权运营平台、数据资产服务平台,在确保全流程数据安全可靠、可信、可控的前提下,构建上下游合作的数据流通产业链,为数据要素市场建设积极贡献力量。

例如此前助力德州财金集团打造的“玻璃温室番茄生产数据集”数据产品,不只完成数据资产入表、盘活了企业数据资源,还利用数商身份进行供需撮合,实现首笔数据交易。越来越多沉淀在企业内、产业端的高质量数据,逐渐“浮出水面”,推动大模型迭代升级。

知易行难,加速破局尚需多方合力。据张帆介绍,让更多企业拥有高质量的数据,打造行业或特定领域、任务的专用大模型,实现生产力革新和产业升级,已成为目前浪潮卓数大数据聚焦的重要方向。

推荐阅读

  • 第十五届中国大学生服务外包创新创业大赛“浪潮卓数杯”北部区域赛决赛圆满落幕

    6月23日,由山东大学等主办,浪潮卓数大数据承办的第十五届中国大学生服务外包创新创业大赛“浪潮卓数杯”北部区域赛决赛在青岛开幕,浪潮卓数大数据总经理助理孙荣田出席并致辞。 本次大赛以“紧贴服务外包……

    时间:2024-06-26 16:26:50
  • 杜淳女朋友杨璐(杜淳的女朋友)

    老婆怀孕的时候老公应该怎么办?相信在备孕阶段大家就已经看了无数的书籍、咨询了无数的过来人了吧,但是今天愚记君不是要和大家讨论育儿经,而是想和大家分享一下《妻子的浪漫旅行》中的几位老公的做法杜淳杨璐。……

    时间:2023-01-06 22:36:48
  • 宜宾市南溪区信访局组织开展 《信访工作条例》知识竞赛

    5月23日下午,为深入学习宣传贯彻《信访工作条例》(以下简称《条例》),切实提升信访工作质效,提高信访干部信访知识水平,宜宾市南溪区信访局在《条例》实施一周年之际组织全体机关干部开展《信访工作条例》……

    时间:2023-05-29 17:16:04
  • “跨界融合,创新未来”XRMID 2023 –虚拟现实及元宇宙论坛在京举办

    虚拟现实和增强现实技术与云计算、大数据、物联网、工业互联网、区块链、人工智能一并纳入重点开发产业。国务院发布的《“十四五”数字经济发展规划》中明确表示要创新发展“云生活”服务,深化人工智能、虚拟现……

    时间:2023-04-23 15:59:35
  • 卓数DeepSeek大模型一体机,助力企业级AI落地降本、增效、提质

    随着DeepSeek开源大模型持续引领全球AI技术演进浪潮,人工智能正加速实现从科研突破到产业赋能的转换。当前,大模型技术已在智能交互、内容生成、数据洞察、智能决策等方面展现出颠覆性价值,成为驱动产业变革的……

    时间:2025-03-17 11:05:55
  • 首届泮湖(北京)创新论坛隆重举办

    4 月 21 日,天津工业大学北京校友会联合和君集团,成 功举办了首届“ 泮湖(北京)创新论坛 ”。此次论坛以“ 人 工智能赋能企业成长 ”为主题,吸引了政界、学术界、企业界及天津工业大学校友的广泛关注和参与。 ……

    时间:2024-04-23 11:57:29
  • 海若讲堂第七期丨浪潮云李志华:海若交通大模型赋能交通设施病害智能检测

    今年1月,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,推动科研机构、相关企业开展行业共性数据资源库建设,打造高质量大模型训练数据集。大模型的发展是实现“数据要素×”目标的关键举……

    时间:2024-10-31 16:27:06
  • 瞄准就业“靶心” 海若就业大模型加速人岗双向奔赴

    时值盛夏,人才市场招聘求职热度不减,今年招聘会的台前幕后,似乎多了一点“黑科技”。 求职者可以提前在家用大模型模拟面试,通过一次又一次的“头脑风暴”,见识不同角度的问题,再借助大模型进行复盘提升。另……

    时间:2024-08-24 10:55:04
  • 德州市武城县: 电力业务数字化,营商环境再优化

    德州市武城县以“高效办成一件事”为牵引,以数赋能努力打造便利化、透明化、标准化、规范化的服务模式,向资料最简、流程最优、时限最短的目标持续迈进,为企业和群众提供更优质高效的政务服务。 “在手机上刷……

    时间:2024-05-11 14:08:02
  • 长宁县新联会副会长被聘为宜宾市法学会 首席法律咨询专家

    长宁县新联会副会长、川安律师主任罗世兵被聘为宜宾市法学会首席法律咨询专家。宜宾市法学会是汇集法治精英、关注法治动态、聚焦法治热点、传播法治精神的平台。 专家库主要为市委、市政府重大决策论证、……

    时间:2023-09-05 14:11:54
随机推荐