绿法国际联盟丨绿法联盟丨绿盟丨绿法联盟研究院-绿法GLGA

绿盟观察丨创新性探索高质量数据，共建生态推动大模型应用落地

2023-07-10 23:25:08 来源：绿法国际联盟作者：绿盟研究院

要点：在全球人工智能蓬勃发展背景下，数据与算力、算法共同构成了新一代人工智能发展过程中的三大要素。发展自主可控的大模型是我国抢占数据发展高地的必然选择，而数据要素则是支撑大模型发展的重要引擎。意识到数据要素重要性的同时，更应该认清目前我国在数据要素利用过程中所面临的阻碍。多层次数据要素市场的建设需要有明确的数据需求应用场景。未来，颠覆性创新一定是基于数据+人工智能+行业专业知识发生的。

——援引自证券日报

发展自主可控的大模型是我国抢占数据发展高地的必然选择，而数据要素则是支撑大模型发展的重要引擎。7月8日，上海数交所总经理汤奇峰在2023世界人工智能大会“大模型时代下的数据要素流通”论坛上表示，大模型建设中，语料库是一个非常重要的方向，语料库采购已经在不少大模型企业成本中占据重要比重，上海数交所希望以市场配置的方式组织数据要素推动语料库建设。在全球人工智能蓬勃发展背景下，数据与算力、算法共同构成了新一代人工智能发展过程中的三大要素。因此，意识到数据要素重要性的同时，更应该认清目前我国在数据要素利用过程中所面临的阻碍。

目前存在的阻碍有哪些？

语料库建设是一件长期性、专业性的工作，需要遵循相应的质量标准和规范，并保持持续更新和扩充，以适应大模型发展的新需求和新挑战。

“从与大模型相关企业沟通的情况来看，我国语料库建设还存在供给不足、质量不高、多样性匮乏、标准欠缺等现状。”汤奇峰指出。

“数据要素在人工智能大模型的发展中具有关键性的作用，决定了模型的训练质量、性能表现和应用领域的广度与深度。”在中国电子副总经理陆志鹏看来，大模型技术实现高质量发展，数据有效供给是关键，亟需建设安全可信的数据底座。当前数据合规确权、计量估价、协调分配、安全隐私保护等核心难题需要破解。

科大讯飞大数据研究院院长谭昶表示，我们对大模型语料数据方面有三大关注点：首先，语料数据更新问题亟待解决。目前，大模型训练都是按月为周期，能否实现以天为周期值得思考。其次，语料偏见问题目前需要通过一些规则模式将其屏蔽，但这种模式对于大模型来说是一种约束和限制。第三，数据安全问题不容忽视。

在谈及数据流通过程中面临的问题时，中国知网副总经理张宏伟称，在真正的交易流通里面有定价的问题，有确权的问题，有收益分配的问题，尤其是我们的数据，包括它的主体是多元的，有了数据分配之后，如何在这些利益主体之间分配，这个是非常难的问题。

“破题”关键在何方？

数据驱动三大变革，包括经济结构、创新范式、企业模式。面向大模型，数据要素市场大有可为，多层次数据要素市场建设需要提供重要助力。因此，在认清数据要素流通过程中存在的问题之后，更应清楚“破题”关键所在。

关于语料库建设的挑战，汤奇峰认为，可以根据开放程度强弱和数据质量高低将语料数据生态机构分出四类供方，制定差异化工作策略。同时，从政府引导市场主导、丰富种类提高质量、统一标准规范建设、加强监管保障安全四个方向建设大模型时代下的语料库。汤奇峰称，针对数据质量高但开放程度低的供方，可以通过数据交易链有效破解语料数据流通的信任问题，“核心之一在于产权和参与大模型后的收益分配问题。”

商汤科技联合创始人杨帆认为，对于训练数据的管理和监督必不可少。同时，要实现数据开源，特别是训练数据相关领域的开源，只有开源才是更加健全。在谈及如何应对上述风险和阻碍时，张宏伟认为，各方权益的保护在某种程度为技术让步的，但也不能过多让步，保护创作者的利益仍然很重要。

大数据流通与交易技术国家工程实验室常务副主任黄丽华表示，多层次数据要素市场的建设需要有明确的数据需求应用场景，数据要素产权制度可以提供重要支撑，合规安全机制提供保障，基于这样的一个市场，数据产品低成本、大规模可得才有可能实现，才能更好地赋能商业高效应用，促进数字化转型。未来，颠覆性创新一定是基于数据+人工智能+行业专业知识发生的。

来源丨证券日报

论坛 | 前瞻引领共创！第六届中国经济发展与法律规制高峰论坛暨首个绿色立体法律生态平台“绿法ECO”&建设工程行业法律健康指数发布会

后疫情时代，我国战略性提出“碳达峰”“碳中和”目标，并在“十四五”经济发展主要目标和2035年远景目标中作出明确部署，定调我国未来绿色发展战略建设工程行业实现绿色发展，既需要有顶层设计和战略引领，更需要良性的治理体系和系统工具，这也成为中国经济新发展中的重要命题。在此背景下，绿法（国际）联盟、北京市道可特律师事务所、新浪财经再度携手，共同举办第六届中国经济发展与法律规制高峰论坛暨国内首个绿色立体法律生态平台系统“绿法ECO”&建设工程行业法律健康指数发布会。

2021-11-20
论坛 | 全球疫情冲击下的金融资本市场发展论坛暨2018&2019中国私募基金行业法律健康蓝皮书线上发布会

2020年以一种出乎意料的方式开始，当前疫情下中国经济甚至世界经济的走向仍是未知数，在认识“新冠”病毒疫情及其经济冲击并提出政策建议方面，经济学家的观点仍然存在着较大的分歧。政策先行，法律跟进，中国经济发展会走向何方？以私募、保险、银行、信托等为代表的资产管理行业传达了怎样的政策导向？法律在本次经济危机中应发挥什么作用？全球疫情冲击下的金融资本市场发展论坛将围绕后疫情时代金融资本市场发展与法律规制展开深入探讨。

2020-06-06
研讨会 | 绿法联盟研究院首次研讨会 “资本配置策略、投资实践与管理之道”

2017年1月14日，绿法（国际）联盟首次研讨会在北京市道可特律师事务所成功举行，通过对新书《私募股权LP》的分析讨论，研讨会确立了私募股权LP的最新发展特点和趋势、中国政府引导基金和产业基金的政策与市场展望、PPP与AMC等金融发展对私募股权基金LP格局的影响、私募股权与跨境并购等研究方向，经过多方探讨研究，本次会议取得了丰硕成果。

2017-01-14
研讨会 | 绿法（国际）联盟启动仪式暨“打造绿色立体法律生态圈”高端研讨会

2016年12月4日，由北京市道可特律师事务所主发起并承办的绿法（国际）联盟启动仪式暨“打造绿色立体法律生态圈”高端研讨会在北京隆重举行。来自经济、金融、法律、文化等领域的专家学者、行业精英百余人应邀出席启动仪式。新华网、新浪财经、21世纪经济报道、中国经济导报、法制网、民主与法制、人民法治网、法制日报、检察日报、央广传媒、今日说法、中国律师网、《投资圈》杂志、《首席财务官》杂志等二十余家媒体进行现场报道。

2016-12-04
绿盟大讲堂 | 精彩回顾 | 绿盟大讲堂第六期 ·管涛先生独家解读贸易摩擦、经济形势与人民币汇率

2019年7月25日，绿盟大讲堂第六期在绿盟创新发展中心成功举行。本期绿盟大讲堂邀请了武汉大学经济学博导、董辅礽讲座教授管涛先生，他长期从事货币可兑换、国际收支、汇率政策、国际资本流动等问题的研究，撰写了大量工作报告和学术论文，参加了1994年至2014年间一系列重大外汇管理体制改革方案的设计。本期大讲堂中，管涛先生围绕当前贸易摩擦、经济形势与人民币汇率进行了独家解读。

2019-07-29
绿盟大讲堂 | 绿盟大讲堂精彩回放 | 赵民：中国国情&管理规律——两大维度告诉你如何在中国做管理

2018年11月1日下午，“绿盟大讲堂”第五期在绿法（国际）联盟创新发展中心成功举办。本期主讲嘉宾为正略集团董事长，正略咨询创始人赵民先生。赵民先生从中国国情和管理规律两大维度出发，对“企业管理的中国实践”进行独家解读。绿法（国际）联盟秘书处对赵民先生的核心观点进行整理，换个视角看如何在中国做管理。

2018-11-07

第一时讯

专家视点

绿盟智库

绿盟新闻

绿盟课题

绿盟观察丨创新性探索高质量数据，共建生态推动大模型应用落地

论坛 | 前瞻引领共创！第六届中国经济发展与法律规制高峰论坛暨首个绿色立体法律生态平台“绿法ECO”&建设工程行业法律健康指数发布会

论坛 | 全球疫情冲击下的金融资本市场发展论坛暨2018&2019中国私募基金行业法律健康蓝皮书线上发布会

研讨会 | 绿法联盟研究院首次研讨会 “资本配置策略、投资实践与管理之道”

研讨会 | 绿法（国际）联盟启动仪式暨“打造绿色立体法律生态圈”高端研讨会

绿盟大讲堂 | 精彩回顾 | 绿盟大讲堂第六期 ·管涛先生独家解读贸易摩擦、经济形势与人民币汇率

绿盟大讲堂 | 绿盟大讲堂精彩回放 | 赵民：中国国情&管理规律——两大维度告诉你如何在中国做管理