传媒行业AI跟踪:欧盟提案要求生成式AI披露版权信息 关注数据源及版权方
事件:据Euractive 报道,4 月27 日,欧洲议会成员(MEP)就《人工智能法案》
【资料图】
达成提案,该法案由欧盟于21 年4 月开始起草,目前仍在完善。此次提案对生成式AI 模型提出了更严格的监管要求,包括版权披露、公平竞争、保障合法权益等。提案提出,版权披露上,模型开发商将被要求披露在构建其系统时所使用的任何版权材料;保障合法权利上,生成式AI 模型应保护隐私。提案表示,不论模型采用何种分发渠道、开发方式、训练数据类型,都必须遵守这套更严格的监管要求。
国内发布管理办法要求数据来源合法性,MEP 就《人工智能法案》达成对版权披露要求更加严格的提案。国内角度看,网信办4 月11 日发布《生成式人工智能服务管理办法(征求意见稿)》,对提供大模型训练的数据提出合法性要求。国外角度看, 4 月27 日MEP 就《人工智能法案》达成提案,其中关注度较高的是对版权披露提出了更严格的监管要求:要求部署ChatGPT 等生成式人工智能工具的公司披露用于开发其系统的受版权保护的材料。这为《人工智能法案》出台铺平道路,如果法案通过,可能是世界上第一部综合性人工智能法律,并将对欧盟区内提供的所有AI 系统有约束作用。生成式AI 模型需要从数据库等获取大量的素材来支持其训练,目前模型生成的内容并不会披露其依据的素材来源,这次提案要求部署生成式AI 模型的公司披露素材获取源,这有利于保护数据源公司和版权方的权益,为拥有高质量数据或较多版权资源的公司提供更多机会。此前海外知名社交媒体平台Reddit 也宣布,将向使用其API 训练模型的公司收费。
数据资产在AIGC 发展中至关重要,需重视其价值。AI 模型训练的基础是需要海量的数据,同时AI 也可以反哺数据拓展多元化变现路径,不仅是版权收费,还可以通过AIGC技术给原有版权带来更丰富的落地场景和玩法。综上我们看好以下特质的公司,1)具有优质数据和大模型能力的头部大厂,由于数据合规性,大模型训练门槛提高;2)具有丰富且相对高质量的数据资产储备公司,未来有望实现多元化变现;3)数据产业链重点环节卡位公司,比如在确权交易重要环节,提供数据安全审核等方向。
数据收费未来发展趋势明确,数据资产维度值得重点关注。
1、关注兼具自有优质数据和大模型能力的头部大厂:百度集团-SW(09888,未评级)、阿里巴巴-SW(09988,买入)、腾讯控股(00700,买入)、字节跳动(未上市);此外,关注UGC 内容储备丰富的快手-W(01024,买入)、哔哩哔哩-W(09626,买入)、芒果超媒(300413,增持)、爱奇艺(IQ.O,增持)等。
2、建议关注数据资产方面公司,尤其相对高质量数据更有价值。
a)优先高质量数据: 中国科传(601858,未评级)(万方数据)、中国出版(601949,未评级)、视觉中国(000681,未评级)(高质量图片数据)、知乎-W(02390,未评级)(高质量问答);
b)出版+数字阅读数据价值量大:中信出版(300788,增持)、果麦文化(301052,未评级)、时代出版(600551, 未评级)、读者传媒(603999, 未评级)、中原传媒(000719,未评级)、中文在线(300364,未评级)、掌阅科技(603533,未评级)、阅文集团(00772,未评级);
c)影视综艺IP版权:华策影视(300133,未评级)、中国电影(600977,未评级)、上海电影(601595,未评级)、光线传媒(300251,未评级)、欢瑞世纪(000892,未评级)。
3、关注数据要素产业链,确权交易等重点环节: 新华网(603888,未评级)、人民网(603000,未评级)、浙数文化(600633,未评级)、每日互动(300766,未评级)、三人行(605168,未评级)。
风险提示
技术落地进程慢于预期;行业竞争格局激化;政策落地进程慢于预期