我们经常都会听到“大数据”一词,中宣部文化体制改革和发展办公室巡视员、副主任高书生认为,“讲大数据不是赶时髦,而是历史发展的必然。”在前几天的金鸡湖出版智库产业创新峰会上,高书生就“文化大数据”发表了自己的看法。他认为,文化大数据分为需求侧大数据和供给侧大数据,而供给侧的大数据对文化产业的发展尤为重要,而供给侧的文化大数据要分类开放开发。对于如何用好文化大数据,则是要把生产和消费联系在一起,加速产业转型升级。
作者:高书生,中宣部文化体制改革和发展办公室巡视员、副主任;财政部文化司(中央文化企业国有资产监督管理领导小组办公室)副主任;国家行政学院兼职教授。曾在国家体改委、国务院体改办工作,参与国家若干改革方案的制订。2002年提出的中国养老金制度改革方案,经世界银行精算验证(时限为75年),被认为创造了制度转轨的一个范例,转轨成本及缴费率最低并具有财务可持续性。
金鸡湖出版智库产业创新峰会于2016年12月10日在苏州举行。此次峰会以“大数据·转型·创新”为核心,旨在推动大数据在出版行业的应用。中宣部文化体制改革和发展办公室巡视员、副主任高书生做了“文化大数据:从哪儿来、到哪儿去”的主题演讲。他说,“讲大数据不是赶时髦,而是历史发展的必然。”说到大数据,高书生指出,文化大数据分两类,一类叫需求侧大数据,另一类叫供给侧大数据,后者更像是一座金山银山。
以下是高书生的演讲实录:
关于文化大数据,现在讲得最多的实际上是需求侧的大数据,客户的资源、市场的信息、流量的多少,都是针对文化消费的。而供给侧的大数据常常被忽略,其实供给侧的大数据对文化产业的发展更为急迫、重要。
需求侧的大数据是因文化消费而产生的,如读书看报、听广播看电视、艺术鉴赏等文化消费活动中所产生的海量数据。供给侧的大数据来自三个方面:
一是公共文化机构,包括图书馆、美术馆、博物馆、文化馆、纪念馆、档案馆;
二是高校科研机构,如美术学院、服装学院、艺术研究所、考古研究所;
三是文化生产机构,包括出版社、广播电台、电视台、电影制片厂、唱片公司、文艺院团等。
2013年年底,习总书记给我们提了一项极为重要的任务,就是系统梳理传统文化资源,这个过程就可以产生海量的素材和数据,包括文献素材、音频素材、视频素材、戏曲素材、文化遗产素材,所以,供给侧文化大数据非常庞大,称得上是金山银山。
大数据要从两方面看,需求侧反馈的是文化消费的信息,供给侧提供的是文化生产的素材,不能顾此失彼。
怎样开发大数据
供给侧的文化大数据要分类开放开发,分类就是分为文物遗产类和文化产品类。从开发路径上来看,最主要的是文化遗产的元数据,其中包括三个程序,一是采集,二是加工(也叫清洗),三是存储。在此基础上,通过市场化的方式开发这些元数据,将其碎片化,形成中华文化素材库,再通过产业化的展示和交易,应用到文化创作生产中去。
在数据开发的过程中,采集、加工、存储这一步是分散化的,但展示和交易的时候,一定是集中化的,否则就变成了一个一个孤岛,无法利用。所以,要解决集中化和分散化如何统一的问题。从投入的角度看,公益性(主要是文化遗产类)的采集、加工和存储,应该由财政预算渠道来解决,文化产品类的采集、加工和存储以及市场化、产业化的展示和交易,应该是通过市场融资渠道解决。
如何用好文化大数据
首先,从文化消费的角度看,现在对文化产品和服务特别渴望。在供给和需求两者的矛盾中,供给是矛盾的主要方面。其次,消费终端在变化。如今文化消费提速,但文化生产还停留在半工业化状态,要把生产和消费联系在一起,加速产业转型升级。
自2013年起,财政部会同中宣部、新闻出版广电总局扶持出版业加快数字化转型升级。数字化转型升级的核心是实现出版业务的全流程再造,不管是纸质的还是数字的都要达到全流程数字化。要推动出版业数字化转型升级,一是要进行设备更新,二是要推动技术升级。出版企业通过大规模的技术改造、技术升级,就会跃上一个新台阶,站到数字化和网络化平台上,与各种文化消费终端无缝对接。
这次数字化转型升级一定要以编辑为中心,解放和发展编辑生产力,说的通俗点,就是做两道算术题,一道题叫做减法,就是通过技术改造把简单性、重复性工作,交给软件去做。另一道题就是做加法,就是用好用足上述两类大数据,将需求侧大数据和供给侧大数据提供给编辑去选择,恢复编辑专业化、职业化的功力。
数字化转型升级是不是完成,有两个标志,第一个标志,专门做数字出版的部门撤没撤,如果出版社的纸质书和电子书还是分属不同的部门负责,那说明还是“两张皮”。第二个标志,将来的图书,不管是纸质的还是数字的,有多大比例是出自经过技术改造而形成的这条数字化的生产线,最终应当达到80%以上。现在看来这条路还很长,目标远远没有实现。
问题出在哪儿?是出版社不努力,还是技术不成熟,根本原因恐怕出在最后一公里上,即渠道和终端。
纸质书原来有书店这条渠道和终端,电子书靠书店不行了,大家不约而同想到了互联网以及以移动终端为载体的移动互联网。许多出版社尝试着用电信这张互联网,用手机这个终端,但不太理想,一是电子书定价低,二是与运营商、技术商的分成比例低。
为解决最后一公里,我们想到了与电视机连接的有线电视网络这条渠道,以及电视机这个古老的终端。手机是终端,电视机其实也是终端,而且现在的技术已经可以实现PC、手机、电视机、移动终端多屏互动。与PC、手机相连的叫互联网,与电视机相连的也是一张互联网,前者可称之为电信互联网,后者可称之为电视互联网。
我们说最后一公里用电视互联网,至少目前不是为了在电视上看书,而是把电视机当做一个个小书店,或者说电视机就是售书机。在电视上找到喜欢的书,通过二维码就可以转到手机等移动终端上。可以说,这在电信互联网上早已经实现了。假如有一天,出版社都通过电视互联网卖书了,你可以不看电视节目,打开电视机是浏览新书、买书,这个电视机还是有用的。
也许有人会问,以后要在电视上看书吗? 也不是不可能实现的,但是未来在电视上看到的书,绝不是纸质书的样式,也不是现在的PDF版,介质和样式是会发生变化的。现在已有公司研制出可以让读者和作者互动的新技术,读者的阅读体验可以直接反馈给作者,作者也可以与作者分享创作感悟,畅谈创作背后的故事。更重要的是,现在的技术手段可以让电子书承载比纸质书更多更多的信息,如果读者愿意,作者可以通过出版社这个平台,与读者保持较长时期的互动,在作者—出版社—读者之间架起一座互动的桥梁。我们现在正在探讨的“一书一世界”,实际上是在描绘图书的未来形态和样式,在电视上看书总会实现的。
图片来源:找项目网