童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

田杰棠:抓住大数据发展的关键问题

5月21日 飞凤谷投稿
  在今年“双十一”电商大战中,刚刚上市的阿里巴巴以日销售额571亿元引来全球关注,大数据应用也成为其中的一个新亮点。大数据应用今年以来获得快速发展,百度、阿里等网络巨头与行业领军企业都在谋求大数据应用的发展,国家部委及地方政府对发展大数据兴趣浓厚,纷纷推出行动计划。但人们对于大数据却总有些雾里看花的感觉。
  究竟什么是大数据?为什么大家竞相发展大数据?大数据会对经济发展产生什么影响?为此,中国经济时报记者专访了国务院发展研究中心技术经济研究部第二研究室主任田杰棠。
  怎样挖掘非结构化数据是关键
  记者:今年大数据发展加速,但“大数据”仍是一个新生事物,目前还没有形成学术上的定义,所以人们对大数据的认识、理解比较模糊。您作为研究技术经济的专家,怎么理解大数据?
  田杰棠:互联网应用以来,从2005年开始,数据在不断地增长,到2010年以后基本上是一个指数增长的过程,到2013年时已经超过4个ZB(10万亿亿字节),每年的增长率超过50。这是一个从量变到质变的过程,因此“大”的概念就蹦出来了,但它其实不是一个严格的学术概念。
  现在谈大数据的定义,最多的就是所谓的四个“V”,第一个“V”就是它的实际规模。
  第二个“V”是多样的数据类型,尤其是里面包涵了大量的非结构化数据。
  第三个“V”是价值,有两点:一个是价值大,大数据带来各种可能性;另外一个比较重要的是,它虽然量很大、价值也很大,但是密度很低。
  第四个“V”就是动态数据的快速处理。这里面比较核心的,也是大数据将来能不能从“可能”到“可行”转变的两个要素,即:非结构化和低密度。如果技术上能解决怎么分析非结构化数据、怎么从低密度价值里面提取数据的价值,那么大数据的应用可能就会有一个飞跃式增长。所以,我觉得非结构化和低密度可能是大数据的核心东西。
  记者:您认为大数据未来需要关注更多的非结构化数据处理,那么需要什么技术促进大数据发展产生飞跃?
  田杰棠:大数据要快速发展,前提就是数据的存储技术和挖掘技术的发展以及技术成本的不断降低。
  现在数据的来源是非常多的,主要可以分为物的数据和人的数据。物的数据基本是结构化的数据,是比较好存储分析的。但人的数据,又主要是非结构化的数据,目前对非结构化数据的处理还是一个难点。
  这两年,随着IT成本的下降,云计算的使用率在不断上升,现在云储存的成本是在慢慢降低的。因为IT成本的下降和云计算发展,数据存储成本得以下降,数据量才能出现指数倍增长。
  未来的数据更多的是人的数据,是非结构化的数据,因为大数据具有价值大但价值密度低的特点,目前数据挖掘分析技术成本还很高,尤其是对非结构化的数据的分析挖掘技术。所以,未来大数据要得到快速发展,必须把数据挖掘技术成本降下来。
  大数据发展对经济的影响和前景
  记者:科技的发展必然会对经济产生影响,大数据的应用对经济有何影响?
  田杰棠:如果从宏观或者立体的角度看,人类整个经济发展的过程其实就是不断把一些不可利用的资源变成可利用资源的过程。这个过程一般就是技术的一个个大突破,当然每一次技术突破都伴随着不断的、大量的投资过程,并将其转化成价值。
  实际上很多发达国家在2008年金融危机以后寄希望于一套新技术来摆脱实体经济的衰落和危机,大数据、云计算、新能源都是被寄予厚望的几个关键技术之一。1995年,Bresnahan和Trajtenberg教授提出了通用目的技术,通用目的技术的特征就是它在许许多多的部门都具有广泛而且普遍深入使用的潜力和技术活力。
  如果我们从增长的视角来观察大数据的话,一个核心的问题就是:大数据会不会成为我们期待的下一代的通用目的技术?如果是的话,它可能会带来比较显著的经济增长效应。
  麦肯锡研究院分析认为大数据影响的面是比较广的,包括了教育、交通、零售、电器、能源以及医疗、金融等等,有可能会每年为世界带来大概3万亿美元至5万亿美元的经济效应,但这个情况目前还只是一个预测。
  从经济波动和政府干预的视角看,大数据也会带来一些冲击效应。大数据的发展能否真正改善供需平衡?淘宝曾经做的“订单农业”、“抢先购”以及“家电定制”,都是先收集需求数据情况,再组织生产的事例,在当时的效果都是不错的。收集全国所有的数据,在目前还有点困难。但至少从这个角度是有这种可能性,值得思考。比如政府干预是不是比以前更加不必要了。
  记者:可以发现许多国家都在发展大数据,中国一些龙头企业也在做大数据,您认为大数据的发展前景怎么样?
  田杰棠:IDC在2013年认为,2017年大数据市场规模将达324亿美元,麦肯锡也认为大数据会带动其他产业每年有3万亿美元至5万亿美元的增长,这里面的乘数效应是非常大的。在中国,工信部下属的赛迪做过一个关于投资的预测:对大数据的投资从2012年到2015年大概每年增长100左右,这个速度甚至超过国外的速度。
  我国的领导层也比较关注大数据,从2012年以后,科技部、发改委、工信部等部委在研发、探索和产业化专项上,陆续支持了一批大数据项目,不少地方政府也在搞大数据,比如陕西的“大数据科学园区”经、广东的“大数据战略合作方案”、上海的“大数据研发三年行动计划”等等,基本是“多点开花”的状态。
  另外像BAT(百度、阿里、腾讯)这样的互联网龙头企业也都在做大数据。所以大数据的发展前景还是非常可期的。
  大数据发展的制度建设和政府作用
  记者:目前数据的流通并不通畅,政府的大部分数据在目前也没有公开。大数据发展需要怎样的制度建设?
  田杰棠:现在一个很核心的问题是如何界定数据的产权,产权的界定是大数据交易和商业化的前提。
  数据的所有权、使用权应该如何界定才能达到最大的经济效应?比如数据企业,包括阿里巴巴或者国内其他公司,他们对数据在什么层次上有使用权?什么情况下可以不经过数据生产者的同意就可以使用?数据的生产者对数据到底有哪些权利?这些都是值得思考的问题。
  另外,政府及公共机构的数据是否应该开放?是不是应该把使用权让渡给社会?或者说哪些数据应该开放,开放到什么程度?在中国,政府、部分事业单位有非常多的数据,但是使用得非常不充分。
  怎么去界定数据产权至少需要三个层次的立法:其一,数据的商业运用应该是什么边界?个人隐私保护应该在什么边界?政府数据的公开应该在什么边界?另外,还有其他的制度需求,需要公平竞争的环境,例如对金融行业使用大数据的前景是非常好的,但现在也存在很多的市场准入门槛,使银行仅靠存贷差就可以过好日子。
  其二,数据安全或者信息安全的问题。关于这点甚至提得更高,说“数据主权比产权还高”,包括一些安全预警与审查机制;数据存储的地域限制;再如对国家数据的外泄要立法等。
  其三,行业性立法。中国的医疗行业,在大数据出现之前,病历在医院已经电子化了,但是不同医院之间仍然不能够共享,所以这也是一个体制问题。如果能通过行业性立法,把这些能够利用的大数据都放在一个平台上,那情况就大不一样了。
  记者:在大数据发展中政府应该起什么作用,如何推动大数据的发展?
  田杰棠:首先来看国外政府在做什么。2012年美国政府推出“大数据行动计划”,已经炒得很热。主要是在研究和应用上投了很多钱。
  奥巴马2013年签署法令,要求所有新增政府数据都必须以电脑文件方式向公众开放。白宫颁布了开放数据政策,要求政府部门列出所有可公开的数据清单。如果不可公开的话,也要做出说明,为什么不可公开?
  在政府采购方面,云计算时,联邦政府还任命了一个首席技术官,专门推进联邦政府和部门的云计算应用。现在数据服务可能也是这样。
  最后要制定法规。这不仅是中国的问题,也有医疗、教育、个人隐私等方面的问题,也需要制定法规。在欧洲,有关个人隐私的法律很多,还有很多的工作要做。
  关于大数据的发展有几点建议:不要急于出台所谓的战略性规划和设立产业专项资金。合理改造、建设和布局好IT基础设施,除云计算外,主要就是加快“宽带普及提速工程”。推动隐私保护和公共机构信息公开等立法。资助大数据基础技术研究,包括人才培养。

于鸿宣:台湾人对于支农网的一些期待主编您好:我是一位台湾人,一向对大陆的社会发展抱持着关注,最近在支农网上阅读了不少大陆农业专家的论述,深受启迪,我从小在台湾成长,从未在大陆生活,对于大陆社会,缺乏耳濡目……王国宏沈丹:布哈林悲剧与党内民主布哈林是国际共产主义运动的著名活动家、十月革命的重要领导人,曾被列宁称为“党的最可宝贵和最大的理论家”。二十世纪二十年代末,以斯大林为首的联(共)布中央同以布哈林为首的“反对派……宋圭武:由一则案例看制度创新最近,听一位朋友说,他的小孩有病住进中国兰州的一家某某医院。动手术的前一两天,他照以往惯例给主治大夫、麻醉师等有关医务人员每人分送了多则五、六百元,少则一、二百元的红包。当时送……姚文俊:中国压根就没有过真正的国学大师网见,新闻午报8日报道:“十大国学大师”的网评榜单日前新鲜出炉,他们分别是王国维、钱钟书、胡适、鲁迅、梁启超、蔡元培、章太炎、陈寅恪、郭沫若和冯友兰。评选活动自4月12日启动以……非常感谢谁?(吴万伟译)生活在当今没有上帝的世界里意味着我们要面对前人没有遭遇到的生与死的问题,意味着我们要寻找生活的意义,因为生活中不仅没有了全能的上帝,而且没有了给予从前的几代现……蒋庆:儒家文化建构中国式市民社会的深厚资源近读邓正来、景跃进二先生的大作《建构中国的市民社会》,笔者认为,在中国建构市民社会还要涉及到可欲不可欲与可能不可能的问题,更涉及到应该不应该的问题。笔者认为:从实现富裕抵御专制……陈奎德:纪念匈牙利革命五十年半个世纪前,1956年,共产世界的一个关键年份。在苏联,当斯大林1953年死后,不久,赫鲁晓夫逐步通过权力斗争获得最高权位,于是开始了向斯大林帝国的挑战。他的第一个战役,……施卫江:读书和创新应两分对待《中国社会导刊》于20067上期上刊登的吴小彬文章《人们为何不愿读书了》中,作者引用旅美学者薛涌的话陈述,国民阅读率下降会导致国家的创造能力降低的情景。但是笔者以为,这样的说法……杰克迈尔斯:大学教授和知识分子的区别:人文科学被踢出大学校园(吴万伟译)如果大学教授是在庄稼地上耕作的农夫,知识分子就是跨越很多庄稼地追捕猎物的猎人,谁是丢掉工作的人呢?杰克迈尔斯是吉保罗盖提信托基金(J。PaulGetty……张鸣:从哪儿来的这么多“学”?近来,小说家刘心武不写小说了,专做“红学”,产品据说还很畅销,恨得若干红学家牙根痒痒,连声致讨,酿成一场不大不小的学术事件。此事件,我对于双方均无爱无憎,到是因此想起了似乎是题……王锦思:南京大屠杀纪念日能否设国家公祭日13日上午10时,南京上空响起凄厉的警报声,悼念南京大屠杀30万同胞遇难68周年。与此同时,江苏省暨南京市各界人士数千人在侵华日军南京大屠杀遇难同胞纪念馆举行国际和平集会,肃立……克里斯托弗夏恩:道轨上的鲜血(吴万伟译)大卫休莫(DavidHume)写到理性是“感情的奴隶”。但是新的研究结果表明在我们做出道德决定的时候,理性和感情在头脑里打了个平手。伦理哲学家和研究人类……
沈德咏:刑事司法程序改革发展的基本方向今天,我们相聚在黄浦江畔,隆重召开中国刑事诉讼法学研究会2014年年会,围绕“法治中国视野下的刑事程序建设”主题展开研讨,这是中国刑事诉讼法学研究会贯彻落实党的十八大和十八届三……陈德胜李洪侠:结构性债务风险趋高应重点防范防控债务风险是去年中央经济工作会议首次提到的新话题。近一年了,目前债务情况如何,债务需求和偿债能力发生哪些变化,未来是否还需要关注债务风险,怎样化解债务风险?如何回答这些问题,……杨建顺:期待以法治反腐防腐的新时代党的十八大以来展开的反腐惩腐取得了可圈可点的业绩,无论位居多么显耀的高位,也无论是否退下来以及退下来多久,只要有贪腐劣迹,便可能被追责。鉴于国家发改委价格系统等权力高度集中部门……姜明安:什么是法治体系十八届四中全会通过的《中共中央关于全面推进依法治国若干重大问题的决定》指出,全面推进依法治国的总目标是建设中国特色社会主义法治体系,建设社会主义法治国家。……成思危:中国经济面临的挑战和对策改革开放以来,中国经济的发展举世瞩目。中国经济已经成为世界经济的重要组成部分。中国国内生产总值占全球的比重由1978年的1上升到2007年的5以上,中国进出口总额占全球的比重由……江平:解码四中全会法治路线图十八届四中全会于10月23日闭幕,会议研究了全面推进依法治国重大问题,审议通过了《中共中央关于全面推进依法治国若干重大问题的决定》,明确了全面推进依法治国的六项任务:完善以宪法……童之伟:政法改良可考虑的十三个具体选项有朋友说,《中共中央关于全面推进依法治国若干重大问题的决定》初稿早定了,一个字不会改。言下之意,显然是我现在说了也白说。但我觉得,如果考虑到政改的长远性和艰巨性……乔恩康里夫:如何避免银行资本的流动性幻觉“巴”风险加权资本标准的基本原则仍然是有效的,但风险加权方法受制于模型风险,因此,需要有一种度量简单的替代方法,该方法不依靠大量模型,这就是所谓“杠杆率”方法背后的逻辑。……高一飞:“不敢说自己是法官”的知耻之勇近日,海南省三亚市中级人民法院院长刘诚接受记者专访时说:“法官的形象已被法官队伍里的害群之马抹了黑”。三亚市法院系统两年来连续出现“震荡”:2004年,三亚市中级人民法院原副院……梁立俊:合规律性与合目的性统一对市场经济的一个“美学”解读内容提要:合规律性与合目的性的统一就是市场经济效率、公平和至善的完美融合。中国市场经济完成了效率阶段,正处在向公平和至善转变的关头,面临各方面的掣肘。去年的三中全会《决定》试图……田飞龙:“四点倡议”实质开启政改二次咨询在各方角力与期待之下,港府和学联的首轮对话终于在10月21日晚举行,全程直播,南早中文网全程文字实录,可见到主持公正,程序对等。这种高规格、公开化的政改协商对话形式,不只是运动……夏锋杨天英:走向经济新常态的转型与改革2014年11月1~2日,中国(海南)改革发展研究院与联合国开发计划署、中国国际经济技术交流中心和德国国际合作机构合作召开了以“走向新常态的新兴经济体”为主题的2014’新兴经……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界