对于大数据时代,社会文明的进步与风险

对于大数据时代,社会文明的进步与风险

http://www.shuoshilunwen.com/shehuixuelunwen.html
大数据时代,社会文明的进步与风险1988年,出生于奥地利小镇的22岁的维克多·迈尔-舍恩伯格和朋友创建公司,推出了一款名为IKARUS 的反病毒软件,IKARUS 一举夺得了当年奥地利最畅销软件的头衔,舍恩伯格的事业蒸蒸日上,他的成绩也获得了史蒂夫·乔布斯的关注。
  乔布斯把舍恩伯格请来在他的公司开发类似的系统。有次同乔布斯吃饭,舍恩伯格问乔布斯编过的第一个程序是什么,乔布斯很震惊,愣住没有回答,“于是我们再也没有出去吃过饭”。
  舍恩伯格不知道乔布斯一辈子都没编过一行代码,不过若干年后,谷歌翻译的团队也没有几个专业的翻译人员,亚马逊的荐书系统也没有一个书评人,从小琢摩计算机的舍恩伯格亲历了计算机和数据科学的发展,渐渐成为了“大数据时代”权威的研究人。
  什么是大数据呢?舍恩伯格在《大数据时代》中写道,“最先经历信息爆炸的学科,如天文学和基因学,创造出了‘大数据’这个概念”,“大数据并非一个确切的概念。最初,这个概念是指需要处理的信息量过大,已经超出了一般电脑在处理数据时所能使用的内存量,因此工程师们必须改善处理数据的工具。”现在的“大数据”,简而言之,就是指那些近乎所有的可利用的数据。
  如今,大数据这个概念几乎应用到了所有人类致力于发展的领域之中。
  20世纪80年代后期,IBM公司的研发人员针对于电脑翻译提出了全新的观点,他们利用10年的时间将约300万句之多的加拿大双语议会资料(加拿大的 语言为英语和法语)进行统计分析,让机器识别英语和法语的某个词在什么样的情况被翻译成对应语言的词汇,研发团队放弃了语言中的语法(因果关系),纯靠统计出大数据时代,社会文明的进步与风险由优秀论文网站http://www.shuoshilunwen.com提供,助您写好论文.语言之间的相关性进行翻译,虽然取得了一定的成绩,不过因为没有足够多的数据,IBM最后取得的成效并不大。
  15年后,谷歌采取了同样的做法,它不仅采用了加拿大议会的会议稿,还把互联网上几十亿页面的数据进行抓取分析,寻找不同语言词汇之间的关联性。到2012年年中,谷歌数据库涵盖了60多种语言,甚至能够接受14种语言的语音输入,并且能够很流利地对等翻译。虽然谷歌抓取的互联网数据很混乱,有些还是错误的,但他们的规模是IBM的上万倍甚至百万倍,“因为他们在规模上做大了这么多,所以他们在质量上稍微有一点牺牲是没有理由。”
  大数据的统计分析甚至击败了亚马逊网站1997年成立