大数据的高烧 - 王垠的博客

3,844 阅读4分钟
原文链接: www.yinwang.org

大数据真的很热,烧得很热。有人说,现在数据是最宝贵的资源,超过石油,电和水,有了数据就有了一切。

Google的研究总监Peter Norvig,每次给实习生做讲座,都会鼓吹大数据的功效,说牛顿爱因斯坦算什么啊,比不上我们Google的大数据。看Google Translate多么的厉害啊,它根本不需要parse和理解人类语言,只要把很多的对照翻译文本丢进去,然后它就能自己学习,实现机器自动翻译了。

我曾经帮助过一个做通信app的公司。一开头的时候,他们的CEO跟我说:“我们准备用大数据分析来发现UI设计中存在的问题。比如,通过分析用户在app注册过程的哪一个页面退出,再也没有回来,我们就知道那个页面有问题……”

如此种种的发烧症状,跟文化大革命的年代有得一拼…… 许多的人,只知道大数据的名字,就脑残一般的相信它能解决世界上所有的问题。可是大数据真的解决了问题吗?

Peter Norvig大力鼓吹的Google Translate,真的好用吗?你愿意看它翻译出来的文章或者书籍?你敢用它来生成多国语言的产品说明书吗?实际上Google Translate翻译的东西,表面看上去貌似某种语言的样子,细看就发现其实不是很像人话。大部分时候,你只能说“凑合知道这文章在说什么”而已。

实际上,只有能正确parse人类语言句子,真正理解里面的结构和涵义,加上大量的常识和背景知识,建立思维模型,才有可能真正准确的翻译人类语言。所有的人类翻译者都是这么做的,你为什么就觉得大数据技术能够超越人的智能,跳过这一步呢?那只不过是瞎蒙而已。拿Google Translate就想证明大数据的功效,藐视语言学研究甚至其它科学的价值,这烧发得真够可以。

至于那个通信app公司,我只用了他们的app两次,就发现用户注册界面有一个严重的设计失误。屏幕显示:“新用户注册”。当你输入自己的电话号码之后,它会弹出一个窗口说:“现在我们要给你发一个短信,验证你的电话号码。OK?”然而稍后他们的服务器却发现你的电话号码已经注册过(是一个回头用户),它就会一声不吭,转而给你另一个窗口,让你输入账号密码,而不是短信验证码。

输入密码和短信验证码的窗口样式,并没有很大差别,只不过输入栏旁边的小字有一点不同。由于之前已经提示要发短信验证码,所以用户根本不会去看那输入栏旁边的小字,就会认为这是要他输入短信验证码的界面,所以他就会一直等那条短信。可是由于这人已经注册,所以服务器不会发出短信,而是等待他输入密码。结果用户在等短信,而app在等密码。几分钟之后,用户终于决定,这是一个劣质的app,这么久没用还是这么烂,居然短信验证码都收不到,所以删了它……

当我把这个发现告诉他们老总的时候,他说:“这个不关你的事!这界面是我们请专业的UX设计师弄的,你外行就别管了!”设计问题明摆在眼前,玩几下就发现了,可有人就是视而不见。明眼人说的话不听,恁是相信大数据分析能够告诉他真理,你拿他有啥办法?于是呢,他继续叫人分析这app的登录数据,然后向投资人鼓吹自己采用的各种尖端big data技术,最后用户越来越少,走上穷途末路……

所以你看到了,大数据并不能代替好的科学家,不能代替好的设计师。像任何工具一样,大数据有适用的地方,也有它解决不了的问题。我不否认大数据在某些方面能够提供帮助,然而这种认为“大数据能解决一切问题”的想法,只是高烧产生的幻觉而已。