云云搜索创始人刘骏
幼狮、幻影、雷电、米格……如果不是军事迷,可能很难马上意识到这几个词组之间的内在关系——实际上,他们代表的均是各国的知名战斗机。而这也是云云搜索(yunyun.com)所有内部会议室的名称,看起来就像是承载了某种成为“战斗机”的期冀。
2010年,从谷歌中国网页搜索研发负责人任上离职的刘骏,带领十余名谷歌工程师,一起开始云云搜索的创业。关于搜索,刘骏一直有个想法。
谷歌不是第一家搜索引擎,但却通过在算法中引入网页之间的关系(PageRank),在搜索领域掀起一次革命。在刘骏看来,这之后再没有大规模提高搜索质量的技术出现,整个行业基本上处于维持状态。搜索该如何进化,下一代搜索引擎会是什么样?
“继续往前需要把人的因素加进来”,这是刘骏想要的结果。相对而言,搜索引擎不是轻创业,以至于前两年云云搜索一直都在搭建基础搜索体系,直到今年初,云云搜索才确定以何种方式将与人有关的“信号”与搜索体系结合起来。
昨晚(12月17日),经过半年多的内测,云云搜索正式上线。
与一般搜索引擎不同的是,注册用户(或者使用五家合作伙伴帐号)在云云搜索登录后,每个人都会得到一份不同的搜索结果,与社交结合的个性化结果。以关键词“泰囧”为例,某个页面社交网络上分享的人越多(尤其是你关注的),排名就越靠前。
刘骏从四个角度阐释不同:相关性层面,社交信号的引入提高了可信度;覆盖率层面,搜索结果提供的内容范围进一步丰富;时效层面,解决了搜索引擎对即时内容抓取呈现缓慢的难点;体验层面,增强了用户的搜索参与感。
“我们的时效性好一个数量级”,刘骏对新浪科技说质量是搜索的关键问题,他笑称自己通过云云搜索找到了很多原来不知道的东西。
试错
从想法到现实,是一个坎坷的过程。对于云云搜索团队而言也不例外。在把社交内容引入搜索的过程中,至少有两个最具代表性的难题。
第一个难题是关联。对于云云搜索的模式而言,既要处理来自社交网络的大规模实时数据,又要把这些实时数据和成千上万的网页关联起来。“这需要一个巨大的数据处理能力”,刘骏说其中的困难不是小规模实时数据处理可以比拟的。
第二个难题是结果变化问题。一个用户在社交网络中关注了多少人,这些人都发出了什么样的内容,全部都是处在无法预测的动态变化之中。而云云搜索正需要从这些动态内容中寻找结果,常见的缓存处理模式在这个过程中完全失效。
“一开始性能很糟糕”,刘骏回忆说当时要花费5~6秒的时间才能返回搜索结果,云云团队最初也对需要处理的数据量估计不足——有20%的搜索结果,会出现社交网络上的内容。解决这一问题需要对算法和机器架构进行改造。
5~6秒的时间,需要缩短到100~200毫秒。
改进的方法之一,就是采用闪存取代硬盘作为存储介质。硬盘的随机读写速度约为每秒50~60次,而闪存的随机处理速度可以达到每秒两三万次。
“这跟传统的搜索引擎就不一样了”,刘骏坦言这些对传统搜索引擎并不构成绝对的技术壁垒,“但是看你有多快,有多大的决心改动底层架构”。此外,他还给自己留了另一个保护性武器:专利,尽管这种方式的收效很难评说。
颠覆
云云搜索靠什么竞争?“我们走的路跟别人不一样”,刘骏在解读这种不同时指出,云云搜索并不想进行入口的争夺,在他看来一些传统模式的搜索引擎同行,虽然用数学公式即可算出市场份额,但最终的成功已经封顶。
新的探索才具有颠覆的可能性,刘骏对新浪科技表示,只有差异化的竞争,才能提供无限的想象力。他补充说:高风险才有高回报。不过,曾有同行在不同场合或直言不讳的说云云搜索的理念是个噱头,或表现出一副漠不关心不愿多谈。
然而谁也无法对搜索引擎的明天下个明确的定义。哪一条才是康庄大道?又或者这样的道路是否只有一条?没有人能预知未来。
刘骏自有一套理论。上面提到的谷歌PageRank技术,在提升搜索效果的同时,也对丰富互联网页面起到了决定性的作用,因为搜索能让更多页面有机会被展示。同样,刘骏希望云云搜索能够和社交网络产生同样的相辅相成、相互促进关系。
他总结说:“大的逻辑上,对搜索引擎而言,别人越繁荣,我才越有价值”。
社交网络也需要信息整合,云云搜索想要做好这个工作。下一步云云搜索还将继续探索和更多开放型的社交网络结合。尽管业界有观点认为搜索流量在下降,不过刘骏却表示社交网络能走多远,云云搜索的差异化之路就能走多远。
“我希望颠覆现在的搜索形态和格局”,刘骏对云云搜索充满信心,“我们肯定也会遇到一些挤压,但是不会因此而害怕”。
风言
就在云云搜索筹备正式上线前几日,坊间关于这家创业公司的讨论开始多起来。甚至有种说法称云云搜索创始团队内谷歌系的人已经在融资后基本套现走人。
谷歌班底的创业团队,是云云搜索的特性之一。新浪科技今年3月的报道中提到,云云创始团队中来自谷歌中国的成员包括孙峥、陈利人、安兴华、王东、曲径、项琨、李大海等十多位工程师,还有盛佳带领的产品设计团队。
其中陈利人、盛佳在传言中被推到聚光灯下。
这两个人前者的确已经从云云搜索离职,即将接任新华社与中移动合建的盘古搜索CTO一职。而盛佳以及其他核心团队成员未有变化。除此以外,云云搜索今年的一些业务调整,例如放弃自建社交网络的计划,还带来一些人员的离职。
“我们最近的确有些流动,主要是业绩不好的人,我们需要一些淘汰的机制”,刘骏说所谓谷歌系团队套现走人的说法,是“造谣污蔑”。他告诉新浪科技,来自谷歌的云云搜索核心团队一直很团结,且精神状态跟以前完全不同:“在大公司里面,你做事情快点慢点无所谓,现在每一步都要很扎实,没有退路”。
云云搜索又如何留住员工?一是股份激励,不过刘骏又说上市不能是目标,否则就会急功近利;二是理想,刘骏闭上眼使劲想了一会儿,又强调了一次理想这个词,他还说“我们真正是在做一个比较大的创新,一个有意义的事情”。
“我们学到的最重要一点,就是找到共赢之路”,刘骏总结创业这几年说。