第(3/3)页 换了话题,他心情就好了,脸上的笑容也多了,谦谦温和地说:“互联网上的中文信息其实并不多,连英文的千分之一都不到,其中存在大量的同质化的内容。搜狗的中文网页收录量达100亿,反而说明其技术不够好。” “为什么?” “缺乏排查机制啊。大量重复的同质内容,有什么用?收录进来只会浪费搜索效率,影响搜索速度。” “谷歌呢?” “谷歌是都有收录,可人家的技术好啊,大数据算法之下,再大的网页量也能在极短的时间内检索出结果。可百度、搜狗都不行,就只能缩小网页检索量的规模,提高搜索速度。” 周不器点了点头,这才想起来,这个道理好像许良杰、程秉皓跟他讲过。 不得不说,李彦红在和谷歌的竞争上,在各方面都做到了极大的优化,值得效仿学习,回去得跟王小船说一声。 “对了,大数据算法……你们百度有吗?” “没有。” “百度都没有?” “岂止是百度,微软、雅虎、IBM都没有,全世界就谷歌有。不是发了三篇理论性论文嘛,不过没公开代码。美国那边有团队在根据论文做分布式算法……咦?紫微星不是也在做分布式计算吗?那就是大数据算法的雏形。” 周不器揣着明白装糊涂,“这样啊,那百度呢?百度是国内第一大搜索引擎,总不能只通过减少检索量的方式取巧吧?总归要大数据算法支持。” 李彦红瞥他一眼,笑着说:“这可是商业机密了。” “不能说?” “等处理完股票的事,打败了谷歌中国,外部忧患就算解除了。到了明年,百度有意向做这方面的研究。” “分布式?大数据?” “嗯。” “要不要合作?”周不器眼睛里流露着满满的期待,“我们的分布式算法都做出模板了,咱们合作,说不定可以事半功倍。” 李彦红心中哼了一声。 只以为这小子是想占百度的便宜。 做技术研发,国内任何一家互联网公司都没资格跟百度深度合作。紫微星的分布式数据库项目是做了快一年了,在分布式领域有了很深的研究。 可那又如何? 给百度三个月时间,说不定就能反超。 李彦红本身就是技术大牛,他有自己的骄傲,觉得跟周不器这种外行谈技术合作,有点掉价,平淡而坚定的道:“百度不需要帮手。” “帮你打打下手呗?” “不需要。” “那行吧。” 周不器心凉了半截。 就觉得想为国为民做点好事,怎么这么难啊? 第(3/3)页