自2001年9月Google中文网站悄然开通以来,搜索引擎已经成为中文互联网上最热门的话题之一。作为互联网重要应用的搜索引擎,在中国市场上以惊人的爆炸式方式释放着能量。在中文搜索引擎领域中,百度和Google中文搜索引擎凭借其较大的市场占有率遥遥领先、傲视群雄。
总体来说,Google和百度搜索引擎依靠自身的特点和优势受到了中国网民的欢迎,开辟出了一片市场。本文试图通过对二者的比较分析摸索出一条具有中国特色的搜索引擎发展道路,也希望为那些刚刚起步的搜索引擎网站提供一些借鉴。
中文搜索引擎历史
1.Google历史
Google公司成立于1998年9月。2000年6月,雅虎正式宣布以Google搜索技术取代原先采用的Inktomi技术,Google由此踏出了成功的第一步。2004年8月在纳斯达克上市,开创了第二代搜索引擎技术。
Google利用“蜘蛛程序”在互联网上抓取各个网站的网页,对网页内容进行分词处理,并对抓取到的网页进行超链接分析,然后做Page Rank方式排序(按照此网页被引用次数多少进行排序)。这种Page Rank机制类似于SCI论文被引用次数统计排序机制。Google还独创了多语言搜索技术,支持世界上几十种主要语言。
Google技术成熟、稳定,是全球最大的搜索引擎,其企业文化开放而独特、品牌优势明显,推出了GB级电子邮箱、桌面搜索、专业搜索、把美国庞大的图书资料搬上网络等服务,开创了许多互联网先河。
2.百度历史
百度创办于1999年。2000年1月,百度为eNet提供了eS—earch和原ChinaRen的“孙悟空智能搜索”之后,国内如新浪、搜狐、网易等20多家门户网站和专业网站均采用了百度的搜索引擎服务。2002年9月,百度开始转型,推出www.baidu.com,但没有开创自己的搜索引擎风格而是全部照搬Google。
日前,百度立足国内、专注中文搜索市场,研究汉语特点和国内网民的上网习惯,在中文分词、相关性搜索、特色搜索等方面已经超越了Google,摆脱了早期的照搬风格、逐渐自成一体。百度自己研发并较早地推出国人喜爱的MP3搜索,吸引了大量年轻网民。2003年12,月百度推出了“贴吧”这样的个性搜索服务来聚集人气,因而逐步奠定了百度成功的基石。2003年、2004年,百度推出“新闻搜索”、“下吧”、“IE搜索工具条”等一系列搜索产品。2004年8月,收购Ha0123.corn进入网站网址搜索市场,逐步成为了中国搜索引擎的领头羊。2004年6月,引入了包括IDG、JDF、Google等多家风险投资的1亿美元,其中,Google投资1000万美元,占3%股份。
网页搜索服务比较
网页搜索是搜索引擎立业根本,Google和百度都提供了很多的搜索引擎功能,以下面一些功能为例来做一下比较:
中文简体网页搜索方面,不论Google还是百度,在搜索性能和效果方面都不错,难分仲伯。
Google尽管开发了众多的搜索功能并最早推出中文搜索,但由于不太专注中文搜索的开发,在汉语理解、中国人搜索习惯的把握等方面均要落后于百度。
与Google相比,百度更专注于中文搜索,甚至可以说只重视中文简体搜索,因而,提供的中文搜索服务最全面、功能和性能经得起长时间考验,而且,对中国网民使用习惯也进行了优化。
MP3搜索服务比较
MP3搜索服务包括各种音频文件、Flash和歌词专辑等服务,目前使用最多的是搜索歌曲和音乐服务。2002年和2003年,Google与大多数国外门户网站尚未开设专业音乐搜索频道,这让中国的搜索引擎公司抓住机会得以发展。其中,百度是开设MP3搜索服务的最大受益者,许多人知道百度是从搜歌开始的,而且许多坚持使用Google的早期网民还保持一个习惯:找网页到Google,搜歌到百度。
百度自主研发出了非常实用的MP3频道,继承了以往百度网页搜索的简洁风格。百度MP3频道拥有近600万中英文歌曲,同时,每天都要对歌曲链接功能进行分析以排除死链接和下载慢的链接。如对“MP3”进行搜索Google搜索到331,00旧项查询结果,搜索用时0.08秒;百度搜索到865296项查询结果,搜索用时0.001秒。由于其MP3频道歌曲链接的准确性和下载速度都很不错,所以,深受广大网民的欢迎。从A1exa.com显示数据看,mp3.baidu.com占百度访问量的20%,成为国内影响力最大的搜索引擎,其影响力已经超越了互联网,成为了许多广告商投放的首选。