觅搜:使用Search API建立的元搜索引擎

Posted by metasoo 10 August,2008 (1)Comment

在改版之前,实现元搜索的方法全部是通过服务器端抓取,然后返回到客户端分析、去重、排序。最近关注的Google APIs里有很多的Search API,所以就搜集了Google Web Search API, Yahoo Web Search API, Live Search API,可惜国内中文的搜索引擎可能是没兴趣发展这些技术、也可能出于保护的目的,都没有发布Search API。我的观点是:网络是开放的,发布API后,确实会失去一些东西,但会得到更多的东西。

对于没有发布API的搜索引擎,我直接在服务器端抓取,返回自己定义的API接口,这样对于整个网站来说,所有SE都有API了。

由于考虑到执行时间问题,觅搜默认加入的源 SE只有:Google、baidu、Live三个,给它们的排序权重(可信度)分别是:32、23、23。可信度用户可以自己设定进行重新排序。

为了提供更好的搜索体验,觅搜在同一页面加入了最常用的几个搜索引擎,实现一站式搜索,如果用户想在不同的搜索引擎中搜索东西,就不用繁琐地输网址、输关键词了。

本站主要运用Ajax + Json + Xhtml 1.0 + CSS 2.0 实现,工作量不大,主要是要熟悉几个SE的API,还有自己写些js,具体细节和资料我会在接下来的博客中和大家交流分享。

分享家:Addthis中国

Related Items

Categories : 觅搜 Tags : 觅搜  
Comments
2009-4-24 11:20:55

我是搜索技术的外行。但有一点外行的建议,供创办者参考。
采用可信度方式,提高了搜索结果的质量,是个好办法。
但是,我想,如果能够在可信度操作之前,先将百度等搜索的商业化条目过滤掉,搜索的结果将会有一个新的飞跃。
因为绝大多数搜索者搜索的目的是知识和信息搜索,商业化内容是他们不需要的,是干扰,而且可能会误导他们的。需要商业化搜索的时候,人们会采用专门的商业化的搜索词汇、网站、方法等。
虽然可信度操作方式客观上也有过滤商业化条目的功能,但是不彻底。
让觅搜给搜索者一个纯粹的无商业化条目混淆和误导的搜索结果吧。

Posted by 陈体滇 Gravatar Icon

发表评论