中文维基百科模糊查询实例(巧用维基百科接口Wikipedia API)

by shinichi_wtn 2009-11-26 19:40
本科生科研基金项目最近进入了实例化阶段,需要将之前的成果做一个展示的平台,也就是我之前提到的“校园维基百科模糊查询平台”,充分利用了我们项目的成果和维基百科的接口。下面谈谈这一个星期的一些进展:可以先到http://www.bnubaike.cn/wiki.aspx体验后再阅读下文 早在一年前,我就想过利用维基百科作为海量数据库的数据源,因为它的词条规模很大,中文有几十万级别,英文则达到千万级别。当时我想过制作离线维基,并下载了维基百科定期dump的xml文件,还自己写了个xml分割器将其分割成几千个小文件并建立索引,不过由于时间关系,最终没有付诸实践。 现在好... [More]

About

shinichi_wtnI'm Shinichi_wtn

Software Engineering Manager at Microsoft

[More...]


Month List