成功尝试WEB数据挖掘,打造自习室查询平台

by shinichi_wtn 2009-04-04 10:12

由于学校的教学楼比较紧张,而学校并没有提供给我们方便查看所有教室的教室信息的平台,而仅仅有一个单独查询每个教室的破玩儿意儿,所以自习只能到每个教学楼下查看教务处打印出来的教室安排表,为了方便寻找自习室,自己决定通过WEB挖掘,把每个教室的上课信息挖掘到自己的数据库中,然后生成和每个教学楼楼下教室信息一样的表,这样就能方便大伙儿了。

经过3天的努力,终于完工,前两天主要学习.NET的网页抓取方式,导入自己的数据文件中,第三天,也就是昨天,完成WEB平台的展现方式,最终效果如下

网址为http://class.bnubaike.cn

谈谈原理吧,由于学校教务网络管理系统进行教室查询是需要通过POST请求的,于是直接利用客户端的请求是无法获得源码的,只能通过服务器端进行WEBREQUEST,然后把获取方式设为POST,传入POST参数,最后获得挖掘网页的页面流,通过正则表达式处理,然后导入自己的数据库,最后用ASP.NET的常规方式构建网站即可。

该任务的难点是数据搜集和获取 ,而WEB展现就不困难了

说得简单点,就是做一个类似于爬虫似的小工具,定期从教务网络系统上抓取新的数据并更新之前缓存的数据。

Comments (2) -

匿名网友 People's Republic of China
11/27/2009 10:00:23 AM #

怎么和你联系?

Reply

shinichi_wtn People's Republic of China
11/27/2009 9:22:19 PM #

百度空间的个人档案里就有我的联系方式啊!conan_wtn@yahoo.com.cn

Reply

(仅用于Gavatar)

  Country flag

biuquote
  • Comment
  • Preview
Loading

About

shinichi_wtnI'm Shinichi_wtn

Software Engineering Manager at Microsoft

[More...]


Month List