You are here

2014年3月1日北京Drupal网页数据采集聚会总结

3.1日下午,在北京成功举办了一次Drupal聚会,参与人数很多,看来大家对数据的抓取及整合都非常有兴趣。

老葛介绍了历年给中华书局、高能物理所抓取RSS信息、外语研究出版社图书信息共享以及抓取京东图书信息的心得体会。可以看出drupal在数据的抓取、处理、整合及共享方面功能越来越强大。

老葛重点介绍FeedAPI,Feeds,FeedsCrawler, Feeds Spider, Feeds Self Node processor,XML,Xpath, Feeds Smart Parser,job scheduler的具体应用。并把抓取应该注意的流程及Xpath等做了相关介绍。其中https://drupal.org/project/feeds_smartparser 是老葛贡献的。赞一下。

崔克俊介绍了赵高欣基于Drupal做的社交问答网站Drupal大学,http://drupal001.net,欢迎大家注册,邀请码请给113017582@qq.com发信要。

于志成介绍了他马上就要上线的采集Drupal官方网站模块,并增加汉化翻译,功能汇总整合的Drupalproject项目,非常炫,令人耳目一新,即将上线,敬请期待。

初步定于4月初再举办一次聚会,征集聚会话题,欢迎交流分享。联系人崔克俊

cuikejun@qq.com 手机13681445347 13381113196 QQ:372948992

论坛:

Drupal版本: