You are here

知道什么时候使用过滤器

g089h515r806 的头像
Submitted by g089h515r806 on 星期三, 2009-08-19 10:29

老葛的Drupal培训班 Think in Drupal

如果可以使用已有的钩子来处理文本,那么你可能会想,为什么此时还需要使用过滤器呢?例如,使用hook_nodeapi()为URL添加超链接,这也非常方便,比URL过滤器还好用。但是考虑一下这种情况----你需要为节点的主体字段使用5个不同的过滤器。现在假定你查看默认http://example.com/?q=node页面,它一次显示10个节点。那么算一下,现在为了显示这个页面,你就需要运行50个过滤器,而对文本的过滤操作是很费资源的。这同时也意味着无论什么时候调用一个节点,即便是正被过滤的文本未被修改,那么也需要运行这些过滤操作。你在一次又一次的没有必要的运行这一操作。
    过滤器系统有一个缓存层,极大的提升了性能。一旦为给定的文本片段运行完了所有的过滤器,该文本的过滤版本将被存储在cache_filter表中,在文本被再次修改前缓存的内容保持不变(使用过滤内容的MD5哈希值来判断是否被修改)。现在让我们回到前面的例子中,当文本未被修改时,我们就可以绕过过滤器直接从缓存表中加载10个节点的数据了---速度快多了!图11-7给出了过滤器系统处理流程的概览。
 
提示 MD5是一个算法,用来计算文本字符串的哈希值。Drupal使用它作为数据库中的一个高效的索引列,用来查找节点的过滤数据。
11-7 文本过滤系统的生命周期
 
提示 对于包含大量内容的站点,通过将过滤器缓存移到一个内存缓存中,比如memcached,那么可以极大地提升性能。
 
     现在你应该比刚才更聪明一点了,你可能会想,“好吧,如果在我们的nodeapi钩子中直接将过滤后的文本保存到node表中,那不更好吗?它的运行结果和过滤器系统可是一样的啊?” 尽管这一方法也解决了性能问题,但是你破坏了Drupal架构的一个基本原则:永不修改用户的原始数据。假定你的一个初级用户回过头来想编辑一篇文章时,当他看到很多内容都被包含在了HTML标签中时,我想他十有八九会向你打电话寻求支持的。过滤器系统的目标就是保持原始数据不变,同时可以在Drupal框架其余部分中使用过滤数据的缓存拷贝。这一原理应用在Drupal的各个API中,你将会经常看到。
 
注意 即便是禁用了Drupal页面缓存,过滤器系统仍将缓存它的数据。如果你看到的还是以前的过滤数据,那么可以导航到“管理➤站点配置➤性能”,点击底部的“清除缓存数据”按钮,来清空cache_filter表。
 

Drupal版本:

评论