返回   CHF站长论坛 > 特色讨论区 > Drupal 讨论专栏

Drupal 讨论专栏 Drupal 是一个高度个性化、模块化的开源内容管理系统。[官方]

完美世界私服 魔兽世界私服 魔兽私服 双至强仅二千,企商在线,最早租用商 传奇世界私服 完美世界私服 此文字广告位招租
传奇世界私服 传世私服 新开魔域私服 明网Linux合租空间,独立IP 全球最新的创意科技产品 魔域私服 传奇私服 魔兽私服 完美世界私服
发表新主题 回复
 
主题工具 主题评分 显示模式
旧 2008-03-14, 11:27   #1 (页面定位)
老鬼
CH重振中
 
老鬼 的头像
 
注册日期: 2005-08-30
住址: 地球
帖子: 12099
老鬼 的声望功能已被禁用
默认 drupal 中文搜索优化

drupal默认就是全文搜索,但需要运行Cron进行内容分词建立索引。

比如我的原句是

引用:
大黄蜂变形金刚扬声器诞生
drupal不懂中文,如果你设置索引关键词为2,默认的分词会生成下面的索引,只是机械地两个字两个字分开。

引用:
大黄 黄蜂 蜂变 变形 形金 金刚 刚扬 扬声 声器 器诞 诞生
如果内容多,索引关键词短,索引数据表会非常大,会让数据库效率下降。国内drupal牛人 http://www.blogme.cn 的站长开发了一个中文分词模块,http://drupal.org/node/53886 ,这个模块用中文辞典文件对内容进行索引,可以大量减少索引的数量。

下面是利用这个模块生成的索引

引用:
大黄蜂 变形 金刚 扬声器 诞生
是不是准确精简了很多?当然你可以用其他辞典让分词更准确。


另一个减少索引的方法是只搜索标题,既可以减少索引的时间,又可以减少索引的数量。只需进行下面的修改

modules/node/node.module

$text = '<h1>'. check_plain($node->title) .'</h1>'. $node->body;

改为

$text = check_plain($node->title) ;
老鬼 当前离线   回复时引用此帖
旧 2008-03-14, 11:37   #2 (页面定位)
kernel
 
注册日期: 2005-11-14
帖子: 39
kernel 是普普通通的会员
默认

标题搜索用二元分词 全文索引
内容搜索用google自定义
kernel 当前离线   回复时引用此帖
旧 2008-03-14, 13:40   #3 (页面定位)
zipo_han
 
zipo_han 的头像
 
注册日期: 2006-07-08
帖子: 94
zipo_han 是普普通通的会员
默认

收藏。留用。


Where did you go? I choose noise.

UIcity
zipo_han 当前离线   回复时引用此帖
旧 2008-03-14, 17:15   #4 (页面定位)
DeadFireFireFir
青铜长老
 
注册日期: 2007-11-13
帖子: 220
DeadFireFireFir 是普普通通的会员
默认

引用:
作者: zipo_han 查看帖子
收藏。留用。
同收同收。
DeadFireFireFir 当前离线   回复时引用此帖
回复

书签

标签

主题工具
显示模式 对此主题评分
对此主题评分:



所有时间均为北京时间。现在的时间是 12:41