免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5467 | 回复: 2
打印 上一主题 下一主题

09献礼, 发布基于libscws的mysql-5.1.x(x>13)分词插件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-01-01 11:02 |只看该作者 |倒序浏览
新年快乐!

之前我也发过少许 myft 系列的小东西, 现在 libscws 已经比较成熟好用, 故在 myql-5.1.30 的基础上开发了分词插件(plugin/scws).

该分词插件的提供的功能有: 让您在MYSQL上创建FULLTEXT的索引和检索时可以直接支持中文分词(仅MyISAM表), 同时提供两个自定义
函数(UDF) 分别为
scws_segment(string buf [, int multi [, int duality [, int ignore]]] )   - 针对 buf 分词, 返回分好的词汇并以空格相连
scws_topwords(string buf [, int limit [, string xattr]])  - 针对 buf 进行分词并自动提取前 limit 个关键/重要词汇

MYSQL 内置的 FULLTEXT 功能仅仅是比 LIKE 更好的选择而已, 对于大的数据量仍然不佳, 最大的优点是不必担心索引同步的问题, 伴随
着您的 update/delete 它会自动处理. 在十万层级的标题检索应用是非常高效的,可用它实现简单的标签检索等, 比 LIKE 好用而且高效.

下载地址: http://www.hightman.cn/down/myft-5.1.30-081231.tgz

详细介绍及说明在压缩包中有, 或者进入我的论坛去查看.  http://www.hightman.cn/bbs/showthread.php?tid=503

论坛徽章:
0
2 [报告]
发表于 2009-01-02 02:15 |只看该作者
这个顶下
09年第一贴给你了

论坛徽章:
8
综合交流区版块每周发帖之星
日期:2015-12-02 15:03:53数据库技术版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每日发帖之星
日期:2015-09-14 06:20:00金牛座
日期:2014-10-10 11:23:34CU十二周年纪念徽章
日期:2013-10-24 15:41:34酉鸡
日期:2013-10-19 10:17:1315-16赛季CBA联赛之北京
日期:2017-03-06 15:12:44
3 [报告]
发表于 2009-01-02 13:17 |只看该作者
顶你
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP