打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Coreseek开源中文检索引擎 - Sphinx - 论坛搜索、信息检索、文献检索、站内...

Sphinx

Sphinx Search 是由俄罗斯人Andrew Aksyonoff 开发的高性能全文搜索软件包,在GPL与商业协议双许可协议下发行。
Sphinx支持从多种数据源获取待检索的数据,目前包括:

  • MySQL数据库
  • PostgreSQL数据库
  • XML数据管道,允许索引其他用户自定义格式

 


Sphinx的主要功能包括:

  • 高速建立索引(可达10 MB/秒)
  • 高性能搜索(在2-4 GB的文本上搜索,平均0.1秒内获得结果)
  • 高扩展性(在单一CPU上,实测可对100GB的文本建立索引,单一索引可包括100M文件 )
  • 支持分布式检索
  • 支持基于短语和基于统计的复合结果排序机制
  • 支持任意数量的文件字段(数值属性或全文检索属性)
  • 支持不同的搜索模式( “完全匹配” , “短语匹配”和“任一匹配” )
  • 支持作为Mysql的存储引擎

Coreseek 在Sphinx的基础上,对Sphinx 的中文支持进行增强,包括:

  • 使用Python的可编程数据源
  • 基于最大匹配算法的中文分词模块
  • 支持GB18030编码的数据源

下载:

  • 基于复合最大匹配算法的中文分词法 libmmseg 。该分词库在GPL协议下授权发布。

 

目前,Coreseek 不单独提供补丁文件,有在Sphinx中启用中文分词的用户,请直接下载 Coreseek 全文检索服务器

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Coreseek开源中文检索引擎
开发者都应该知道的开源搜索引擎
搜索服务器
基于Sphinx+MySQL的千万级数据全文检索架构设计
13 款开源的全文检索引擎
Sphinx+MySQL全文检索架构和安装过程
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服