当前位置: 首页 > news >正文

【编译打包】sphinx-for-chinese-2.2.1-r4311.el6.src.rpm

sphinx 由于中文分词效果不佳,于是就有国内牛人给它改装了,sphinx-for-chinese(简称sfc)就是其中一个。


sphinx-for-chinese采用的分词方法是预设字典,将文本字典转换成二进制后载入内存,作为分词依据,如果分词效果不好,可以根据需要调整词典,性能据称达到官方版的一半。


sfc官网没有提供rpm包,我的包安装方便,集成了字典,初始化时需要生成字典,务必检查字典源文件是utf-8格式的,见下文。


环境CentOS 6.5 X64


安装步骤

1
2
3
4
5
yum  install  yum-utils -y
rpm -ivh sphinx- for -chinese-2.2.1-r4311.el6.src.rpm
yum-builddep ~ /rpmbuild/SPECS/sphinx-for-chinese .spec
rpmbuild -ba ~ /rpmbuild/SPECS/sphinx-for-chinese .spec
rpm -ivh ~ /rpmbuild/RPMS/x86_64/sphinx-for-chinese-2 .2.1-r4311.el6.x86_64.rpm


准备字典,将文本字典转换成二进制

1
2
3
4
5
yum  install  dos2unix -y
cd  /etc/xdict
tar  zxvf xdict_1.1. tar .gz
dos2unix xdict_1.1.txt
/usr/bin/mkdict  xdict_1.1.txt xdict.bin


确保在/etc/sphinx/sphinx.conf 的index 段中包含下面三行配置

1
2
3
charset_type   = utf-8
chinese_dictionary =  /etc/xdict/xdict .bin
ngram_len = 1


附件有点大,超过了博客附件限制,请移步百度网盘下载


http://pan.baidu.com/s/1c08dWFQ


其他配置,参见官方

http://www.sphinx-search.com/










本文转自 紫色葡萄 51CTO博客,原文链接:http://blog.51cto.com/purplegrape/1581342,如需转载请自行联系原作者

相关文章:

  • 缓冲区溢出漏洞实验
  • MSQL基本增删改语句汇总练习
  • Jsp/Servlet:小结图片操作的一些代码
  • 十:Application Lifecycle Management in Visual Studio 2008 Team Foundation Server 2008
  • it之家
  • 天气预报代码调用
  • Java静态方法和实例方法 java中的数组作为形参传入
  • [CodeForces-759D]Bacterial Melee
  • MongoDB lsm降低 disk lantency
  • CentOS7 LVM添加硬盘及扩容
  • Hanlp等七种优秀的开源中文分词库推荐
  • python基础===抽象
  • 【洛谷 P2303】 [SDOi2012]Longge的问题 (欧拉函数)
  • 【iOS-cocos2d-X 游戏开发之十六】Cocos2dx编译后的Android自动使用(-hd)高清图设置自适应屏幕...
  • 了解一下ES6: let const
  • 【剑指offer】让抽象问题具体化
  • 【跃迁之路】【444天】程序员高效学习方法论探索系列(实验阶段201-2018.04.25)...
  • 【跃迁之路】【641天】程序员高效学习方法论探索系列(实验阶段398-2018.11.14)...
  • Android组件 - 收藏集 - 掘金
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • javascript 哈希表
  • javascript面向对象之创建对象
  • node 版本过低
  • passportjs 源码分析
  • Vue.js 移动端适配之 vw 解决方案
  • 区块链分支循环
  • 区块链共识机制优缺点对比都是什么
  • 微服务入门【系列视频课程】
  • 无服务器化是企业 IT 架构的未来吗?
  • d²y/dx²; 偏导数问题 请问f1 f2是什么意思
  • C# - 为值类型重定义相等性
  • 如何用纯 CSS 创作一个菱形 loader 动画
  • # 达梦数据库知识点
  • (14)Hive调优——合并小文件
  • (23)Linux的软硬连接
  • (70min)字节暑假实习二面(已挂)
  • (ibm)Java 语言的 XPath API
  • (SpringBoot)第二章:Spring创建和使用
  • (第27天)Oracle 数据泵转换分区表
  • (附源码)springboot课程在线考试系统 毕业设计 655127
  • (力扣记录)235. 二叉搜索树的最近公共祖先
  • (免费分享)基于springboot,vue疗养中心管理系统
  • (生成器)yield与(迭代器)generator
  • (十六)一篇文章学会Java的常用API
  • (原創) 如何將struct塞進vector? (C/C++) (STL)
  • (转)关于多人操作数据的处理策略
  • (转载)虚函数剖析
  • ./和../以及/和~之间的区别
  • .NET Core WebAPI中使用swagger版本控制,添加注释
  • .NET 使用 XPath 来读写 XML 文件
  • .NET中winform传递参数至Url并获得返回值或文件
  • @RestController注解的使用
  • [ NOI 2001 ] 食物链
  • [ASP.NET 控件实作 Day7] 设定工具箱的控件图标
  • [boost]使用boost::function和boost::bind产生的down机一例