C++分词工具:Jieba分词
这里简单介绍以下cppjieba,cppjieba是一款分词工具。如下图
用户输入一句话,cppjieba分词工具会将这句话进行有规则的分割。
下面就带大家进行安装。
cppjieba代码仓库gitcode.net
将上面的代码仓库克隆到你服务器上。
git clone https://gitcode.net/qq_55172408/cppjieba.git
因为我已经克隆过了,所以显示已经存在该文件了。
克隆好之后,你所在的目录中会存在对应的文件(cppjieba)。
include:里面包含着各种头文件。
dict:包含着字符集等信息,因为测试案例中用到了,我没做太多了解。
同时,cppjieba库中还提供了,各种案例。
这个文件就是案例使用代码,我将它拷贝出去带大家看看。
创建动态链接:(源文件路径必须是绝对路径,否则会建立不成功)
建立dict目录的动态链接
ln -s ~/Project/Hpp/cppjieba/dict test/dict
原始文件中,会用到该路径下的字符集什么的,我没做太多了解,只是简单的使用。
建立include目录的动态链接
ln -s ~/Project/Hpp/cppjieba/include/cppjieba test/cppjieba
你也可以不写这个cppjieba,只是需要你在使用的文件中,指明清楚,否则编译器找不到。
cppjieba库在使用中的问题:
这里需要注意一下,将deps/limonp中的内容拷贝到 include/cppjieba中,不然会编译不通过。
没拷贝编译后告诉你需要这个文件,但是没有找到。
这是cppjieba库的缺陷。拷贝的时候看一看limonp目录下有没有内容,没有的话会报错,那就需要找正确的库进行克隆。
cd cppjieba
cp -rf deps/limonp include/cppjieba/
我将demo.cpp拷贝到外面,可以为大家展示如何使用这个工具,首先我们要建立对应的头文件和目录链接。
绿色:我所建立的目录
红色:动态链接(可能不同的设备颜色会不一样,
这个没有了解过)
蓝色:对demo.cpp进行编译形成的可执行文件
g++ demo.cpp -o out
-o 后面是形成的可执行文件名称 你可以自行指定。
cppjieba分词工具的使用说明:
如果你的项目中有用到分词的操作,可以将对应的头文件和目录建立对应的动态链接,引入到你项目路径中。