wdcp安装中文分词scws

2014-4-20 寒川 计算机

自从有了虚拟机,鼓捣的东西从没停过。昨晚为wdcp安装中文分词,今天整理如下,分享出来。

测试环境:

OS:centos6.5

WDCP:wdcp_v2.5.10(20140213) 

PHP:5.3.27

环境介绍完毕,下面是安装步骤:

cd /root #已root进入root目录
wget http://www.xunsearch.com/scws/down/scws-1.2.2.tar.bz2 #下载源码
tar xvjf scws-1.2.2.tar.bz2 #解压源码
cd scws-1.2.2 #进入源码目录
./configure --prefix=/usr/local/scws ; make ; make install #配置,安装
cd /usr/local/scws/etc #进入scws目录
wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 #下载gbk词库
wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 #下载utf8词库
tar xvjf scws-dict-chs-gbk.tar.bz2 #解压gbk词库
tar xvjf scws-dict-chs-utf8.tar.bz2 #解压utf8词库
cd /root/scws-1.2.2/phpext #进入php扩展源码目录
/www/wdlinux/apache_php-5.3.27/bin/phpize #侦测环境(phpize工具是在php安装目录下,基于这点phpize对应了当时的php环境,所以是要根据该php的配置情况生成对应的configure文件),建立一个configure文件。必须在一个目录下去运行phpize。那么phpize就知道你的的环境是哪个目录,并且configure文件建立在该目录下。
./configure --with-php-config=/www/wdlinux/apache_php-5.3.27/bin/php-config --with-scws=/usr/local/scws #配置
make install
配置php,在 php.ini 中加入以下几行:
 [scws]
 ;
 ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
 ; 再把 extension = scws.so 指定绝对路径。
 ;
 extension = /www/wdlinux/apache_php-5.3.27/lib/php/extensions/no-debug-non-zts-20090626/scws.so #此路径编译后会显示
 scws.default.charset = utf8
 ;上一行也可说gbk
 scws.default.fpath = /usr/local/scws/etc
service httpd restart #重启web服务器

若上述均无误,中文分词scws-1.2.2应该安装成功。 其他版本,请参考安装。

最后,可能出现用php分词时出现单字的情况,貌似词库没起作用。经测试,确实是没起作用,原因是词库不具有读写权限,手动设置一下就OK了。

标签: php CentOS wdcp 中文分词 scws

评论:

yagni
2016-12-07 17:15
nice!不错嘛

发表评论:

Powered by emlog 蜀ICP备12030225号

川公网安备 51042102000001号

sitemap