thinkphp5.1和5.0下的中文分词

thinkphp5.1中文分词方法
config目录下的app.php文件中增加
//中文分词的目录
'CONF_PATH' => Env::get('root_path') . 'application' . DIRECTORY_SEPARATOR . '你的模块' . DIRECTORY_SEPARATOR . '中文分词的目录'.DIRECTORY_SEPARATOR
thinkphp5.0的config.php 
//中文分词的目录
'CONF_PATH' => ROOT_PATH . 'application' . DS . '你的模块' . DS . '中文分词的目录'.DS


公共方法:
/**
* 中文分词
* @params string $title 需要分词的语句
* @params int $num 分词个数,默认不用填写
**/
function get_tags($title,$num=null){
$pscws = new \app\你的模块\中文分词目录\Pscws();
$pscws->set_dict(config('app.CONF_PATH') . 'dict.utf8.xdb');
$pscws->set_rule(config('app.CONF_PATH') . 'rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words = $pscws->get_tops($num);
$pscws->close();
$tags = array();
foreach ($words as $val) {
$tags = $val['word'];
}
return implode(',', $tags);
}
Tp5.0框架下
config('app.CONF_PATH') 改成 CONF_PATH
调用方法:
dump(get_tags('积分第三方鉴定是非得失佛挡杀佛度是的不舒服'));die;
本地测试结果:
string(50) "是非得失,第三方,鉴定,是的,舒服,积分"

0 个评论

要回复文章请先登录注册