当前位置:首页» 标签php分词文章
零分 2016.05.05 编程 , , 1,726 读 0 评
今天,有反应说商品采集一直卡住。恰巧又比较喜欢折腾,就去看了下。刚开始以为API卡了,就把API分离出来测试。没问题,更新了一下API接口文件,没问题!一直纳闷哪里出了问题。又重新优化下AJAX,还是一样,一直卡住(其实是AJAX数据返回比较慢!)!最后试着打开下discuz的分词API,发现原来是discuz分词接口的问题。就开着折腾分词! 百度了一下,好像大多都是用scws的分词。就整理了一个scws的分词API! 接口:http://demo.32xp.com/phpkeys/ 请求:get 参数:title,type,n 说明: title:需要分词的内同 type:返回格式,json-返回json格式,arr-返回数组,txt-返回文本,默认返回json! n:取词个数,默认4个 示例: http://demo.32xp.com/phpkeys/?title=新浪SAE彻底收费,图床彻底挂了&type=txt&n=10 截图: 以txt文本返回! 以json格式返回(汉字被编码) 以数组格式返回!  
零分 2015.06.16 代码 , , 3,821 读 0 评
记得之前写过DZ提取关键词的API,返回的是XML,今天打包下代码,返回json,顺便写下调用代码 API:http://32xp.sinaapp.com/api/fc.php 参数:t 编码:utf-8 返回:get ,JSON 代码: <?php $title=“php中计算中文字符串长度、截取中文字符串的函数代码”;  //php 标题参数 $com=@file_get_contents(“http://32xp.sinaapp.com/api/fc.php?t=“.$title); $json=json_decode($com); if($json[0]->eorr){     echo “没有词”; }else{     $k=“关键词:”;     foreach($json as $kw){         $k.=$kw->kw.“,”;     }     $k=rtrim($k,’,’);     echo $k; } ?> 返回:关键词:字符串,中文 封装代码: <?php function fenci($title){ $com=@file_get_contents(“http://32xp.sinaapp.com/api/fc.php?t=”.$title); $json=json_decode($com); if($json[0]->eorr){     echo “没有词”; }else{     $k=“关键词:”;     foreach($json as $kw){         $k.=$kw->kw.“,”;     }     $k=rtrim($k,’,’); } return $k; } ?> 调用: <?php echo fenci(“截取字符串的函数代码”);?> 返回:关键词:字符串,中文
零分 2015.03.13 代码 , , 5,118 读 0 评
自动分词,顾名思义就是自动提取文章标题内容的标签关键词。 DZ有一个API:http://keyword.discuz.com/related_kw.html?title=标题&content=内容&ics=utf-8&ocs=utf-8 返回xml。 PHP代码: <?php    $hanzi=$_GET[‘k’];//方便测试GET标题       function dz_segment($title = ”, $content = ”, $encode = ‘utf-8‘){        if($title == ”){            return false;        }        $title = rawurlencode(strip_tags($title));        $content = strip_tags($content);        if(strlen($content)>2400){ //在线分词服务有长度限制            $content =  mb_substr($content, 0, 800, $encode);        }        $content = rawurlencode($content);        $url = ‘http://keyword.discuz.com/related_kw.html?title=’.$title.’&content=’.$content.’&ics=’.$encode.’&ocs=’.$encode;        $xml_array=simplexml_load_file($url);                        //将XML中的数据,读取到数组对象中          $result = $xml_array->keyword->result;        $data = array();        foreach ($result->item as $key => $value) {                array_push($data, (string)$value->kw);        }        if(count($data) > 0){            return $data;        }else{            return false;        }     }          $r=dz_segment($hanzi);    print_r($r);       ?>   演示:http://2.jspintu.sinaapp.com/dome/fenci.php?k=DZ%E8%87%AA%E5%8A%A8%E6%8F%90%E5%8F%96%E6%A0%87%E9%A2%98%E5%85%B3%E9%94%AE%E8%AF%8DAPI
TOP