当前位置: 首页 » 乱折腾事 » 编程 » PHP字典分词API

PHP字典分词API

Zero零分 编程 2,244 0 5年前

今天,有反应说商品采集一直卡住。恰巧又比较喜欢折腾,就去看了下。刚开始以为API卡了,就把API分离出来测试。没问题,更新了一下API接口文件,没问题!一直纳闷哪里出了问题。又重新优化下AJAX,还是一样,一直卡住(其实是AJAX数据返回比较慢!)!最后试着打开下discuz的分词API,发现原来是discuz分词接口的问题。就开着折腾分词!

百度了一下,好像大多都是用scws的分词。就整理了一个scws的分词API!

接口://demo.32xp.com/phpkeys/

请求:get

参数:title,type,n

说明:

title:需要分词的内同

type:返回格式,json-返回json格式,arr-返回数组,txt-返回文本,默认返回json!

n:取词个数,默认4个

示例:

//demo.32xp.com/phpkeys/?title=新浪SAE彻底收费,图床彻底挂了&type=txt&n=10

截图:

以txt文本返回!

以json格式返回(汉字被编码)

以数组格式返回!

 

END

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

*

用户评论(0)

php提取关键词/标题分词API

记得之前写过DZ提取关键词的API,返回的是XML,今天打包下代码,返回json,顺便写下调用代码 API://32xp.sinaapp.com/api/fc.php 参数:t 编码:utf-8 返回:get ,JSON 代码: <?php $title=“php中计算中文字符串长度、截取中文字符串的函数代码”;  //php 标题参数 $com=@file_get_contents(“//32xp.sinaapp.com/api/fc.php?t=“.$title); $json=json_decode($com); if($json[0]->eorr){     echo “没有词”; }else{     $k=“关键词:”;     foreach($json as $kw){         $k.=$kw->kw.“,”;     }     $k=rtrim($k,’,’);     echo $k; } ?> 返回:关键词:字符串,中文 封装代码: <?php function fenci($title){ $com=@file_get_contents(“//32xp.sinaapp.com/api/fc.php?t=”.$title); $json=json_decode($com); if($json[0]->eorr){     echo “没有词”; }else{     $k=“关键词:”;     foreach($json as $kw){         $k.=$kw->kw.“,”;     }     $k=rtrim($k,’,’); } return $k; } ?> 调用: <?php echo fenci(“截取字符串的函数代码”);?> 返回:关键词:字符串,中文
代码 ·

DZ自动提取标题关键词API

自动分词,顾名思义就是自动提取文章标题内容的标签关键词。 DZ有一个API://keyword.discuz.com/related_kw.html?title=标题&content=内容&ics=utf-8&ocs=utf-8 返回xml。 PHP代码: <?php    $hanzi=$_GET[‘k’];//方便测试GET标题       function dz_segment($title = ”, $content = ”, $encode = ‘utf-8‘){        if($title == ”){            return false;        }        $title = rawurlencode(strip_tags($title));        $content = strip_tags($content);        if(strlen($content)>2400){ //在线分词服务有长度限制            $content =  mb_substr($content, 0, 800, $encode);        }        $content = rawurlencode($content);        $url = ‘http://keyword.discuz.com/related_kw.html?title=’.$title.’&content=’.$content.’&ics=’.$encode.’&ocs=’.$encode;        $xml_array=simplexml_load_file($url);                        //将XML中的数据,读取到数组对象中          $result = $xml_array->keyword->result;        $data = array();        foreach ($result->item as $key => $value) {                array_push($data, (string)$value->kw);        }        if(count($data) > 0){            return $data;        }else{            return false;        }     }          $r=dz_segment($hanzi);    print_r($r);       ?>   演示://2.jspintu.sinaapp.com/dome/fenci.php?k=DZ%E8%87%AA%E5%8A%A8%E6%8F%90%E5%8F%96%E6%A0%87%E9%A2%98%E5%85%B3%E9%94%AE%E8%AF%8DAPI
代码 ·

宝塔Linux无法安装32位问题

宝塔Linux无法安装32位问题,记录一下: vi install.sh,删除以下代码 if [ "$is64bit" = '32' ];then echo '================================================='; echo -e "\033[31m BT-Panel Incompatible 32 bit OS. \033[0m"; exit; fi :wq,保存退出,重新运行sh install.sh,即可安装
编程 ·

微信公众号订阅号未认证开发者关注后自动回复图文

好久没有打理过公众号了,最近又想着从新整理下,订阅号,无法设置菜单,想着关注后就能直接说明下公众号支持的指令,直接用text,太长了,就想着通过关注后以图文消息形式回复指令操作大全。 效果: 思路,修改关注后回复的消息形式,默认是text,修改成图文形式news。 修改: "is_add_friend_reply_open": 1, "is_autoreply_open": 1, "add_friend_autoreply_info": { "type": "text", "content": "Thanks for your attention!" }, 为: "is_add_friend_reply_open": 1, "is_autoreply_open": 1, "add_friend_autoreply_info": { "type": "news", "news_info": { "list": [ { "title": "it's news", "author": "jim", "digest": "it's digest", "show_cover": 1, "cover_url": "封面", "content_url": "链接", "source_url": "原文" } ] } }, 将关注后自动回复的消息text改为图文形式。 官方接口说明:获取公众号的自动回复规则 测试公众号,搜索:豆芽菜园
编程 ·

使用电脑谷歌浏览器模拟微信内置浏览器

有时候觉得别人的微信网页很漂亮?想扒皮? 有时候觉得别人发的微信分享效果很牛逼?想仿制? 有时候觉得别人微信。。。 当复制到浏览器打开的时候,发现跳转了? 当复制到浏览器打开的时候,发现限制了? 想看源码,看不到了吧! 废话一大篇,主要就是想告诉你,可以设置一个微信内置浏览器的模拟器,用谷歌! 原理:设置一个 User Agent! 废话结束,切入正题! 打开谷歌浏览器(其他浏览器应该也可以) 进入开发者模式,按F12或者右键页面–检查,进入控制台 点击竖三点–点击 More tools — 点击Network conditions Network throttling:选择 No  throttling User Agent:选择Custom… 下面有个输入框,输入以下代码: Chrome/33.0.0.0 Mobile Safari/537.36 MicroMessenger/6.0.0.54_r849063.501 NetType/WIFI 输入之后,有人说要回车一下,那你就回车一下好了! 在浏览器地址栏黏贴微信链接。发现真的和微信一模一样哦! 最后上图: 上图是一个淘宝的商品链接。你懂的!至于是否能成功,自己看着办咯,至少博主我是成功了!  
编程 ·
Zero零分
站龄14年资深站长
一个喜欢折腾,却又折腾不出像样东西的,不会PHP的PHP程序员!
467
文章
92
评论
27
分类
822
标签
7
友链
onlinelovesky 317355746 122551965@qq.com

百度广告