好得很程序员自学网
  • 首页
  • 后端语言
    • C#
    • PHP
    • Python
    • java
    • Golang
    • ASP.NET
  • 前端开发
    • Angular
    • react框架
    • LayUi开发
    • javascript
    • HTML与HTML5
    • CSS与CSS3
    • jQuery
    • Bootstrap
    • NodeJS
    • Vue与小程序技术
    • Photoshop
  • 数据库技术
    • MSSQL
    • MYSQL
    • Redis
    • MongoDB
    • Oracle
    • PostgreSQL
    • Sqlite
    • 数据库基础
    • 数据库排错
  • CMS系统
    • HDHCMS
    • WordPress
    • Dedecms
    • PhpCms
    • 帝国CMS
    • ThinkPHP
    • Discuz
    • ZBlog
    • ECSHOP
  • 高手进阶
    • Android技术
    • 正则表达式
    • 数据结构与算法
  • 系统运维
    • Windows
    • apache
    • 服务器排错
    • 网站安全
    • nginx
    • linux系统
    • MacOS
  • 学习教程
    • 前端脚本教程
    • HTML与CSS 教程
    • 脚本语言教程
    • 数据库教程
    • 应用系统教程
  • 新技术
  • 编程导航
    • 区块链
    • IT资讯
    • 设计灵感
    • 建站资源
    • 开发团队
    • 程序社区
    • 图标图库
    • 图形动效
    • IDE环境
    • 在线工具
    • 调试测试
    • Node开发
    • 游戏框架
    • CSS库
    • Jquery插件
    • Js插件
    • Web框架
    • 移动端框架
    • 模块管理
    • 开发社区
    • 在线课堂
    • 框架类库
    • 项目托管
    • 云服务

当前位置:首页>后端语言>PHP
<tfoot draggable='sEl'></tfoot>

php中文分词接口 php中文分词接口有哪些

很多站长朋友们都不太清楚php中文分词接口,今天小编就来给大家整理php中文分词接口,希望对各位有所帮助,具体内容如下:

本文目录一览: 1、 php 提取中文后简单分词 2、 我想用PHP做一个聊天机器人,我调用别人的API实现了中文分词,我要怎样构建自己的数据库呢? 3、 php 一般使用什么中文分词扩展 php 提取中文后简单分词

$str?=?"汉字一二3四5六七八,九十六七...";

$s1?=?array();//初始化储存第二步结果的数组

//preg_match_all("/[x80-xff]+/",?$str,?$match);//此为GBK使用

preg_match_all("/[\x{4e00}-\x{9fa5}]{2,}+/u",?$str,?$match);//此为UTF-8使用

foreach($match[0]?as?$str1)//循环遍历匹配到的汉字

{

?$leng?=?iconv_strlen($str1,?"UTF-8");//计算汉字其长度

?for($i?=?0;?$i?<?$leng-1;?$i++)

?{

??$temp?=?mb_substr($str1,?$i,?2,?"UTF-8");//将汉字切割长两个字,得第一步结果

??if(!in_array($temp,?$s1))//去除重复,得第二步结果

???$s1[]?=?$temp;//得到的汉字存入数组

?}

}

//print_r($s1);//第一二步完成,得数组$s1,可打印查看结果

$s2?=?file_get_contents("21.txt");//将文件内所有字符读取成一个字符串

$s2?=?iconv("",?"UTF-8",?$s2);//将字符串转码,否则难免有乱码

//echo?$s2;//可输出查看文件中的内容

$s?=?"";//初始化最终结果的变量

foreach($s1?as?$j)//遍历汉字对

{

?if(preg_match("/".$j."/",?$s2))//判断该汉字对是否被包含于文件的文字中

??$s?.=?(""?==?$s)???$j?:?"\\".$j;//将结果合在$s中

}

echo?$s;//得结果,可输出查看或调用

若有疑问,可追问。

注释详细,希望能加分

我想用PHP做一个聊天机器人,我调用别人的API实现了中文分词,我要怎样构建自己的数据库呢?

可以用SimSimi API:(不需要数据库)。

根据提示进行注册(注册地址:)。

登录后访问:,

点击[Get a 7 days Trial Key],你就会获得一个Trial Key(有效期为7天),然后直接

$key??=?'';?//?你的?Trial?Key

$lang?=?'';?//?语言

$msg??=?'';?//?用户说的话

$res??=?file_get_contents(''.$key.'lc='.$lang.'ft=1.0text='.$msg);

或者你要购买一个Paid Key,也可以。

在中,点击[Get Paid Key],就可以购买。

只是代码要改为(响应地址不同):

$key??=?'';?//?你的?Paid?Key

$lang?=?'';?//?语言

$msg??=?'';?//?用户说的话

$res??=?file_get_contents(''.$key.'lc='.$lang.'ft=1.0text='.$msg);

就可以了。注意php.ini中,allow_url_fopen要为On:

allow_url_fopen?=?On

然后会返回一个JSON字符串,与下面类似:

{

"result":?100,

"response":?"SimSimi的回答",

"id":?本次会话的标识符(int),

"msg":?"响应描述"

}

相应描述与result的值相关。

100:OK.???????????//?成功

400:Bad?Request.??//?参数错误

401:Unauthorized.?//?Key?不存在

404:Not?found.????//?页面不存在

500:Server?Error.?//?服务器出错

参见:SimSimi API:

谢谢!

php 一般使用什么中文分词扩展

Robbe是建立在Friso中文分词器上的一个高性能php中文分词扩展,除了提供了基本的分词函数以外,还提供一些编码转换函。

Robbe完整版本(PHP测试程序, 开发帮助文档, WinNT下php各版本的dll文件)下载:code.google测试数据/p/robbe

一. 关于Robbe:

robbe是建立在friso中文分词上的一个高性能php中文分词扩展。了解friso

1.目前最高版本:friso 1.6.0,【源码无需修改即可在各平台下编译运行】

2.mmseg四种过滤算法,分词准确率达到了98.41%。

3.详细功能,请访问friso官方首页:friso [code.google测试数据/p/friso]

二. Robbe分词速度:

测试环境:2.8GHZ/2G/Ubuntu

简单模式:3.1M/秒

复杂模式:1.4M/秒

(因为php中的大量字符串的复制,性能比friso有些下降)。

关于php中文分词接口的介绍到此就结束了,不知道本篇文章是否对您有帮助呢?如果你还想了解更多此类信息,记得收藏关注本站,我们会不定期更新哦。

查看更多关于php中文分词接口 php中文分词接口有哪些的详细内容...

声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://www.haodehen.cn/did209273
更新时间:2023-05-03   阅读:31次

上一篇: php使用pdo修改数据 php内容修改

下一篇:php面试有笔试太烦 php面试2021

最新资料更新

  • 1.token验证php Token验证失败异地登陆什么意思
  • 2.php提取css文件 php引用css文件
  • 3.php获取网页乱码 php网页显示乱码
  • 4.php多线程上锁 php8 jit 多线程
  • 5.扫描登录php代码 扫描登录php代码错误
  • 6.抓取淘宝商品php 抓取淘宝商品风控
  • 7.php获取阴历 php获取日期
  • 8.php函数rand PHP函数的参数传递包括
  • 9.零基础php模板 php0基础教程
  • 10.php获取监控视频 php采集视频地址
  • 11.php技术网学习 php技术门户
  • 12.php前端页面源码 php前端页面源码是多少
  • 13.php系统源代码下载 php源码免费下载
  • 14.php绘制健康码 php源码怎么搭建网站
  • 15.bashphp的简单介绍
  • 16.phpcurl解析失败 php在html中无法解析
  • 17.怎php计算学生成绩 php输入成绩判断成绩等级
  • 18.php输出jq代码 php输出hello
  • 19.主流php框架比较 php框架排行2020
  • 20.php框架制作教程外包 怎么做php框架

CopyRight:2016-{hedonghua:year}{hedonghua:sitegs} 备案ICP:湘ICP备09009000号-16 {hedonghua:sitejym}
本站资讯不构成任何建议,仅限于个人分享,参考须谨慎!
本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。

网站内容来源于网络分享,如有侵权发邮箱到:kenbest@126.com,收到邮件我们会即时下线处理。
网站框架支持:HDHCMS   51LA统计 百度统计
Copyright © 2018-2025 「好得很程序员自学网」
[ SiteMap ]