好得很程序员自学网
  • 首页
  • 后端语言
    • C#
    • PHP
    • Python
    • java
    • Golang
    • ASP.NET
  • 前端开发
    • Angular
    • react框架
    • LayUi开发
    • javascript
    • HTML与HTML5
    • CSS与CSS3
    • jQuery
    • Bootstrap
    • NodeJS
    • Vue与小程序技术
    • Photoshop
  • 数据库技术
    • MSSQL
    • MYSQL
    • Redis
    • MongoDB
    • Oracle
    • PostgreSQL
    • Sqlite
    • 数据库基础
    • 数据库排错
  • CMS系统
    • HDHCMS
    • WordPress
    • Dedecms
    • PhpCms
    • 帝国CMS
    • ThinkPHP
    • Discuz
    • ZBlog
    • ECSHOP
  • 高手进阶
    • Android技术
    • 正则表达式
    • 数据结构与算法
  • 系统运维
    • Windows
    • apache
    • 服务器排错
    • 网站安全
    • nginx
    • linux系统
    • MacOS
  • 学习教程
    • 前端脚本教程
    • HTML与CSS 教程
    • 脚本语言教程
    • 数据库教程
    • 应用系统教程
  • 新技术
  • 编程导航
    • 区块链
    • IT资讯
    • 设计灵感
    • 建站资源
    • 开发团队
    • 程序社区
    • 图标图库
    • 图形动效
    • IDE环境
    • 在线工具
    • 调试测试
    • Node开发
    • 游戏框架
    • CSS库
    • Jquery插件
    • Js插件
    • Web框架
    • 移动端框架
    • 模块管理
    • 开发社区
    • 在线课堂
    • 框架类库
    • 项目托管
    • 云服务

当前位置:首页>后端语言>PHP
<tfoot draggable='sEl'></tfoot>

php中文分词接口 php中文分词接口有哪些

很多站长朋友们都不太清楚php中文分词接口,今天小编就来给大家整理php中文分词接口,希望对各位有所帮助,具体内容如下:

本文目录一览: 1、 php 提取中文后简单分词 2、 我想用PHP做一个聊天机器人,我调用别人的API实现了中文分词,我要怎样构建自己的数据库呢? 3、 php 一般使用什么中文分词扩展 php 提取中文后简单分词

$str = "汉字一二3四5六七八,九十六七...";

$s1 = array();//初始化储存第二步结果的数组

//preg_match_all("/[x80-xff]+/", $str, $match);//此为GBK使用

preg_match_all("/[\x{4e00}-\x{9fa5}]{2,}+/u", $str, $match);//此为UTF-8使用

foreach($match[0] as $str1)//循环遍历匹配到的汉字

{

 $leng = iconv_strlen($str1, "UTF-8");//计算汉字其长度

 for($i = 0; $i < $leng-1; $i++)

 {

  $temp = mb_substr($str1, $i, 2, "UTF-8");//将汉字切割长两个字,得第一步结果

  if(!in_array($temp, $s1))//去除重复,得第二步结果

   $s1[] = $temp;//得到的汉字存入数组

 }

}

//print_r($s1);//第一二步完成,得数组$s1,可打印查看结果

$s2 = file_get_contents("21.txt");//将文件内所有字符读取成一个字符串

$s2 = iconv("", "UTF-8", $s2);//将字符串转码,否则难免有乱码

//echo $s2;//可输出查看文件中的内容

$s = "";//初始化最终结果的变量

foreach($s1 as $j)//遍历汉字对

{

 if(preg_match("/".$j."/", $s2))//判断该汉字对是否被包含于文件的文字中

  $s .= ("" == $s) ? $j : "\\".$j;//将结果合在$s中

}

echo $s;//得结果,可输出查看或调用

若有疑问,可追问。

注释详细,希望能加分

我想用PHP做一个聊天机器人,我调用别人的API实现了中文分词,我要怎样构建自己的数据库呢?

可以用SimSimi API:(不需要数据库)。

根据提示进行注册(注册地址:)。

登录后访问:,

点击[Get a 7 days Trial Key],你就会获得一个Trial Key(有效期为7天),然后直接

$key  = ''; // 你的 Trial Key

$lang = ''; // 语言

$msg  = ''; // 用户说的话

$res  = file_get_contents(''.$key.'lc='.$lang.'ft=1.0text='.$msg);

或者你要购买一个Paid Key,也可以。

在中,点击[Get Paid Key],就可以购买。

只是代码要改为(响应地址不同):

$key  = ''; // 你的 Paid Key

$lang = ''; // 语言

$msg  = ''; // 用户说的话

$res  = file_get_contents(''.$key.'lc='.$lang.'ft=1.0text='.$msg);

就可以了。注意php.ini中,allow_url_fopen要为On:

allow_url_fopen = On

然后会返回一个JSON字符串,与下面类似:

{

"result": 100,

"response": "SimSimi的回答",

"id": 本次会话的标识符(int),

"msg": "响应描述"

}

相应描述与result的值相关。

100:OK.           // 成功

400:Bad Request.  // 参数错误

401:Unauthorized. // Key 不存在

404:Not found.    // 页面不存在

500:Server Error. // 服务器出错

参见:SimSimi API:

谢谢!

php 一般使用什么中文分词扩展

Robbe是建立在Friso中文分词器上的一个高性能php中文分词扩展,除了提供了基本的分词函数以外,还提供一些编码转换函。

Robbe完整版本(PHP测试程序, 开发帮助文档, WinNT下php各版本的dll文件)下载:code.google.com/p/robbe

一. 关于Robbe:

robbe是建立在friso中文分词上的一个高性能php中文分词扩展。了解friso

1.目前最高版本:friso 1.6.0,【源码无需修改即可在各平台下编译运行】

2.mmseg四种过滤算法,分词准确率达到了98.41%。

3.详细功能,请访问friso官方首页:friso [code.google.com/p/friso]

二. Robbe分词速度:

测试环境:2.8GHZ/2G/Ubuntu

简单模式:3.1M/秒

复杂模式:1.4M/秒

(因为php中的大量字符串的复制,性能比friso有些下降)。

关于php中文分词接口的介绍到此就结束了,不知道本篇文章是否对您有帮助呢?如果你还想了解更多此类信息,记得收藏关注本站,我们会不定期更新哦。

查看更多关于php中文分词接口 php中文分词接口有哪些的详细内容...

声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://www.haodehen.cn/did209273
更新时间:2023-05-03   阅读:27次

上一篇: php使用pdo修改数据 php内容修改

下一篇:php面试有笔试太烦 php面试2021

相关资讯

最新资料更新

  • 1.php的特点有. 简述什么是php?php的主要特点有哪些?
  • 2.php链接数据库创建表格 php连接数据库的方法
  • 3.phpisset多个值 php __set __get
  • 4.phpoutfile的简单介绍
  • 5.php的项目开发 php项目开发案例整合
  • 6.php声明字符串 在php中声明变量应使用什么符号
  • 7.学php学什么专业 学php可以干什么工作
  • 8.php语法基础csdn php语言基础
  • 9.php会员登录与注册 php 用户登录
  • 10.php截取汉子 php 截断
  • 11.php实现小说目录的方法 php自动生成小说
  • 12.phpmysql当天 mysql 当天
  • 13.php网页老是跳转 php 网页跳转
  • 14.phpsql过滤类 php过滤器
  • 15.phpping测速 测试php性能工具
  • 16.php交叉报表 ureport 交叉报表
  • 17.php微信爬虫 微信爬虫访问是什么
  • 18.图片二进制php 图片二进制转换器
  • 19.JavaPHP你好 java welcome
  • 20.怎么写php需求 php市场需求

CopyRight:2016-2025好得很程序员自学网 备案ICP:湘ICP备09009000号-16 http://www.haodehen.cn
本站资讯不构成任何建议,仅限于个人分享,参考须谨慎!
本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。

网站内容来源于网络分享,如有侵权发邮箱到:kenbest@126.com,收到邮件我们会即时下线处理。
网站框架支持:HDHCMS   51LA统计 百度统计
Copyright © 2018-2025 「好得很程序员自学网」
[ SiteMap ]