代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
PHP
】
统计中英文单词数(GB2312/UTF-8编码)
作者:
/ 发布于
2011/3/15
/
757
<div> <span style="font-family: 宋体; color: #000; font-size: 16px"><?php</span> <span style="font-family: 宋体; color: #000; font-size: 16px">define( "GB2312_CHINESE_PATTERN", "/[\xb0-\xfe][\xa0-\xfe]/" ); define( "GB2312_SYMBOL_PATTERN", "/[\xa1-\xa3][\xa0-\xfe]/" ); // count only chinese words function str_gb2312_chinese_word_count($str = ""){ $str = preg_replace(GB2312_SYMBOL_PATTERN, "", $str); return preg_match_all(GB2312_CHINESE_PATTERN, $str, $textrr); } // count both chinese and english function str_gb2312_mix_word_count($str = ""){ $str = preg_replace(GB2312_SYMBOL_PATTERN, "", $str); return str_gb2312_chinese_word_count($str) + str_word_count(preg_replace(GB2312_CHINESE_PATTERN, "", $str)); }</span> <span style="font-family: 宋体; color: #000; font-size: 16px">define( "UTF8_CHINESE_PATTERN", "/[\x{4e00}-\x{9fff}\x{f900}-\x{faff}]/u" ); define( "UTF8_SYMBOL_PATTERN", "/[\x{ff00}-\x{ffef}\x{2000}-\x{206F}]/u" ); // count only chinese words function str_utf8_chinese_word_count($str = ""){ $str = preg_replace(UTF8_SYMBOL_PATTERN, "", $str); return preg_match_all(UTF8_CHINESE_PATTERN, $str, $textrr); } // count both chinese and english function str_utf8_mix_word_count($str = ""){ $str = preg_replace(UTF8_SYMBOL_PATTERN, "", $str); return str_utf8_chinese_word_count($str) + str_word_count(preg_replace(UTF8_CHINESE_PATTERN, "", $str)); }</span> <span style="font-family: 宋体; color: #000; font-size: 16px">// convert a string to hex-coding form function binhex($str) { $hex = ""; $i = 0; do { $hex .= sprintf("%02x", ord($str{$i})); $i++; } while ($i < strlen($str)); return $hex; }</span> <span style="font-family: 宋体; color: #000; font-size: 16px">$text = $_REQUEST["text"] ? $_REQUEST["text"] : ""; echo "Text: " . $text . ""; echo "Hex : " . ($text ? binhex($text) : "") . ""; // use one of the following two lines according to the page encoding echo "Word count: " . str_gb2312_mix_word_count($text); // echo "Word count: " . str_utf8_mix_word_count($text); ?></span> <span style="font-family: 宋体; color: #000; font-size: 16px"><form action="test.php"> <input type="text" name="text" id="text" value="<?=$text?>"/> <input type="submit" /> </form></span> </div>
试试其它关键字
同语言下
.
用net匹配并替换iOS标准的emoji表情符号
.
处理带Emoji表情的的字符串
.
获取微信昵称时 过滤特殊字符
.
通过判断上传文件的头字符来判断文件的类型
.
模拟百度URL加密解密算法
.
以太坊检查地址是否合法
.
实现crontab解析类
.
获取每个月的开始和结束时间
.
图片上传工具类
.
APP手机应用信息采集
可能有用的
.
用net匹配并替换iOS标准的emoji表情符号
.
处理带Emoji表情的的字符串
.
获取微信昵称时 过滤特殊字符
.
通过判断上传文件的头字符来判断文件的类型
.
模拟百度URL加密解密算法
.
以太坊检查地址是否合法
.
实现crontab解析类
.
获取每个月的开始和结束时间
.
图片上传工具类
.
APP手机应用信息采集
贡献的其它代码
Label
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3