首页
导航
博客
电子书
算法
众创
代码
随贴
关于我们
您好,欢迎来到码863代码分享网! 请
[登录]
/
[注册]
搜 索
标题:
*
140
字
TAG标签:
(用空格隔开)
30
字
恢复历史版本:
请选择分类
html
python
javascript
php
sql
c
c++
c#
java
plain
所有人可见
仅自己可见
编辑器:UEditor
编辑器:TinyMCE
编辑器:Editor.md
HTML转MD
HTML转MD2
<p>一、编码范围<br/>1. GBK (GB2312/GB18030)<br/>x00-xff GBK双字节编码范围<br/>x20-x7f ASCII<br/>xa1-xff 中文<br/>x80-xff 中文<br/><br/>2. UTF-8 (Unicode)<br/>u4e00-u9fa5 (中文)<br/>x3130-x318F (韩文)<br/>xAC00-xD7A3 (韩文)<br/>u0800-u4e00 (日文)<br/>ps: 韩文是大于[u9fa5]的字符<br/><br/>正则例子:<br/></p><p>if(preg_match ( '/[\x{4e00}-\x{9fa5}]/u','d口令')===1) //jetee 测试成功 </p><p>echo 'utf8';</p><p>else {</p><p> echo 'gbk';</p><p>}</p><p> </p><p> </p><p> </p><p> <?php</p><p>$action = trim($_GET['action']);<br/>if($action == "sub")<br/>{<br/>$str = $_POST['dir']; <br/>//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312汉字字母数字下划线正则表达式<br/>if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8汉字字母数字下划线正则表达式<br/>{ <br/> echo "<font color=red>您输入的[".$str."]含有违法字符</font>"; <br/>}<br/>else<br/>{<br/> echo "<font color=green>您输入的[".$str."]完全合法,通过!</font>"; <br/>}<br/>}<br/>?><br/><form method="POST" action="?action=sub"><br/>输入字符(数字,字母,汉字,下划线):<br/><input type="text" value=""><br/><input type="submit" value="提交"><br/></p><p></form></p><p><br/></p><p><br/></p><p> </p><p>二、代码例子<br/><br/>//判断内容里有没有中文-GBK (PHP)<br/>function check_is_chinese($s){<br/> return preg_match('/[x80-xff]./', $s);<br/>}<br/>//获取字符串长度-GBK (PHP)<br/>function gb_strlen($str){<br/> $count = 0;<br/> for($i=0; $i<strlen($str); $i++){<br/> $s = substr($str, $i, 1);<br/> if (preg_match("/[x80-xff]/", $s)) ++$i;<br/> ++$count;<br/> }<br/> return $count;<br/>}<br/>//截取字符串字串-GBK (PHP)<br/>function gb_substr($str, $len){<br/> $count = 0;<br/> for($i=0; $i<strlen($str); $i++){<br/> if($count == $len) break;<br/> if(preg_match("/[x80-xff]/", substr($str, $i, 1))) ++$i;<br/> ++$count; <br/> }<br/> return substr($str, 0, $i);<br/>}<br/>//统计字符串长度-UTF8 (PHP)<br/>function utf8_strlen($str) {<br/> $count = 0;<br/> for($i = 0; $i < strlen($str); $i++){<br/> $value = ord($str[$i]);<br/> if($value > 127) {<br/> $count++;<br/> if($value >= 192 && $value <= 223) $i++;<br/> elseif($value >= 224 && $value <= 239) $i = $i + 2;<br/> elseif($value >= 240 && $value <= 247) $i = $i + 3;<br/> else die('Not a UTF-8 compatible string');<br/> }<br/> $count++;<br/> }<br/> return $count;<br/>}<br/><br/>//截取字符串-UTF8(PHP)<br/>function utf8_substr($str,$position,$length){<br/> $start_position = strlen($str);<br/> $start_byte = 0;<br/> $end_position = strlen($str);<br/> $count = 0;<br/> for($i = 0; $i < strlen($str); $i++){<br/> if($count >= $position && $start_position > $i){<br/> $start_position = $i;<br/> $start_byte = $count;<br/> }<br/> if(($count-$start_byte)>=$length) {<br/> $end_position = $i;<br/> break;<br/> } <br/> $value = ord($str[$i]);<br/> if($value > 127){<br/> $count++;<br/> if($value >= 192 && $value <= 223) $i++;<br/> elseif($value >= 224 && $value <= 239) $i = $i + 2;<br/> elseif($value >= 240 && $value <= 247) $i = $i + 3;<br/> else die('Not a UTF-8 compatible string');<br/> }<br/> $count++;<br/> }<br/> return(substr($str,$start_position,$end_position-$start_position));<br/>}<br/><br/>//字符串长度统计-UTF8 [中文3个字节,俄文、韩文占2个字节,字母占1个字节] (Ruby)<br/>def utf8_string_length(str)<br/> temp = CGI::unescape(str)<br/> i = 0;<br/> j = 0;<br/> temp.length.times{|t|<br/> if temp[t] < 127<br/> i += 1<br/> elseif temp[t] >= 127 and temp[t] < 224<br/> j += 1<br/> if 0 == (j % 2)<br/> i += 2<br/> j = 0<br/> end<br/> else<br/> j += 1<br/> if 0 == (j % 3)<br/> i +=2<br/> j = 0<br/> end<br/> end<br/> }<br/> return i<br/>}<br/><br/>//判断是否是含有韩文-UTF-8 (javascript)<br/>function checkKoreaChar(str) {<br/> for(i=0; i<str.length; i++) {<br/> if(((str.charCodeAt(i) > 0x3130 && str.charCodeAt(i) < 0x318F) || (str.charCodeAt(i) >= 0xAC00 && str.charCodeAt(i) <= 0xD7A3))) {<br/> return true;<br/> }<br/> }<br/> return false;<br/>}<br/><br/>//判断是否有中文字符-GBK (javascript)<br/>function check_chinese_char(s){<br/> return (s.length != s.replace(/[^x00-xff]/g,"**").length);<br/></p><p>}</p><p><br/></p>
CopyRight 2002~2023 精通2100网 联系邮箱:qqtxt@163.com
版权所有:精通2100网
湘ICP备2023018646号-1
MYSQl共执行 4 个查询,用时 0.0018279552459717 秒,PHP脚本用时 0.003971 秒,占用内存 0.546 MB,Gzip 已启用