2011-10-11 09:26:54  浏览:1886

php 字符串

strlen() 函数和 mb_strlen() 函数

在 PHP 中,函数s trlen() 返回字符串的长度。函数原型如下:

nt strlen(string string_input); 

参数 string_input 为要处理的字符串。

strlen() 函数返回字符串所占的字节长度,一个英文字母、数字、各种符号均占一个字节,它们的长度均为 1。一个中午字符占两个字节,所以一个中午字符的长度是 2。例如

<?php  
echo strlen("www.sunchis.com");  
echo strlen("三知开发网");  
?>

“echo strlen("www.sunchis.com");” 的运行结果:15

“echo strlen("三知开发网");”的运行结果:15

这里有一个疑问,一个中文字符不是占 2 个字节吗?“三知开发网”,明明是五个汉字,运行的结果怎么会是 15 ?

原因出在这里:strlen() 计算时,对于一个 UTF-8 的中文字符,会把它当做长度为3来处理。当出现中英文混排的情况下,怎么准确的计算字符串的长度呢?这里,得引入另外一个函数 mb_strlen()。mb_strlen() 函数的用法与 strlen() 几乎一摸一样,只是多了一个指定字符集编码的参数。函数原型为:

int mb_strlen(string string_input, string encode); 

PHP 内置的字符串长度函数  strlen 无法正确处理中文字符串,它得到的只是字符串所占的字节数。对于 GB2312 的中文编码,strlen 得到的值是汉字个数的2倍,而对于 UTF-8 编码的中文,就是 3 倍的差异了(在 UTF-8 编码下,一个汉字占 3 个字节)。 因此,下面的代码能准确计算出中文字符串的长度:

<?php  
$str = "三知sunchis开发网";  
echo strlen($str)."<br>";               //结果:22  
echo mb_strlen($str,"UTF8")."<br>";     //结果:12  
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2;  
echo $strlen;                           //结果:17  
?> 

原理分析:

    strlen() 计算时,对待 UTF-8 的中文字符长度是 3,所以“三知 sunchis 开发网”的长度为 5×3+7×1=22
    在 mb_strlen 计算时,选定内码为 UTF8,则会将一个中文字符当作长度 1 来计算,所以“三知 sunchis 开发网”长度为 5×1+7×1=12

剩下的就是纯数学问题了,在此就不啰嗦了……

注意:对于 mb_strlen($str, ‘UTF-8‘),如果省略第二个参数,则会使用 PHP 的内部编码。内部编码可以通过 mb_internal_encoding() 函数得到。需要注意的是,mb_strlen 并不是 PHP 核心函数,使用前需要确保在 php.ini 中加载了 php_mbstring.dll,即确保“extension=php_mbstring.dll”这一行存在并且没有被注释掉,否则会出现未定义函数的问题。

--------------------------割--------------------------------

顺便写一个destoon里面的

{php $sub_str="";}

{php $str_length=0;}

{loop $sub $j $s}

{if $str_length<30}

{php $sub_str.=$s[catname];}

<li>

<a href="{$MODULE[$mid][linkurl]}{$s[linkurl]}" target="_blank" class="g">{set_style($s[catname], $s[style])}</a>

{php $str_length=mb_strlen($sub_str,‘UTF-8‘);}

</li>

{/if}

{/loop}

这个的作用就是,累加字符串,当长度超过30个字的时候,就不输出啦

返回首页