- 相關(guān)推薦
PHP如何獲取中文字符串長(cháng)度
PHP對中文字符串的處理一直困擾于剛剛接觸php開(kāi)發(fā)的新手程序員。下面就有小編分享PHP如何獲取中文字符串長(cháng)度的方式,歡迎大家學(xué)習!
PHP自帶的函數如strlen()、mb_strlen()都是通過(guò)計算字符串所占字節數來(lái)統計字符串長(cháng)度的,一個(gè)英文字符占1字節。例:
$enStr = ‘Hello,China!’;
echo strlen($enStr); // 輸出:12
而中文則不然,做中文網(wǎng)站一般會(huì )選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站長(cháng)的喜愛(ài)。gbk與utf-8對中文的編碼不同,導致中文在gbk與utf-8編碼下所占字節也有差異。
gbk編碼下每個(gè)中文字符所占字節為2,例:
$zhStr = ‘您好,中國!’;
echo strlen($zhStr); // 輸出:12
utf-8編碼下每個(gè)中文字符所占字節為3,例:
$zhStr = ‘您好,中國!’;
echo strlen($zhStr); // 輸出:18
那么如何計算這組中文字符串的長(cháng)度呢?有人可能會(huì )說(shuō)gbk下獲取中文字符串長(cháng)度除以2,utf-8編碼下除以3不就行了嗎?但是您要考慮字符串并不老實(shí),99%的情況會(huì )以中英混合的情況出現。
這是WordPress中的一段代碼,主要思想就是先用正則將字符串分解為個(gè)體單元,然后再計算單元的個(gè)數即字符串的長(cháng)度,代碼如下(只能處理utf-8編碼下的字符串):
$zhStr = ‘您好,中國!’;
$str = ‘Hello,中國!’;
// 計算中文字符串長(cháng)度
function utf8_strlen($string = null) {
// 將字符串分解為單元
preg_match_all(“/./us”, $string, $match);
// 返回單元個(gè)數
return count($match[0]);
}
echo utf8_strlen($zhStr); // 輸出:6
echo utf8_strlen($str); // 輸出:9
mb_strlen()方法有同樣的效果
【PHP如何獲取中文字符串長(cháng)度】相關(guān)文章:
php獲取數組長(cháng)度詳解05-24
php中獲取數組長(cháng)度的方法05-21
PHP如何獲取表單07-27
PHP如何獲取系統信息02-02
php指定長(cháng)度分割字符串str-split函數如何實(shí)現06-15
php如何獲取指定地區天氣02-09