Python 字符串

字符串是 Python 中最常用的數據類型。我們可以使用引號('或")來創建字符串。

創建字符串很簡單,只要為變量分配一個值即可。例如:

var1 = 'Hello World!'
var2 = "Python Runoob"

Python訪問字符串中的值

Python不支持單字符類型,單字符在 Python 中也是作為一個字符串使用。

Python訪問子字符串,可以使用方括號來截取字符串,如下實例:

實例(Python 2.0+)

#!/usr/bin/python var1 = 'Hello World!' var2 = "Python Runoob" print "var1[0]: ", var1[0] print "var2[1:5]: ", var2[1:5]

以上實例執行結果:

var1[0]:  H
var2[1:5]:  ytho

Python字符串更新

你可以對已存在的字符串進行修改,并賦值給另一個變量,如下實例:

實例(Python 2.0+)

#!/usr/bin/python # -*- coding: UTF-8 -*- var1 = 'Hello World!' print "更新字符串 :- ", var1[:6] + 'Runoob!'

以上實例執行結果

更新字符串 :-  Hello Runoob!

Python轉義字符

在需要在字符中使用特殊字符時,python用反斜杠(\)轉義字符。如下表:

轉義字符描述
\(在行尾時) 續行符
\\ 反斜杠符號
\' 單引號
\" 雙引號
\a 響鈴
\b 退格(Backspace)
\e 轉義
\000
\n 換行
\v 縱向制表符
\t 橫向制表符
\r 回車
\f 換頁
\oyy 八進制數,yy代表的字符,例如:\o12代表換行
\xyy 十六進制數,yy代表的字符,例如:\x0a代表換行
\other 其它的字符以普通格式輸出

Python字符串運算符

下表實例變量 a 值為字符串 "Hello",b 變量值為 "Python":

操作符描述實例
+字符串連接
>>>a + b 'HelloPython'
*重復輸出字符串
>>>a * 2 'HelloHello'
[]通過索引獲取字符串中字符
>>>a[1] 'e'
[ : ]截取字符串中的一部分
>>>a[1:4] 'ell'
in成員運算符 - 如果字符串中包含給定的字符返回 True
>>>"H" in a True
not in 成員運算符 - 如果字符串中不包含給定的字符返回 True
>>>"M" not in a True
r/R原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思來使用,沒有轉義特殊或不能打印的字符。 原始字符串除在字符串的第一個引號前加上字母"r"(可以大小寫)以外,與普通字符串有著幾乎完全相同的語法。
>>>print r'\n' \n >>> print R'\n' \n
%格式字符串請看下一章節

實例(Python 2.0+)

#!/usr/bin/python # -*- coding: UTF-8 -*- a = "Hello" b = "Python" print "a + b 輸出結果:", a + b print "a * 2 輸出結果:", a * 2 print "a[1] 輸出結果:", a[1] print "a[1:4] 輸出結果:", a[1:4] if( "H" in a) : print "H 在變量 a 中" else : print "H 不在變量 a 中" if( "M" not in a) : print "M 不在變量 a 中" else : print "M 在變量 a 中" print r'\n' print R'\n'

以上程序執行結果為:

a + b 輸出結果: HelloPython
a * 2 輸出結果: HelloHello
a[1] 輸出結果: e
a[1:4] 輸出結果: ell
H 在變量 a 中
M 不在變量 a 中
\n
\n

Python 字符串格式化

Python 支持格式化字符串的輸出 。盡管這樣可能會用到非常復雜的表達式,但最基本的用法是將一個值插入到一個有字符串格式符 %s 的字符串中。

在 Python 中,字符串格式化使用與 C 中 sprintf 函數一樣的語法。

如下實例:

#!/usr/bin/python

print "My name is %s and weight is %d kg!" % ('Zara', 21) 

以上實例輸出結果:

My name is Zara and weight is 21 kg!

python 字符串格式化符號:

    符   號 描述
      %c 格式化字符及其ASCII碼
      %s 格式化字符串
      %d 格式化整數
      %u 格式化無符號整型
      %o 格式化無符號八進制數
      %x 格式化無符號十六進制數
      %X 格式化無符號十六進制數(大寫)
      %f 格式化浮點數字,可指定小數點后的精度
      %e 用科學計數法格式化浮點數
      %E 作用同%e,用科學計數法格式化浮點數
      %g %f和%e的簡寫
      %G %F 和 %E 的簡寫
      %p 用十六進制數格式化變量的地址

格式化操作符輔助指令:

符號功能
*定義寬度或者小數點精度
-用做左對齊
+在正數前面顯示加號( + )
<sp>在正數前面顯示空格
# 在八進制數前面顯示零('0'),在十六進制前面顯示'0x'或者'0X'(取決于用的是'x'還是'X')
0 顯示的數字前面填充'0'而不是默認的空格
% '%%'輸出一個單一的'%'
(var)映射變量(字典參數)
m.n. m 是顯示的最小總寬度,n 是小數點后的位數(如果可用的話)

Python2.6 開始,新增了一種格式化字符串的函數 str.format(),它增強了字符串格式化的功能。


Python三引號(triple quotes)

python中三引號可以將復雜的字符串進行復制:

python三引號允許一個字符串跨多行,字符串中可以包含換行符、制表符以及其他特殊字符。

三引號的語法是一對連續的單引號或者雙引號(通常都是成對的用)。

 >>> hi = '''hi 
there'''
>>> hi   # repr()
'hi\nthere'
>>> print hi  # str()
hi 
there  

三引號讓程序員從引號和特殊字符串的泥潭里面解脫出來,自始至終保持一小塊字符串的格式是所謂的WYSIWYG(所見即所得)格式的。

一個典型的用例是,當你需要一塊HTML或者SQL時,這時當用三引號標記,使用傳統的轉義字符體系將十分費神。

 errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
cursor.execute('''
CREATE TABLE users (  
login VARCHAR(8), 
uid INTEGER,
prid INTEGER)
''')

Unicode 字符串

Python 中定義一個 Unicode 字符串和定義一個普通字符串一樣簡單:

>>> u'Hello World !'
u'Hello World !'

引號前小寫的"u"表示這里創建的是一個 Unicode 字符串。如果你想加入一個特殊字符,可以使用 Python 的 Unicode-Escape 編碼。如下例所示:

>>> u'Hello\u0020World !'
u'Hello World !'

被替換的 \u0020 標識表示在給定位置插入編碼值為 0x0020 的 Unicode 字符(空格符)。


python的字符串內建函數

字符串方法是從python1.6到2.0慢慢加進來的——它們也被加到了Jython中。

這些方法實現了string模塊的大部分方法,如下表所示列出了目前字符串內建支持的方法,所有的方法都包含了對Unicode的支持,有一些甚至是專門用于Unicode的。

方法 描述

string.capitalize()

把字符串的第一個字符大寫

string.center(width)

返回一個原字符串居中,并使用空格填充至長度 width 的新字符串

string.count(str, beg=0, end=len(string))

返回 str 在 string 里面出現的次數,如果 beg 或者 end 指定則返回指定范圍內 str 出現的次數

string.decode(encoding='UTF-8', errors='strict')

以 encoding 指定的編碼格式解碼 string,如果出錯默認報一個 ValueError 的 異 常 , 除非 errors 指 定 的 是 'ignore' 或 者'replace'

string.encode(encoding='UTF-8', errors='strict')

以 encoding 指定的編碼格式編碼 string,如果出錯默認報一個ValueError 的異常,除非 errors 指定的是'ignore'或者'replace'

string.endswith(obj, beg=0, end=len(string))

檢查字符串是否以 obj 結束,如果beg 或者 end 指定則檢查指定的范圍內是否以 obj 結束,如果是,返回 True,否則返回 False.

string.expandtabs(tabsize=8)

把字符串 string 中的 tab 符號轉為空格,tab 符號默認的空格數是 8。

string.find(str, beg=0, end=len(string))

檢測 str 是否包含在 string 中,如果 beg 和 end 指定范圍,則檢查是否包含在指定范圍內,如果是返回開始的索引值,否則返回-1

string.format()

格式化字符串

string.index(str, beg=0, end=len(string))

跟find()方法一樣,只不過如果str不在 string中會報一個異常.

string.isalnum()

如果 string 至少有一個字符并且所有字符都是字母或數字則返

回 True,否則返回 False

string.isalpha()

如果 string 至少有一個字符并且所有字符都是字母則返回 True,

否則返回 False

string.isdecimal()

如果 string 只包含十進制數字則返回 True 否則返回 False.

string.isdigit()

如果 string 只包含數字則返回 True 否則返回 False.

string.islower()

如果 string 中包含至少一個區分大小寫的字符,并且所有這些(區分大小寫的)字符都是小寫,則返回 True,否則返回 False

string.isnumeric()

如果 string 中只包含數字字符,則返回 True,否則返回 False

string.isspace()

如果 string 中只包含空格,則返回 True,否則返回 False.

string.istitle()

如果 string 是標題化的(見 title())則返回 True,否則返回 False

string.isupper()

如果 string 中包含至少一個區分大小寫的字符,并且所有這些(區分大小寫的)字符都是大寫,則返回 True,否則返回 False

string.join(seq)

以 string 作為分隔符,將 seq 中所有的元素(的字符串表示)合并為一個新的字符串

string.ljust(width)

返回一個原字符串左對齊,并使用空格填充至長度 width 的新字符串

string.lower()

轉換 string 中所有大寫字符為小寫.

string.lstrip()

截掉 string 左邊的空格

string.maketrans(intab, outtab])

maketrans() 方法用于創建字符映射的轉換表,對于接受兩個參數的最簡單的調用方式,第一個參數是字符串,表示需要轉換的字符,第二個參數也是字符串表示轉換的目標。

max(str)

返回字符串 str 中最大的字母。

min(str)

返回字符串 str 中最小的字母。

string.partition(str)

有點像 find()和 split()的結合體,從 str 出現的第一個位置起,把 字 符 串 string 分 成 一 個 3 元 素 的 元 組 (string_pre_str,str,string_post_str),如果 string 中不包含str 則 string_pre_str == string.

string.replace(str1, str2,  num=string.count(str1))

把 string 中的 str1 替換成 str2,如果 num 指定,則替換不超過 num 次.

string.rfind(str, beg=0,end=len(string) )

類似于 find()函數,不過是從右邊開始查找.

string.rindex( str, beg=0,end=len(string))

類似于 index(),不過是從右邊開始.

string.rjust(width)

返回一個原字符串右對齊,并使用空格填充至長度 width 的新字符串

string.rpartition(str)

類似于 partition()函數,不過是從右邊開始查找

string.rstrip()

刪除 string 字符串末尾的空格.

string.split(str="", num=string.count(str))

以 str 為分隔符切片 string,如果 num 有指定值,則僅分隔 num+ 個子字符串

string.splitlines([keepends])

按照行('\r', '\r\n', \n')分隔,返回一個包含各行作為元素的列表,如果參數 keepends 為 False,不包含換行符,如果為 True,則保留換行符。

string.startswith(obj, beg=0,end=len(string))

檢查字符串是否是以 obj 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定范圍內檢查.

string.strip([obj])

在 string 上執行 lstrip()和 rstrip()

string.swapcase()

翻轉 string 中的大小寫

string.title()

返回"標題化"的 string,就是說所有單詞都是以大寫開始,其余字母均為小寫(見 istitle())

string.translate(str, del="")

根據 str 給出的表(包含 256 個字符)轉換 string 的字符,

要過濾掉的字符放到 del 參數中

string.upper()

轉換 string 中的小寫字母為大寫

string.zfill(width)

返回長度為 width 的字符串,原字符串 string 右對齊,前面填充0