Stringi moodul sisaldab kasulikke konstante ja klasse, samuti
mõningaid funktsioone, mis on kasutatavad ka
stringimeetoditena. Regulaaravaldisi käsitleb re
moodul.
Selles moodulis on määratud järgmised konstandid:
ascii_lowercase
ja ascii_uppercase
konstandid koos. Ei sõltu lokaalest.
Väiksed tähed 'abcdefghijklmnopqrstuvwxyz'. Väärtus ei sõltu lokaalest ja ei muutu.
Suured tähed 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'. Väärtus ei sõltu lokaalest ja ei muutu.
String '0123456789'.
Kuueteistkümnendsüsteemi numbrid. String '0123456789abcdefABCDEF'.
Allpoolkirjeldatud lowercase
ja uppercase
stringide summa.
Väärtus sõltub lokaalest ja uuendatakse kui kutsutakse funktsioon
locale.setlocale()
.
String, mis sisaldab kõiki väikseid tähti. Väärtus
sõltub lokaalest ja uuendatakse kui kutsutakse funktsioon
locale.setlocale()
.
String '01234567'.
String, mis koosneb nendest ASCII tähtedest, mida loetakse kirjavahemärkideks "C" lokaadis.
String, mis koosneb trükitavatest märkidest. Sisaldab numbreid, tähti, kirjavahemärke ja valget tühikut.
String, mis sisaldab kõiki suuri tähti. Väärtus
sõltub lokaalest ja uuendatakse kui kutsutakse funktsioon
locale.setlocale()
.
String, mis sisaldab kõiki valgetühiku märke. Enamasti on nendeks tühik, tabulaator, uusrida, reaalgus, lehevahetus, vertikaalne tabulaator.
Stringide ja unikoodi objektidlele saab rakendada järgmisi funktsioone, mida ei saa kasutada stringimeetoditena.
Lahutab argumendi sõnadeks, kasutades
funktsiooni split()
,
teeb iga sõna suurtäheliseks kasutades
funktsiooni capitalize()
ja ühendab sõnad kasutades
funktsiooni join()
.
Asendab mitu valget tühikut sõnavahega
ja kaotab ära alguses ja lõpus olevad valged tühikud.
Tagastab teisendustabeli, mis sobib argumendiks
translate()
või regex.compile()
jaoks, et teisendada märki from
argumendist
to
argumenti. Peavad olema ühepikkused.
Argumentideda ei tohi kasutada stringe, mille
tagastavad lowercase ja uppercase — mõnes lokaadis ei ole need
ühepikkused. Selleks, et muuta suurtähti väiketähtedeks või vastupidi,
kasutage vastavalt funktsioone lower()
või upper()
.
Stringi ja unikoodi objektidel on üks operaator: % (modulo). Seda tuntakse ka stringiformaatija või interpolatsiooni operaatorina.
Kui formaat vajab ühte argumenti, siis võib väärtus olla üks mitte-korteeži objekt. Kui mitu, siis väärtused moodustavad korteeži, millel on täpselt nii palju liikmeid, kui palju kohti on määrtatud formaadtistringiga; või on väärtused mapping objetkis* (milleks võib olla näiteks dict).
Teisenduse spetsifitseerija koosneb vähemalt kahest järgnevalt spetsifitseeritud märgist, mis peavad esinema sellises järjekorras:
Protsendimärk %, mis tähistab spetsifikori algust.
Kujutusvõti* (mapping key) (suvand), mis koosneb sulgudes olevast tähejärjendist (näiteks (minginimi)).
Teisenduslipud (suvand), mis mõjutavad mõnede teisenduste tulemust.
Minimaalne välja laius (suvand). Kui spetsifitseeritud kui "*" (tärn), siis loetakse tegelik laius järgmisest väärtuste korteeži elemendist ja objekt, mida teisendatakse, tuleb pärast miinimumvälja laiust ja suvandina antud täpsust.
Täpsus (suvand), märgitakse kui "." (punkt) millele järgneb täpsus. Kui spetsifitseeritud kui "*" (tärn), siis loetakse tegelik laius järgmisest väärtuste korteeži elemendist ja objekt, mida teisendatakse, tuleb pärast miinimumvälja laiust ja suvandina antud täpsust.
Pikkuse modifitseerija (suvand).
Teisenduse tüüp.
Kui parempoolne argument on dict* (või mingi muu kujutustüüp), siis peab stringis leiduvas formaadikirjelduses olema sulgudes kujutusvõti* sellele kujutusele*, mis järgneb kohe peale "%" märki.
>>>
print '%(language)s has %(#)03d quote types.' % \
{'language': "Python", "#": 2}
Python has 002 quote types.
Toodud näite puhul ei saa kasutada "*" spetsifikaatorit, kuna selleks on vaja järgnevaid parameetreid.
Tabel 7.1. Teisenduslipu märgid
Lipp | Tähendus |
---|---|
# | Väärtuse teisendamisel kasutatakse "alternatiivset vormi" |
0 | Teisendamisel täidetakse vasakule jäävad kohad nullidega. |
- | Teisendatud väärtus on joondatud vasakule (muudab "0" tähenduse, kui antakse mõlemad). |
(tühik) Positiivse väärtuse puhul jäetakse arvu ette tühik. | |
+ | Arvu ette pannakse märk ("+" või "-"). Muudab tühiku tähenduse. |
Tabel 7.2. Teisendustüübid
Teisendus | Tähendus | Märkused |
---|---|---|
d | kümnendsüsteemis märgiga täisarv | |
i | kümnendsüsteemis märgiga täisarv | |
o | kaheksandsüsteemis täisarv ilma märgita | (1) |
u | ilma märgita kümnendsüsteemis arv | |
x | ilma märgita väiketäheline kuueteistkümnendsüsteemis arv | (2) |
X | ilma märgita suuretäheline kuueteistkümnendsüsteemis arv | (2) |
e | komaga arv eksponentsiaalkujul (väikesetäheline) | |
E | komaga arv eksponentsiaalkujul (suuretäheline) | |
f | komaga arv | |
F | komaga arv | |
g | sama, mis "e" kui eksponent on suurem kui -4 või väiksem kui täpsus, vastasel juhul "f". | |
G | sama, mis "E" kui eksponent on suurem kui -4 või väiksem kui täpsus, vastasel juhul "F". | |
c | üksik märk. Võib olla ka number. | |
r | String. Teisendab suvalise Pythoni objekti kasutades repr(). | |
s | String. Teisendab suvalise Pythoni objekti kasutades str(). | (3) |
% | Midagi ei konverteerita, kasutatakse "%" stringi. |
Alternatiivne vorm lisab nulli ("0") vasaku positsiooni ja numbrivormi vahele, kui number ei alga nulliga.
Alternatiivne vorm lisab '0x' või '0X' olenevalt sellest, kas kasutatakse "x" või "X" vormingut, vasaku positsiooni ja numbrivormi vahele, kui number ei alga nulliga.
Kui väärtus on unikoodi-string, on ka tulemus unikoodi string.