114培訓(xùn)網(wǎng)歡迎您來(lái)到全國(guó)python學(xué)習(xí)中心!

13289378727

全國(guó)統(tǒng)一學(xué)習(xí)專線 9:00-21:00

萬(wàn)字干貨,Python語(yǔ)法大合集,一篇文章帶你入門(mén)

這份資料非常純粹,只有Python的基礎(chǔ)語(yǔ)法,專門(mén)針對(duì)想要學(xué)習(xí)Python的小白。

Python中用#表示單行注釋,#之后的同行的內(nèi)容都會(huì)被注釋掉。

使用三個(gè)連續(xù)的雙引號(hào)表示多行注釋,兩個(gè)多行注釋標(biāo)識(shí)之間內(nèi)容會(huì)被視作是注釋。

Python當(dāng)中的數(shù)字定義和其他語(yǔ)言一樣:

我們分別使用+, -, *, /表示加減乘除四則運(yùn)算符。

這里要注意的是,在Python2當(dāng)中,10/3這個(gè)操作會(huì)得到3,而不是3.33333。因?yàn)槌龜?shù)和被除數(shù)都是整數(shù),所以Python會(huì)自動(dòng)執(zhí)行整數(shù)的計(jì)算,幫我們把得到的商取整。如果是10.0 / 3,就會(huì)得到3.33333。目前Python2已經(jīng)不再維護(hù)了,可以不用關(guān)心其中的細(xì)節(jié)。

但問(wèn)題是Python是一個(gè) 弱類(lèi)型 的語(yǔ)言,如果我們?cè)谝粋€(gè)函數(shù)當(dāng)中得到兩個(gè)變量,是無(wú)法直接判斷它們的類(lèi)型的。這就導(dǎo)致了同樣的計(jì)算符可能會(huì)得到不同的結(jié)果,這非常蛋疼。以至于程序員在運(yùn)算除法的時(shí)候,往往都需要手工加上類(lèi)型轉(zhuǎn)化符,將被除數(shù)轉(zhuǎn)成浮點(diǎn)數(shù)。

在Python3當(dāng)中撥亂反正,修正了這個(gè)問(wèn)題,即使是兩個(gè)整數(shù)相除,并且可以整除的情況下,得到的結(jié)果也一定是浮點(diǎn)數(shù)。

如果我們想要得到整數(shù),我們可以這么操作:

兩個(gè)除號(hào)表示 取整除 ,Python會(huì)為我們保留去除余數(shù)的結(jié)果。

除了取整除操作之外還有取余數(shù)操作,數(shù)學(xué)上稱為取模,Python中用%表示。

Python中支持 乘方運(yùn)算 ,我們可以不用調(diào)用額外的函數(shù),而使用**符號(hào)來(lái)完成:

當(dāng)運(yùn)算比較復(fù)雜的時(shí)候,我們可以用括號(hào)來(lái)強(qiáng)制改變運(yùn)算順序。

Python中用首字母大寫(xiě)的True和False表示真和假。

用and表示與操作,or表示或操作,not表示非操作。而不是C++或者是Java當(dāng)中的&&, || 和!。

在Python底層, True和False其實(shí)是1和0 ,所以如果我們執(zhí)行以下操作,是不會(huì)報(bào)錯(cuò)的,但是在邏輯上毫無(wú)意義。

我們用==判斷相等的操作,可以看出來(lái)True==1, False == 0.

我們要小心Python當(dāng)中的bool()這個(gè)函數(shù),它并不是轉(zhuǎn)成bool類(lèi)型的意思。如果我們執(zhí)行這個(gè)函數(shù),那么 只有0會(huì)被視作是False,其他所有數(shù)值都是True

Python中用==判斷相等,>表示大于,>=表示大于等于, <表示小于,<=表示小于等于,!=表示不等。

我們可以用and和or拼裝各個(gè)邏輯運(yùn)算:

注意not,and,or之間的優(yōu)先級(jí),其中not > and > or。如果分不清楚的話,可以用括號(hào)強(qiáng)行改變運(yùn)行順序。

關(guān)于list的判斷,我們常用的判斷有兩種,一種是剛才介紹的==,還有一種是is。我們有時(shí)候也會(huì)簡(jiǎn)單實(shí)用is來(lái)判斷,那么這兩者有什么區(qū)別呢?我們來(lái)看下面的例子:

Python是全引用的語(yǔ)言,其中的對(duì)象都使用引用來(lái)表示。is判斷的就是 兩個(gè)引用是否指向同一個(gè)對(duì)象 ,而==則是判斷兩個(gè)引用指向的具體內(nèi)容是否相等。舉個(gè)例子,如果我們把引用比喻成地址的話,is就是判斷兩個(gè)變量的是否指向同一個(gè)地址,比如說(shuō)都是沿河?xùn)|路XX號(hào)。而==則是判斷這兩個(gè)地址的收件人是否都叫張三。

顯然,住在同一個(gè)地址的人一定都叫張三,但是住在不同地址的兩個(gè)人也可以都叫張三,也可以叫不同的名字。所以如果a is b,那么a == b一定成立,反之則不然。

Python當(dāng)中對(duì)字符串的限制比較松, 雙引號(hào)和單引號(hào)都可以表示字符串 ,看個(gè)人喜好使用單引號(hào)或者是雙引號(hào)。我個(gè)人比較喜歡單引號(hào),因?yàn)閷?xiě)起來(lái)方便。

字符串也支持+操作,表示兩個(gè)字符串相連。除此之外,我們把兩個(gè)字符串寫(xiě)在一起,即使沒(méi)有+,Python也會(huì)為我們拼接:

我們可以使用[]來(lái)查找字符串當(dāng)中某個(gè)位置的字符,用 len 來(lái)計(jì)算字符串的長(zhǎng)度。

我們可以在字符串前面 加上f表示格式操作 ,并且在格式操作當(dāng)中也支持運(yùn)算,比如可以嵌套上len函數(shù)等。不過(guò)要注意,只有Python3.6以上的版本支持f操作。

*是None的判斷,在Python當(dāng)中None也是一個(gè)對(duì)象, 所有為None的變量都會(huì)指向這個(gè)對(duì)象 。根據(jù)我們前面所說(shuō)的,既然所有的None都指向同一個(gè)地址,我們需要判斷一個(gè)變量是否是None的時(shí)候,可以使用is來(lái)進(jìn)行判斷,當(dāng)然用==也是可以的,不過(guò)我們通常使用is。

理解了None之后,我們?cè)倩氐街敖榻B過(guò)的bool()函數(shù),它的用途其實(shí)就是判斷值是否是空。所有類(lèi)型的 默認(rèn)空值會(huì)被返回False ,否則都是True。比如0,"",[], {}, ()等。

除了上面這些值以外的所有值傳入都會(huì)得到True。

Python當(dāng)中的標(biāo)準(zhǔn)輸入輸出是 input和print 。

print會(huì)輸出一個(gè)字符串,如果傳入的不是字符串會(huì)自動(dòng)調(diào)用__str__方法轉(zhuǎn)成字符串進(jìn)行輸出。 默認(rèn)輸出會(huì)自動(dòng)換行 ,如果想要以不同的字符結(jié)尾代替換行,可以傳入end參數(shù):

使用input時(shí),Python會(huì)在命令行接收一行字符串作為輸入??梢栽趇nput當(dāng)中傳入字符串,會(huì)被當(dāng)成提示輸出:

Python支持 三元表達(dá)式 ,但是語(yǔ)法和C++不同,使用if else結(jié)構(gòu),寫(xiě)成:

上段代碼等價(jià)于:

Python中用[]表示空的list,我們也可以直接在其中填充元素進(jìn)行初始化:

使用append和pop可以在list的末尾插入或者刪除元素:

list可以通過(guò)[]加上下標(biāo)訪問(wèn)指定位置的元素,如果是負(fù)數(shù),則表示 倒序訪問(wèn) 。-1表示*一個(gè)元素,-2表示倒數(shù)第二個(gè),以此類(lèi)推。如果訪問(wèn)的元素超過(guò)數(shù)組長(zhǎng)度,則會(huì)出發(fā) 的錯(cuò)誤。

list支持切片操作,所謂的切片則是從原list當(dāng)中 拷貝 出指定的一段。我們用start: end的格式來(lái)獲取切片,注意,這是一個(gè) 左閉右開(kāi)區(qū)間 。如果留空表示全部獲取,我們也可以額外再加入一個(gè)參數(shù)表示步長(zhǎng),比如[1:5:2]表示從1號(hào)位置開(kāi)始,步長(zhǎng)為2獲取元素。得到的結(jié)果為[1, 3]。如果步長(zhǎng)設(shè)置成-1則代表反向遍歷。

如果我們要指定一段區(qū)間倒序,則前面的start和end也需要反過(guò)來(lái),例如我想要獲取[3: 6]區(qū)間的倒序,應(yīng)該寫(xiě)成[6:3:-1]。

只寫(xiě)一個(gè):,表示全部拷貝,如果用is判斷拷貝前后的list會(huì)得到False??梢允褂胐el刪除指定位置的元素,或者可以使用remove方法。

insert方法可以 指定位置插入元素 ,index方法可以查詢某個(gè)元素*次出現(xiàn)的下標(biāo)。

list可以進(jìn)行加法運(yùn)算,兩個(gè)list相加表示list當(dāng)中的元素合并。 等價(jià)于使用extend 方法:

我們想要判斷元素是否在list中出現(xiàn),可以使用 in關(guān)鍵字 ,通過(guò)使用len計(jì)算list的長(zhǎng)度:

tuple和list非常接近,tuple通過(guò)()初始化。和list不同, tuple是不可變對(duì)象 。也就是說(shuō)tuple一旦生成不可以改變。如果我們修改tuple,會(huì)引發(fā)TypeError異常。

由于小括號(hào)是有改變優(yōu)先級(jí)的含義,所以我們定義單個(gè)元素的tuple, 末尾必須加上逗號(hào) ,否則會(huì)被當(dāng)成是單個(gè)元素:

tuple支持list當(dāng)中絕大部分操作:

我們可以用多個(gè)變量來(lái)解壓一個(gè)tuple:

解釋一下這行代碼:

我們?cè)赽的前面加上了星號(hào), 表示這是一個(gè)list 。所以Python會(huì)在將其他變量對(duì)應(yīng)上值的情況下,將剩下的元素都賦值給b。

補(bǔ)充一點(diǎn),tuple本身雖然是不可變的,但是 tuple當(dāng)中的可變?cè)厥强梢愿淖兊?/strong> 。比如我們有這樣一個(gè)tuple:

我們雖然不能往a當(dāng)中添加或者刪除元素,但是a當(dāng)中含有一個(gè)list,我們可以改變這個(gè)list類(lèi)型的元素,這并不會(huì)觸發(fā)tuple的異常:

dict也是Python當(dāng)中經(jīng)常使用的容器,它等價(jià)于C++當(dāng)中的map,即 存儲(chǔ)key和value的鍵值對(duì) 。我們用{}表示一個(gè)dict,用:分隔key和value。

對(duì) 。我們用{}表示一個(gè)dict,用:分隔key和value。

dict的key必須為不可變對(duì)象,所以 list、set和dict不可以作為另一個(gè)dict的key ,否則會(huì)拋出異常:

我們同樣用[]查找dict當(dāng)中的元素,我們傳入key,獲得value,等價(jià)于get方法。

我們可以call dict當(dāng)中的keys和values方法,獲取dict當(dāng)中的所有key和value的集合,會(huì)得到一個(gè)list。在Python3.7以下版本當(dāng)中,返回的結(jié)果的順序可能和插入順序不同,在Python3.7及以上版本中,Python會(huì)保證返回的順序和插入順序一致:

我們也可以用in判斷一個(gè)key是否在dict當(dāng)中,注意只能判斷key。

如果使用[]查找不存在的key,會(huì)引發(fā)KeyError的異常。如果使用 get方法則不會(huì)引起異常,只會(huì)得到一個(gè)None

方法可以 為不存在的key 插入一個(gè)value,如果key已經(jīng)存在,則不會(huì)覆蓋它:

我們可以使用update方法用另外一個(gè)dict來(lái)更新當(dāng)前dict,比如a.update(b)。對(duì)于a和b交集的key會(huì)被b覆蓋,a當(dāng)中不存在的key會(huì)被插入進(jìn)來(lái):

我們一樣可以使用del刪除dict當(dāng)中的元素,同樣只能傳入key。

Python3.5以上的版本支持使用**來(lái)解壓一個(gè)dict:

set是用來(lái)存儲(chǔ) 不重復(fù)元素 的容器,當(dāng)中的元素都是不同的,相同的元素會(huì)被刪除。我們可以通過(guò)set(),或者通過(guò){}來(lái)進(jìn)行初始化。注意當(dāng)我們使用{}的時(shí)候,必須要傳入數(shù)據(jù),否則Python會(huì)將它和dict弄混。

set當(dāng)中的元素也必須是不可變對(duì)象,因此list不能傳入set。

可以調(diào)用add方法為set插入元素:

set還可以被認(rèn)為是集合,所以它還支持一些集合交叉并補(bǔ)的操作。

set還支持 超集和子集的判斷 ,我們可以用大于等于和小于等于號(hào)判斷一個(gè)set是不是另一個(gè)的超集或子集:

和dict一樣,我們可以使用in判斷元素在不在set當(dāng)中。用copy可以拷貝一個(gè)set。

Python當(dāng)中的判斷語(yǔ)句非常簡(jiǎn)單,并且Python不支持switch,所以即使是多個(gè)條件,我們也只能 羅列if-else 。

我們可以用in來(lái)循環(huán)迭代一個(gè)list當(dāng)中的內(nèi)容,這也是Python當(dāng)中基本的循環(huán)方式。

如果我們要循環(huán)一個(gè)范圍,可以使用range。range加上一個(gè)參數(shù)表示從0開(kāi)始的序列,比如range(10),表示[0, 10)區(qū)間內(nèi)的所有整數(shù):

如果我們傳入兩個(gè)參數(shù),則 代表迭代區(qū)間的首尾 。

如果我們傳入第三個(gè)元素,表示每次 循環(huán)變量自增的步長(zhǎng) 。

如果使用enumerate函數(shù),可以 同時(shí)迭代一個(gè)list的下標(biāo)和元素

while循環(huán)和C++類(lèi)似,當(dāng)條件為T(mén)rue時(shí)執(zhí)行,為false時(shí)退出。并且判斷條件不需要加上括號(hào):

Python當(dāng)中使用 try和except捕獲異常 ,我們可以在except后面限制異常的類(lèi)型。如果有多個(gè)類(lèi)型可以寫(xiě)多個(gè)except,還可以使用else語(yǔ)句表示其他所有的類(lèi)型。finally語(yǔ)句內(nèi)的語(yǔ)法 無(wú)論是否會(huì)觸發(fā)異常都必定執(zhí)行

在Python當(dāng)中我們經(jīng)常會(huì)使用資源,最常見(jiàn)的就是open打開(kāi)一個(gè)文件。我們 打開(kāi)了文件句柄就一定要關(guān)閉 ,但是如果我們手動(dòng)來(lái)編碼,經(jīng)常會(huì)忘記執(zhí)行close操作。并且如果文件異常,還會(huì)觸發(fā)異常。這個(gè)時(shí)候我們可以使用with語(yǔ)句來(lái)代替這部分處理,使用with會(huì) 自動(dòng)在with塊執(zhí)行結(jié)束或者是觸發(fā)異常時(shí)關(guān)閉打開(kāi)的資源

以下是with的幾種用法和功能:

凡是可以使用in語(yǔ)句來(lái)迭代的對(duì)象都叫做 可迭代對(duì)象 ,它和迭代器不是一個(gè)含義。這里只有可迭代對(duì)象的介紹,想要了解迭代器的具體內(nèi)容,請(qǐng)移步傳送門(mén):

Python——五分鐘帶你弄懂迭代器與生成器,夯實(shí)代碼能力

當(dāng)我們調(diào)用dict當(dāng)中的keys方法的時(shí)候,返回的結(jié)果就是一個(gè)可迭代對(duì)象。

我們 不能使用下標(biāo)來(lái)訪問(wèn) 可迭代對(duì)象,但我們可以用iter將它轉(zhuǎn)化成迭代器,使用next關(guān)鍵字來(lái)獲取下一個(gè)元素。也可以將它轉(zhuǎn)化成list類(lèi)型,變成一個(gè)list。

使用def關(guān)鍵字來(lái)定義函數(shù),我們?cè)趥鲄⒌臅r(shí)候如果指定函數(shù)內(nèi)的參數(shù)名, 可以不按照函數(shù)定義的順序 傳參:

可以在參數(shù)名之前加上*表示任意長(zhǎng)度的參數(shù),參數(shù)會(huì)被轉(zhuǎn)化成list:

也可以指定任意長(zhǎng)度的關(guān)鍵字參數(shù),在參數(shù)前加上**表示接受一個(gè)dict:

當(dāng)然我們也可以兩個(gè)都用上,這樣可以接受任何參數(shù):

傳入?yún)?shù)的時(shí)候我們也可以使用*和**來(lái)解壓list或者是dict:

Python中的參數(shù) 可以返回多個(gè)值

函數(shù)內(nèi)部定義的變量即使和全局變量重名,也 不會(huì)覆蓋全局變量的值 。想要在函數(shù)內(nèi)部使用全局變量,需要加上 global 關(guān)鍵字,表示這是一個(gè)全局變量:

Python支持 函數(shù)式編程 ,我們可以在一個(gè)函數(shù)內(nèi)部返回一個(gè)函數(shù):

Python中可以使用lambda表示 匿名函數(shù) ,使用:作為分隔,:前面表示匿名函數(shù)的參數(shù),:后面的是函數(shù)的返回值:

我們還可以將函數(shù)作為參數(shù)使用map和filter,實(shí)現(xiàn)元素的批量處理和過(guò)濾。關(guān)于Python中map、reduce和filter的使用,具體可以查看之前的文章:

五分鐘帶你了解map、reduce和filter

我們還可以結(jié)合循環(huán)和判斷語(yǔ)來(lái)給list或者是dict進(jìn)行初始化:

使用 import語(yǔ)句引入一個(gè)Python模塊 ,我們可以用.來(lái)訪問(wèn)模塊中的函數(shù)或者是類(lèi)。

我們也可以使用from import的語(yǔ)句,單獨(dú)引入模塊內(nèi)的函數(shù)或者是類(lèi),而不再需要寫(xiě)出完整路徑。使用from import *可以引入模塊內(nèi)所有內(nèi)容(不推薦這么干)

可以使用as給模塊內(nèi)的方法或者類(lèi)起別名:

我們可以使用dir查看我們用的模塊的路徑:

這么做的原因是如果我們當(dāng)前的路徑下也有一個(gè)叫做math的Python文件,那么 會(huì)覆蓋系統(tǒng)自帶的math的模塊 。這是尤其需要注意的,不小心會(huì)導(dǎo)致很多奇怪的bug。

我們來(lái)看一個(gè)完整的類(lèi),相關(guān)的介紹都在注釋當(dāng)中

以上內(nèi)容的詳細(xì)介紹之前也有過(guò)相關(guān)文章,可以查看:

Python—— slots ,property和對(duì)象命名規(guī)范

下面我們來(lái)看看Python當(dāng)中類(lèi)的使用:


這里解釋一下,實(shí)例和對(duì)象可以理解成一個(gè)概念,實(shí)例的英文是instance,對(duì)象的英文是object。都是指類(lèi)經(jīng)過(guò)實(shí)例化之后得到的對(duì)象。


繼承可以讓子類(lèi) 繼承父類(lèi)的變量以及方法 ,并且我們還可以在子類(lèi)當(dāng)中指定一些屬于自己的特性,并且還可以重寫(xiě)父類(lèi)的一些方法。一般我們會(huì)將不同的類(lèi)放在不同的文件當(dāng)中,使用import引入,一樣可以實(shí)現(xiàn)繼承。

我們創(chuàng)建一個(gè)蝙蝠類(lèi):

我們?cè)賱?chuàng)建一個(gè)蝙蝠俠的類(lèi),同時(shí)繼承Superhero和Bat:

執(zhí)行這個(gè)類(lèi):

我們可以通過(guò)yield關(guān)鍵字創(chuàng)建一個(gè)生成器,每次我們調(diào)用的時(shí)候執(zhí)行到y(tǒng)ield關(guān)鍵字處則停止。下次再次調(diào)用則還是從yield處開(kāi)始往下執(zhí)行:

除了yield之外,我們還可以使用()小括號(hào)來(lái)生成一個(gè)生成器:

關(guān)于生成器和迭代器更多的內(nèi)容,可以查看下面這篇文章:

五分鐘帶你弄懂迭代器與生成器,夯實(shí)代碼能力

我們引入functools當(dāng)中的wraps之后,可以創(chuàng)建一個(gè)裝飾器。裝飾器可以在不修改函數(shù)內(nèi)部代碼的前提下,在外面包裝一層其他的邏輯:

裝飾器之前也有專門(mén)的文章詳細(xì)介紹,可以移步下面的傳送門(mén):

一文搞定Python裝飾器,看完面試不再慌

不知道有多少小伙伴可以看到結(jié)束,原作者的確非常厲害,把Python的基本操作基本上都囊括在里面了。如果都能讀懂并且理解的話,那么Python這門(mén)語(yǔ)言就算是入門(mén)了。


如果你之前就有其他語(yǔ)言的語(yǔ)言基礎(chǔ),我想本文讀完應(yīng)該不用30分鐘。當(dāng)然在30分鐘內(nèi)學(xué)會(huì)一門(mén)語(yǔ)言是不可能的,也不是我所提倡的。但至少通過(guò)本文我們可以做到熟悉Python的語(yǔ)法,知道大概有哪些操作,剩下的就要我們親自去寫(xiě)代碼的時(shí)候去體會(huì)和運(yùn)用了。

根據(jù)我的經(jīng)驗(yàn),在學(xué)習(xí)一門(mén)新語(yǔ)言的前期,不停地查閱資料是免不了的。希望本文可以作為你在使用Python時(shí)候的查閱文檔。

*,我這里有各種免費(fèi)的編程類(lèi)資料,有需要的及時(shí)私聊我,回復(fù)"學(xué)習(xí)",分享給大家,正在發(fā)放中............





一篇文章帶你深度解析Python線程和進(jìn)程

使用Python中的線程模塊,能夠同時(shí)運(yùn)行程序的不同部分,并簡(jiǎn)化設(shè)計(jì)。如果你已經(jīng)入門(mén)Python,并且想用線程來(lái)提升程序運(yùn)行速度的話,希望這篇教程會(huì)對(duì)你有所幫助。

線程與進(jìn)程

什么是進(jìn)程

進(jìn)程是系統(tǒng)進(jìn)行資源分配和調(diào)度的一個(gè)獨(dú)立單位 進(jìn)程是具有一定獨(dú)立功能的程序關(guān)于某個(gè)數(shù)據(jù)集合上的一次運(yùn)行活動(dòng),進(jìn)程是系統(tǒng)進(jìn)行資源分配和調(diào)度的一個(gè)獨(dú)立單位。每個(gè)進(jìn)程都有自己的獨(dú)立內(nèi)存空間,不同進(jìn)程通過(guò)進(jìn)程間通信來(lái)通信。由于進(jìn)程比較重量,占據(jù)獨(dú)立的內(nèi)存,所以上下文進(jìn)程間的切換開(kāi)銷(xiāo)(棧、寄存器、虛擬內(nèi)存、文件句柄等)比較大,但相對(duì)比較穩(wěn)定安全。

什么是線程

CPU調(diào)度和分派的基本單位 線程是進(jìn)程的一個(gè)實(shí)體,是CPU調(diào)度和分派的基本單位,它是比進(jìn)程更小的能獨(dú)立運(yùn)行的基本單位.線程自己基本上不擁有系統(tǒng)資源,只擁有一點(diǎn)在運(yùn)行中必不可少的資源(如程序計(jì)數(shù)器,一組寄存器和棧),但是它可與同屬一個(gè)進(jìn)程的其他的線程共享進(jìn)程所擁有的全部資源。線程間通信主要通過(guò)共享內(nèi)存,上下文切換很快,資源開(kāi)銷(xiāo)較少,但相比進(jìn)程不夠穩(wěn)定容易丟失數(shù)據(jù)。

進(jìn)程與線程的關(guān)系圖

線程與進(jìn)程的區(qū)別:

進(jìn)程

現(xiàn)實(shí)生活中,有很多的場(chǎng)景中的事情是同時(shí)進(jìn)行的,比如開(kāi)車(chē)的時(shí)候 手和腳共同來(lái)駕駛 汽車(chē) ,比如唱歌跳舞也是同時(shí)進(jìn)行的,再比如邊吃飯邊打電話;試想如果我們吃飯的時(shí)候有一個(gè)領(lǐng)導(dǎo)來(lái)電,我們肯定是立刻就接聽(tīng)了。但是如果你吃完飯?jiān)俳勇?tīng)或者回電話,很可能會(huì)被開(kāi)除。

注意:

多任務(wù)的概念

什么叫 多任務(wù) 呢?簡(jiǎn)單地說(shuō),就是操作系統(tǒng)可以同時(shí)運(yùn)行多個(gè)任務(wù)。打個(gè)比方,你一邊在用瀏覽器上網(wǎng),一邊在聽(tīng)MP3,一邊在用Word趕作業(yè),這就是多任務(wù),至少同時(shí)有3個(gè)任務(wù)正在運(yùn)行。還有很多任務(wù)悄悄地在后臺(tái)同時(shí)運(yùn)行著,只是桌面上沒(méi)有顯示而已。

現(xiàn)在,多核CPU已經(jīng)非常普及了,但是,即使過(guò)去的單核CPU,也可以執(zhí)行多任務(wù)。由于CPU執(zhí)行代碼都是順序執(zhí)行的,那么,單核CPU是怎么執(zhí)行多任務(wù)的呢?

答案就是操作系統(tǒng)輪流讓各個(gè)任務(wù)交替執(zhí)行,任務(wù)1執(zhí)行0.01秒,切換到任務(wù)2,任務(wù)2執(zhí)行0.01秒,再切換到任務(wù)3,執(zhí)行0.01秒,這樣反復(fù)執(zhí)行下去。表面上看,每個(gè)任務(wù)都是交替執(zhí)行的,但是,由于CPU的執(zhí)行速度實(shí)在是太快了,我們感覺(jué)就像所有任務(wù)都在同時(shí)執(zhí)行一樣。

真正的并行執(zhí)行多任務(wù)只能在多核CPU上實(shí)現(xiàn),但是,由于任務(wù)數(shù)量遠(yuǎn)遠(yuǎn)多于CPU的核心數(shù)量,所以,操作系統(tǒng)也會(huì)自動(dòng)把很多任務(wù)輪流調(diào)度到每個(gè)核心上執(zhí)行。 其實(shí)就是CPU執(zhí)行速度太快啦!以至于我們感受不到在輪流調(diào)度。

并行與并發(fā)

并行()

并行:指兩個(gè)或兩個(gè)以上事件(或線程)在同一時(shí)刻發(fā)生,是真正意義上的不同事件或線程在同一時(shí)刻,在不同CPU資源呢上(多核),同時(shí)執(zhí)行。

特點(diǎn)

并發(fā)()

指一個(gè)物理CPU(也可以多個(gè)物理CPU) 在若干道程序(或線程)之間多路復(fù)用,并發(fā)性是對(duì)有限物理資源強(qiáng)制行使多用戶共享以提高效率。

特點(diǎn)

.Process模塊

process模塊是一個(gè)創(chuàng)建進(jìn)程的模塊,借助這個(gè)模塊,就可以完成進(jìn)程的創(chuàng)建。

語(yǔ)法:Process([group [, target [, name [, args [, kwargs]]]]])

由該類(lèi)實(shí)例化得到的對(duì)象,表示一個(gè)子進(jìn)程中的任務(wù)(尚未啟動(dòng))。

注意:1. 必須使用關(guān)鍵字方式來(lái)指定參數(shù);2. args指定的為傳給target函數(shù)的位置參數(shù),是一個(gè)元祖形式,必須有逗號(hào)。

參數(shù)介紹:

group:參數(shù)未使用,默認(rèn)值為None。

target:表示調(diào)用對(duì)象,即子進(jìn)程要執(zhí)行的任務(wù)。

args:表示調(diào)用的位置參數(shù)元祖。

kwargs:表示調(diào)用對(duì)象的字典。如kwargs = {'name':Jack, 'age':18}。

name:子進(jìn)程名稱。

代碼:

除了上面這些開(kāi)啟進(jìn)程的方法之外,還有一種以繼承Process的方式開(kāi)啟進(jìn)程的方式:

通過(guò)上面的研究,我們千方百計(jì)實(shí)現(xiàn)了程序的異步,讓多個(gè)任務(wù)可以同時(shí)在幾個(gè)進(jìn)程中并發(fā)處理,他們之間的運(yùn)行沒(méi)有順序,一旦開(kāi)啟也不受我們控制。盡管并發(fā)編程讓我們能更加充分的利用IO資源,但是也給我們帶來(lái)了新的問(wèn)題。

當(dāng)多個(gè)進(jìn)程使用同一份數(shù)據(jù)資源的時(shí)候,就會(huì)引發(fā)數(shù)據(jù)安全或順序混亂問(wèn)題,我們可以考慮加鎖,我們以模擬搶票為例,來(lái)看看數(shù)據(jù)安全的重要性。

加鎖可以保證多個(gè)進(jìn)程修改同一塊數(shù)據(jù)時(shí),同一時(shí)間只能有一個(gè)任務(wù)可以進(jìn)行修改,即串行的修改。加鎖犧牲了速度,但是卻保證了數(shù)據(jù)的安全。

因此我們*找尋一種解決方案能夠兼顧:1、效率高(多個(gè)進(jìn)程共享一塊內(nèi)存的數(shù)據(jù))2、幫我們處理好鎖問(wèn)題。

模塊為我們提供的基于消息的IPC通信機(jī)制:隊(duì)列和管道。隊(duì)列和管道都是將數(shù)據(jù)存放于內(nèi)存中 隊(duì)列又是基于(管道+鎖)實(shí)現(xiàn)的,可以讓我們從復(fù)雜的鎖問(wèn)題中解脫出來(lái), 我們應(yīng)該盡量避免使用共享數(shù)據(jù),盡可能使用消息傳遞和隊(duì)列,避免處理復(fù)雜的同步和鎖問(wèn)題,而且在進(jìn)程數(shù)目增多時(shí),往往可以獲得更好的可獲展性( 后續(xù)擴(kuò)展該內(nèi)容 )。

線程

Python的threading模塊

Python 供了幾個(gè)用于多線程編程的模塊,包括 thread, threading 和 Queue 等。thread 和 threading 模塊允許程序員創(chuàng)建和管理線程。thread 模塊 供了基本的線程和鎖的支持,而 threading 供了更高級(jí)別,功能更強(qiáng)的線程管理的功能。Queue 模塊允許用戶創(chuàng)建一個(gè)可以用于多個(gè)線程之間 共享數(shù)據(jù)的隊(duì)列數(shù)據(jù)結(jié)構(gòu)。

python創(chuàng)建和執(zhí)行線程

創(chuàng)建線程代碼

1. 創(chuàng)建方法一:

2. 創(chuàng)建方法二:

進(jìn)程和線程都是實(shí)現(xiàn)多任務(wù)的一種方式,例如:在同一臺(tái)計(jì)算機(jī)上能同時(shí)運(yùn)行多個(gè)QQ(進(jìn)程),一個(gè)QQ可以打開(kāi)多個(gè)聊天窗口(線程)。資源共享:進(jìn)程不能共享資源,而線程共享所在進(jìn)程的地址空間和其他資源,同時(shí),線程有自己的棧和棧指針。所以在一個(gè)進(jìn)程內(nèi)的所有線程共享全局變量,但多線程對(duì)全局變量的更改會(huì)導(dǎo)致變量值得混亂。

代碼演示:

得到的結(jié)果是:

首先需要明確的一點(diǎn)是GIL并不是Python的特性,它是在實(shí)現(xiàn)Python解析器(CPython)時(shí)所引入的一個(gè)概念。就好比C++是一套語(yǔ)言(語(yǔ)法)標(biāo)準(zhǔn),但是可以用不同的編譯器來(lái)編譯成可執(zhí)行代碼。同樣一段代碼可以通過(guò)CPython,PyPy,Psyco等不同的Python執(zhí)行環(huán)境來(lái)執(zhí)行(其中的JPython就沒(méi)有GIL)。

那么CPython實(shí)現(xiàn)中的GIL又是什么呢?GIL全稱Global Lock為了避免誤導(dǎo),我們還是來(lái)看一下官方給出的解釋:

主要意思為:

因此,解釋器實(shí)際上被一個(gè)全局解釋器鎖保護(hù)著,它確保任何時(shí)候都只有一個(gè)Python線程執(zhí)行。在多線程環(huán)境中,Python 虛擬機(jī)按以下方式執(zhí)行:

由于GIL的存在,Python的多線程不能稱之為嚴(yán)格的多線程。因?yàn)? 多線程下每個(gè)線程在執(zhí)行的過(guò)程中都需要先獲取GIL,保證同一時(shí)刻只有一個(gè)線程在運(yùn)行。

由于GIL的存在,即使是多線程,事實(shí)上同一時(shí)刻只能保證一個(gè)線程在運(yùn)行, 既然這樣多線程的運(yùn)行效率不就和單線程一樣了嗎,那為什么還要使用多線程呢?

由于以前的電腦基本都是單核CPU,多線程和單線程幾乎看不出差別,可是由于計(jì)算機(jī)的迅速發(fā)展,現(xiàn)在的電腦幾乎都是多核CPU了,最少也是兩個(gè)核心數(shù)的,這時(shí)差別就出來(lái)了:通過(guò)之前的案例我們已經(jīng)知道,即使在多核CPU中,多線程同一時(shí)刻也只有一個(gè)線程在運(yùn)行,這樣不僅不能利用多核CPU的優(yōu)勢(shì),反而由于每個(gè)線程在多個(gè)CPU上是交替執(zhí)行的,導(dǎo)致在不同CPU上切換時(shí)造成資源的浪費(fèi),反而會(huì)更慢。即原因是一個(gè)進(jìn)程只存在一把gil鎖,當(dāng)在執(zhí)行多個(gè)線程時(shí),內(nèi)部會(huì)爭(zhēng)搶gil鎖,這會(huì)造成當(dāng)某一個(gè)線程沒(méi)有搶到鎖的時(shí)候會(huì)讓cpu等待,進(jìn)而不能合理利用多核cpu資源。

但是在使用多線程抓取網(wǎng)頁(yè)內(nèi)容時(shí),遇到IO阻塞時(shí),正在執(zhí)行的線程會(huì)暫時(shí)釋放GIL鎖,這時(shí)其它線程會(huì)利用這個(gè)空隙時(shí)間,執(zhí)行自己的代碼,因此多線程抓取比單線程抓取性能要好,所以我們還是要使用多線程的。

GIL對(duì)多線程Python程序的影響

程序的性能受到計(jì)算密集型(CPU)的程序限制和I/O密集型的程序限制影響,那什么是計(jì)算密集型和I/O密集型程序呢?

計(jì)算密集型:要進(jìn)行大量的數(shù)值計(jì)算,例如進(jìn)行上億的數(shù)字計(jì)算、計(jì)算圓周率、對(duì)視頻進(jìn)行高清解碼等等。這種計(jì)算密集型任務(wù)雖然也可以用多任務(wù)完成,但是花費(fèi)的主要時(shí)間在任務(wù)切換的時(shí)間,此時(shí)CPU執(zhí)行任務(wù)的效率比較低。

IO密集型:涉及到網(wǎng)絡(luò)請(qǐng)求(time.sleep())、磁盤(pán)IO的任務(wù)都是IO密集型任務(wù),這類(lèi)任務(wù)的特點(diǎn)是CPU消耗很少,任務(wù)的大部分時(shí)間都在等待IO操作完成(因?yàn)镮O的速度遠(yuǎn)遠(yuǎn)低于CPU和內(nèi)存的速度)。對(duì)于IO密集型任務(wù),任務(wù)越多,CPU效率越高,但也有一個(gè)限度。

當(dāng)然為了避免GIL對(duì)我們程序產(chǎn)生影響,我們也可以使用,線程鎖。

Lock&RLock

常用的資源共享鎖機(jī)制:有Lock、RLock、Semphore、Condition等,簡(jiǎn)單給大家分享下Lock和RLock。

Lock

特點(diǎn)就是執(zhí)行速度慢,但是保證了數(shù)據(jù)的安全性

RLock

使用鎖代碼操作不當(dāng)就會(huì)產(chǎn)生死鎖的情況。

什么是死鎖

死鎖:當(dāng)線程A持有獨(dú)占鎖a,并嘗試去獲取獨(dú)占鎖b的同時(shí),線程B持有獨(dú)占鎖b,并嘗試獲取獨(dú)占鎖a的情況下,就會(huì)發(fā)生AB兩個(gè)線程由于互相持有對(duì)方需要的鎖,而發(fā)生的阻塞現(xiàn)象,我們稱為死鎖。即死鎖是指多個(gè)進(jìn)程因競(jìng)爭(zhēng)資源而造成的一種僵局,若無(wú)外力作用,這些進(jìn)程都將無(wú)法向前推進(jìn)。

所以,在系統(tǒng)設(shè)計(jì)、進(jìn)程調(diào)度等方面注意如何不讓這四個(gè)必要條件成立,如何確定資源的合理分配算法,避免進(jìn)程永久占據(jù)系統(tǒng)資源。

死鎖代碼

python線程間通信

如果各個(gè)線程之間各干各的,確實(shí)不需要通信,這樣的代碼也十分的簡(jiǎn)單。但這一般是不可能的,至少線程要和主線程進(jìn)行通信,不然計(jì)算結(jié)果等內(nèi)容無(wú)法取回。而實(shí)際情況中要復(fù)雜的多,多個(gè)線程間需要交換數(shù)據(jù),才能得到正確的執(zhí)行結(jié)果。

python中Queue是消息隊(duì)列,提供線程間通信機(jī)制,python3中重名為為queue,queue模塊塊下提供了幾個(gè)阻塞隊(duì)列,這些隊(duì)列主要用于實(shí)現(xiàn)線程通信。

在 queue 模塊下主要提供了三個(gè)類(lèi),分別代表三種隊(duì)列,它們的主要區(qū)別就在于進(jìn)隊(duì)列、出隊(duì)列的不同。

簡(jiǎn)單代碼演示

此時(shí)代碼會(huì)阻塞,因?yàn)閝ueue中內(nèi)容已滿,此時(shí)可以在第四個(gè)queue.put('蘋(píng)果')后面添加timeout,則成為 queue.put('蘋(píng)果',timeout=1)如果等待1秒鐘仍然是滿的就會(huì)拋出異常,可以捕獲異常。

同理如果隊(duì)列是空的,無(wú)法獲取到內(nèi)容默認(rèn)也會(huì)阻塞,如果不阻塞可以使用queue.get_nowait()。

在掌握了 Queue 阻塞隊(duì)列的特性之后,在下面程序中就可以利用 Queue 來(lái)實(shí)現(xiàn)線程通信了。

下面演示一個(gè)生產(chǎn)者和一個(gè)消費(fèi)者,當(dāng)然都可以多個(gè)

使用queue模塊,可在線程間進(jìn)行通信,并保證了線程安全。

協(xié)程

協(xié)程,又稱微線程,纖程。英文名Coroutine。

協(xié)程是python個(gè)中另外一種實(shí)現(xiàn)多任務(wù)的方式,只不過(guò)比線程更小占用更小執(zhí)行單元(理解為需要的資源)。為啥說(shuō)它是一個(gè)執(zhí)行單元,因?yàn)樗詭PU上下文。這樣只要在合適的時(shí)機(jī), 我們可以把一個(gè)協(xié)程 切換到另一個(gè)協(xié)程。只要這個(gè)過(guò)程中保存或恢復(fù) CPU上下文那么程序還是可以運(yùn)行的。

通俗的理解:在一個(gè)線程中的某個(gè)函數(shù),可以在任何地方保存當(dāng)前函數(shù)的一些臨時(shí)變量等信息,然后切換到另外一個(gè)函數(shù)中執(zhí)行,注意不是通過(guò)調(diào)用函數(shù)的方式做到的,并且切換的次數(shù)以及什么時(shí)候再切換到原來(lái)的函數(shù)都由開(kāi)發(fā)者自己確定。

在實(shí)現(xiàn)多任務(wù)時(shí),線程切換從系統(tǒng)層面遠(yuǎn)不止保存和恢復(fù) CPU上下文這么簡(jiǎn)單。操作系統(tǒng)為了程序運(yùn)行的高效性每個(gè)線程都有自己緩存Cache等等數(shù)據(jù),操作系統(tǒng)還會(huì)幫你做這些數(shù)據(jù)的恢復(fù)操作。所以線程的切換非常耗性能。但是協(xié)程的切換只是單純的操作CPU的上下文,所以一秒鐘切換個(gè)上百萬(wàn)次系統(tǒng)都抗的住。

greenlet與gevent

為了更好使用協(xié)程來(lái)完成多任務(wù),除了使用原生的yield完成模擬協(xié)程的工作,其實(shí)python還有的greenlet模塊和gevent模塊,使實(shí)現(xiàn)協(xié)程變的更加簡(jiǎn)單高效。

greenlet雖說(shuō)實(shí)現(xiàn)了協(xié)程,但需要我們手工切換,太麻煩了,gevent是比greenlet更強(qiáng)大的并且能夠自動(dòng)切換任務(wù)的模塊。

其原理是當(dāng)一個(gè)greenlet遇到IO(指的是input output 輸入輸出,比如網(wǎng)絡(luò)、文件操作等)操作時(shí),比如訪問(wèn)網(wǎng)絡(luò),就自動(dòng)切換到其他的greenlet,等到IO操作完成,再在適當(dāng)?shù)臅r(shí)候切換回來(lái)繼續(xù)執(zhí)行。

模擬耗時(shí)操作:

如果有耗時(shí)操作也可以換成,gevent中自己實(shí)現(xiàn)的模塊,這時(shí)候就需要打補(bǔ)丁了。

使用協(xié)程完成一個(gè)簡(jiǎn)單的二手房信息的爬蟲(chóng)代碼吧!

以下文章來(lái)源于Python專欄 ,作者宋宋

文章鏈接:

python發(fā)布文章時(shí)防止重復(fù)發(fā)布

python發(fā)布文章時(shí)防止重復(fù)發(fā)布可以禁掉提交按鈕。表單提交后使用使提交按鈕disable。這種方法防止心急的用戶多次點(diǎn)擊按鈕。Python由荷蘭數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究學(xué)會(huì)的吉多·范羅蘇姆于1990年代初設(shè)計(jì),作為一門(mén)叫做ABC語(yǔ)言的替代品。Python提供了高效的高級(jí)數(shù)據(jù)結(jié)構(gòu),還能簡(jiǎn)單有效地面向?qū)ο缶幊獭?/p>

用Python實(shí)現(xiàn)英文文章難度評(píng)級(jí)

By Jiaxian Shi

英文文章的難度從直覺(jué)上來(lái)講可以從以下兩方面來(lái)定義:

句子的難易程度可以從句子的長(zhǎng)度和復(fù)雜性(從句數(shù)量,嵌套)方面來(lái)考慮。詞匯的難易程度可以從詞匯的長(zhǎng)度和使用頻率(專業(yè)詞匯,罕見(jiàn)詞匯)方面來(lái)考慮。通過(guò)查閱維基百科等相關(guān)資料,發(fā)現(xiàn)目前普遍得到運(yùn)用的可讀性標(biāo)準(zhǔn)為Flesch–Kincaid可讀性測(cè)試指標(biāo)。Flesch–Kincaid可讀性測(cè)試指標(biāo)由兩個(gè)指標(biāo)構(gòu)成:Flesch Reading Ease(FRE)和Flesch–Kincaid Grade Level(FKGL)。與我們的直覺(jué)一致,兩者都使用了類(lèi)似的方法:句子長(zhǎng)度和詞匯長(zhǎng)度(由音節(jié)數(shù)確定,不單純考慮字母數(shù))。由于兩個(gè)指標(biāo)對(duì)句子長(zhǎng)度和詞匯長(zhǎng)度所采取的權(quán)重不同(包括正負(fù)號(hào)),所以兩個(gè)指標(biāo)的意義相反:FRE數(shù)值越高,文章就越簡(jiǎn)單,可讀性也越高。而FKGL數(shù)值越高,文章就越復(fù)雜,文章的可讀性也就越低。

使用Python強(qiáng)大的自然語(yǔ)言處理(NLP)包NLTK,來(lái)實(shí)現(xiàn)下述3個(gè)功能:

其中,斷句使用NLTK提供的非監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練模型/punkt/english.pickle,分詞則使用NLTK推薦的word_tokenize函數(shù)(使用和模塊),分音節(jié)則使用NLTK供的模塊。需要注意的是,分詞會(huì)將標(biāo)點(diǎn)符號(hào)分為一個(gè)單詞,需要手動(dòng)去除。同時(shí),分音節(jié)時(shí)會(huì)講英語(yǔ)中的連字符“-”分為一個(gè)音節(jié),也需要手動(dòng)去除。另外,文章需要進(jìn)行預(yù)處理,去除回車(chē)符和空格,并將非標(biāo)準(zhǔn)標(biāo)點(diǎn)符號(hào)轉(zhuǎn)換為英文標(biāo)準(zhǔn)標(biāo)點(diǎn)符號(hào)。

統(tǒng)計(jì)出句數(shù),詞數(shù)和音節(jié)數(shù)后,即可根據(jù)上文提供的公式計(jì)算出FRE和FKGL了。本程序使用4段不同類(lèi)型的英文文章分別計(jì)算FRG和FKGL,并使用模塊繪制出柱狀圖已做比較。

文章:

比較結(jié)果如下圖所示:

可以發(fā)現(xiàn),文章的難度為:兒童文學(xué)<偵探小說(shuō)<雜志文章<學(xué)術(shù)論文,這與我們的實(shí)際感受是一致的。

python docx 使用總結(jié)

本文將總結(jié)之前在使用 python-docx 包處理 word 文檔時(shí)的一些理解與經(jīng)驗(yàn)。

安裝

引入

python-docx 將整個(gè)文章看做是一個(gè) Document 對(duì)象 官方文檔 - Document ,其基本結(jié)構(gòu)如下:

在 python-docx 中, run 是最基本的單位,每個(gè) run 對(duì)象內(nèi)的文本樣式都是一致的,也就是說(shuō),在從 docx 文件生成文檔對(duì)象時(shí), python-docx 會(huì)根據(jù)樣式的變化來(lái)將文本切分為一個(gè)個(gè)的 Run 對(duì)象。

你也可以通過(guò)它來(lái)處理表格 官方文檔 - 表格 ,基本結(jié)構(gòu)如下:

溫馨提示:為不影響您的學(xué)業(yè),來(lái)校區(qū)前請(qǐng)先電話咨詢,方便我校安排相關(guān)的專業(yè)老師為您解答
相關(guān)資料
  • 作者最新文章
  • 在線報(bào)名
申請(qǐng)?jiān)嚶?tīng)課程

只要一個(gè)電話
我們免費(fèi)為您回電

姓名不能為空
手機(jī)號(hào)格式錯(cuò)誤