新聞中心
對于Python的GIL和線程安全很多人不是很了解,通過本文,希望能讓大家對Python的GIL等內(nèi)容有所幫助。本文還將就主要談下筆者對線程安全的一些理解。

成都創(chuàng)新互聯(lián)服務(wù)項目包括武鄉(xiāng)網(wǎng)站建設(shè)、武鄉(xiāng)網(wǎng)站制作、武鄉(xiāng)網(wǎng)頁制作以及武鄉(xiāng)網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,武鄉(xiāng)網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到武鄉(xiāng)省份的部分城市,未來相信會繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
摘要
什么是線程安全? 為什么Python會使用GIL的機(jī)制?
在多核時代的到來的背景下,基于多線程來充分利用硬件的編程方法也不斷發(fā)展起來, 但是一旦 牽扯到多線程,就必然會涉及到一個概念,即 線程安全, 本文就主要談下筆者對線程安全的一些理解.
而Python為很多人所抱怨的一點就是GIL,那么Python為什么選擇使用GIL, 本文也就這個問題進(jìn)行一些討論.
Contents
摘要
引入
線程安全
GIL
個人的觀點
參考資料
本文的rst源碼
引入
你的PC或者筆記本還是單核嗎? 如果是,那你已經(jīng)out了.
隨著納米技術(shù)的不斷進(jìn)步, 計算機(jī)芯片的工藝也在進(jìn)步,但是已經(jīng)很難在工藝上的改進(jìn)來提高 運算速度而滿足 摩爾定理, 所以intel, amd相繼在采用橫向的擴(kuò)展即增加更多的CPU, 從而雙核, 4核, N核不斷推出,于是我們進(jìn)入了多核時代.
于是一個問題出現(xiàn)了, 多核時代的出現(xiàn)對于我們程序員而言意味著什么, 我們?nèi)绾卫枚嗪说膬?yōu)勢?
在回答這個問題之前,建議對 進(jìn)程 和 線程 不熟悉的讀者可以先補(bǔ)下相關(guān)的知識.
當(dāng)然方案是,可以采用 多進(jìn)程, 也可以采用 多線程. 二者的***區(qū)別就是, 是否共享資源, 后者是共享資源的,而前者是獨立的. 所以你也可能想起了google chrome為什么又開始使用獨立的進(jìn)程 來作為每個tab服務(wù)了(不共享數(shù)據(jù),意味著有更好的安全性).
相對于進(jìn)程的輕型特征,多線程環(huán)境有個***的問題就是 如何保證資源競爭,死鎖, 數(shù)據(jù)修改等.
于是,便有了 線程安全 (thread safety)的提出.
線程安全
Thread safety is a computer programming concept applicable in the context of multi-threaded programs.
A piece of code is thread-safe if it functions correctly during simultaneous execution by multiple threads.
In particular, it must satisfy the need for multiple threads to access the same shared data,
and the need for a shared piece of data to be accessed by only one thread at any given time.
上面是wikipedia中的解釋, 換句話說, 線程安全 是在多線程的環(huán)境下, 線程安全能夠保證多個線程同時執(zhí)行時程序依舊運行正確, 而且要保證對于共享的數(shù)據(jù),可以由多個線程存取,但是同一時刻只能有一個線程進(jìn)行存取.
既然,多線程環(huán)境下必須存在資源的競爭,那么如何才能保證同一時刻只有一個線程對共享資源進(jìn)行存取?
加鎖, 對, 加鎖可以保證存取操作的唯一性, 從而保證同一時刻只有一個線程對共享數(shù)據(jù)存取.
通常加鎖也有2種不同的粒度的鎖:
fine-grained(所謂的細(xì)粒度), 那么程序員需要自行地加,解鎖來保證線程安全
coarse-grained(所謂的粗粒度), 那么語言層面本身維護(hù)著一個全局的鎖機(jī)制,用來保證線程安全
前一種方式比較典型的是 java, Jython 等, 后一種方式比較典型的是 CPython (即Python).
前一種本文不進(jìn)行討論, 具體可參考 java 中的多線程編程部分.
至于Python中的全局鎖機(jī)制,也即 GIL (Global Interpreter Lock), 下面主要進(jìn)行一些討論.
Python的GIL
什么是GIL ? 答案可參考wikipedia中的說明, 簡單地說就是:
每一個interpreter進(jìn)程,只能同時僅有一個線程來執(zhí)行, 獲得相關(guān)的鎖, 存取相關(guān)的資源.
那么很容易就會發(fā)現(xiàn),如果一個interpreter進(jìn)程只能有一個線程來執(zhí)行, 多線程的并發(fā)則成為不可能, 即使這幾個線程之間不存在資源的競爭.
從理論上講,我們要盡可能地使程序更加并行, 能夠充分利用多核的功能, 那么Python為什么要使用 全局的GIL 來限制這種并行呢?
這個問題,其實已經(jīng)得到了很多的討論, 不止十年, 可以參考下面的文檔:
反對GIL的聲音:
An open letter to Guido van Rossum (這個文章值得一看,下面有很多的留言也值得一看)
認(rèn)為GIL不能去除的:
It isn't Easy to Remove the GIL (這個文章來自python作者 Guido, 他說明了什么要使用 GIL)
其它的一些討論很容易從Google來搜索得到, 譬如: GIL at google.
那么,簡單總結(jié)下雙方的觀點.
認(rèn)為應(yīng)該去除GIL的:
不順應(yīng)計算機(jī)的發(fā)展潮流(多核時代已經(jīng)到來, 而 GIL 會很影響多核的使用)
大幅度提升多線程程序的速度
認(rèn)為不應(yīng)該去除GIL 的(如果去掉,會):
寫python的擴(kuò)展(module)時會遇到鎖的問題,程序員需要繁瑣地加解鎖來保證線程安全
會較大幅度地減低單線程程序的速度
后者是Guido最為關(guān)切的, 也是不去除GIL最重要的原因, 一個簡單的嘗試是在1999年(十年前), 最終的結(jié)果是導(dǎo)致單線程的程序速度下降了幾乎2倍.
歸根結(jié)底,其實就是多進(jìn)程與多線程的選擇問題, 有一段話比較有意思, 可以參考 http://www.artima.com/forums/flat.jsp?forum=106&thread=214235.
我引用如下:
I actually don't think removing the GIL is a good solution.
But I don't think threads are a good solution, either.
They're too hard to get right, and I say that after spending literally years studying threading in both C++ and Java.
Brian Goetz has taken to saying that no one can get threading right.
引自Bruce Eckel 對Guido 的回復(fù). 而Bruce Eckel 是何許人, 如果你了解Java 或者C++, 那么應(yīng)該不會不知道他.
個人的觀點
那么,從我自己的角度來看(我沒有太多的多線程編程經(jīng)驗), 先不論多線程的速度優(yōu)勢等,我更加喜歡多進(jìn)程的是:
簡單,無需要人為(或者語言級別)的加解鎖. 想想 java 中的多線程編程,程序員通常會在此處出錯(Java程序員可以思考下)
安全, 這也是瀏覽器為什么開始使用多進(jìn)程的一個原因
依照Python自身的哲學(xué), 簡單 是一個很重要的原則,所以, 使用 GIL 也是很好理解的.
當(dāng)然你真的需要充分利用多核的速度優(yōu)勢,此時python可能并非你***的選擇,請考慮別的語言吧,如Java, erlang 等.
鏈接:http://www.cnblogs.com/mindsbook/archive/2009/10/15/thread-safety-and-GIL.html
網(wǎng)頁標(biāo)題:淺析Python的GIL和線程安全
文章URL:http://m.fisionsoft.com.cn/article/cdcgdes.html


咨詢
建站咨詢
