程序空間理解


在硬件工程師和普通用戶看來,內存就是插在或固化在主板上的內存條,它們有一定的容量——比如64 MB。但在應用程序員眼中,並不過度關心插在主板上的內存容量,而是他們可以使用的內存空間——他們可以開發一個需要占用1 GB內存的程序,並讓其在OS平台上運行,哪怕這台運行主機上只有128 MB的物理內存條。而對於OS開發者而言,則是介於二者之間,他們既需要知道物理內存的細節,也需要提供一套機制,為應用程序員提供另一個內存空間,這個內存空間的大小可以和實際的物理內存大小之間沒有任何關系。
   
  我們將主板上的物理內存條所提供的內存空間定義為物理內存空間;將應用程序員看到的內存空間定義為線性空間。物理內存空間大小在不同的主機上可以是不一樣的,隨着主板上所插的物理內存條的容量不同而不同;但為應用程序員提供的線性空間卻是固定的,不會隨物理內存的變化而變化,這樣才能保證應用程序的可移植性。盡管物理內存的大小可以影響應用程序運行的性能,並且很多情況下對物理內存的大小有一個最低要求,但這些因素只是為了讓一個OS可以正常的運行。
   
  線性空間的大小在32-bit平台上為4 GB的固定大小,對於每個進程都是這樣(一個應用可以是多進程的,在OS眼中,是以進程為單位的)。也就是說線性空間不是進程共享的,而是進程隔離的,每個進程都有相同大小的4 GB線性空間。一個進程對於某一個內存地址的訪問,與其它進程對於同一內存地址的訪問絕不沖突。比如,一個進程讀取線性空間地址1234ABCDh可以讀出整數8,而另外一個進程讀取線性空間地址1234ABCDh可以讀出整數20,這取決於進程自身的邏輯。
   
  在任意一個時刻,在一個CPU上只有一個進程在運行。所以對於此CPU來講,在這一時刻,整個系統只存在一個線性空間,這個線性空間是面向此進程的。當進程發生切換的時候,線性空間也隨着切換。所以結論就是每個進程都有自己的線性空間,只有此進程運行的時候,其線性空間才被運行它的CPU所知。在其它時刻,其線性空間對於CPU來說,是不可知的。所以盡管每個進程都可以有4 GB的線性空間,但在CPU眼中,只有一個線性空間的存在。線性空間的變化,隨着進程切換而變化。
   
  盡管線性空間的大小和物理內存的大小之間沒有任何關系,但使用線性空間的應用程序最終還是要運行在物理內存中。應用所給出的任何線性地址最終必須被轉化為物理地址,才能夠真正的訪問物理內存。所以,線性內存空間必須被映射到物理內存空間中,這個映射關系需要通過使用硬件體系結構所規定的數據結構來建立。我們不妨先稱其為映射表。一個映射表的內容就是某個線性內存空間和物理內存空間之間的映射關系。OS Kernel一旦告訴某個CPU一個映射表的位置,那么這個CPU需要去訪問一個線性空間地址時,就根據這張映射表的內容,將這個線性空間地址轉化為物理空間地址,並將此物理地址送到地址線,畢竟地址線只知道物理地址。
   
  所以,我們很容易得出一個結論,如果我們給出不同的映射表,那么CPU將某一線性空間地址轉化的物理地址也會不同。所以我們為每一個進程都建立一張映射表,將每個進程的線性空間根據自己的需要映射到物理空間上。既然某一時刻在某一CPU上只能有一個應用在運行,那么當任務發生切換的時候,將映射表也更換為響應的映射表就可以實現每個進程都有自己的線性空間而互不影響。所以,在任意時刻,對於一個CPU來說,也只需要有一張映射表,以實現當前進程的線性空間到物理空間的轉化。
  
  --------------------------------------------------------------------------------
  
  
  
  2. OS Kernel Space & Process Space
  
   
  由於OS Kernel在任意時刻都必須存在於內存中,而進程卻可以切換,所以在任意時刻,內存中都存在兩部分,OS Kernel和用戶進程。而在任意時刻,對於一個CPU來說只存在一個線性空間,所以這個線性空間必須被分成兩部分,一部分供OS Kernel使用,另一部分供用戶進程使用。既然OS Kernel在任何時候都占用線性空間中的一部分,那么對於所有進程的線性空間而言,它們為OS Kernel所留出的線性空間可以是完全相同的,也就是說,它們各自的映射表中,也分為兩部分,一部分是進程私有映射部分,對於OS Kernel映射部分的內容則完全相同。
   
  從這個意義上來說,我們可以認為,對於所有的進程而言,它們共享OS Kernel所占用的線性空間部分,而每個進程又各自有自己私有的線性空間部分。假如,我們將任意一個4 GB線性空間分割為1 GB的OS Kernel空間部分和3 GB的進程空間部分,那么所有進程的4 GB線性空間中1 GB的OS Kernel空間是共享的,而剩余的3 GB進程空間部分則是各個進程私有的。Linux就是這么做的,而Windows NT則是讓OS Kernel和進程各使用2 GB線性空間。
  
  --------------------------------------------------------------------------------
  
  
  
  3. Segment Mapping & Page Mapping
  
   
  所有的線性空間的內容只有被放置到物理內存中才能夠被真正的運行和操作。所以,盡管OS Kernel和進程都被放在線性空間中,但它們最終必須被放置到物理內存中。所以OS Kernel和所有的進程都最終共享物理內存。在現階段,物理內存遠沒有線性空間那么大——線性空間是4 GB,而物理內存空間往往只有幾百兆,甚至更小。另外即使物理內存有4 GB,但由於每個進程都可以有3 GB線性空間(假如進程私有線性空間是3 GB的話),如果把所有進程的線性空間內容都放在物理內存中,明顯是不現實的。所以OS Kernel必須將某些進程暫時用不到的數據或代碼放在物理內存之外,將有限的內存提供給當前最需要的進程。另外,由於OS Kernel在任何時候都有可能運行,所以OS Kernel最好被永遠放在物理內存中。我們僅僅將進程數據進行換入換出。
   
  從線性空間到物理空間的映射需要映射表,映射表的內容是將某段線性空間映射到相同大小的物理內存空間上。從理論上,我們可以使用兩種映射方法:變長映射,和定長映射。變長映射指的是根據不同的需要,將一個一個變長段映射到物理內存上,其格式可以如下(線性空間段起始地址,物理空間段起始地址,段長度)。假如一個進程有3個段:10M的數據段,5M的代碼段,和8K的堆棧段,那么就可以在映射表中建立3項內容,每一項針對一個段。這看起來沒有問題。但假如現在我們的實際的內存只有32M,其中10M被內核占用,留給進程的物理空間只有22M,那么此進程在運行時,就占據了10M+5M+8K的內存空間。隨后當進程發生切換時,假如另一個進程和其有相同的內存要求,那么剩余的22M-(10M+5M+8K)明顯就不夠用了,這時只能將原進程的某些段換出,並且必須是整段的換出。這就意味着我們必須至少換出一個10M的數據段,而換出的成本很高,因為我們必須將這10M的內容拷貝到磁盤上,磁盤I/O是很慢的。
   
  所以,使用變長的段映射的結果就是一個段要么被全部換入,要么被全部換出。但在現實中,一個程序中並非所有的代碼和數據都能夠被經常訪問,往往被經常訪問的只占全部代碼數據的一部分,甚至是一小部分。所以更有效的策略是我們最好只換出那些並不經常使用的部分,而保留那些經常被使用的部分。而不是整個段的換入換出。這樣可以避免大塊的慢速磁盤操作。
   
  這就是定長映射策略,我們將內存空間分割為一個個定長塊,每個定長塊被稱為一個頁。映射表的基本格式為(物理空間頁起始地址),由於頁是定長的,所以不需要指出它的長度,另外,我們不需要在映射表中指定線性地址,我們可以將線性地址作為索引,到映射表中檢索出相應的物理地址。當使用頁時,其策略為:當換出的時候,我們只將那些不活躍的,也就是不經常使用的頁換出,而保留那些活躍的頁。在換入的時候,只有被請求訪問的頁才被換入,沒有被請求訪問的頁將永遠不會被換入到物理內存。這就是請求頁(Demand Page)算法的核心思想。
   
  這就引出一個頁大小的問題:首先我們不可能以字節為單位,這樣映射表的大小和線性空間大小相同——假如整個線性空間都被映射的話——我們不可能將全部線性空間用作存放這個映射表。由此,我們也可以得知,頁越小,則映射表的容量越大。而我們不能讓映射表占用太多的空間。但如果頁太大,則面臨着和不定長段映射同樣的問題,每次換出一個頁,都需要大量的磁盤操作。另外,由於為一個進程分配內存的最小單位是頁,假如我們的頁大小為4 MB,那么即使一個進程只需要使用4 KB的內存,也不得不占用整個4 MB頁,這明顯是一種很大的浪費。所以我們必須在兩者之間進行折衷,一般平台所規定的頁大小為1 KB到8 KB,IA-32所規定的頁大小為4 KB。(IA-32也支持4 MB頁,你可以根據你的OS的用途進行選擇,一般都是使用4 KB頁)。

注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



關於空間的理解 對於空間的理解 如何理解假設空間與版本空間? 關於高維空間的個人理解 空間曲面的理解 對表空間的理解 關於尺度空間理解 關於尺度空間的理解 矩陣空間理解 對命名空間的理解
 
粤ICP备14056181号  © 2014-2021 ITdaan.com