淺論當前軟件抗衰技術(shù)中存在的幾點(diǎn)問(wèn)題
摘要:計算系統軟件抗衰技術(shù)是隨著(zhù)計算機技術(shù)的發(fā)展衍生出的一個(gè)新的研究方向,屬于計算機應用研究領(lǐng)域。它涉及系統性能檢測、故障診斷、軟件工程及可靠性分析等方面,主要針對當前計算機運行過(guò)程中普遍出現的性能衰退現象,研究其原因、檢測和評價(jià)方法、軟件抗衰策略及實(shí)現技術(shù)。本論文主要探討了當前軟件抗衰技術(shù)中存在的幾點(diǎn)問(wèn)題。
關(guān)鍵詞:軟件抗衰 軟件工程 計算機軟件
一、引言
軟件的體系結構為軟件系統的構造、行為和關(guān)鍵性質(zhì)提供了一個(gè)高層的抽象,這種抽象包括對構成系統的元素的描述,對元素間交互的描述,對元素間組成模式的描述,以及對模式上的約束的描述。實(shí)現抗衰或自愈的軟件系統展示了能在運行時(shí)自適應以應對資源變動(dòng),系統故障等情況的能力,這種能力恰好是建立在這種對于軟件系統的高層抽象上的。
二、系統性能的監控和采集
系統性能的監控和性能數據的采集是實(shí)現系統抗衰的數據來(lái)源,是一個(gè)必不可少的環(huán)節,因此需要設計一個(gè)能適應于分布式計算環(huán)境,并且盡可能少的干擾所監控計算節點(diǎn),可擴縮的性能監控工具。
目前軟件系統正變的越來(lái)越復雜,龐大,能夠反映出系統性能的參數有成千上百,為了能夠實(shí)時(shí)的獲悉軟件系統所處的狀態(tài),需要高頻率的采集性能參數數據, 這對監控工具的性能數據采集、編碼、傳輸、存儲提出了更高的要求。此外,隨著(zhù)軟件抗衰粒度的細化,僅有系統級的監控已經(jīng)不能滿(mǎn)足要求,因此需要監控工具能夠實(shí)現進(jìn)程級,甚至于線(xiàn)程級的性能監控,從而為細粒度的抗衰策略的研究提供數據支持。
度量系統性能狀況的資源耗費參數有很多,各種資源耗費參數對于整體性能的影響是各不相同的,因此還需要對所確定的資源參數的權重進(jìn)行分析。要確定可以衡量一個(gè)計算系統的性能的系統資源參數已不是很容易的問(wèn)題,要分析其權重給出一個(gè)計算系統的合理的評價(jià)標準便更加困難,目前尚未檢索到有關(guān)這方面的研究報告,但是這方面的工作是非常必要的,它會(huì )影響到后期的策略制定。
三、系統性能衰退的檢測和量化
軟件系統運行時(shí)的狀態(tài)像人的狀態(tài)一樣可粗略的劃分為“健康”,“亞健康”和“不健康”等三大狀態(tài),狀態(tài)劃分的標準以及如何來(lái)量化是需要解決的問(wèn)題。因為它是抗衰策略的制定和實(shí)施的重要依據;同時(shí)“不健康”狀態(tài)有著(zhù)一個(gè)比較龐大的范圍,也需要進(jìn)一步細化,需要細粒度的刻畫(huà)衰退狀態(tài),劃分衰退的范圍,為細粒度的抗衰提供支持。目前這方面的研究主要是通過(guò)檢測軟件系統資源的占用和釋放情況、服務(wù)的響應時(shí)間和響應率來(lái)驗證軟件衰退出現,但不能給出進(jìn)一步更為細致的量化。
四、系統性能的預測
軟件系統的實(shí)時(shí)性能狀態(tài)能通過(guò)選擇性能參數來(lái)刻畫(huà),通過(guò)性能衰退的檢測和量化確定,但光有系統狀態(tài)的歷史數據和實(shí)時(shí)數據對于軟件抗衰是不夠的,這是因為軟件系統未來(lái)的負載信息和性能狀態(tài)對于抗衰決策的制定同樣有著(zhù)重要的影響,需要根據它們做出合理的抗衰決策,從而降低抗衰成本,同時(shí)提高可用性。目前這方面的研究工作主要集中是采用線(xiàn)性預測方式預測各種系統資源耗盡的時(shí)間估計,這種方式往往難于刻畫(huà)真正的衰退趨勢,誤差較大,因此有必要開(kāi)展這方面的研究工作,提出符合精確性更高的預測方式。
五、軟件抗衰策略決策
軟件抗衰的目的是提高系統的可靠性,提供持續高質(zhì)量的服務(wù),同時(shí)降低服務(wù)的維護成本,因此軟件抗衰的時(shí)間決策和抗衰粒度決策是值得研究的重要內容?顾r(shí)間的選擇會(huì )極大地影響抗衰系統,如果在系統負載高峰期實(shí)施,可能帶來(lái)較低的服務(wù)率,如果過(guò)早的實(shí)施,可能增加抗衰成本,過(guò)晚的實(shí)施,可能需要采用更高粒度的抗衰,也增加抗衰成本。由于在抗衰期間實(shí)施抗衰的部分不能正常提供服務(wù),抗衰粒度的選擇又影響了抗衰成本和可用性?顾チ6冗^(guò)小,可能抗衰帶來(lái)的性能改善不明顯,需要頻的實(shí)施抗衰;粒度過(guò)大,抗衰實(shí)施期間造成的服務(wù)不可用時(shí)間較長(cháng)。目前抗衰策略的決策研究工作基本上基于預先假設的狀態(tài)轉移概率和單位時(shí)間下各種粒度的抗衰成本,通過(guò)公式推導出能獲得最大的可用性、最低的抗衰成本的抗衰時(shí)間間隔。這種通過(guò)分析模型來(lái)基于很多假設得出的抗衰決策,在理論上講得通,而很難應用于實(shí)際系統抗衰的決策過(guò)程中。鑒于上述分析,有必要開(kāi)展抗衰決策方面的研究工作,使得能夠做出適時(shí)適度的抗衰決策。
六、抗衰實(shí)施技術(shù)
直觀(guān)上解決衰退問(wèn)題最有效的途徑是重啟整個(gè)系統,恢復到初始狀態(tài),不能輕易選擇這種方式的理由是高的抗衰成本和低的系統可用性。因此,目前抗衰實(shí)施技術(shù)的研究主要集中在微重啟技術(shù)和遞歸重啟技術(shù)等方面,研究的目的就是以最小的抗衰粒度來(lái)到達抗衰目的、提高系統可用性,無(wú)論是微重啟,還是遞歸重啟技術(shù), 研究的難點(diǎn)都在于獲取模塊之間的關(guān)聯(lián)關(guān)系,而關(guān)聯(lián)關(guān)系的獲取可能來(lái)自靜態(tài)的系統體系結構視圖,也可能來(lái)自系統運行時(shí)的反射。對于有完整的設計文檔的系統, 問(wèn)題變得很簡(jiǎn)單,只需把文檔作為輸入就能解決問(wèn)題,然而對于缺乏設計文檔的系統,需要在運行時(shí)建立模塊之間的關(guān)聯(lián)關(guān)系,這也是研究的難點(diǎn)。
七、結語(yǔ)
計算系統自身總體結構的復雜化傾向己使人難以直接進(jìn)行系統性能的衰退檢測和防護,因此需要研究一種新的技術(shù)—軟件抗衰技術(shù)。它能夠擺脫人的干預,自動(dòng)地檢測和分析計算系統性能,并在性能出現衰退時(shí)及時(shí)采取必要的措施。該技術(shù)實(shí)施的關(guān)鍵是性能檢測與分析和抗衰策略的制定。應用了軟件抗衰技術(shù)的計算系統在運行時(shí)能自主地維持其高性能,為系統的高可信賴(lài)、高性能和高可靠性提供有力的保證。
【淺論當前軟件抗衰技術(shù)中存在的幾點(diǎn)問(wèn)題】相關(guān)文章:
淺論現代文學(xué)教學(xué)中存在的問(wèn)題與對策11-23
當前企業(yè)成本管理存在的問(wèn)題及對策03-21
當前食品安全報道存在的問(wèn)題12-06
當前應試教育存在的問(wèn)題分析03-13
淺論獨立學(xué)院新聞教育存在的問(wèn)題及對策12-02
當前學(xué)校德育工作存在的問(wèn)題及對策的論文01-21
當前農村養豬業(yè)存在的問(wèn)題及對策論文05-29
淺析當前企業(yè)信息化建設中存在的問(wèn)題及應對措施06-15
淺析當前管理會(huì )計實(shí)際應用中存在的問(wèn)題及對策11-17
- 相關(guān)推薦