JSP軟件工程師不可不知的10個概念
10.關系數據庫(Relational Databases)
關系數據庫因為在大規模Web服務上缺乏可擴充性而頗受微詞,然而,關系數據庫仍然是近20年來計算機技術中最偉大的成就。關系數據庫對處理訂單,公司數據方面有著出色的表現。JSP軟件工程師不能不了解關系數據庫。
關系數據庫的核心是以記錄表示數據,記錄存放在數據庫表,數據庫使用查詢語言(SQL)對數據進行搜索與查詢,同時,數據庫對各個數據表進行關聯。
數據庫的標準化技術(normalization)講的是使用正確的方式對數據進行分存以降低冗余,并加快存取速度。
9.安全(Security)
隨著黑客的崛起與數據敏感性的上升,安全變得非常重要。安全是個廣義的概念,涉及驗證,授權與信息傳輸。
驗證是對用戶的身份進行檢查,如要求用戶輸入密碼。驗證通常需要結合SSL(secure socket layer)進行;授權在公司業務系統中非常重要,尤其是一些工作流系統。最近開發的OAuth協議可以幫助Web服務將相應信息向相應用戶開放。Flickr便使用這種方式管理私人照片和數據的訪問權限。
另外一個安全領域是網絡設防,這關系到操作系統,配置與監控。不僅網絡危險重重,任何軟件都是。Firefox被稱為最安全的瀏覽器,仍然需要頻頻發布安全補丁。要為你的系統編寫安全代碼就需要明白各種潛在的問題。
8.云計算(Cloud Computing)
RWW最近的關于云計算的文章Reaching For The Sky Through Compute Clouds講到了云計算如何改變大規模Web應用的發布。大規模的并行,低成本,與快速投入市場。
并行算法發明以來,首先迎來的是網格計算,網格計算是借助空閑的桌面計算機資源進行并行計算。最著名的例子是Berkley大學的SETI@home計劃,該計劃使用空閑的CPU資源分析太空數據。金融機構也大規模實施網格計算進行風險分析。空閑的資源,加上J2EE平臺的崛起,迎來了云計算的概念:應用服務虛擬化。就是應用按需運行,并可以隨著時間和用戶規模而實時改變。
云計算最生動的例子是Amazon的Web服務,一組可以通過 API 進行調用的應用,如云服務(EC2),一個用來存儲大型媒體文件的數據庫(S3),索引服務(SimpleDB),序列服務(SQS)。
7.并發(Concurrency)
并發是JSP軟件工程師最容易犯錯的地方,這可以理解,因為我們一直遵從線形思維,然而并發在現代系統中非常重要。
并發是程序中的并行處理,多數現代編程語言包含內置的并發能力,在Java,指的是線程。關于并發,最經典的例子是“生產/消費”模式,生產方生產數據和任務,并放入工作線程消費或執行。并發的復雜性在于,線程需要經常訪問共同數據,每個線程都有自己的執行順序,但需要訪問共同數據。Doug Lea曾寫過一個最復雜的并發類,現在是core Java的一部分。
6.緩存(Caching)
緩存對現代Web程序不可或缺,緩存是從數據庫取回,并存放在內存中的數據。因為數據庫直接存取的代價非常高,將數據從數據庫取回并放在緩存中訪問就變得十分必要。比如,你有一個網站,要顯示上周的暢銷書,你可以從數據庫將暢銷書榜一次性取回放在緩存中,而不必在每次訪問時都去數據庫讀數據。
緩存需要代價,只有最常用的內容才可以放入緩存。很多現代程序,包括Facebook,依靠一種叫做Memcached的分布式緩存系統,該系統是Brad Firzpatrick在工作于LiveJournal項目時開發的,Memcached使用網絡中空閑的內存資源建立緩存機制,Memcached類庫在很多流行編程語言,包括Java和PHP中都有。
5.散列法(Hashing)
Hashing的目的是加速訪問速度。如果數據是序列存儲的,從中查詢一個項的時間取決于數據列的大小。而散列法對每一個項計算一個數字作為索引,在一個好的Hashing算法下,數據查找的速度是一樣的。
除了存儲數據,散列法對分布式系統也很重要。統一散列法(uniform hash)用來在云數據庫環境下,在不同計算機之間分存數據。Google的索引服務就是這種方法的體現,每一個URL都被散列分布到特定計算機。
散列函數非常復雜,但現代類庫中都有現成的類,重要的是,如何對散列法進行細調以獲得最好的性能。
4.算法的復雜性(Algorithmic Complexity)
關于算法的復雜性,JSP軟件工程師需要理解這樣幾件事。第一,大O標記法(big O notation);第二,你永遠都不應該使用嵌套式循環(循環里面套循環),你應該使用Hash表,數組或單一循環;第三,如今優秀類庫比比皆是,我們不必過分糾纏于這些庫的效能的差別,我們以后還有機會進行細調;最后,不要忽視算法的優雅及性能,編寫緊湊的,可讀的代碼可以讓你的算法更簡單,更干凈。
3.分層(Layering)
用分層來討論軟件架構是最容易的。John Lakos曾出版過一本關于大型C++系統的書。Lakos認為軟件包含了層,書中介紹了層的概念,方法是,對每個軟件組件,數一下它所依賴的組件數目就可以知道它的復雜程度。
Lakos認為,一個好的軟件擁有金字塔結構,就是說,軟件組件擁有層層積累的復雜度,但每個組件本身必須簡單,一個優秀的軟件包含很多小的,可重復使用的模塊,每個模塊有自己的職責。一個好的系統中,組件之間的依賴性不可交叉,整個系統是各種各樣的組件堆積起來,形成一個金字塔。
Lakos在軟件工程的很多方面都是先驅,最著名的是 Refactoring(代碼重構)。代碼重構指的是,在編程過程中需要不斷地對代碼進行改造以保證其結構的健壯與靈活。
2.慣例與模板(Conventions and Templates)
命名慣例和基礎模板在編程模式中常被忽視,然而它可能是最強大的方法。命名慣例使軟件自動化成為可能,如:Java Beans框架在getter和setter 方法中,使用簡單的命名慣例。del.icio.us網站的URL命名也使用統一的格式,如[url]http://del.icio.us/tag/software[/url]會將用戶帶到所有標簽為 software 的頁。
很多社會網絡均使用簡單命名,如:你的名字是 johnsmith,那你的頭像可能命名為johnsmith.jpg,而你的rss聚合文件的命名很可能是johnsmith.xml。 養成良好的命名習慣是JSP軟件工程師的必修課。
命名慣例還用于單元測試,如:JUnit單元測試工具會辨認所有以test開頭的類。
我們這里說的模板(templates)指的并不是C++或Java語言中的constructs,我們說的是一些包含變量的模板文件,用戶可以替換變量并輸出最終結果。
Cold Fusion是最先使用模板的程序之一,后來,Java使用JSP實現模板功能。Apache近來為Java開發了非常好用的通用模板,Velocity。PHP 本身就是基于模板的,因為它支持eval函數。
1.界面(Interfaces)
軟件工程中最重要的概念是界面。任何軟件都是一個真實系統的模型。如何使用簡單的用戶界面進行模型化至關重要。很多軟件系統走這樣的極端,缺乏抽象的冗長代碼,或者過分設計而導致無謂的復雜。
在眾多軟件工程書籍中,Robert Martin寫的《敏捷編程》值得一讀。
關于模型化,以下方法對你會有幫助。首先,去掉那些只有在將來才可能用得著的方法,代碼越精練越好。第二,不要總認為以前的東西是對的,要善于改變。第三,要有耐心并享受過程。
【編輯推薦】