目錄
1. Android設計的現實意義
1.1 發展的前提:硬件抽象
1.2 能力的樞紐:組件化
1.3 應用的基礎-接口層
2. 對于我們的象征意義和實踐
3. 小結
阿里妹導讀:現實工作中經常可以聽到這樣的說法:框架的升級帶來協議性能的提升、編程模式的變革帶來業務的飛躍...... 姑且不論這些表述是否有問題,實際上如果系統地看待事物整體,可能會有不一樣的發現。以LINUX為例,盡管其內核大獲成功,但如果不是遵循POSIX、并成為一個開源、精簡的UNIX實現,很難想象其最終會有何種發展。因此,對事物進行全局和一定深入的探究有時會有更多啟發。
?
今天,阿里高級無線開發專家所為將結合自己多年的經驗,為你深入闡述整個?Android?技術域及移動研發生態,期待與大家共同探討。
?
1. Android設計的現實意義
?
架構的工程意義在于:定義并解決一類問題,為需求到實現的平穩過渡提供保障。傳統意義的Android架構(圖1)已被人熟知,但不同角色的視角不同,例如認為Runtime和框架是其核心、或者將Android看做是一種特異性JVM平臺、還有從嵌入式出發將其看做是Linux…… 實際上,Android是極少數幾個用設計來解決自身發展問題的系統,其核心在于通過硬件抽象、組件化、接口層三種能力來為發展提供基礎,并為諸多變數預留大量可操作、斡旋的空間。
?
圖1. Android傳統架構
?
1.1 發展的前提:硬件抽象
?
2008年,我國邁入3G時代前夜,基礎設施的變革讓移動領域充滿變數,無論設備、硬件還是軟件都均未定型。擅長架構和軟件的Google在這一領域要獲得生存和長足發展,需要團結一切可能的、甚至是未知的力量,取得移動運營商、芯片供應商、手機制造商的支持則是生存的第一步。
硬件抽象層(HAL)在一定程度上起到這樣的目的:它為移動領域五花八門、標準不統一的硬件驅動定義標準接口,避免Android過分依賴Linux,讓后續的擴展和整機集成更加高效,滿足了手機制造商的重要訴求;同時還起到隔離Linux內核的作用,避免廠商充滿硬件秘密的驅動源碼受GPL協議影響而開源,保障了芯片等硬件制造商的核心利益。傳統手機OS的定制和集成流程需要修改大量代碼,負擔不少,從這個角度來看Android HAL其設計是領先的。結合AOSP優良的代碼分支、模塊管理,加上基于GNU automake巨集形成的Android build system,廠商享受到超越以往的便捷。
然而HAL并無固定做法(如圖2所示),Android 8.0之前,最初大量采用HAL舊版方式,表現為framework直接加載*.so并依賴,主要集中在網絡、藍牙等模塊;舊版方式導致framework與具體驅動接口耦合過緊,后來形成HAL傳統方式,即提供一定規范和接口進行改進,從而減少直接耦合,但每次廠商支持新版Android依舊有大量改動和適配;為更有效地解決這一問題,Android 8.0開啟Treble項目,從此芯片廠商能通過基于Binder的HIDL提供穩定接口,制造商則可不受芯片廠商影響而直接更新Framework,甚至獲得無需重新編譯HAL即可OTA的能力。
?
圖2. Android對硬件驅動的設計
?
受益于HAL這一設計,Google在全球獲得更廣泛的支撐,尤其是Android 8.0在國內廠商的迅速適配可見一斑。HAL為Android設備量的持續增長提供了基礎,并促進有實力的廠商向設備上層及基礎設施兩個領域縱深發展(圖3),體現在掌握核心技術的廠商(如高通、華為、MTK),通過不斷建設系統能力來強化競爭力(支持5G標準、硬件能力、軟硬結合以及系統能力的深度定制等),而具備渠道和資源整合優勢的手機制造商(華為、OPPO、小米、VIVO等),則立足OS持續構建更高效的應用來拓展版圖(UI、推送、商店、輕應用等),這都體現出Android HAL對整個產業的凝聚和影響,間接彌補Android自身的諸多不足。
圖3. 具備核心競爭力的廠商的發展趨勢
?
1.2 能力的樞紐:組件化
?
對能力進行如何組織和復用是架構的最大挑戰,借鑒現有能力是發展的捷徑。無論是Mircosoft的COM,還是OMG的CORBA,或是從EJB到Spring、從SOA到Serverless,隨著基礎設施如網絡、終端設備的能力提升,這些技術的發展呈現出從重量到輕量、從對中心(總線)的重度依賴到輕量級依賴的趨勢。Android充分結合各領域先進技術,并基于移動端資源受限這一最大特色,形成了自身的技術特色:AIDL衍生自復雜的CORBA IDL,組件由SOA精簡而來,各獨立生老病死的System Service類似一個個微服務,Binder可以看做是對一種弱化總線、性能更好、可點對點通信的DBUS,UI布局系統則極大程度受到SWING的影響、manifest實際上就是APP與系統通信所必須的組件接口描述文件......
?
上面提到的領域技術的確有利于Android發展,但遠遠不夠。回想之前談到的HAL以及整體架構,我們看到Android實際上就是個大雜燴,使用的是諸多技術的混合。過去除Palm等Web OS外,無論是基于Linux/Unix構建的系統如Meego,還是Symbian、MTK、UCOS、WindowsCE,無論是實時系統還是非實時系統,這些移動端系統都以C/C++為主且小巧精悍,對內存使用和要求極為考究,雖然滿足了資源受限設備的使用訴求但帶來了門檻;虛擬機類的平臺如KJava、.NET on Windows Phone雖然內存使用和能耗方面比較大方,卻勝在研發效率和容錯性,因而受到不少開發者歡迎。
?
所以選擇混合架構對于缺乏完整移動領域產業鏈支撐的Google既符合其自身技術理念、又勝算最大,于是量身定制的組件化能力便肩負起這一使命,使得各組件得到有機組合、應用之間以及應用和系統的溝通更為明確和有約束,最終幫助整個系統靈活運轉,能力被迅速放大。
?
觀察Android系統的啟動運行流程(圖4)以及APP對系統能力的使用(圖5),可以發現其各類能力已按照組件化標準和粒度進行組織(能力的注冊發現、接口和通信的標準化、運行空間的隔離等),讓快速迭代的手機硬件和持續升級的系統能力以最小代價透出,將復用的價值在移動設備系統上具體化并最大化,從而具備更高的靈活性和兼容性;其背后軟件工程的意義在于為軟件需求、設計之間架起一座橋梁,解決了系統結構和研發需求向實現平坦過渡的問題。
?
圖4. Android系統進程架構概要
?
圖5. 使用設備能力的典型調用路徑
?
當然,歷史上其他公司面臨這類挑戰時也有不一樣的想法,例如Windows Phone 8.0選擇了另外一條路,無論是提供媲美JAVA的C#及VB.NET框架、還是基于Sliverlight Dependency Property + XAML的UI系統、甚至是為了支持C++研發出來的C++/CX及一套運行時,都仿佛無時無刻標榜著其系統技術的多樣化與復雜性,算得上是一場技術盛宴。
?
Meego則是另外一個例子,被期待救Nokia于危難,并由Intel聯袂推出,通過各種開源能力的組合來完成系統的建設,如Linux內核+QEMU模擬器+QT+QML界面,但實際上曇花一現。
?
1.3 應用的基礎-接口層
?
系統能力基本就緒,如何迎來更多開發者對Android長遠發展至關重要。選擇JAVA作為上層語言,既需要勇氣又足夠彰顯其野心;為迎合資源受限這一移動領域過去、現在也是未來的最大客觀事實,其設計了基于寄存器架構、可執行文件更小的Dalvik虛擬機,并通過凈室工程來高質量實現,同時結合諸多工具對外提供了流暢的JAVA編程方式,擺脫類似MTK feature phone只能用KJava寫些小游戲的局限,使得Android研發兼具JAVA的便利和不錯的性能。
天有不測風云,SUN在09年4月被Oracle收購,距離Android 1.0發布還不到一年。雖然最初選擇Apache Harmony來提供JAVA API十分明智,但卻遭遇到技術上不支持JAVA 7/8、版權上Oracle訴訟紛至沓來等諸多挑戰。為應對這一切,Google從Android N開始,將JAVA的支持變更為OpenJDK。另外,Kotlin因為特性相近、又可被編譯為class或者dx字節碼,也獲得了Google青睞和收編(圖6)。
?
圖6. Android接口層的過去和未來
?
實際上,之所以Android敢這么做,還是因為有其設計基礎的支撐,根據個人的一點粗鄙了解,從Android API的調用鏈路(圖7)上能發現端倪:無論底層依賴、實現和流程如何變化,上層的使用形式并不會改變。
?
圖7. Android內部對調用鏈路的3種實現
?
這意味著幾乎所有系統能力的核心,已在native library被實現殆盡,并結合上層提供良好屏蔽。這為其他語言實現Framework提供了可能,尤其是一門特性與JAVA相近的語言。所以是什么語言、是不是kotlin都只事先設計規范下的一種合適的選擇。
?
圖8. 一種未來用kotlin代替java的極端可能
?
2. 對于我們的象征意義和實踐
?
綜上所述,Android從三個方面來解決其發展的關鍵問題:
?
-
硬件驅動:形成廠商的合作基礎,并反過來對整個產業施加影響。
-
組件化:高效組織各種內部能力,尋求自身的更快發展。
-
接口層:滿足上層對系統和硬件能力的各種使用訴求。
?
移動互聯網產業巨頭發展因為起點以及執行理念不同而有所不同,Apple圍繞著其App Store構建其整個體系并精心維護,而且在現代化API編程、整機體驗、垂直領域技術如網絡/算法等各縱深領域走在前列;Google則用Android帶路,需要在各個層面維護和團結不同力量來形成自己的發展特色。所以,Android為系統如何發展提供了另外一種答案:除關注系統自身能力的發展,如何維護好系統不斷發展的基礎和前提、如何更好地暴露和讓外界使用系統能力也至關重要(見圖九)。
?
圖9. Android設計對解決問題的啟示
?
回到我們自身,在重用戶、重交互、手機即人的今天,我們的產品有理由也有必要用其內涵延展并放大服務的價值。要做到這一點并非易事。首先,業務迭代越來越快,各種應用層出不窮對中間件意味著廣泛的需求;其次,環境在改變,無論是運行硬件和設備的五花八門、還是對接集群的復雜多樣,都對阿里原有端側中間件帶來巨大沖擊;再次,在基礎技術發展變緩的今天,技術的價值需要被持續放大,我們希望基于自身能力來構建服務和業務的泛連接基礎,并將其作為發展愿景。這要求我們基于集團背景以及核心APP發展的主要目標下,來綜合思考這個發展問題(圖10)。
?
圖10. 對泛連接能力建設的思考
?
通過Android的啟發,結合環境和現狀,在滿足業務目標的同時我們從三個層面不斷演進網絡能力(圖11)。
?
-
首先,通過覆蓋線上線下、各類場景、形態各異的設備,不斷打造高效私有、支持通用標準的協議,并提供部分其他端側網絡不能或者及其難以提供的特殊能力,來幫助我們構建設備和服務、用戶與業務的泛連接基礎。
-
其次,自底向上地抽象,將非阻塞的IO復用、用戶態網絡棧支持、通道能力擴展以及可支持混合集群的多實例架構進行高效組織,從而保障了數據在不通層面的流轉和管理訴求。
-
最后,基于SDK矩陣和接入能力的建設,我們實現了服務接入到業務、業務透出給用戶的目的,并通過提供豐富的數據帶來更多價值。
?
圖11. 泛連接能力的系統性建設
?
基于以上的不斷沉淀,目前我們已能觸達海量設備和用戶,成為接入阿里內外各服務和平臺的接口,并為終端和服務分別屏蔽集群的多元化及設備的多樣性,實現新零售系統能力與用戶的泛連接(圖12)。
?
圖12.團隊能力在集團中所處的位置
?
3. 小結
?
結合傳統的C/S觀念,服務端獲取的信息來源于各網絡終端,網絡+協議屏蔽或規范了外界對服務輸入的多樣性,使得服務端過去關注的是集群和高并發,但現在無論是上云還是利用率,背后都是業務、成本規模和邊際效應在驅動,這里面發展的代際主旨鮮明。但回到客戶端,由于受到環境和交互等多樣性直接影響,即便是動態性的技術也難以代表端側的全部甚至是主流。所以在某種局部技術比拼武功,成為過去客戶端的一種行業“潮流”。
?
在局部技術和單點深入的確有其意義,筆者也曾有過一些班門弄斧,如非輪詢方式獲取手機棧頂Activity、面向阿里特有復雜集群的SDK多實例設計、Sophix熱修復及云上產品等。但結合過往經驗及Android設計,可以更系統性地看待這一現象:即除了滿足業務核心訴求(因為投入大量資源,必須、肯定要成,至少小成),更應該關注技術如何更好地服務業務以及如何持續挖掘能力護城河這兩頭的問題。所以要打造和發展好一個系統,除構建系統各中堅能力外,還需維護好系統發展的前提、組織好各系統能力的內聚、滿足好外部對系統的訴求。
?
以上是個人從Android系統設計到技術支撐系統發展的一點淺薄看法,期待和業界同仁共同探討。
?
作者:?所為?轉自:?阿里技術