從清華大學到貝爾實驗室,再到中國移動,作為“IT老人”,錢嶺的技術人生幾乎覆蓋了20世紀90年代至今的信息產業革命。2007年開始,錢嶺在中國移動經歷了基礎科研到產品落地,再到團隊孵化;也經歷了云計算從無到有,從有到優;同時還經歷了技術到政策,政策到產業的全生態鏈。《新程序員》特邀錢嶺講述他編程人生中鮮為人知的故事。
作者 | 楊陽 ? ?
出品 |? 《新程序員》編輯部
錢嶺生于1972年,2022年是他的半百之年。按照中國傳統,50歲本應“知天命,”但他并不相信宿命論,而是時常和自己說:“這個世界上本沒有正確的選擇,只有通過不懈努力,讓當初的選擇變得正確。”
錢嶺,中國移動集團級首席專家,中國移動云能力中心技術部/創新中心總經理,軟件工程領域知名專家,高級工程師,享受“國務院政府特殊津貼”。畢業于清華大學,獲得工學博士學位,主修軟件工程方向。畢業后加入貝爾實驗室基礎科學研究院,2007年加入中國移動通信研究院,負責中國移動“大云”項目。目前專注于移動云規劃、架構和創新研究。
在他的認知中,“正確”并非初始注定、一成不變,而是在時代和環境的變化中,伴隨著主觀能動性的層層推動,從而不斷達到新的平衡狀態。相較于從理念出發的固定價值衡量,他更相信從實踐中萌生的動態理性力量。
當然,思維的塑造非一日之功,需要長久磨煉。對于錢嶺來說,他的思維塑型期在清華大學,成長期在貝爾實驗室,成熟期則在中國移動。
2001年,他從清華大學計算機科學與技術系畢業,主修軟件工程方向,獲得工學博士學位。同年,加入貝爾實驗室基礎科學研究院,開始從事通信軟件的基礎科學研究。
說起貝爾實驗室。不僅誕生了15位諾貝爾獎得主,還孵化出了UNIX、C和C++等系統與編程語言。作為世界最大、最成功的私有實驗室,它有太多世界之最。但因其母公司是AT&T,根基主要還是扎在信息通訊,不僅有天才科學家香農提出信息論,成為現代通信和信息科技的基礎之一,而且第一顆商用通信衛星、第一條商用光纜都出自貝爾實驗室。
1997年,實驗室正式進入中國,并于三年后在北京成立“基礎科學研究院”。“那時候畢業的主流選擇是去外企,我是因為早兩年畢業的師弟去了貝爾實驗室,他介紹我,就選擇了這里。”
在殿堂級的實驗室進行通信基礎科學研究,對錢嶺來說是極大的鍛煉。與此同時,每月八千元的高薪比北京當時的平均房價都要高。
在貝爾實驗室的六年,錢嶺可謂得心應手。他表示:“每年績效考核都是A”。在寬松的科研環境下,他在包括網絡傳輸、即時通信、手機通訊等不同領域中展開研究,花了幾年時間把從IT到終端的網絡技術幾乎“扒”了一遍,就這樣一直到2006年。
這一時期,通信業受到互聯網的沖擊,貝爾實驗室在母公司經營不善的情況下開始走下坡路,最后隨著朗訊和阿爾卡特的合并逐漸式微。經營問題很快影響到研究,此時的錢嶺感覺到了危機:“已經沒有新項目可做,非常閑,一個月的工作幾天就能做完。”
不想浪費青春就要另尋出路,他在一年后去了中國移動通信研究院,并于2008年6月正式加入中國移動“大云(Big Cloud)”研發項目,從項目經理做到首席架構師,再到蘇州研發中心首席科學家和現在的集團級首席專家。他前期聚焦科研攻關,中期做產品成果轉化,后期負責技術和團隊搭建,從第一批大數據和云計算科研工作者,成長為“云端之旅”的技術創業者。
投身大數據和云的十四年,他先用三年時間實現“大云”云計算產品規模化商用部署(單集群1000臺服務器),再用兩年時間實現“大云”大數據產品商用規模化部署(單集群1000臺服務器),實現了兩大產品線從“0”到“1”的突破。在技術和研發管理方面,他創造性地提出了敏捷方法和瀑布模型的融合理論。與此同時,他也帶領團隊通過了CMMI五級和DevOps三級評定,讓中國移動在“云數”領域實現領先。
一直以來,錢嶺都在用實際行動踐行著他“努力奮斗,讓選擇變得正確”的座右銘。
1、當首席架構師轉型管理者
去年年中,貝索斯卸任亞馬遜CEO,接替他的是創辦了亞馬遜云業務的安迪 · 雅西。之所以能夠接任,與安迪·雅西負責的AWS業務的高速增長和高額利潤密不可分。
如今,云服務正在成為很多科技廠商的賺錢利器,但在發展的最早期并不如此。亞馬遜云科技團隊初創時只有8個人,2006年公司發布了各類服務,都沒有太大反響。三年后,阿里云計算有限公司正式成立,也被產業界唱衰,公司團隊內部也都異常辛酸。
事實上,中國移動在2007年就開啟了云計算的關鍵技術研究,也是先行者。對于錢嶺來說無疑是一大挑戰:一方面,他對這一研究領域相對陌生;另一方面,要從基礎研究的純科學轉型到應用技術,“產業落地”成為替代“研究成果”的衡量標準,不僅需要心態上的很大轉變,也要在實踐中身體力行。
在最初五年的產業孵化期,錢嶺經歷了基礎研究的沉淀,進行了云計算的科研攻關,日常工作主要集中在研究和撰寫論文,包括架構和標準化的研究,以及開源軟件產品化改造等方面。從2010年開始,云計算概念開始流行。這一年“大云”發布了1.0版本,并在天津政府首先實現商用。
到了2013年,國內外云產業開始逐漸落地。隨著AWS推出“ECS容器產品”和“智能網卡卸載技術”,CPU的利用率大幅提升,成為云計算超越傳統IT的開始。與此同時,技術的利好也帶來了利潤突破。在國內,阿里開始嘗試云化的互聯網金融服務,將自家余額寶核心系統遷移到了阿里云上。
相較而言,通信業的云化業務沒有互聯網行業緊迫,但這場提升基礎設施服務的“新風”吹來,錢嶺選擇加快腳步跟上去。當“擬成立專門從事云計算研發的蘇州研發中心”消息傳來,他積極響應,帶領技術團隊作為第一批籌建者,離開北京到蘇州創業。
錢嶺的第一項重要任務是組建并擔任產品部總經理,他帶領團隊展開產品化業務。“2014年以北京研究院的云計算系統為班底成立了蘇州研發中心,開展公司化運作,之后的目標是如何把技術真正落地。業務落地需要人才,就發出不少招聘,但那時還沒有多少云計算的專業人才,我們只能在相關領域開展招聘。開始的時候都不能馬上勝任,所以從2014年到2016年基本是團隊孵化期,從基礎能力開始構建、磨合和提升。”
對于此時的他而言,從架構師轉型管理者,面臨一個不得不解決的難題。
2、帶領團隊從“0”到“1”
“是先做技術研究,還是先產品化?”事實上,這個問題在科技圈普遍存在,也是科技行業里“雞生蛋,還是蛋生雞”的哲學。
通常我們會認為應該先研究,等技術成熟后再落地。但這種想法只在外界沒有任何干擾的理想化狀態下才可能實現。現實中,除了基礎科學或早期的應用技術,研發幾乎沒有脫離市場獨立存在的可能。
處于產業化階段,錢嶺自然知道產品落地和技術研究上的矛盾點。“公司發展需要生存,就會聚焦在工程化上,通過開發界面和管理平臺滿足客戶的需求。但工程開發會消耗大量人力,在人員有限的情況下,創新、創造就會投入不足,而且研發人員投入在創造性工作上的時間總被日常生產打斷,長期來看是很大的問題。”
這個矛盾帶來的不良影響很快顯現。早期的強工程能力在平臺架構搭建好后,便因為創新能力不足而進入上升瓶頸期。為了解決這個問題,錢嶺受命在2019年組建創新中心。和產品部門不同,創新中心的主要任務是攻堅克難,做原創技術,需要團隊拆解項目底層需求,并從基礎技術的實現邏輯開始逐步深入。“該研究的時候就研究,學習和發表論文,打好理論基礎;該去調研產業也不能偷懶,真正深入企業生產當中。”
直至目前,創新中心已經在多個領域展開相關研究布局,如從論文開始做第一代的云原生數據庫 — “凌霄”的孵化。國內很多互聯網企業都在做云原生數據庫,錢嶺的團隊基于工程化的架構能力做技術孵化,據他透露,目前已完成第一版本的研發,具備多項關鍵能力,性能達到預期水平。
量子計算和機器人云是創新中心另外兩個專注研究的項目。其中,量子計算聚焦通用模擬器技術,已經完成單項算法研發,正在開展平臺化工作。在錢嶺看來,機器人未來的數量將大幅超過人類的數量,成為重要的云化應用終端,目前團隊在機器人的云化應用上也在大力投入。
通過創新中心解決了產品落地和技術研究的矛盾,錢嶺面前還有一個技術難題——“研發管理一體化”的體系構建。
“我們在2017年架構了針對軟件研發的IPD-S體系,當時穩定使用了一段時間,也通過了CMMI五級評定,但到2019年云改之后就不適用了,必須‘研發一體化’。這涉及從管理體系、工具、架構、團隊和文化的全面轉向,特別是架構。經過兩年改造,移動云架構實現了‘研發運營一體化’的目標。但因為沒有時間停下研發做架構改造,只能邊研發邊改造,整個團隊都非常辛苦。與此同時,我們也完成了管理體系和工具鏈等方面的建設。目前已經正式并網,開展藍綠和灰度發布,但并不完美,還在優化中。”
除了錢嶺自己帶隊進行內部的優化變革,公司也在分配和激勵層面進行創新推動,分別在2019年和2021年開啟了“云改”和“科改”。在他看來,“云改”最大的作用在于指明了公司短期和中長期的發展方向和目標,移動云成為公司基礎性、關鍵性業務,技術和研發能力的重要性被充分提升。“科改”進一步落實了市場化、差異化的激勵約束機制,加大向價值大、能力強、貢獻高的人才傾斜力度,這對于高端技術人才、核心研發崗位來說是很大的利好。
通過優化研發管理體系、建立創新中心,以及激勵制度改革,錢嶺發現團隊的創新和工程能力確實出現快速提升。體現在云化業務的落地方面,速度明顯加快。以單集群1000臺服務器作為規模化應用量:“早期做項目階段,云計算和大數據分別用時三年和五年,而移動云在短短幾年的部署量便超過了十萬臺服務器。同時因為在工程化和研發運營一體化上的積淀,我們的‘研發管理體系’進入了國內第一陣營,2021年第三季度移動云的收入在IDC上排名第七。”
最讓錢嶺欣慰的,是團隊的穩定給他帶來的信心:“我們的人員流失率不高,目前只有個位數,相較整個業界的30%是很低的。”錢嶺帶領大數據部拿到公司績效考核第一,同事給錢嶺畫了素描(見圖1)。
錢嶺和素描的合影
3、應對“跑馬圈地”后的常態問題
2008年開始做云計算,至今(2022年)已十四年,錢嶺經歷了中國這一產業的整個發展歷程。從早期被懷疑,到2011年后逐漸被重視,再到2013年產業化的落地,直到2015年政策開始紛紛出臺。
從技術應用來說,在公有云之后,私有云也開始發展:“經歷了一段時間‘跑馬圈地’的亂象到真正沉淀,從2017年起產業界開始真正認識到云的價值,有所共識,需求點開始鎖定。”
但近年來,新的產業問題依然比較突出,錢嶺認為表現在技術和生態兩個方面。
首先是技術層。在他看來,無論是互聯網還是通信行業在云計算的聚焦點都是算力網絡。和之前云只提供算力不同,現在需要算力加網絡。對于互聯網企業來說,算力是強項,網絡則是弱項,所以無論是阿里的企業網,還是亞馬遜的直聯業務,都存在不能一次性滿足用戶完整需求的問題。
然后是生態層,因為還在發展早期,整體來看問題比較多,核心在于以下幾點:
-
行業發展不均,互聯網“一馬當先”,但更多傳統行業改造明顯不足。對云化技術使用不充分,用戶體驗、安全性都有很大提升空間;
-
?“國家隊”力量需要進一步提升,保障國計民生的產業技術不能拿來即用,云是基礎設施,還是由央企或國有化企業來主導建設更好,但目前這方面力量明顯不足;
-
存在資源浪費的現象。傳統行業缺乏相應云上研發能力的企業會把公有云當成私有云來用,對優質資源沒有充分利用;
-
硬件問題還沒有很好地解決。軟件可以做得很好,但核心硬件還需要國產替代,軟硬件需要兩手都抓。
在錢嶺看來,他們推進的云網融合正在解決算力浪費、資源調度難、用戶體驗差等問題,移動云具備一次性開通云和網的雙重能力,可以在全國范圍內調度。事實上,不僅是中國移動,云網融合也是各家運營商主推的數字化轉型戰略。
對于云技術體系的構建,“大云架構”從2009年的內測0.5版直至2017年發布5.0版,再到2020年移動云新內核。移動云已經由原先結構不統一的多項產品,形成以云原生作為主體基礎、軟硬一體、靈活組網、大規模高可用、云網邊和云數智融合的新型統一架構,同時還有三個通用底座,包括業務支撐系統、運營支撐系統、運維支撐系統。
“我們近年來一直在做的事情是通過云改把架構統一,目前實現了很多創新。在云計算各項關鍵技術領域,包括數據庫、大數據、云智融合、虛擬化、存儲等,都獲得過省部級科技進步獎。”
此外,要想真正解決以上問題,還需從技術管理和經營管理的層面不斷提升。自從2018年調任戰略技術部,錢嶺在戰略架構方面的主要工作包括產品、研發和技術的三大管理體系構建。
“只有公司架構起最強的力量,才能真正推動產業界的發展。目前我們在做的事情不是學術上的方法論,而是真正與生產強相關的各種體系的建設,除了產品、研發和技術三大體系緊密關聯,也包括財務和市場的拉通管理,同時包括人才體系的建設。人才和體系融合,才能真正高效運轉起來。”
4、年輕人不要擔心變老
從初為技術人到資深管理者,近三十載的技術人生讓錢嶺感悟頗多。濃縮成精華,他想給開發者傳授的主要有兩方面。
一方面是持續學習,從“單點技術”到“融合實踐”。“只要選擇了IT行業就要持續學習,這點是IT人,尤其是做云計算的人需要做好的思想準備。這一領域經常出現新概念,如果離開兩年后再回來,也許就完全聽不懂這些新概念了。”
在持續學習的基礎上,要從單個技術,如“云計算、大數據、人工智能”擴展到“云網融合、軟硬一體、云邊協同、數智化”的組合能力。且不能只鉆到書本里,需要在熱愛的基礎上動手生產實踐。錢嶺認為自己之所以動手能力強,主要因為熱愛,需要把靈魂灌注其中。
另一方面是系統性思考,要多問五個“Why”。“現在很多開發者可能不愛看‘老頭’總結的東西,但理性思維的東西是相通的,系統性思考是做好技術和技術管理的重要基礎。”
五個“Why”由豐田公司最早提出,目的在于“打破砂鍋問到底”。
例如,為什么產生了質量問題?——從制造環節找答案;為什么質量問題沒有被發現?——是檢驗沒有做好;為什么質量問題反復發生?——工藝流程,或者是制度體系沒有架構得當……
錢嶺認為,就和蘇格拉底的“詰問法”一樣,一層層問下去就會發現問題根源所在。至于該如何形成更系統化的思維方式,他給開發者推薦一本書:An Introduction to General Systems Thinking?,由著名軟件專家杰拉爾德 · 溫伯格撰寫。
除此之外,他也希望做技術管理的“老人”,可以多給年輕人分享和指引:“在如何達成組織目標上,‘老人’還是需要給年輕人更多方向。如果沒有足夠的目標感和方法論,缺乏能力的新人往往不能按質保量的完成任務,他們或許會在黑暗中摸索很久,甚至出現負能量,如果做得不開心,可能就直接放棄了。”
對于時下科技圈流傳的“45歲退休,35歲換人”,他認為這種現象不會存在太久,一是技術沉淀是循序漸進的,只要堅持做好,就能成為專家;二是從技術發展長河來看,DevOps、OpenFlow等優秀技術往往都是行業老司機提出來的。
“所以,年輕人不要擔心自己變老,而是要變成‘老專家’。”
本文節選自《新程序員004》,從MySQL之父、MariaDB創始人 Michael "Monty" Widenius,到PostgreSQL全球開發組聯合創始人Bruce Momjian、阿里巴巴副總裁賈揚清、指令集創始人兼 CEO潘愛民、著名科技作者吳軍,再到 Vue.js 作者尤雨溪……《新程序員004》以「我們的技術時代,我的程序人生」為主題,與多位國內外知名的技術先鋒和新生代程序員代表進行了深度對話,希望行業優秀人物的技術之路與人生感悟給大家帶來啟發。
---------------------
作者:《新程序員》編輯部
來源:CSDN
原文:https://blog.csdn.net/programmer_editor/article/details/124876727
版權聲明:本文為作者原創文章,轉載請附上博文鏈接!
內容解析By:CSDN,CNBLOG博客文章一鍵轉載插件