為什么說選擇正確的編程語言很重要,以及如何正確的選擇

編程語言書籍


幾個月前,一個同事問我,應該如何選擇編程語言,或者有沒有什么固定的選擇模式,當時我便打算寫點什么。上周在硅谷開會,這我是第一次跟“hack3rs”的創業狂以及技術狂們打交道。我學會了很多前所未聞的臟話,也有所得–即便是追求精簡的初創企業也傾向于把問題過份復雜化。

將真正領悟精簡精神的人甄別出來并不困難。谷歌,Facebook以及Akamai的程師們的講座魅力十足。他們從一個更宏觀的角度思考和解決問題。這跟公司的財力,規模沒有關系,他們特意剪除細枝末節,以便將注意力集中在問題的根本。

我自己也曾一味要求手下考慮使用高級編程語言甚至全面向對象語言,我發現許多的新時代初創企業也還沒領悟其精髓。他們用Javascript、Python和Ruby編程,卻不明白為什么要用這些語言。

不可否認,把循環寫得緊湊或者避免使用模板固有其道理。但如果這是你選擇一門編程語言的唯一理由,那么你就大錯特錯了。日常工作中,與其用基于深度優化的向量化C++語言構建的多核并行異步map-reduce架構去做一個卷積離散傅立葉變換(correlation-DFT),我寧愿用BASIC來做一個快速傅立葉變換(FFT)。

那么到底應該根據什么來選擇編程語言呢?唯一檢驗標準:是否言而達意。

拋開語言的執行效率和功能等等不談,一門語言必須能夠讓你描述自己的意圖,不光是對編譯器而言,更是對未來的讀者而言。我相信軟件維護中99%的問題都是由于最初寫代碼的人沒能準備表述他們的意圖造成的。如果言不達意,文檔就不叫文檔。如果言不達意,UML圖就不是UML圖。如果無法描述某種數據型適用于哪些操作符的話,面向對象編程就不是面向對象編程。言而達意不是指C風格的ModifyWindowEx(HWND wnd)不易讀而Window.modify()告訴了你和編譯器這個window可以和不可以做什么。關鍵是要表明你的意圖。

Fortran如今已大大落后,因為它用下面這種方式描述一個算式:

MOV AX, $5D
ADD AX, $6F
MOV $7F, AX

其實完全可以寫成這樣:

c = a + b

如此你就知道是a加上b,結果存到c,即便你不懂計算機也能看懂。

一個常見的誤解是:函數式編程語言表達你要什么(what you want)而命令式編程語言表達你想怎樣(how you want)。

這是一種糟糕的理解。因為有時候“你想怎樣”恰恰是你想表達的意思。

按照我一貫的博文風格,請你問自己一個基本問題,當面臨語言的選擇時:

“我是否把意思說清楚了?”

如果你無法回答這個問題,那么你沒有用最佳語言。如果你不得不寫文檔或者做注釋,這說明你的代碼沒能描述你的意圖。看看這個函數原型:

char* reverseString(const char *foo);

在缺少關于空指針,空字符串以及其他異常處理文檔的幫助下,根本沒法理解作者到底想干什么。這不太好。當然,函數內部可能對輸入做了無數的驗證,但你必須寫一堆針對各種特定輸入的單元測試以確保你的假設是正確的。

我所指的“把意思說清楚”是什么意思呢?假設C++在原型中支持以下虛擬語法:

char* @Nullable reverseString(@NonNullable const char *foo);

函數原型中加上這些注解有兩個好處:

1. 你不需要事先測試foo是不是null。編譯器保證會給你一個非null。

2. 明確地告訴調用者你不容忍null。這種表述方式編譯器能夠明白,優秀的靜態分析工具可以檢測到這類bug,這是C語言做不到的。

雖然這看起來只不過是增強了一下語法,實際不僅如此,它還增強了語義。如此不論是人或是機器就明白foo這個變量不可為null,否則函數很生氣,后果很嚴重。而且,你給這個函數劃定了界限,再不用擔心foo可否為null了。

函數式編程并不是萬金油:

大家對我的另外一個常見誤解是我推崇純函數式語言。我的確有理由喜歡它們。看到上面那個式子了嗎?

c = a + b

如果我想把expr1和expr2的值相加該如何表達呢?

c = (expr1) + (expr2)

如果expr1有附加操作而且會影響expr2的值又該如何表達呢?這并不罕見:

c = (a++) + (a + b);

這里的問題不是你想的那樣。我知道你在想什么:“天知道這門語言會如何解釋這個式子。萬一計算的順序反了怎么辦?”

你想錯了。正是由于人們會產生那樣的想法,編程語言才會有這樣的特點。要解答你的疑問很簡單,看看編譯手冊就知道了。

上面式子的根本問題是我無法知道那樣的計算順序是偶然的還是有意的。我確切地知道上面式子的會做什么,但我無法確定的是,它的計算順序是不是有意的?我能不能優化那個式子,放到一個循環里去?我能不能在多核多線程的情況下調用它?假設有人問我,如果給z賦值10而不是20,會不會影響c的值,我無法回答。

理論上是無法回答上面那個問題的。當然了我們可以根據經驗做加一些斷言(assertion)。在斷言出了一堆或者一個警告后,理性地說,我們仍然不知道z會不會影響a或者b,最終影響到c。

為什么這很重要

代碼的可維護性是建立在代碼的可閱讀性的基礎上的。你知道為什么CSS不好嗎?如果僅僅是程序員寫錯了或者設計者把字體和布局規則混淆了,地球人都知道那還不算太壞。CSS壞就壞在如果不加上大量的注釋,人們就無法通過字面上的意思來理解代碼的意圖。

別忘了基于規則的聲明式語言并不是新概念,更不是革命。50年前Prolog就提供了類似CSS的聲明方式。今天的Erlang也提供了這類方式,并在業界得到廣泛應用。

請看下面這行代碼:

div .title #subtitle {color: blue}

如果不加載試一下的話,我敢打賭你完全想不到這會對頁面產生怎樣的效果。字面上完全看不出跟其它規則的關系,也看不出它如何處理匹配沖突。

因此對于汝等Ruby/Python/Node.js程序員而言,我的建議是,如果你真想超凡脫俗的話,學學谷歌和Facebook。他們使用一些實驗性技術,并不是為了取代for-loops,而是用來表明for-loops的意圖。快速原型的話選擇簡單的語言就可以了,當需要準確描述意圖的時候才考慮更換編程語言。

命令式語言的必要性:

最后,我想解釋一下為什么命令式語言是必要的。看看下面這個驅動程序例子:

setlpt1(00000000b);setlpt1(00010000b);setlpt1(00000000b);

這是我假想的串口命令協議。這幾行代碼是按照先后順序排列的。哪怕200年以后,它們的意圖也不會發生什么變化。必要的時候使用命令型語言,明確地告訴讀者不要打亂這些代碼。你不應該改變它們的順序。你也不會把他們用在某些抽象的端口上,它們只適用于串口或者所謂打印機口。

用函數式語言來實現上面的功能,并且加上同步原語來保證它們按照順序運行,是愚蠢的。

結論:

如果說這篇文章有一點點值得總結的東西的話,那便是:下次你寫任何代碼/規范/程序的時候,問問自己,意圖是否清楚表達?未來的維護者看到你寫的東西,是否能明白它


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/447351.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/447351.shtml
英文地址,請注明出處:http://en.pswp.cn/news/447351.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

細數開源歷史上的十個重大事件

開放源碼(開源)的精神在于使用者可以使用、復制、散布、研究和改進軟件。這可以追溯到20世紀60年代,至今已有半個世紀了。雖然下面所列舉的不都是專門的開源產品,但還是在開源發展的進程中有著巨大的影響。開放源碼(開…

科研必備學士搜索引擎推薦

綜合性學術搜索引擎 中國知網萬方數據百度學術谷歌學術谷歌學術鏡像Web of ScienceEiVillage2EIsevier電子期刊SpringerSemanticScholar 圖片文獻檢索方法 CNKI 期刊查詢 DOAJSocolarOpenDOAROALIB開放存取圖書館 碩博論文搜索下載 上海交大鏡像網站歐洲學位論文庫 國外電子…

如何寫一篇論文

文獻綜述的地位 體現了學術研究的繼承性 文獻綜述的寫作是由學術研究的繼承性決定的,因為繼承是創新的基礎和前提。文獻綜述部分要澄清所研究問題“從哪里來,到哪里去” 。這部分主要是繼承,是梳理前人的成果并找出其內在的邏輯關系和演進的規…

深度卷積神經網絡CNNs的多GPU并行框架及其應用

摘要:本文是騰訊深度學習系列文章之一,主要聚焦于騰訊深度學習平臺(Tencent Deep Learning Platform)中深度卷積神經網絡Deep CNNs的多GPU模型并行和數據并行框架。 【編者按】深度卷積神經網絡有著廣泛的應用場景,本…

如果誤刪谷歌瀏覽器的書簽,怎么恢復

如果是Mac用戶,command和z一直恢復就可以 同理,windows用戶,也可以使用撤銷鍵,ctrlz即可

55分鐘學會正則表達式

正則表達式是一種查找以及字符串替換操作。正則表達式在文本編輯器中廣泛使用,比如正則表達式被用于: 檢查文本中是否含有指定的特征詞找出文中匹配特征詞的位置從文本中提取信息,比如:字符串的子串修改文本 與文本編輯器相似&a…

線程安全和對應的核心概念

線程安全 線程安全的概念:當多個線程訪問某一個類(對象和方法)時,這個類始終都能表現出正確的行為,那么這個類(對象或者方法)就是線程安全的synchronized:可以在任意對象及方法上加…

JDK Unsafe類的使用與CAS原子特性

JDK Unsafe類的使用與CAS原子特性 Java.util.concurrent.atomic包,其中包含了大量使用到Unsafe這個類Java不能直接訪問操作系統的底層,而是通過本地方法來訪問。 Unsafe類提供了硬件級別的原子操作,主要提供了以下功能 內存操作字段的定位和…

寫軟件不是造汽車

寫軟件和做其他事情是不一樣的。當我們制造別的東西的時候——像汽車、玩具、椅子、畫作、甚至包括數字產品如平面圖片和3D模型——我們做出來的成品就是最終的結果。而開發軟件則不是,我們做出來的產品永遠不可能有最終的結果——我們需要向計算機解釋如何根據任意…

線程池核心概述

線程池核心概述 Executors工廠類使用 Executors工廠類底層源碼分析詳解 ThreadPoolExecutor自定義線程池 ThreadPoolExecutor拒絕策略詳解 計算機密集型與IO密集型詳解 如何正確的使用線程池…

網站盈利的10種方式

如果你有自己的網站,而且已經有了不少的流量,你肯定會開始考慮如何通過這個網站來掙一些錢。 在這篇文章中,我會向大家介紹網站最常見的10種盈利方式。 1.按點擊付費廣告 在網站上展示一個按點擊付費的廣告橫幅是最簡單的盈利方式&#xff…

程序員如何創業?

摘要:工作機會減少,讀大學也不是保障。大公司亦不再是構筑職業生涯的安全港灣。透過媒體的鏡頭,創業似乎成了沙漠中唯一的綠洲。然而關于創業,或許少有人給你建議,這里所列出的一些因素都是你可以考慮的。 如果你的年…

Redis數據的類型

Redis一共分為五種基本數據類型:String、Hash、List、Set、Zset. string 內部編碼有三種,raw,embstr,int String 是二進制的。可以存儲序列化對象,圖片,字符串,數值等 set和get方法 &#x…

Redis高級命令與特性以及單點模式的介紹

高級命令 keys * 返回滿足條件的所有key,可以模糊匹配exists 是否存在指定的keypersist 取消過期時間select 選擇數據庫 (0-15,總共16個數據庫)move key index 將當前數據庫的 key 移動到給定的數據庫 db 當中randomkey 隨機返回…

華為副總裁徐家駿離職:年薪千萬工作感悟十二條

從普通的公司職員,到年薪千萬的華為副總裁,再到離開華為轉戰百度,徐家駿的十年從業經歷和經驗可資借鑒,我們從中也可以一窺華為的運作過程。徐家駿是華為數據中心的頭,技術超級牛人,一級部門總監&#xff0…

Redis持久化之RDB和AOF

Redis持久化之RDB和AOF Redis 有兩種持久化方案,RDB (Redis DataBase)和 AOF (Append Only File); RDB 詳解 RDB 是 Redis 默認的持久化方案。在指定的時間間隔內,執行指定次數的寫操作&#…

同為程序員 為什么我的工資最低

我看著工資單上每一個開發團隊成員的薪水,慢慢地我不能保持淡定了。 而當我看到我的工資排名是倒數的時候——靠近最后一名——我不由得倒抽一口冷氣。就像圣誕故事中的那個可愛的小男孩Ralphie ,想買氣槍卻被忽悠會有危險一樣,我也不斷忽悠…

Docker安裝Redis以及配置Redis環境

1,下載Redis鏡像 首先拉取 Redis 鏡像, 這里我選擇的是 redis:alpine 輕量級鏡像版本 docker pull redis:alpine 下載完成后,通過 docker images 查看我們已經下載的鏡像,看看是否已經下載到本地 2,運行 Redis 容器 docker run …

.NET程序性能的基本要領

摘要:本文分享了性能優化的一些建議和思考,比如不要過早優化、好工具很重要、性能的關鍵,在于內存分配等。開發者不要盲目的沒有根據的優化,首先定位和查找到造成產生性能問題的原因點最重要。 【編者按】Bill Chiles&#xff08…

redis.conf配置文件詳解

基本配置 daemonize no #是否以后臺進程啟動databases 16 #創建database的數量(默認選中的是database 0)save 900 1 #刷新快照到硬盤中,必須滿足兩者要求才會觸發,即900秒之后至少1個關鍵字發生變化save 300 10 #必須是300秒之后至少10個關鍵字發生變…