C++ 能否成為你新的腳本語言?
一些背景
***個我真正喜愛的編程語言是 C。我花了不少時間才找到它:當我還是一個孩子,我就開始在珍貴的ZX Spectrum上使用 Z80 匯編。那些日子是你能夠真正掌握你的電腦的時候,你不需要蘋果,谷歌,微軟或者其他任何人的允許就能寫一個程序。我在漂亮的128K ZX Spectrum +2上學習了在超出 CPU 尋址空間時對內存塊分頁。直到我進入大學,我才擁有一臺 IBM PC 機 。我玩遍了電子表格,試圖修復現存的 Fortran 程序,用土耳其字符給鍵盤驅動打補丁,還學了點 Pascal 語言。之后,在我就職于土耳其中央銀行期間,我又學習了 SQL 和 APL。
我一直對 C 語言有所耳聞,但我一直沒有接觸到一款C語言編譯器。直到我到康奈爾大學擁有了一個Unix 賬號之后,我編譯了我人生中的***個 hello.c 文件,不久之后,我有了***臺電腦……我在 DOS 分區上安裝了 DJGPP 編譯器,構建了我人生中***個 Linux 內核(我***個發行版是 Debian),并且開始學習 C 語言。Plauger 的 “Standard C Library” 是我最喜歡的書。
當我開始享受用 C 編程的時候,C++ 已經廣泛應用超過十年了。所以,我下一步使用 C++ 看起來是很自然的一步了。
除了……好吧,除了 C++ 是一片混亂。那段時間,所有人都被繼承層次深深吸引了,每個人都在編寫精心設計的字符串類。大多數硬盤都太慢,不能再有限的時間內編譯出可靠的 C++ 庫(好吧,我有點夸張了),大部分 CPU 都在試圖實例化模板中融化了,大部分人,那些假裝 C++ 程序員的 C 程序員們,差點就把 malloc 的返回值給扔了。
在那時,我正忙于試圖建立定制化的網絡經濟實驗,看起來 Java 似乎很有優勢。至少,它不需要麻煩地拼湊出一個對話框。產生少量的 socket 連接,并且使你的應用編譯和運行在多種多樣的系統上。當然,AWT 和 Swing 都很丑陋且笨重,但對我的目的來說,那沒關系。
但是,僅僅是因為不能在實驗室之外運行我的實驗(因為在實驗室已經配置了所有電腦,java應用程序運行不會有問題)。所以我快速的把 FreeBSD部署到了一臺擁有100Mhz奔騰處理器,16Mb內存,在角落里收集灰塵的機器上,并搭建了一個擁有perl模塊(mod_perl)的 Apache服務器,然后就能工作了。那就是我愛上Perl的時候。
那份愛完全起源于實用的原因,我并不是認為Perl特別的***,并且那時候我認為包括其他許多語言都不是很***,他們中的每一個都有自己的瑕疵。
Perl總是能減少我必須解決的特別問題的工作的數量,有些是因為語言特性,但大部分是因為 CPAN。
舉例來說,作為一個 Perl 程序員,解析 HTML 作為 HTML 是一個解決方案。我必須決定,要么就構造整個樹, 或者使用流化的方式。在某些情況下,前者是具有優勢的,但后者的好處是可以使內存的需求降至***,即使是在這個年代,如果你處理 HTML 文檔以兆字節方式還是可以奏效的。不論哪種方式,這些工具都不會在無效的 HTML 上被卡住,并在非 XML 的有效 HTML 上運作良好。
還有,Perl 提供可移植性。如果我不需要操作系統特定的功能,不用任何修改地方,我的 perl 代碼就可以運行。
當我寫了一些類,并為它們做了封裝,也不會有復雜的架構。
C++ 涅槃
在過去的數年,C++如獲新生。許多聰明人已經開始意識到須要向C++程序員提供同時涵蓋 work of the ISO committee和 boost的構建模塊。
在真實環境下,仍然有90%的菜鳥生成C++程序員就是沒有意識到new是一個合法符號的C程序員。在這方面,C++與Perl非常相似:大部分人寫過Perl代碼的人也沒有意識到Perl不是C、Java、Python、shell、Awk或者其他你可以列舉的語言。
但是,當你看到新C++標準中的新東西,以及編譯器不斷實現浙西特性的新聞時,我們無法抑制住內心的興奮和好奇。
單詞計算練習
這是一個簡單的練習,使用 C++ 或者 Perl 并且不依賴外部庫,所以這是一個很好的起點。
這是 Perl 版本,供您參考:
- #!/usr/bin/env perl
- use strict;
- use warnings;
- run(/@ARGV);
- sub run {
- my $argv = shift;
- my @counts;
- for my $file ( @$argv ) {
- my $count = -1;
- eval {
- $count = word_count($file);
- 1;
- } or warn "$@";
- push @counts, {
- file => $file,
- word_count => $count,
- };
- }
- for my $result (@counts) {
- printf "%s: %d words/n", $result->{file}, $result->{word_count};
- }
- }
- sub word_count {
- my $file = shift;
- my %words;
- open my $fh, '<', $file
- or die "Cannot open '$file': $!";
- while (my $line = <$fh>) {
- my @words = split ' ', $line;
- $words{ $_ } += 1 for @words;
- }
- close $fh;
- my $word_count;
- $word_count += $_ for values %words;
- return $word_count;
- }
而且,這是我***的付出在轉化 Perl 到現代風格的 C++ 上面。我沒有嘗試寫特別搞笑的代碼:只是和 Perl 一樣,我把重點放在寫代碼上面,使得我感到非常自然,同時確保兩個程序都做大致相同的事情。
- #include <cerrno>
- #include <cstdio>
- #include <cstdlib>
- #include <fstream>
- #include <iostream>
- #include <numeric>
- #include <unordered_map>
- #include <string>
- #include <vector>
- using std::accumulate;
- using std::cerr;
- using std::cout;
- using std::endl;
- using std::ifstream;
- using std::make_pair;
- using std::pair;
- using std::strerror;
- using std::string;
- using std::unordered_map;
- using std::vector;
- int word_count(const char *const file) noexcept(false);
- int main(int argc, char *argv[]) {
- vector< pair<string, int> > counts {};
- for (auto i = 1; i < argc; i += 1) {
- try {
- counts.push_back(make_pair(argv[i], word_count(argv[i])));
- } catch (const string& e) {
- cerr << e << endl;
- counts.push_back(make_pair(argv[i], -1));
- }
- }
- for (auto& result : counts) {
- cout << result.first << ": " << result.second << " words" << endl;
- }
- return 0;
- }
- int
- word_count(const char *const file) noexcept(false) {
- errno = 0;
- ifstream fp(file);
- {
- // Does fp.fail() preserve errno?
- int save_errno = errno;
- if (fp.fail()) {
- throw("Cannot open '" + string(file) + "': " + strerror(save_errno));
- }
- }
- unordered_map<string, int> word_count {};
- string word;
- while (fp >> word) {
- word_count[word] += 1;
- }
- fp.close();
- return accumulate(
- word_count.cbegin(),
- word_count.cend(),
- 0,
- [](int sum, auto& el) { return sum += el.second; }
- );
- }
20 行代碼用于 #include 和 using 聲明可能看起來有點多,但是我抬眼 using namespace std,也討厭不斷地輸入 std::… 更多的是因為我喜歡較短的代碼行。
首先要注意的是沒有看得見的顯式的內存分配。容器集裝箱管理自己的內存。
第二,這是一個大問題:我們有自動導入(autovivification)!
- unordered_map<string, int> word_count {};
- string word;
- while (fp >> word) {
- word_count[word] += 1;
- }
第三,我們有 lambda 表達式:
- return accumulate(
- word_count.cbegin(),
- word_count.cend(),
- 0,
- [](int sum, auto& el) { return sum += el.second; }
- );
在這背后,accumulate 將內部變量初始化為 0,并調用一個匿名函數,其***一個參數指定為當前值,以及word_count的下一個元素。
現在,我不得不承認,我不知道這些特性是如何實現的,但是 Microsoft Visual C++ 2015 RC 成功運行了,微軟似乎終于趕上了在該領域的***發展。
現在的情況
然而,一切都不樂觀。盡管 boost libraries 填補了許多空白,而且標準庫提供了令人印象深刻的構件,但是也很難戰勝 Perl 和 CPAN 結合帶來的那種編寫可在任何地方***運行的可移植代碼的便利性。
例如,我能找到一個平臺無關的庫,可以讓我在不需要 Excel 的情況下解析或創建 Excel 文件嗎?這個庫能夠用 clang、g++ 和 cl 輕易地編譯出來嗎?好像不太可能。
我真的非常感謝標準委員會的人們的辛勤工作,和那些開發編譯器,眾多庫的人們。它們讓我不必在編寫 C++ 程序時辛苦的思考。
這讓我在真正控制我的計算機時還能感覺舒適。
在這里,我真的非常感謝。
你可以在/r/cpp評論本文。