淺析C語言中的數組及字符數組

2020-01-26 14:48:49

字體：大中小

來源：轉載

供稿：網友

我們來編寫一個程序，以統計各個數字、空白符（包括空格符、制表符及換行符）以及所有其它字符出現的次數。這個程序的實用意義并不大，但我們可以通過該程序討論 C 語言多方面的問題。

所有的輸入字符可以分成 12 類，因此可以用一個數組存放各個數字出現的次數，這樣比使用 10 個獨立的變量更方便。下面是該程序的一種版本：

#include <stdio.h>/* count digits, white space, others */main(){ int c, i, nwhite, nother; int ndigit[10]; nwhite = nother = 0; for (i = 0; i < 10; ++i) ndigit[i] = 0; while ((c = getchar()) != EOF) if (c >= '0' && c <= '9')  ++ndigit[c-'0']; else if (c == ' ' || c == '/n' || c == '/t')  ++nwhite; else  ++nother; printf("digits ="); for (i = 0; i < 10; ++i)  printf(" %d", ndigit[i]); printf(", white space = %d, other = %d/n", nwhite, nother);}

當把這段程序本身作為輸入時，輸出結果為： digits = 9 3 0 0 0 0 0 0 0 1, white space = 123, other = 345

該程序中的聲明語句 int ndigit[10] 將變量 ndigit 聲明為由 10 個整型數構成的數組。在 C 語言中，數組下標總是從 0 開始，因此該數組的 10 個元素分別為 ndigit[0]、ndiglt[1]、…、ndigit[9]，這可以通過初始化和打印數組的兩個 for 循環語句反映出來。

數組下標可以是任何整型表達式，包括整型變量（如 i）以及整型常量。

該程序的執行取決于數字的字符表示屬性。例如，測試語句 if (c >= '0' && c <= '9') 用于判斷 c 中的字符是否為數字。如果它是數字，那么該數字對應的數值是 c- '0' 。只有當'0'、'1'、…、'9'具有連續遞增的值時，這種做法才可行。幸運的是，所有的字符集都是這樣的。

由定義可知，char 類型的字符是小整型，因此 char 類型的變量和常量在算術表達式中等價于 int 類型的變量和常量。這樣做既自然又方便，例如，c - '0'是一個整型表達式，如果存儲在 c 中的字符是'0'～'9'，其值將為 0～9，因此可以充當數組 ndigit 的合法下標。

判斷一個字符是數字、空白符還是其它字符的功能可以由下列語句序列完成：

if (c >= '0' && c <= '9') ++ndigit[c-'0'];else if (c == ' ' || c == '/n' || c == '/t') ++nwhite;else ++nother;

程序中經常使用下列方式表示多路判定：
if (條件 1)
語句 1
else if (條件 1)
語句 2
...
...
else
語句 n
在這種方式中，各條件從前往后依次求值，直到滿足某個條件，然后執行對應的語句部分。這部分語句執行完成后，整個語句體執行結束（其中的任何語句都可以是括在花括號中的若干條語句）。如果所有條件都不滿足，則執行位于最后一個 else 之后的語句（如果有的話）。類似于前面的單詞計數程序，如果沒有最后一個 else 及對應的語句，該語句體將不執行任何動作。在第一個 if 與最后一個 else 之間可以有 0 個或多個下列形式的語句序列：
else if (條件)
語句
就程序設計風格而言，我們建議讀者采用上面所示的縮進格式以體現該結構的層次關系，否則，如果每個 if 都比前一個 else 向里縮進一些距離，那么較長的判定序列就可能超出頁面的右邊界。

字符數組
字符數組是 C 語言中最常用的數組類型。下面我們通過編寫一個程序，來說明字符數組以及操作字符數組的函數的用法。該程序讀入一組文本行，并把最長的文本行打印出來。該算法的基本框架非常簡單：
while (還有未處理的行)
if (該行比已處理的最長行還要長)
保存該行為最長行
保存該行的長度
打印最長的行
從上面的框架中很容易看出，程序很自然地分成了若干片斷，分別用于讀入新行、測試讀入的行、保存該行，其余部分則控制這一過程。

因為這種劃分方式比較合理，所以可以按照這種方式編寫程序。首先，我們編寫一個獨立的函數 getline，它讀取輸入的下一行。我們盡量保持該函數在其它場臺也有用。至少 getline 函數應該在讀到文件末尾時返回一個信號；更為有用的設計是它能夠在讀入文本行時返回該行的長度，而在遇到文件結束符時返回 0。由于 0 不是有效的行長度，因此可以作為標志文件結束的返回值。每一行至少包括一個字符，只包含換行符的行，其長度為 1。

當發現某個新讀入的行比以前讀入的最長行還要長時，就需要把該行保存起來。也就是說，我們需要用另一個函數 copy 把新行復制到一個安全的位置。

最后，我們需要在主函數 main 中控制 getline 和 copy 這兩個函數。以下便是我們編寫的程序：

#include <stdio.h>#define MAXLINE 1000 /* maximum input line length */int getline(char line[], int maxline);void copy(char to[], char from[]);/* print the longest input line */main(){ int len; int max; /* current line length */ /* maximum length seen so far */ char line[MAXLINE]; /* current input line */ char longest[MAXLINE]; /* longest line saved here */ max = 0; while ((len = getline(line, MAXLINE)) > 0) if (len > max) { max = len; copy(longest, line); } if (max > 0) /* there was a line */ printf("%s", longest); return 0;}/* getline: read a line into s, return length */int getline(char s[],int lim){ int c, i; for (i=0; i < lim-1 && (c=getchar())!=EOF && c!='/n'; ++i) s[i] = c; if (c == '/n') { s[i] = c; ++i; } s[i] = '/0'; return i;}/* copy: copy 'from' into 'to'; assume to is big enough */void copy(char to[], char from[]){ int i; i = 0; while ((to[i] = from[i]) != '/0') ++i;}</stdio.h>

程序的開始對 getline 和 copy 這兩個函數進行了聲明，這里假定它們都存放在同一個文件中。

main 與 getline 之間通過一對參數及一個返回值進行數據交換。在 getline 函數中，兩個參數是通過程序行。

int getline(char s[], int lim)

聲明的，它把第一個參數 s 聲明為數組，把第二個參數 lim 聲明為整型，聲明中提供數組大小的目的是留出存儲空間。在 getline 函數中沒有必要指明數組 s 的長度，這是因為該數組的大小是在 main 函數中設置的。如同 power 函數一樣，getline 函數使用了一個 return語句將值返回給其調用者。上述程序行也聲明了 getline 數的返回值類型為 int。由于函數的默認返回值類型為 int，因此這里的 int 可以省略。

有些函數返回有用的值，而有些函數（如 copy）僅用于執行一些動作，并不返回值。copy 函數的返回值類型為 void，它顯式說明該函數不返回任何值。

getline 函數把字符'/0'（即空字符，其值為 0）插入到它創建的數組的末尾，以標記字符串的結束。這一約定已被 C 語言采用：當在 C 語言程序中出現類似于

"hello/0"

的字符串常量時，它將以字符數組的形式存儲，數組的各元素分別存儲字符串的各個字符，并以'/0'標志字符串的結束。

printf 函數中的格式規范%s 規定，對應的參數必須是以這種形式表示的字符串。copy 函數的實現正是依賴于輸入參數由'/0'結束這一事實，它將'/0'拷貝到輸出參數中。也就是說，空字符'/0'不是普通文本的一部分。

值得一提的是，即使是上述這樣很小的程序，在傳遞參數時也會遇到一些麻煩的設計問題。例如，當讀入的行長度大于允許的最大值時，main 函數應該如何處理，getline 函數的執行是安全的，無論是否到達換行符字符，當數組滿時它將停止讀字符。main 函數可以通過測試行的長度以及檢查返回的最后一個字符來判定當前行是否太長，然后再根據具體的情況處理。為了簡化程序，我們在這里不考慮這個問題。

調用 getline 函數的程序無法預先知道輸入行的長度，因此 getline 函數需要檢查是否溢出。另一方面，調用 copy 函數的程序知道（也可以找出）字符串的長度，因此該函數不需要進行錯誤檢查。

上一篇：C語言編程中函數的基本學習教程

下一篇：快速學習C語言中for循環語句的基本使用方法