前言
前不久遇到一個問題,是公司早期的基礎庫遇到的,其實很低級,但是還是記錄下來。出錯點是一個 IO 流的寫入bug,我們項目會有一種專有的數據格式,這個格式的奇葩點在于如果設置 IO 讀緩沖區為 2014 字節的時候,整個文件剛好能讀完,也就是說其 length 剛好是 1024 的倍數。后來在一次升級中增加了更多的文件格式,并且新的文件格式使用了新的自定義寫入流,具有加密和壓縮的作用,這樣一來,文件的長度就不一定是 1024 的倍數了。
后來通過查看這個基礎類的源代碼發現因為是 .NET 2.0 時代的東西,也沒有 Stream.Copy 的方法,于是當時的程序員手動寫了個 Stream.Copy 的方法,我稍作改動為了更直觀將輸出流改為輸出到文件,代碼大概如下:
var fs_in = System.IO.File.OpenRead(@"C:/3.0.6.apk");var fs_out = System.IO.File.OpenWrite(@"C:/3.0.6.apk.copy");byte[] buffer = new byte[1024];while (fs_in.Read(buffer,0,buffer.Length)>0){ fs_out.Write(buffer, 0, buffer.Length);}Console.WriteLine("復制完成");
所以一眼就能看出這個方法簡直有天大的 bug ,假設文件長度不為 1024 的倍數,永遠會在文件尾部多補充上一段的冗余數據。
這里整整多出了 878 字節的數據,導致整個文件都不對了,明顯是基礎知識都沒學好。
增加一個變量保存實際讀取到的字節數,改為如下:
var fs_in = System.IO.File.OpenRead(@"C:/迅雷下載/3.0.6.apk");var fs_out = System.IO.File.OpenWrite(@"C:/迅雷下載/3.0.6.apk.copy");byte[] buffer = new byte[1024];int readBytes = 0;while ((readBytes= fs_in.Read(buffer, 0, buffer.Length)) >0){ fs_out.Write(buffer, 0, readBytes);}Console.WriteLine("復制完成");
對于處理大型文件,一般都有進度指示,比如處理壓縮了百分多少之類的,這里我們也可以加上,比如專門寫一個方法用于文件讀取并返回 byte[] 和百分比。
static void ReadFile(string filename,int bufferLength, Action<byte[],int> callback){ if (!System.IO.File.Exists(filename)) return; if (callback == null) return; System.IO.FileInfo finfo = new System.IO.FileInfo(filename); long fileLength = finfo.Length; long totalReadBytes = 0; var fs_in = System.IO.File.OpenRead(filename); byte[] buffer = new byte[bufferLength]; int readBytes = 0; while ((readBytes = fs_in.Read(buffer, 0, buffer.Length)) > 0) { byte[] data = new byte[readBytes]; Array.Copy(buffer, data, readBytes); totalReadBytes += readBytes; int percent = (int)((totalReadBytes / (double)fileLength) * 100); callback(data, percent); }}
調用就很簡單了:
static void Main(string[] args){ string filename = @"C:/3.0.6.apk"; var fs_in = System.IO.File.OpenRead(filename); long ttc = 0; ReadFile(filename, 1024, (byte[] data, int percent) => { ttc += data.Length; Console.SetCursorPosition(0, 0); Console.Write(percent+"%"); }); Console.WriteLine("len:"+ttc); Console.ReadKey();}
這是基于文件讀取的,稍微改一下就可以改成輸入流輸出流的,這里就不貼出來了。文件讀寫非常耗時,特別是大文件,IO 和 網絡請求都是 “重操作”,所以建議大家 IO 都放在單獨的線程去執行。C# 中可以使用 Task、Thread、如果同時有多個線程需要執行就用 ThreadPool 或 Task,Java 或 Android 中用 Thread 或線程池,以及非常流行的 RxJava 等等 ...
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對VEVB武林網的支持。
新聞熱點
疑難解答