《人人做得到的網路資料整理術》寫在文末

資料分析有兩個層面:先取得相關資料、後進行有意義的分析。一方面取得網頁資料的技術大部份人比較不熟悉,另方面資料處理是一般Excel書籍的重點,因此這本書會側重於藉助Excel VBA取得網站資料,第一章到第六章介紹某特定類型的網站如何獲取資料,到了第七章和第八章是綜合運用,總承前面幾章所學技巧,批次取得所需要的完整資料,接著進行有意義分析,依照情況還可以透過Outlook發送結果,所以七八章不但是補充前面章節不足的部分,同時也是就全書內容做個總復習。

針對這本書的VBA技術三點補充:

首先,從做中學永遠是最快的!贊贊小屋無論是Excel或者VBA,皆緊密與實際應用相結合,作為講解說明的出發點。「首張同名專輯」《會計人的Excel小教室》票房口碑不錯,感謝各位讀者捧場,其獨門特色便是以會計實務個案為核心,介紹工作上最常用函數指令,到了《會計人的Excel VBA小教室》,雖然有一半是關於VBA介紹,但一來篇幅有限,二來會計非得用到VBA的情況不多,所以 《會計人的Excel VBA小教室》最多僅能讓讀者對於VBA有基礎概念,操作一些簡單範例,算是初學者的簡單入門。

如今到了贊贊小屋第三本書:《Excel VBA大數據分析》,主要內容為如何取得網頁資料,技術上以VBA來說至少是進階水平,各個網站的狀況架構不一樣,可能需要不同類型的程式代碼處理,書裡面各個章節的VBA範例非常多,有心研讀完這本書,每個範例程式如果都能夠融會貫通,可以算是VBA達人中級了。

第二點,VBA和Excel應當是相輔相成。學習VBA容易陷入一種執著,苦心鑽研VBA技術,力求讓後台的程式代碼全面取代前台的Excel操作、達到全面自動化境界。這個技術上可行,VBA正是把所有Excel操作以程式方式編寫成指令,其強項微軟官網寫的很清楚:一方面把好幾個重複步驟合在一起,寫成像是一鍵懶人包,方便相同對象再次執行一二三步驟;另一方面,就有規則可循的不同Excel對象,也可以一個一個分別執行類似的多步驟操作。

至於VBA弱點,和它的強項正是一體兩面,Excel本來是應用軟體,所有操作於本質上即為電腦程式,所以一定能以代碼形式呈現,不過隨之而來是較高的學習門檻。

個人電腦發展史一路從Dos進化到Windows,不正是從程式代碼轉換成圖像按鈕,才能如此普及深化。一般人熟悉了Excel快捷便利的前台操作,一下子要跳到後台寫程式讓Excel動起來,可想而知會遇到諸多困難。贊贊小屋學習和出書的歷程和大家一樣,都是先熟悉Excel再進階到VBA,兩者並行不悖,在本書的許多範例,Excel和VBA都是相輔相成,需要的時候一定要VBA,但也不至於什麼都是VBA,很多情況直接操作Excel才是王道,這一點過來人經驗,提供有心讀者參考。

第三點,既然是取得網頁資料,對於網頁技術必然須具備基本瞭解,如同書本所示,ExcelVBA有兩種方法取得網頁資料:Query.table和Application.object。其中 Query.table可設置取得整個網頁或網頁中表格,如此有兩種極端情形,倘若想要資料在網頁已經以表格形式寫好了,取資料時相當方便,直接下來便是所需資料,而且是Excel表格形式。然而,假使網頁沒有表格、或者目標並非表格形式,事情變得棘手,勢必要下載整個網頁,然後運用種種Excel技巧,將相關資料擷取出來。

另一個VBA取得網頁的方法為Application建立物件,它比較靈活,是透過Excel開啟IE瀏覽器,用純粹瀏覽器方式抓取網頁資料,最好對於網頁技術有基礎瞭解,瞭解遠端伺服器以什麼格式傳送資料給瀏覽器,至少關鍵的HTML DOM結構模型下點功夫,便能很精準設計VBA程式代碼,告訴IE瀏覽器抓取哪一個網頁節點的資料,如此Application.object可以做到Query.table不容易完成的任務。

以上三點補充,相信可以給讀完這本書的讀者一些參考借鏡。

本書命名為《Excel VBA大數據分析》,其實所謂大數據是因應如今資訊爆炸的時代,所累積起來的電子資料量,已經大於傳統電腦或軟體足以勝任的情況,企業、政府、科學家必須考慮以更為先進的方法處理資料,其中一個方法將資料化整為零,打散到各個處理器分別運算,最後才將結果集中彙總。以這本書所提到的各類型網頁而言,再怎樣不會達到真正大數據程度,然而所有道理是一貫相通,對於個人而言,工作生活中只要有涉及到資料分析,都可以像大數據分析一樣,平時便將資料以電子形式儲存起來,有需要擷取某部份資料出來,根據需求加以分析,可謂是屬於個人應用層面的大數據,其中如何以Excel VBA的方法完成此任務,便是這本書主要核心內容,如同贊贊小屋一脈相傳的特色,書中所有範例皆源自於實務案例,和實務緊密關連,每個人都有自己特殊的狀況和需求,希望這本書拋磚引玉,幫助讀者進行專屬個人的大數據分析。

再次感謝各位讀者。