創作HTML5文字雲的開源社群志工

活躍於自由軟體社群的Mozilla臺灣分公司網路工程師簡冠庭,熱心參與社群活動,並貢獻自身專長

目前任職於Mozilla臺灣分公司的簡冠庭(Timothy),正是最近網路上,相當熱門的HTML5文字雲詞彙分析機作者。該程式有趣的地方,在於它能將匯入的文章,做詞彙的分析,然後依照出現的次數,排列成文字雲圖案,而匯入的來源有多種選擇,例如,RSS、網頁、部落格文章及硬碟內的檔案等。

文字雲程式背後其實有一個小故事,簡冠庭說,由於在大學時便參與了Firefox中文化的工作,而在翻譯的過程中,會出現大量的中文詞彙,例如開啟、關閉、確定等。而為了要驗證這些詞彙有沒有打錯,便用了JavaScript設計出一個統計的演算法,他先將相同的詞彙歸類,再依照出現的次數排序,然後檢查這些整理過的資料中有沒有錯字。

他說這只是當時的一個計畫,最後卻無疾而終,原因則是在Firefox上還真找不出什麼錯誤。後來,由於新推出的HTML5,增加了許多網頁製作的新功能,於是,簡冠庭就有了一個想法:既然有了詞彙分析演算法的程式,可以將任意文章裡的詞彙搜尋出來,那有沒有什麼方法,讓這些文字用很酷的方式呈現。

於是他便利用了HTML5裡的canvas功能,開發出文章詞彙分析機,方法是先使用詞彙分析程式,將分析出來的文字,畫出2個字,再重讀一遍裡面的內容,然後尋找網頁上有沒有空隙,再畫出2個字。如此不斷的循環,直到網頁被文字填滿。而文字雲會這麼受歡迎,他表示滿意外的,但也享受這種感覺。

從接觸Firefox開始進入社群,進而認同自由軟體理念
簡冠庭說,會參與Firefox中文化,要從國中說起,在1998年時有FrontPage等網頁製作軟體,寫網頁算是相當容易,他便與一群好友開始玩起網頁設計。而當其他人轉而去做別的事時,他還是繼續研究相關技術。他說,當時幾乎所有的人都在使用IE瀏覽器,後來出現Firefox時,因為對於網頁設計的興趣,簡冠庭也開始注意到它,從而接觸Mozilla臺灣社群。

在2009年當他還就讀大學時,因為該社群負責中文化工作的人要去當兵,簡冠庭便毛遂自薦,從此成為Mozilla社群的核心人物之一。他說,由於這樣的緣故,他漸漸認同自由軟體的價值。他舉了一個例子,當初因為IE在瀏覽器的市場上沒有競爭對手,反而使網路技術停滯不前,這樣的情形持續了好幾年,直到Firefox的出現,打破了這個局面。

因為有了競爭,所以各家瀏覽器,必須不斷研發新技術,以吸引使用者,最後的結果,便是如今瀏覽器的蓬勃發展,當然收益最大的還是我們自己。另外,他也認為開放原始碼是有其必要性的,透過所有開發者的共同參與,才是網路技術向前推進的力量。

由於認同這樣的理念,因此只要是自由軟體社群的活動,他都盡量的幫忙,像是2011年開源人年會的官網設計,他就參與其中。他說,在這些活動的過程中,看到許多跟他一樣,為了相同理念而付出心力的人,非常感動。

撰寫部落格文章,主要的目的在記錄自己學習的過程