close

Google日前推出了一個新的【線上翻譯平台】- Google Translator Toolkit (http://translate.google.com/toolkit)。你可能會覺得奇怪,Google不是之前就有【翻譯】的服務了嗎?這個新推出的服務功能更多,它可以允許你在線上直接編輯翻譯好的文件,並且整合了【群眾智慧(Wisdom of Crouds)】的概念,讓世界上所有人幫助你翻譯這份文件,只要投入此平台的人越多,照道理翻譯的品質就會越來越好。讓我們來看看這個新服務的好玩之處在哪裡吧!


根據Google官方Blog所描述,Google Translator Toolkit是一個【簡單易用的線上翻譯平台】。首先可以連到服務首頁,第一次會需要輸入一些個人資訊:



輸入完畢後就會看到Google Translator Toolkit的服務平台:

Google Translator Toolkit有幾個特點:
  • 支援文字檔案、網頁、wikipedia和knol的輸入格式。
  • 允許使用者儲存編輯結果。
  • 使用【翻譯記憶(Translation Memory)】來改進翻譯品質。
說了這麼多我們先來看看怎麼使用吧!

首先,你可以看平台上方有一個【Upload】的按鈕:


點下去之後會發現Google Translator Toolkitt所支援的Input格式,有一般文件、網頁、Wikipedia和Knol(基本上除了一般文件之外,其他都是要提供一個網頁的URL):


這裡我們以wikipedia的文章為例子,假設我們想要翻譯Google條目,就選擇【Wikipedia Article】,並且選擇名稱和要翻譯成什麼語言:



按下【Upload for Translation】按鈕之後,等待一會兒就會把翻譯結果呈現出來:



這個就是Google Translator Toolkit的主要翻譯較正平台了!左邊是原始文章,右邊則是譯文。在原文或譯文上點選任何一段文字都會以黃色區塊顯示出目前正在編輯的區塊(Segments),如果你覺得翻譯的不好,你可以直接在右邊的譯文區塊做編輯:


這個平台最重要的功能就是有一些工具(Toolkit)可以使用,想要看看這些功能,可以點選左上方的【Show Toolkit】按鈕,下方就會跑出對應的工具區塊:




Toolkit包括四大類:
  • Translation Search Result:這個部份就是指【Translation Memory】。Google Translator Toolkit會去尋找過去是否有人也翻譯過這一個句子,或是有相似的翻譯句。如果有找到就會在這裡推薦出來,如果你覺得電腦的翻譯品質不佳,不妨碰碰運氣看看有沒有人先前翻譯過類似的句子:


你也可以嘗試自己修正翻譯結果,像我這裡把譯文的【Google】改成【谷歌】,Google Translator Toolkit就會把我的翻譯結果放到Translation Search Results當中,未來有人點選Google這個英文,我的翻譯結果就會被推薦出來:


  • Conputer Translation:這裡指的就是Google幫你翻譯的結果,也就是電腦翻的啦!如果你認為人類翻譯的不好、或是根本沒有人之前翻譯過這一個句子,不妨試試看電腦翻的吧!有時候品質也在可以接受的範圍內:

  • Glossary:
Glossary指的是一些特定的詞彙,假設你想要翻譯的是很專業的技術文件或是某個領域的文章,可能有一些用語是固定的,你可以在這邊尋找有沒有相關的詞彙可以使用。不過可能是這個服務還太新了,抑或是中文使用者還很少,所以大多情況下我是找不到相關的詞彙可以使用。

不過也不用灰心,Glossary檔案是可以自己製作的!你在一開始的平台上可以選擇【Glossaries】,選擇【Add】:

上傳Glossary必須是csv檔案格式,根據Google Translate Toolkit官方說明文件,格式如下所示:

根據我的經驗,用Google Docs來編輯是最不容易出問題的XD:

  • Dictionary:提供即時的線上字典可以做查詢單字的動作:

如果有興趣的人也不妨看看在youtube上的介紹(http://www.youtube.com/watch?v=C7W2NJFdoIg),應該會對Google Translator Toolkit有更多了解:


Google Translator Toolkit提供了一個協同工作的平台,你也可以邀請其他人一同編輯,共同完成一份文件。並且利用到了【群眾智慧】,讓全世界的人幫助你把翻譯的品質變得越來越好。利用不斷不斷的協同翻譯,Google也可以從這些龐大的語料庫中擷取出更多有用的資料,透過這些資料,機器可以從更多的樣本中去學習人類語言的模式,改善機器翻譯品質。


 

Google做出了一套翻譯輔助系統(通常叫做「CAT」工具,Computer Aided/Assisted Translation),功能類似大型專業翻譯公司常用的Trados、或是我使用的Wordfast。根據Google中國網站的說明(內容經過我轉換並小幅編輯):
谷歌翻譯輔助系統是一個看似簡單而實際上功能很強大的翻譯平台。它支持從英文到其他50多種語言的翻譯,覆蓋超過98%的全球互聯網人口。它整合了谷歌翻譯,WYSIWYG(所見即所得)編輯器、開放的評定系統、分享系統、維基百科以及 Knol。它同時支持一些常見的文件類型,包括 Word 和 HTML 格式。對於專業翻譯人員,該系統還提供了翻譯記憶庫、術語和詞彙表的上載復用機制。

也就是說,Google開發了英文叫做「Google Translator Toolkit」(以下簡稱GTT)的這套工具讓譯者免費使用、並且搬到網站上,而不像過去必須在安裝這類軟體的電腦上使用,並且依賴特定作業系統或程式語言。

以我自己而言,工作上無法擺脫Windows的原因之一,就是必須在部份專案中使用作為Microsoft Word外掛模組的Wordfast;雖然今年Wordfast出了以Java語言撰寫的跨平台版本,但並不比舊版好用、執行速度也慢,所以我還是按兵不動。

所以我在家中、工作室、以及隨身攜帶的電腦上,都必須各授權一套Wordfast,並且必須操心翻譯內容資料庫(translation memory,簡稱TM)在各部電腦之間的同步問題。如果有一套Web-based的這類工具、功能足敷需求、又不必大幅改變工作習慣,只要能上網就可以使用,那就是天大的好消息了。
當然,Google不是一家做慈善事業的公司,提供這麼好用(現在還不能確定啦)的工具當然有它的目的,只要設計上能夠利己利人,當然可以抬出「促進人類文明進步」的大帽子來壓。

我在看完
Google Blogoscoped的報導之前,大概就猜到了Google的用意。從這篇報導中的敘述來看,GTT的功能跟上述的CAT系統幾乎完全一樣:
  • 將翻譯過的語文對照存入TM;
  • 以後翻譯到完全相同、或是類似內容時,GTT就會從TM中找出對應內容。如果完全相同,就可以直接使用,不僅省去再次翻譯的時間、而且可以確保一致性;如果是部份相同,則以「fuzzy match」方式比對出最接近的對應內容,讓譯者只要修改就可以使用;
  • 在以團隊方式進行翻譯工作時,TM可以透過網路共享,讓工作人員省時省力,加快計畫的完成時間、並且同樣確保一致性。

這類工具在翻譯手冊、型錄、產品說明之類,修辭變化比較單純、內容同質性高、而且相同段落或詞條可能一再重複的專案時,可以省下非常多的時間,但如果是翻譯文學作品、或是其他故事性比較強的文字時,用處就比較不明顯。

報導中指出Google從2007年起,就自己開發並使用了這項工具;在經過兩年左右、並且實際運用在多項產品專案之後,功能和穩定度方面應該都已經到達一定水準。我不得不說,Google真的是一家有遠見(當然遠見也要資源來支持:P)的公司;我曾經不斷建議某些公司應該針對自己的企業和產品特性,開發類似的工具、或是引進市場上的類似產品,以供產品的國際化團隊使用,但能接受的還是少之又少,還是以案件外發、並且以效率較低的方式進行居多。

說到Google的目的,其實也很簡單:如果把這套工具推廣出去,讓全世界大量的譯者使用,並且將產生出來的TM貢獻給Google、或是作為公共財產,那就等於是一個龐大無比的文化交流資料庫,不僅內容非常珍貴、也可以減少Google未來產品的翻譯成本,而且理論上可以加速世界上知識語言轉換所需要的時間;這種作法,也許就可以稱之為我前面說的「利己利人」啦。

當然,有很多翻譯內容是不能共享的;像是我為企業製作的文字(屬於企業財產和商業機密)、或是商業出版品的翻譯內容(有版權考量)。所以GTT也提供了「不分享」的選項,而把能作為「公共財產」的翻譯內容鎖定在維基百科(
Wikipedia)之類,原本就是開放性質、而且已經有許多人義務翻譯的文字。

當GTT的資料庫累積到一定程度的時候,就可以開始看到對Google本身的好處(好吧,以及對全人類的好處)。由於整個資料庫的內容都是由人類所翻譯、並且反覆修正,所以相對於機器翻譯的生硬、難以納入文化特質(例如典故、俚語等等),進步完全不可同日而語。

理論上,如果累積了一個無限大的人工翻譯資料庫,那麼任何語言都可以非常通順的翻譯成另外一種語言,而且讀者都能夠體會到原文的妙處。當然這應該是不可能完全實現的,但如果有夠多的TM內容被貢獻出來,就可以慢慢往這個目標邁進;屆時Google本身的跨國跨文化產品、以及其中的內容,以及之後的「消費者」將會是最大的受益人。

如果Google不把內容公開出來,也將成為世界上最大的「知識財閥」,但我想Google應該不會、也不敢這樣做;反之,如果這個資料庫能公開出來,則將是全球譯者們透過Google對這個世界所能作出的最大貢獻。

忝為譯者之一,我光想到這一點就激動不已啊。Google這家公司雖然夠大夠黑暗,但也有遠見、有魄力、視野夠寬廣;做這些事雖然還是有自利的成份在,但放眼全球,能做到這些的大概也只有它了。
arrow
arrow
    全站熱搜

    georgehou 發表在 痞客邦 留言(0) 人氣()