因應印度多語言需求而產生的人工智慧
草根影響力新視野(琪拉編譯)
過去兩年,Sawant先生一直騎著摩托車在孟買街頭穿梭,擔任送貨司機。但剛開始工作時,語言障礙又成了問題。他的母語是馬拉地語,而 Sawant 先生的英語卻很不好。 「我能聽懂,但讀起來很費勁。」他解釋道,這給他的新工作帶來很多麻煩。他的雇主 Zepto 承諾提供「印度最快的線上雜貨配送服務」。因此,讓駕駛費力地理解配送指示並非理想之選。為了簡化這項流程,Zepto 一年前與 Reverie Language Technologies公司 合作,為其司機推出了一項人工智慧翻譯服務。自此以後,Zepto 的送貨司機可以在六種語言之間進行選擇。
Sawant 先生面臨的困難很普遍,因為印度有 22 種官方語言和數百種方言,印度理工學院孟買分校的 Pushpak Bhattacharyya 教授說道,他是印度語言人工智慧應用領域的頂尖專家之一。「如果沒有能夠理解和使用這些語言的技術,數百萬人將被排除在數位革命之外,尤其是在教育、政府治理、醫療保健和銀行業。」他指出。ChatGPT 等新型生成式人工智慧系統的推出,使得這項任務更加迫切。
對於印地語和英語等廣泛使用的語言來說,這些數據相對容易獲取,但對於其他語言來說,則更加困難。「創建印度語言模型的主要挑戰在於數據的可用性,普通數據容易獲得,但這些數據質量不高,需要過濾。印度的問題在於,對於許多印度語言,特別是部落和地區方言來說,這些數據根本不存在或沒有數位化。」Bhattacharyya 教授說。
圖片取自:(示意圖123rf)
Reverie Language Technologies 目前正在為一系列印度公司部署其人工智慧翻譯技術。聯合創始人 Vivekananda Pani 表示,雖然翻譯技術將使溝通更加便捷,但「可能會取代一些不太常見的方言」。
為了解決這個問題,印度政府建構了 Bhashini計畫,希望能開發訓練人工智慧所需的高品質資料集。這些資料集完全為了因應印度特殊的文化與語言需要而產生,希望這些以印度為中心的資料集有朝一日能為開發人工智慧模型的人提供工具,使其更容易適應全民需求。
目前Bhashini希望最終能夠以 22 種語言完成。成效似乎不錯,Sawant現在 每天派送的包裹數量從 10 個增加到 30 個左右,得益於配送應用程式中的翻譯功能。
他認為這將幫助更多像他這樣的人。他說,這個工具讓他有歸屬感,因為印度不是每個人都懂英語,但當應用程式能識別我們的語言時,我們會更有信心,工作效率也會更高。
[不許轉載、公開播送或公開傳輸]
- 記者:草根影響力新視野
- 更多科技新聞 »