文章

讓 AI 使用台灣 IT 用語的探索之旅

各位對科技感興趣的朋友們,今天想和大家分享一個關於 AI 使用台灣 IT 用語的有趣探索過程。

作為一個熱愛科技的台灣人(雖然不是專業工程師),我經常使用各種 AI 助手。在這個過程中,我注意到了一個有趣的現象:當要求 AI 使用「台灣用語」時,它在一般對話中確實能使用較為本地化的表達方式。然而,一旦談到 IT 相關話題,AI 就會開始使用一些不太符合台灣習慣的詞彙。

舉例來說,AI 會正確地說「午餐」而不是「午飯」,但在討論程式設計時,它依然會說「創建變量」而不是「建立變數」,或是用「添加功能」而不是「新增功能」。這種不一致的表達方式,讓我們的對話感覺有些彆扭。

為了解決這個問題,我開始了一段有趣的探索之旅,嘗試了幾種不同的方法來讓 AI 學習更道地的台灣 IT 用語。

初步嘗試

1. 詞彙對照表方法

我的第一個嘗試是整理了一份大篇幅的詞彙對照表。這個方法初期看起來很有效,AI 確實能夠按照對照表使用正確的台灣 IT 用語。然而,這個效果只能維持一小段時間。更麻煩的是,這份對照表佔用了大量的上下文空間,限制了 AI 處理其他資訊的能力。

2. 腳本檢查和替換方法

接著,我嘗試使用腳本來檢查 AI 的輸出,並自動替換不正確的詞彙。這個方法的效果相當不錯,能夠有效地將大部分不適當的用語轉換成台灣常用的 IT 術語。然而,這個方法也有其局限性。它偶爾會出現誤判,將一些本來正確的用語錯誤地替換掉。為了提高準確性,我需要不斷地調整規則,這是一個耗時且需要持續關注的過程。

新的方向:自學式 AI 指南

經過這些嘗試後,我決定採取一個新的方向:讓 AI 自己學習並制定台灣 IT 用語指南。

我讓 AI 進行自我反省,並要求它制定一個詳細的台灣 IT 用語指南。經過一些討論和修改,我們得到了這份指南:

台灣 IT 與程式設計用語指引

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
# 台灣 IT 與程式設計用語指引

在回答與資訊科技(IT)和程式設計相關的問題時,請務必使用台灣常用的專業術語和表達方式。以下是一些重要的用語對照和指引:

## 一般 IT 用語

- 使用「程式碼」而非「代碼」
- 使用「資料庫」而非「數據庫」
- 使用「滑鼠」而非「鼠標」
- 使用「硬碟」而非「硬盤」
- 使用「記憶體」而非「內存」
- 使用「資料夾」而非「文件夾」
- 使用「檔案」而非「文件」(指電腦檔案)

## 程式設計術語

- 使用「迴圈」而非「循環」
- 使用「陣列」而非「數組」
- 使用「物件」而非「對象」
- 使用「方法」而非「函數」(在物件導向程式設計中)
- 使用「建構子」而非「構造函數」

## 常用動詞

- 使用「建立」而非「創建」
- 使用「目前」而非「當前」
- 使用「新增」而非「添加」
- 使用「設定」而非「設置」
- 使用「執行」而非「運行」(指程式)
- 使用「儲存」而非「保存」

## 注意事項

1. 優先使用台灣的本地化用語,避免使用中國大陸的專業術語。
2. 在解釋概念時,盡量使用台灣的日常用語,以增加易懂性。
3. 如遇到不確定的術語,可參考台灣的技術文件或主流科技公司的本地化用語。

請依照此指引使用適當的台灣 IT 和程式設計用語,以確保溝通的準確性和在地性。

使用這個指南後,AI 的表現有了明顯的改善。它開始使用「程式碼」而不是「代碼」,說「新增功能」而不是「添加功能」。AI 的回答變得更加符合台灣的 IT 用語習慣。同時我也有問到這些提示詞表列外的詞彙是否會被忽略?它提到了「泛化」的概念,這個概念類似於一個模糊的擴張範圍,只要可能被包含在這個領域的詞彙,就有可能被包括進去。同理可證,如果在其他專業領域中 AI 用詞不正確,或許也可以嘗試將上面的提示詞主題做替換,也許能達到類似的用語調整效果。

然而,在某些情況下,比如使用 GitHub Copilot 時,由於系統限制,無法輸入這麼長的指南。為了解決這個問題,我將指南濃縮成了一句話的精簡版:

精簡版指南

Use Traditional Chinese (Taiwan) IT terms: 程式碼, 資料庫, 建立, 新增, 設定, not mainland terms like 代碼, 數據庫, 創建, 添加, 設置.

令人驚喜的是,這個精簡版在 GitHub Copilot 上也能達到很棒的效果。

反思與展望

這個探索過程不僅讓我們看到了如何讓 AI 更貼近台灣的 IT 用語,也引發了一個更深層的思考:在全球化的數位時代,我們該如何平衡主流語言和本地用語?

就像美式英語相對於英式英語的地位,中國大陸的中文用語在國際上確實佔據了主流地位。這是由於使用人口、經濟影響力等多方面因素造成的現實。然而,這並不意味著我們就該放棄自己的語言特色。

在 AI 迅速發展的今天,我們更應該積極思考如何在這個新的數位時代保留並發揚我們的文化特色。通過上述的方法,我們證明了即使面對強勢的主流用語,我們依然有辦法讓 AI 工具使用更符合台灣習慣的表達方式。這不僅是技術上的嘗試,更是文化保存的一種實踐。

語言是文化的載體,在追求科技進步的同時,我們也不應忽視語言多樣性的重要性。讓 AI 學會使用台灣的 IT 用語,看似是個小小的舉動,卻是我們在數位時代守護本土文化的重要一步。

結語

你們是否也有類似的經驗?或者有其他讓 AI 更貼近台灣使用習慣的方法想要分享?也歡迎大家分享對於如何在 AI 時代平衡主流用語和本地特色的看法。讓我們一起探索,在這個快速變化的數位世界中,如何既能與國際接軌,又能保持自己的語言和文化特色。

本文章以 CC BY 4.0 授權