跳至主要內容
學機器學習

機器學習的目的是透過資料尋找一個函數,這個函數可以把輸入映射到輸出。例如,給定一張圖片,這個函數可以把輸入圖片映射成對應的說明文字。

怎麼樣找這個函數呢?機器學習的過程要先設定模型的形式,以及使用的參數。一般模型大多使用神經網路,而其中的參數則稱為權重。一個大的模型,參數量可能很多,有些高達幾十億個,要想找到好的參數,人力無法勝任,所以就交給機器去運算,這個運算過程,就稱為訓練模型。

訓練模型,也就是在找模型參數的過程。怎樣的參數才算是好的呢?這要有一個判斷的標準。一般會使用一個損失函數,這個損失函數用來衡量模型的輸出和希望得到的輸出之間的差距,並根據這個差距給一個分數,而我們要想辦法讓損失函數的平均分數越小越好。


Jia-Yin大约 2 分鐘courseAIsharing
測試 Gemma

今天早上我測試了 Gemma 模型。 我的電腦有 32G RAM 和 RTX 2070 顯示卡(8G)。 我下載的是 2B 模型。 有 untuned version 和 instruction-tuned version,每個版本解壓縮後約 3.9G。 我在 CPU 模式下執行,但是過了一會兒程式就當掉了,我猜想可能是記憶體不夠的原因。然後我用 GPU 模式執行,結果如下:

Untuned 2B

Jia-Yin小於 1 分鐘AI