跳至主要內容
学机器学习

机器学习的目的是通过数据找到一个函数,这个函数可以把输入映射到输出。例如,给定一张图片,这个函数可以把输入图片映射成对应的说明文字。

怎么样找到这个函数呢?机器学习的过程首先要设定模型的形式,以及使用的参数。一般模型多使用神经网络,而其中的参数则称为权重。一个大的模型,参数量可能很多,有些高达几十亿个,想要找到好的参数,人力无法胜任,所以就交给机器去运算,这个运算过程,就称为训练模型。

训练模型,也就是在找模型参数的过程。怎样的参数才算是好的呢?这需要有一个判断的标准。一般会使用一个损失函数,这个损失函数用来衡量模型的输出和希望得到的输出之间的差距,并根据这个差距给一个分数,而我们要想办法让损失函数的平均分数越小越好。


Jia-Yin大约 2 分钟courseAIsharing
测试 Gemma

今天早上我测试了 Gemma 模型。 我的电脑有 32G RAM 和 RTX 2070 显示卡(8G)。 我下载的是 2B 模型。 有 untuned version 和 instruction-tuned version,每个版本解压缩后约 3.9G。我在 CPU 模式下执行,但是过了一会儿程序就崩溃了,我猜想可能是记忆体不够的原因。然后我用 GPU 模式执行,结果如下:

Untuned 2B

Jia-Yin小于 1 分钟AI