自从ChatGPT问世以来,国内外各类大模型如雨后春笋般涌现,仿佛春秋战国时期,一片“百花齐放、百家争鸣”的景象。各家大模型的名字也是各式各样,层出不穷。

现阶段,国外已发布的大模型之中,除了Open AI自家的王牌产品ChatGPT没有单独命名,直接采用Generative Pretrained Transformer英文首字母缩写以外,其后发布的大语言模型几乎都有各自的命名,如谷歌发布的Gemini和Meta发布的Llama以及斯坦福大学微调后Alpaca模型等等。

Llama和Alpaca这两个词源自西班牙语,中文都有 “羊驼”的意思。大语言模型(Large Language Models)英文缩写LLMs和“llama”这个词看起来很像。

之所以Meta给自家大语言模型取名“llama”,应该是考虑到“LLMs”不太好发音,所以就补上了元音字母,命名为“llama”读起来朗朗上口也便于记忆传播。也正是这样,大语言模型命名自此才和“羊驼”扯上了关系。

细心的读者会发现,“llama”、“alpaca”翻译成中文虽然都有 “羊驼”的意思,但实际上二者是有明显区别的,常常容易混淆。其实,Llama和Alpaca完全是两个不同的品种,通过外形很容易辨别。

Created by GPT4 image generator

确切地说,“llama”应该叫美洲驼,和骆驼是近亲物种,体型较大,也称“大羊驼”。而“alpaca”才是名副其实的正宗“羊驼”,外形有点像绵羊,腿比较短,看起来比较萌,也就是中文互联网传说中位列上古十大神兽之首——“草泥马”的原形。

Created by GPT4 image generator

作为秘鲁人饲养的两种动物,Llama和Alpaca的用途也不一样。Llama由于比较壮实,可以用来驮运。而看起来比较可爱呆萌的alpaca主要是剪毛,用来收集驼绒。

除此之外,还有两个英文单词也是和“羊驼”有关,分别是Vicuna和Guanaco。其中Vicuna已经被用作微调后的开源大模型命名。

Vicuna是UC Berkeley(加州大学伯克利分校)等研究人员联合其它几家研究机构共同推出的开源大语言模型Vicuna。该模型也是基于LLaMA微调后的。

注:作为大模型的另外一个“羊驼”命名品种,Vicuna一词来源西班牙语,词源是 vicuña (ña 读作 nia),中文名叫(南美)骆马,也称“小羊驼”。然而这类羊驼是野生的,也是秘鲁的国家标志。

Created by GPT4 image generator

Guanaco中文翻译是“原驼”,也叫“大羊驼”。看到这里不知道你是否已经开始懵圈,如果没有配图加以区分还真不好辨别“此羊驼非彼羊驼”。估计以后再有微调出来的大模型可能还会叫作guanaco,毕竟这也是羊驼的一种。

Created by GPT4 image generator

ps: 这里补充下,原驼(英文名:Guanaco)拉丁学名是Lama guanicoe,和“Llama”这个单词只差一个字母L,可谓同宗同源呐。

总结一下,llama/alpaca/vicuña/guanaco虽然中文里都是翻译为“羊驼”,实际上外形上还是有差异的。最后,为大家整理了以上四者外形上的区别。

Llama: Standing tall in a mountainous region of Andes Mountains, with a thick, shaggy coat.

美洲驼:生长在安第斯山脉高原地区,有着厚且蓬松的毛皮。


Alpaca: Smaller and fluffier than the llama, in a grassy field, its wool looking soft and dense.

羊驼:看起来比羊驼更小更蓬松,生活在草地上(“草泥马”命名应该就是这样来的),绒毛看起来柔软而密集。


Vicuña: The smallest and most delicate, with fine, light brown fur.

(南美)骆马,又称小羊驼:四种羊驼中最小且最娇弱的,毛色呈淡褐色且细腻。


Guanaco: Similar to a llama but with a smoother coat and a more wild appearance.

原驼:类似于羊驼但毛发更光滑、外观更具野性。

现今,大语言模型技术迭代速度可以说是以 “天”为单位,前有Meta开源大模型LLaMA“大羊驼”,接着紧跟斯坦福大学的Alpaca“羊驼”,再后来又有UC Berkeley主导的Vicuna“小羊驼”。羊驼品种虽多,现在看来如今也只剩下一个Guanaco没有被用来命名了,看样子名字似乎也快不够用了。

以上就是关于国外大模型命名和“羊驼”的渊源了,你都清楚了吗?下次再看到这些“羊驼”名称,应该不再容易混淆了。

举报/反馈

执信在路上

17获赞 2粉丝
君人执信,上下同之。
关注
0
0
收藏
分享