
品牌方舟获悉,近日谷歌宣布发布号称“全球性能最强大、轻量级”的新一代开源系列模型Gemma,与 Meta、Mistral 和 Hugging Face 等几家资金雄厚的AI初创公司展开竞争。
据官方介绍,Gemma模型使用了和Gemini同源的构建技术,总共有20亿个参数(可调节变量)和70亿参数两种规模,每个规模又分预训练和指令微调两个版本。
其中20亿参数版本可以直接在笔记本电脑上运行,而70亿参数版本在一系列语言理解、推理、数学等标准测试上击败了主流开源模型Llama-2和Mistral,一度登顶Hugging Face开源大模型排行榜,成为目前全球最强的开源大模型。
根据谷歌公布的测试显示,在MMLU、BBH、GSM8K等主流测试平台中,其70亿模型在数学、推理、代码的能力超过Llama-2的70亿和130亿,成为最强小参数的类ChatGPT模型。
而和Gemini的全家桶路线不同,Gemma这一次主打轻量级、高性能,除了笔记本电脑电脑,还可以在台式机、物联网设备、移动设备和云端等不同平台运行。
谷歌计划未来推出更多的Gemma变体,以适应更广泛的应用场景。目前,想要开始使用这些模型的开发者可以通过数据科学平台Kaggle、谷歌的Colab笔记本或通过谷歌云进行访问。
小编✎Irene/品牌方舟
声明:此文章版权归品牌方舟所有,未经允许不得转载。