埃隆-马斯克(Elon Musk)的新公司 xAI 声称,仅用两个月时间就建立了一个具有尖端性能的强大语言模型。
上周,埃隆-马斯克(Elon Musk)飞往英国,大肆宣传人工智能带来的生存风险。几天后,他宣布自己的最新公司 xAI 已经开发出一种强大的人工智能–与竞争对手相比,它的防护措施更少。
该人工智能模型名为 “Grok”(这个名字在科技界的意思是 “理解”),”它被设计用来回答带有一点诙谐和反叛色彩的问题,所以如果你讨厌幽默,请不要使用它!” 该公司网站上的公告这样写道。”它还会回答被大多数其他人工智能系统拒绝的辛辣问题”。
公告没有解释 “辛辣” 或 “叛逆” 是什么意思,但大多数商业人工智能模型都会拒绝生成色情、暴力或非法内容,它们的设计也是为了避免表达从训练数据中获取的偏见。如果没有这些防护措施,人们担心人工智能模型可能会帮助恐怖分子开发炸弹,或导致产品基于种族、性别或年龄等特征歧视用户。
xAI 没有在其网站上列出任何联系方式,向普通地址发送的电子邮件也被退回。向 X 的新闻地址发送的电子邮件收到的自动回复是:”现在很忙,请稍后再查看”。
xAI 的公告称,Grok 建立在一个名为 Grok-1 的语言模型之上,该模型有 330 亿个参数。该公司称,它在两个月内开发出了 Grok,以行业标准来看,这是一个相对较短的时间,并声称其根本优势在于 “通过 X 平台实时了解世界”,也就是马斯克在 2022 年以 440 亿美元收购的前身为 Twitter 的平台。
开源人工智能研究机构 EleutherAI 的人工智能研究员斯特拉-比德曼(Stella Biderman)说,xAI 公告中的说法似乎有道理。比德曼认为,Grok 将使用所谓的 “检索增强生成 “技术,在其输出中添加来自 X 的最新信息。其他先进的语言模型也会利用搜索引擎结果和其他信息来做到这一点。
在过去一年左右的时间里,大型语言模型已被证明具有惊人的能力,其中最著名的是 OpenAI 的开创性聊天机器人 ChatGPT。
这些模型从书籍和网络中获取大量文本,然后根据提示生成文本。人类通常还会对这些模型进行进一步的训练,使其不易产生攻击性、粗鲁或危险的输出,并使其更有可能以看似连贯和正确的方式回答问题,尽管它们仍然容易产生错误和偏差。
例如,OpenAI、谷歌以及 Anthropic、Cohere 和 Inflection AI 等初创公司开发的语言模型通常会拒绝就如何犯罪提供建议,而且在被要求提供色情材料时也会表现得很端庄。
从 xAI 的公告中还不清楚,Grok 是否经过训练,对其他模型认为不合适的请求持更开放的态度,或者它只是没有接受过同样的二次训练。
xAI 发布了几项基准测试的结果,旨在衡量大型语言模型的能力。麻省理工学院的研究科学家安德烈-巴尔布(Andrei Barbu)说,测试结果似乎与其他流行模型相似。
xAI 表示,迄今为止,Grok 只接受了少数用户的测试,但现在将向更多申请访问的人开放。马斯克在 X 上发文称,该模型将提供给所有 X Premium+ 用户。
xAI 的公告称,该公司正在研究推进人工智能所涉及的几个关键挑战,包括建立能够评估自身输出可靠性并在必要时请求援助的模型,以及使模型更能抵御旨在使其行为失常的 “对抗性攻击”。报告指出 “我们将努力开发可靠的保障措施,防止灾难性的恶意使用”。
马斯克是生成式人工智能的早期投资者。这位亿万富翁在 2015 年向 OpenAI 投资了 5000 万到 1 亿美元,帮助该公司起步。在未能控制该公司后,他于 2018 年撤出了对该公司(当时是一家非营利性公司)的支持。
在 OpenAI 从非营利企业转变为营利企业并接受微软投资之后,在 ChatGPT 取得巨大成功之后,这位世界首富公开批评 OpenAI,指责其语言模型过于 “清醒”。
随后,马斯克在 2023 年 7 月宣布,他已经组建了一个规模不大但备受尊敬的人工智能研究团队,以开发 “不那么有偏见 “的人工智能。
一些人工智能研究人员已经尝试建立具有更多样化政治观点的语言模型。OpenAI 也表示将努力消除其模型中的政治偏见。
自马斯克控制 X 平台以来的一年里,该平台恢复了一些有争议的用户,包括极右翼用户,这符合其新主人反对在社交媒体上对内容进行审核的声明。多项研究发现,自马斯克接手以来,该平台上的虚假信息有所增加。
Grok 的公告称 “我们正在打造能最大限度造福全人类的人工智能工具。我们认为,设计出对各种背景和政治观点的人都有用的人工智能工具非常重要。我们还希望在遵守法律的前提下,通过我们的人工智能工具增强用户的能力。我们与 Grok 合作的目标就是在公开场合探索和展示这种方法。”
另一位熟悉 xAI 计划但不愿透露姓名的人工智能研究人员表示,xAI 还在开发一种将使用该模型的编码工具,因为与该公司的讨论是私下进行的。微软为其编码程序 Visual Studio Code 提供了一个插件,该插件由 OpenAI 开发的编码专用语言模型提供支持。用计算机代码训练模型可以提高它在其他任务中的表现。
WIRED 联系了几位著名的人工智能研究人员,但目前还找不到能使用 Grok 的人。
麻省理工学院的 Barbu 说,现在有这么多好的语言模型,问题是马斯克打算用 Grok 做什么,以及他希望它如何赚钱。他们已经聚集了优秀的人才,现在似乎已经准备有所作为。只是还不清楚是什么。