帮助程序员在人气竞赛中作弊的GitHub黑市

文章目录

  • 进入机器人世界
  • 加密货币首选

GitHub 上的人气可以为开发人员和初创企业打开宝贵的大门。地下商店在平台上出售 “stars”,为程序员提供了一种 “以假乱真” 的途径。

GitHub-Black-Market-Stars-Business-1272506388

GITHUB 将管理软件的工具与协作功能结合在一起,为懂代码的人创建了一种社交网络,从而确保了它作为程序员最好朋友的地位。GITHUB 的成功使它获得了社交平台中一个不太受欢迎的特征:虚假参与的黑市。

在线商店和聊天群组的生态系统公开出售 GitHub 星级,用户授予星级以表示对某个项目的兴趣,并可统计出最受欢迎项目的排名。WIRED 以以太坊(以太坊区块链的加密代币)支付 6 美元的低价,通过品牌直白的 BuyGithub.com 网站为一个休眠的 GitHub 项目购买了 50 颗星星。这些虚假背书在短短几个小时内就出现了。

这些待售的黑星是更广泛的在线参与度指标黑市的一部分,编码员、投资者和其他科技人员在决定雇用谁、为谁工作或投资谁时,都会使用这些指标来突出有前途的程序员和初创公司。

在线商店还为 Product Hunt(一个承诺帮助个人抢先发现科技领域下一件大事的社区平台)上列出的项目提供 “向上投票“,并为数据科学社区Kaggle上的关注者和浏览量提供 “向上投票”。这些厂商似乎都想利用人们的雄心壮志,也可能是他们的绝望,在这个有时与 “不成功便成仁 “的口号联系在一起的行业里,寻找一条成功的捷径。

印第安纳大学社交媒体观察站(Observatory on Social Media)主任菲利波-门采尔(Filippo Menczer)说:”几乎所有的网络操纵行为都是以某种形式劫持注意力,以达到赚钱的目的–获取注意力,然后将其转化为金钱或权力。GitHub 也不例外。这是一个注意力市场,因为人们可以通过软件的受欢迎程度或广泛使用程度来获得知名度、影响力和声誉。”

进入机器人世界

数据协调初创公司Dagster的发展主管弗雷泽-马洛(Fraser Marlow)去年偶然进入了GitHub游戏市场,因为他注意到投资者似乎将平台上的星级作为开源产品具有吸引力的信号。

他的团队从两家不同的在线商店购买了星星,并利用在此过程中收集到的数据建立了一个模型,用于检测 GitHub 资源库中的虚假星星。他们在 Dagster 自己的代码库和其他几个代码库上运行了该模型。

加密货币项目 Okcash 是最严重的违规者:其 759 颗星星中有 97% 被 Dagster 的检测器标记为虚假。与此同时,在与 Dagster 竞争的开源项目 Apache Airflow 的 29435 颗星星中,只有 1.6% 被标记为虚假。分析仅限于2022年以后获得的恒星;Apache Airflow 社区的主要贡献者 Astronomer 拒绝对此发表评论。

Okcash 的创始人 Oktoshi San 说,他的项目并不关心虚荣指标,比如星级和分叉,但一些社区成员已经发起了赠送活动,邀请人们在 GitHub 上给项目打星,以换取 Okcash 代币。

Dagster 的发现建立在早期工作的基础上,其中包括学术研究人员的一篇论文,他们发现了 2015 年至 2019 年间活跃在 GitHub 上的 63000 多个涉嫌授星的账户。这些发现是通过分析消息应用 Telegram 以及中国消息平台微信和 QQ 上星星卖家的数据得出的。

“多年来,GitHub 安全部一直意识到虚假星级卖家的存在,并积极致力于将这些卖家从平台上清除,” 该公司的在线安全顾问 Jesse Geraci 说。杰西-杰拉西承认,要在准确删除不真实账户与允许真实账户畅通无阻地运行之间取得平衡是一项挑战。格拉西说:”6.3 万个可疑账户听起来似乎很多,但在 GitHub 上的 1 亿多开发者中,这只是很小的一部分。”

马洛在博客上发布了他追踪可疑星级的工作后,几乎所有他付费购买的星级都在一周内消失了。WIRED 购买的星星也在购买后不到一个月就被删除了。GitHub 的反滥用团队将人工调查与软件技术结合起来,以识别不真实的账户。

马洛说:我认为,对GitHub stars的痴迷有点像ZIRP泡沫的遗留问题。他指的是美国最近结束的零利率政策。他说,这是个内幕消息–只有风险投资公司和企业才会为之着迷,但在过去的一年里,他已经注意到人们对它们的重视程度在降低。

风险投资公司Nauta Capital的合伙人普拉蒂玛-艾亚加里(Pratima Aiyagari)说,风险投资者的 “硬连线” 是寻求投资的初创企业的快速增长。她说,开源项目可以运营多年而不产生大量收入,因此投资者会寻找其他增长信号,GitHub 的明星项目只是其中之一。她说,商业软件公司 Mulesoft 和协作软件开发平台 Gitlab 等公司的成功吸引了投资者对开源公司的浓厚兴趣。”风险投资资金一直在涌入这个领域”。

为了跟踪开源初创公司,风险投资公司 Runa Capital 创建了 ROSS 指数,该指数根据 GitHub 星级的年增长率对公司进行排名。该指数已成为快速增长的开源产品的一个广受关注的基准。

Runa 的普通合伙人康斯坦丁-维诺格拉多夫(Konstantin Vinogradov)说,该指数可以很好地预测公司是否会进行融资。他说,自该指数于2020年推出以来,在所有被列入该指数的公司中,约有三分之一的公司在未来12个月内进行了后续融资。

加州大学圣地亚哥分校助理教授斯图尔特-盖格(Stuart Geiger)说,随着时间的推移,衡量标准可能会自我失效。他说,社会科学家的两条 “定律” 概括了其中的原因: 决策中使用的指标越多,它就越容易被操纵(坎贝尔定律),而成为目标的指标就不再有用(古德哈特定律)。

维诺格拉多夫说:聪明的战略与作弊之间的界限可能很模糊。如果一家公司在 Product Hunt 上排名第一,他们就会把它放到网站上,这样也许就能提高客户转化率。这仅仅是赢得游戏吗?还是以业务为导向的合理战略?

凯文-张(Kevin Zhang)曾是一名风险投资者,现在正在创建自己的初创公司,他说,GitHub 的明星似乎已经成为创业者们想要留下深刻印象的目标。”他说:”我开始注意到,创始人在他们的甲板上贴上了更多的明星成长图。他说:”这总会让你产生一点怀疑,对吧?哦,也许这里面有诈。”

但张和其他投资者表示,虽然像星级这样的指标游戏可能会帮助初创公司获得与风险投资人的第一次会面,但不太可能让他们获得第二次会面。Zhang说,近年来,随着游戏化和对开源市场了解的加深,投资者对GitHub指标的看法也发生了变化。Zhang、Vinogradov和Aiyagari都表示,良好的GitHub参与度是一个有希望的信号,但它并不是成功的不二标志,在进行投资之前,创始团队、市场和许多其他数据点的信息都是考虑因素。

加密货币首选

Baddhi Shop 是一家提供非真实指标的在线商店,今年早些时候推出了 GitHub 服务。它还出售 Product Hunt 上的投票数,以及 Kaggle 上的投票数、关注者和浏览量。当《WIRED》向该网站创始人纳加-杜加拉奥-巴德希(Naga Durgarao Baddhi)的 LinkedIn 账户发送信息时,得到的回复声称该业务是光明正大的。

当收到 GitHub stars 或其他指标的订单时,一个由 11 人组成的团队会 “通过不同的云设备” 进行点击,Baddhi 说,这不是垃圾邮件,因为商店尊重每个网站的服务条款。巴德希补充说,GitHub 并不是最流行的度量作弊服务。Baddhi说,加密项目常用的聊天室服务Discord每天都有购买,其他10种服务的度量也很受欢迎。Discord 的发言人 Kellyn Slone 说,创建或出售虚假账户违反了其服务条款,它会采取相应措施,包括将用户从服务中删除。

在 Facebook 等领先的社交平台上,出售虚假参与度的行为最为人熟知。意大利比萨国家研究委员会下属的信息学和远程信息处理研究所(Informatics and Telematics Institute)研究虚假信息、假新闻和社交机器人的研究员斯特凡诺-克雷西(Stefano Cresci)说,GitHub 和 Product Hunt 等较小、较新的网站市场的出现,可能是因为主流平台对虚假账户给予了更多关注。他说,供应商可能会转向其他平台,因为那里更容易维持业务。

还有证据表明,现在网络生活已经成为人类各个领域的中心,即使在小众社区也会出现网络作弊现象。波士顿附近塔夫茨大学的教授贾斯汀-霍兰德(Justin Hollander)最近发表的研究报告显示,推特机器人被用来试图影响城市规划。机器人活跃在美国 21 个房地产项目中,包括加利福尼亚州 SoFi 体育场的开发和亚特兰大的多功能项目。

“一系列不同的社区组织和政府机构都在使用机器人,” 他说。”我们无法只找到一个组织。似乎任何在塑造城市和参与这些政策领域的领域中精明和活跃的实体都在使用机器人。”

印第安纳大学的 Menczer 将社交机器人和虚假参与的广泛使用比作污染的影响,垃圾堆积如山,掩埋了有价值和有质量的东西。他预计,随着技术的进步,情况会越来越糟。Menczer 及其同事最近在 Twitter 上发现了由 ChatGPT 支持的加密货币推送机器人网络的证据。

“人类和软件都很难检测到虚假账户,” Menczer 说。”而 ChatGPT 会很乐意为你创建大量无法与真实账户区分的虚假账户。人工智能图像生成器正被用来生成逼真而独特的虚假个人资料图片,这消除了过去识别虚假账户的线索。”

“这是一场军备竞赛,因为社交机器人变得越来越聪明、越来越复杂,” Menczer 说,”无论软件项目、公司或个人出现什么新的参与度指标,骗子都不会落后。”

微海报