首页>资讯>正文
马斯克要告微软,拒绝AI训练“白嫖”数据
2023-04-25 18:17:42    来源:钛媒体APP

图片来源@视觉中国

“现在是诉讼时间。”4月20日,推特被踢出其数字营销平台后,新掌门人马斯克立马发推回击称,用推特的数据做“非法训练”。这一怼,直接揭开了AI大模型开发商与数据源的利益之争。

此前,在线社区论坛Reddit与程序员社区Stack Overflow先后宣布,将向使用平台API训练数据的公司收费;环球音乐集团直接表示,将阻止AI从其版权歌曲中抓取歌手的声音。


【资料图】

在此之前,AI大模型开发商都在低成本地使用互联网公开的内容数据训练自家的大模型,如今,各种科技巨头们加持的大模型纷纷开始商业化,互联网内容平台们突然反应过来,不能让这些巨头们薅羊毛“白嫖”数据了。‍‍‍‍‍‍‍‍

当推特将API收费门槛摆在面前时,AI大模型训练要给付的成本就不止芯片算力和研发算法的人才了,现在还要加上“为数据付费”。

马斯克直怼微软“非法训练”

“他们非法使用推特的数据进行训练。现在是诉讼时间。” 4月20日,“宇宙顶流”马斯克直接在推特上明示要告。他以推特CEO的身份亲自下场,以此直怼把推特踢出Microsoft Digital Marketing Center(数字营销中心)的做法。

这个“中心”是干嘛的呢?它其实是利用大数据和AI技术开发的一个广告和营销的管理平台,聚合了包括推特、脸书、Ins等海外所有主流的社交平台,方便企业主们在一个平台上完成广告和营销活动的推送,还能管理各种账号、分析推流数据。你刷微博、微信朋友圈时突然冒出的广告,就有类似这种工具的贡献。

这个数字营销中心能实现这些功能,很重要的一环是接入了这些社交平台的API,这是企业主推送广告、分析数据的基础。

结果,马斯克收购推特后,直接把推特API的企业套餐初始订阅费用定为4.2万美元/月,折合人民币28.9万元,以这个价格能获得2500万条推文,一条差不多1块多钱了。如果每月支付12.5万美元,能获得 1 亿条推文,后续还会按照使用量加钱。

推特API的新收费标准直接劝退了不少小公司,连财大气粗的数字营销中心都直言“要价太高”,于是,直接把推特踢出了管理库。这意味着,借助这个平台执行广告和营销计划的广告主们,没法在推特上搞投放了。

原本这是企业主、分发平台、渠道商之间的广告业内事,马斯克跳出来了,直指用推特的数据搞非法训练。

马斯克称用推特数据“非法训练”

谁都知道,爆火的ChatGPT背后有的资本加持。而马斯克和GPT大模型的开发方OpenAI不仅渊源颇深,还积怨许久。

2015年,马斯克与Sam Altman等6人共同创立OpenAI人工智能实验室,致力于建设开源的、研发人工智能的非营利机构,来抗衡当时在人工智能领域大有一家独大之势的谷歌。为此,马斯克捐了1亿美元,承诺未来继续捐9亿。结果不到2年,马斯克就退出了OpenAI董事会,这里既有烧钱开发大模型短期没烧出成果的问题,也有马斯克和Altman对OpenAI的管理权之争。

马斯克退出1年后,即2019年3月,OpenAI成立子公司OpenLP,将其定位为“有限营利机构”,重组后的OpenAI很快拿到了来自微软的10亿美元投资。谁也没想到又一个3年过去后, OpenAI站上了全球科技舞台的最前沿。

ChatGPT爆火后,当初为OpenAI掏过钱、站过台的马斯克频频表达怨念。

2月17日,马斯克发推指称OpenAI从开源、非营利变成了微软控制的“闭源、追求利益最大化”的公司;后来还多次在公开场合强调人工智能对人类社会的潜在危害,甚至认为“风险比飞机、汽车、毒品更大”;3月29日,那封科技大佬联署签名“暂停AI巨型实验”的公开信上,他也第一时间签名表态。

马斯克为人工智能的健康发展操碎了心,看上去,这位将巨型载人飞船送入太空的现实版“钢铁侠”似乎不打算跟风人工智能了。

然而,4月17日,马斯克在媒体采访中披露,将推出一款生成式AI大模型TruthGPT。很快就有媒体爆料,马斯克买了1万个英伟达A100芯片。这是AI大模型训练的重要硬件。

撕微软非法训练数据,怼OpenAI变成逐利公司,无论马斯克如何批评这两家公司,这下也难掩他对人工智能的兴趣了。左手拦下推特数据低成本外流,右手高价囤芯片,在AI大模型赛道上,马斯克开始跑马圈地。

多平台API拟收费,AI训练成本被推高

不过,最近要向AI大模型开发商们收取API费用的平台不止推特。

4月18日,海外最大的社区论坛Reddit宣布,将向使用其API做数据训练的公司收取数据使用费。Reddit暂未公布具体收费标准,业内推测,Reddit很可能会按数据数量分等级收费,这也是业内的常规做法。此外,程序员问答网站Stack Overflow也计划向AI巨头收取训练数据费用。

Reddit更新数据API条款防大公司薅羊毛

要知道,研发AI大模型,算法、算力和算据这“三算”缺一不可。以OpenAI训练GPT-3.5为例,这个模型容纳了多达45TB的文本语料,这些语料既包括书籍期刊等出版物的内容,也包括社交平台、问答网站、论坛小组等在线数据中的用户生成内容。而从OpenAI的公开信息看,该公司并没有提及获取线上数据是否支付过费用。用“爬虫”爬、和第三方合作、以及购买都有可能是OpenAI 获得数据的方式。

此前,各个生成式大模型似乎都在没啥限制地使用互联网上的公开内容,影响大模型性能的要素就集中在算法和算力差异上。从推特、Reddit等平台明确为API收费后,大模型开发商自在地使用数据的好日子到头了。

2019年之前,OpenAI是非营利机构,如今,ChatGPT都有Plus收费版了,更别提该公司还开通了API的付费渠道。当前,OpenAI的估值接近300亿美元,研究机构PitchBook预测,该公司今年的收入将达到2亿美元,明年会翻五番。

社交平台们明确API收费,剑指大模型开发商,双方也正式变成了“商业对商业”的关系,收费与付费实属正常。这也意味着,AI大模型成为科技巨头们狂卷的赛道后,像Reddit这样的海量内容平台将增加商业来源,数据将成为重要要素。

以成立于2008年的Reddit为例,它是全球互联网中最有活力的社区之一,目前日活达到3.3亿,大量的用户创建了超过14万个活跃社区,帖子总量超3.6亿。尤其在很多小众领域,Reddit论坛贡献了很多有价值的讨论内容。换句话说,Reddit提供了英语互联网中最重要的语料库。

OpenAI的CEO Sam Altman也表示,公司在积极与内容公司进行合作,并愿意“为高质量数据支付高价”。

尽管Altman宣称“目前没在训练GPT-5”,但OpenAI应该不会停下数据训练的脚步,因为GPT-4仍有很多需要打磨的地方,比如通识知识的准确性、对人类语言的理解进化等等,这些仍然需要语料数据的持续投入。

放眼全球,研究AI大模型的公司还不止OpenAI一家,海外有谷歌,国内有百度、华为、阿里。可以预见,切入大模型赛道的公司,都将面对数据所有者的收费关卡,训练成本将水涨船高。另一个值得深思的问题是,Twitter也好,Reddit也罢,他们手握数据向大模型开发公司收取价格不菲的费用,那么,为这些平台贡献了海量内容和数据的用户又得到了什么?

责任编辑:

关键词:

马斯克要告微软,拒绝AI训练“白嫖”数据

‍‍‍‍‍‍‍‍当推特将API收费门槛摆在面前时,AI大模型训练要给付的成本就不止芯片算力和研发算法的人2023-04-25

红旅动漫app官方下载_红旅漫画少女_世界新资讯

1、红旅漫画当年是我知道的唯一的动漫网站。2、那上面真的有很多回忆啊,看过很多的动漫都是在那上面看到的2023-04-25

郑州:鼓励批零住餐企业成立总部型企业,最高奖励1000万元|快资讯

对首次入库的新设立大型批零住餐企业,当年零售额在20亿元、10亿元、5亿元以上的,分别给予500万元、200万2023-04-25

全球头条:邀您同行|献礼萨马兰奇纪念馆十周年,耀出行与奥运同心

4月21日,萨马兰奇纪念馆开馆十周年盛典,一场隆重的庆典活动以及两场主题展览在馆内拉开帷幕,梅赛德斯-奔2023-04-25

中超前瞻:近4次交手三镇保持全胜 卫冕冠军新赛季首胜就此到来?

北京时间4月25日19:35,中超第3轮,梅州客家主场对阵武汉三镇,邢琦担任主裁判,王竞担任视频裁判。2023-04-25

全球微动态丨一季度我国黄金生产同比增长1.88% 消费同比增长12.03%

中国人民银行一季度增持黄金57 85吨,这也是自2022年11月至2023年3月央行连续五个月增持黄金。2023-04-25

计算机行业Q1基金配置较2022Q4几乎翻倍 中信建投:TMT行情演绎仍具客观加仓空间

中信建投发布研究报告称,2023Q1主动权益基金股票仓位继续提升1 1pct至85 2%,为2010年以来最高水平。新能2023-04-25

听录音打字是什么工作_听录音打字软件|每日速讯

1、将录音转文字这种工作是我们在办公时候经常会遇到的问题,我们公司就用到了录音转文字助手这个软件进行转2023-04-25

同仁堂涨超4%再创历史新高 总市值突破800亿元 环球要闻

每经AI快讯,4月25日,中药龙头股同仁堂盘中震荡涨超4%,股价再创历史新高,总市值突破800亿元。2023-04-25

荒野大镖客2范霍恩的喜悦成就视频攻略-天天速讯

荒野大镖客2范霍恩的喜悦成就是很多荒野大镖客玩家不知道怎么做的,荒野大镖客2是近期游戏最震撼的作品,拥2023-04-25

天下秀2022年财报发布:营业收入为41.3亿元,传媒板块逐步复苏_速讯

4月24日晚,天下秀(600556 SH)发布2022年年度报告,报告显示,公司营业收入为41 3亿,同比下降8 5%,归母2023-04-25

橘子洲小火车学生票哪里买? 世界独家

橘子洲小火车学生票哪里买?橘子洲小火车学生票可以在自助机上购买或者人工售票窗口购买。其中18周岁(不含)2023-04-25

全球看热讯:廉洁文物传清响

据中央纪委国家监委网站报导,“郑板桥为官12年,其中7年担任潍县知县。当时,有许多大盐商想和郑板桥拉拢2023-04-25

太监成圣100集免费全集

林玄在穿越回古代后,从一位谁都看不起的小太监变成至高无上的人,在这中间,他与沈淑仪又发生了什么呢?《2023-04-25

2023北京五一多条地铁运营时间延长

☑轨道交通方面,4月28日、29日和5月2日、3日,地铁2号线、4号线、6号线、7号线、14号线、16号线等6条轨道2023-04-25

全国累计发电装机容量同比增长百分之九点一_速读

全国累计发电装机容量同比增长百分之九点一(主题)太阳能发电装机已超水电装机(副题)人民日报海外版北京2023-04-25

新刊速览 | 共探数智化转型新路径(2023年4月24日,第15期总第1119期)

《纺织服装周刊》提供便捷、及时、专业的信息服务一周精彩尽在这里阅读精彩内容2023年4月24日第15期,总第12023-04-25

荣旗科技今日登陆创业板 无线充电模组检测领域优势凸显 每日快看

且荣旗科技现已建有江苏省、苏州市两级工程技术研究中心,是苏州重点培育的“瞪羚”企业和“独角兽”培育企2023-04-25

比亚迪在智利获得锂电池材料生产资质 并将在当地建厂

【TechWeb】4月25日消息,比亚迪日前在其官微宣布,已经与智利生产促进委员会就锂电池材料生产方面达成协议2023-04-25

烘焙食品行业进入高速发展时期 2023年中国面包行业市场深度调研_资讯

面包是烘焙食品中继蛋糕、糕点之后的第三大品类,根据2022年11月8日中国焙烤食品糖制品工业协会发布《食品2023-04-25

一季度全国城镇新增就业297万人_全球消息

原标题:1—3月,全国城镇新增就业297万人,同比增加12万人就业形势逐步恢复、总体稳定一季度,稳经济政策2023-04-25

盐城市东风物流有限公司100%股权被挂牌转让 底价约3226万元

标的企业盐城市东风物流有限公司注册资本1000万元人民币,经营范围包括普通货物道路运输;乘用车及其零部件2023-04-25

历史上最冤枉的红颜祸水, 既未干政也未亡国却被人唾骂千古!_环球速看料

历史上最冤枉的红颜祸水,既未干政也未亡国却被人唾骂千古!,在中国有一个用来形容美女的词“环肥燕瘦”,说2023-04-25

宁夏多举措推进减污降碳协同增效

4月24日,记者了解到,即日起,自治区生态环境厅、发改委、科技厅、工信厅、公安厅、财政厅等12个部门联合2023-04-25

2023甲子引力X智能新世代峰会:AICG开局之年,把脉中国科技新风向

2023甲子引力X智能新世代峰会:AICG开局之年,把脉中国科技新风向2023-04-25

滚动
资讯