每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
YouTube首席执行官尼尔·莫汉(Neal Mohan)猛烈抨击OpenAI,指控他们潜在违反服务条款,通过使用YouTube视频来训练他们的AI视频生成器Sora,该生成器距离发布仅有数月。尽管莫汉承认他没有具体证据,但他强调这种使用显然违反了YouTube的规则。
这一指控出现在关于AI模型训练数据伦理来源的辩论日益增长之际。OpenAI对Sora的具体训练数据来源保持沉默,但公司争相收集尽可能多的内容以推动他们的AI进步。目前,两家公司在AI领域都处于领先地位。
从内容创作者的角度来看,当创作者将他们的辛勤工作上传到我们的平台时,他们有一定的期望。其中一个期望是服务条款将被遵守。它不允许下载诸如转录或视频片段之类的内容,这是我们服务条款的明确违规。这些是我们平台内容的规则。
莫汉向公众保证,谷歌在训练其自己的AI模型Gemini时,会在使用任何YouTube视频之前与创作者签订个别合同;这是相当虚伪的,不是吗?这引发了关于谷歌数据使用立场的问题——它在面对竞争对手时保护创作者,但为了自己的利益采用类似策略。
巴里·施瓦茨(Barry Schwartz)正确总结道:
这就是谷歌如何训练其像Gemini这样的LLMs(大型语言模型)。它从网站、文章、书籍和其他内容收集数据。复杂的算法分析数据以提高语言理解能力。这有助于AI模型更准确地执行任务,如翻译语言、生成创意文本和回答问题。
是否OpenAI确实在抓取YouTube内容尚待观察,但这一情况暴露了谷歌生态系统内的潜在双重标准。