Perplexity的“答案引擎”工作原理是收集网络上的海量信息,构建一个庞大的内容数据库(索引)。用户无需输入关键字,只需在Perplexity的平台或应用中提问,就能获得包含引文及网络内容链接的详细回答。
网站通过“机器人排除协议”保护内容免受爬虫抓取,但这一协议的遵守是自愿的。《连线》杂志和独立研究均指出,有证据表明Perplexity无视这些协议,从禁止访问的网站获取内容。
对此,Perplexity的联合创始人兼首席执行官Aravind Srinivas在采访中回应称,Perplexity并未无视协议,而是人们对其工作方式存在误解。他强调,除了自家的网络爬虫,他们还依赖第三方爬虫服务。
斯里尼瓦斯进一步澄清,《连线》发现的神秘爬虫并非来自Perplexity,而是第三方提供商所有。由于保密协议,他不愿透露该提供商的名字。对于是否已通知第三方停止抓取《连线》内容,他表示情况复杂。
喜好儿网
斯里尼瓦斯还指出,机器人排除协议并非法律框架,他认为人工智能的兴起需要内容创作者和搜索公司建立新的合作关系。
《连线》杂志还指出,其文章能够被Perplexity的答案引擎紧密解读,但有时会出现误解。例如,一个案例中,Perplexity错误地指称一名加州警察犯罪。
斯里尼瓦斯建议《连线》使用特定提示以优化Perplexity工具的表现,但普通用户不会看到这种结果。他强调,Perplexity从未声称其答案绝对无误。
六月初,《福布斯》杂志批评Perplexity盗用其内容。Perplexity随后推出的“Pages”产品允许用户根据问题或主题提示生成文章,但被发现使用了《福布斯》的独家新闻内容而未注明出处。在《福布斯》提出质疑后,Perplexity迅速更新了Pages产品,添加了内容出处信息。
斯里尼瓦斯表示,其产品依赖于互联网生态系统,并愿意在盈利和成功的同时,确保整个互联网受益。他还透露,Perplexity正在与一些出版商洽谈“收入分享”协议,但具体名单尚未公布。
尽管出版商对Perplexity持谨慎态度,但市场对其充满期待,认为其有可能成为谷歌的有力竞争对手。然而,Perplexity必须更加谨慎地处理内容抓取和引用问题,以免浪费其潜力。