360集团创始人、董事长周鸿祎在微博发文,对360儿童手表出现错误问答一事致歉。周鸿祎表示,今天在网上看到视频反映我们某型号的儿童手表出现错误的问答,给用户带来不适,我们表示真诚的歉意。
经过快速检查,出现问题的这款手表是2022年5月份的一个旧版本。由于没有装入360大模型。它回答问题不是通过人工智能,而是通过抓取互联网公开网站上的信息来实现的。
目前360已经快速完成了整改,删除了上述所有有害信息,并正在将软件升级到人工智能版本。
“我们也检查了新版的大模型儿童手表的问答功能,我也给大家做了几个测试,从目前来看是没有任何问题的,大家可以放心使用。”
NLP的文本特征抽取和文本摘要
相信一些刚接触 GPT 的朋友,都会对于上面的解释都会有点不理解,尤其是“它回答问题不是通过人工智能,而是通过抓取互联网公开网站上的信息来实现的。”
文本特征抽取是自然语言处理领域中一项非常重要的技术,其目的是从文本数据中提取出有意义的特征,以便于后续的文本分类、聚类、信息抽取等任务。
文本特征抽取的基本原理是从文本中提取出能够代表该文本的特征,这些特征可以是词频、TF-IDF、Word2Vec等。通过对这些特征进行进一步的处理和分析,可以挖掘出文本中隐藏的信息和规律,从而完成各种NLP任务。
文本摘要也是一个重要的任务,旨在从长篇文章中提取关键信息,生成更短的摘要。这有助于用户快速了解文章的主要内容,提高信息处理效率。
文本摘要可以分为两个主要类别:抽取式摘要和生成式摘要。抽取式摘要是从文本中选择一些关键句子或词语,组成一个简短的摘要。而生成式摘要是根据文本生成一个完全新的摘要,不仅仅是选择关键句子。
而这类技术的背后需要海量的互联网数据来支撑,而此次的问题,的确在网上收集的数据集上存在了问题,但同时,也说明旧的API在NLP语义分析上尚存不足之处。所以我觉得老周的态度没问题,科研技术和市场产品是需要时间和空间磨合的,尤其是前沿技术推向市场也不能操之过急,仍需渐进式部署。