目录
范式转变——非结构化数据
非结构化数据示例
范式转变——非结构化数据
既然我们对结构化数据和半结构化数据有了清晰的理解,现在让我们开始谈谈非结构化数据。与结构化数据和半结构化数据不同,非结构化数据可以采取任何形式,可以有任意大小或尺寸,并需要大量的运行时间来转换和索引。我们以图像为例:同一只德国牧羊犬的连续三张正面图片从语义上来讲是相同的。
语义相同?这究竟是什么意思?让我们再深入一点,解读一下语义相似性的概念。尽管三张图片的像素、分辨率、文件大小等可能有很大区别,但它们都是同一场景下的同一只德国牧羊犬。换句话说,这三张图片都有相同或接近的内容,但原始像素值却明显不同。这给使用该数据的行业和公司带来了新的挑战:我们如何能以类似于结构化或半结构化数据的方式来转换、存储和搜索非结构化数据?
在这一点上,你可能想知道,如果非结构化数据没有固定的大小或格式,我们如何进行数据搜索和分析?答案是——机器学习。更具体地说,深度学习。过去十年里,大数据和深度神经网络的结合从根本上改变了数据驱动应用的方式。从