1.网络媒体信息的获取流程
2.三原色原理
3.颜色特征表达的特点、问题和主要方法
4.文本特征表达的方式
5.网络媒体信息与网络通讯信息
6.网络媒体信息获取方法
7.补充
8.视觉特征表达的应用
9.颜色特征表达举例之颜色直方图
10.纹理特征和局部特征
答:
1.网络媒体信息的获取流程主要由以下几个部分组成:
初始URL集合(信息“种子”集合)→等待获取的URL队列→信息获取模块→信息解析模块→信息判重模块→互联网信息库。
2.RGB,锥状细胞对于感知颜色至关重要,人眼里有三种锥状感光细胞,分别对红色、绿色、蓝色最为敏感。人眼之所以能看到各种颜色的光,主要是这三种细胞感觉综合的结果。
3.颜色特征表达的特点:
(1)颜色与图像中包含的物体或场景关系密切;
(2)颜色特征对图像尺寸、方向、视角等的依赖性小。
需要解决的两个问题:
(1)选择合适的颜色空间计算颜色特征;
(2)选择合适的方法将颜色特征量化。
表示的主要方法:
颜色直方图、主色调、颜色矩、颜色集、聚类
4.
1-of-N Encoding(One-hot Encoding)
将词表示成一个向量,该向量的维度是词典的长度。该向量中,该单词索引的位置,值为1,其余的位置为0.
如下所示
词频:一个词在文档中出现的次数。
通过词频进行特征选择就是将词频小于某一闭值或大于某一值的词删除,从而降低特征空间的维数。
文档频数(DF):最为简单的一种特征选择方法,指的是在整个数据集中有多少个文本包含这个单词。
逆文档频率(IDF)=log(语料库的文档总数/(包含该词的文档数+1))
TF-IDF = TF*IDF
5.网络媒体信息是指传统意义上的互联网网站公开发布信息,网路用户通常可以基于网络浏览器获得互联网发布信息。
网络通讯信息是指互联网用户使用除通用网络浏览器以外的专用客户端软件,实现与特定点通信,或进行点对点通信时所交互的信息。
6.按信息发布方式,网络媒体信息可分为直接匿名浏览信息与需身份认证网络媒体发布信息两类;
按网页具体形态,又可分为静态网页与动态网页两类。
其中,自然人网络浏览行为模拟技术在网络媒体信息获取环节正在得到越来越广泛的应用。
7.(1)视觉信息处理过程:
获取、压缩、传输、重建、处理
(2)在计算机中,一幅图像可以用矩阵表示,每一个像素点对应矩阵中的一个元素。
彩色图像:每个像素点由三个矩阵元素表示。
彩色图像→灰色图像:Y=R+G+B/3
(3)视频就是其内容随时间变化的一组动态图像,所以又叫运动图像或活动图像。
(视觉余像,时值是二十四分之一秒。)
8.图像匹配、图像检索
9.颜色直方图描述不同色彩在整幅图像中所占的比例,而不关心每种色彩所处的空间位置。
颜色直方图可基于不同的颜色空间,最常用的是RGB空间,原因在于大部分的数字图像都是用这种颜色空间表达的,也可以用其他颜色空间,如HSV。
步骤:
(1)选择颜色空间,并将该颜色空间划分成若干个小的颜色区域,即颜色量化。
(2)统计其颜色落入到每个小区间的像素数目。
优点:计算简单,一定场景下能反映图像内容。
缺点:丢失空间信息。
10.