第1章 信息系统综合知识
1.1 信息的定义和属性
1.1.1 信息的基本概念
控制论创始人维纳认为:信息就是信息,既不是物质也不是能量。
信息论的奠基者香农认为:信息就是能够用来消除不确定性的东西。
其他流行说法:信息是事先不知道的报导。
哲学界认为:信息是事物普遍联系的方式。
1、本体论信息概念
事物的本体论信息,就是事物的运动状态和状态变化方式的自我表述。按照这个定义,所谓得到了某个事物的本体论信息,就是知道了这个事物处在什么样的运动状态,以及这个运动状态会按照什么方式发生变化。
2、认识论信息概念
主体关于某个事物的认识论信息,就是主体对于该事物的运动状态以及状态变化方式的具体描述,包括对于它的“状态和方式”的形式、含义和价值的概述。由于引入了主体的因素,认识论信息的内涵变得比本体论更丰富了。按照这个定义,所谓得到了某个事物的认识论信息,就是不仅知道了这个事物的运动状态和状态变化方式的表现形式,而且知道了这种“状态和方式”的含义以及它们对主体的价值。
2、本体论和认识论的关联
认识论信息与本体论信息是相通的,它们共同的核心都是“事物运动的状态和状态变化的方式”。不仅如此,两者还可以相互转化。转化的基本条件就是主体因素:引入主体因素,本体论信息就转化为认识论信息。人类认识世界的任务和先决条件之一,就是把本体论信息恰如其分的转化为认识论信息,为其后的决策提供依据。
1.1.2 信息的定量描述
香农用概率来定量描述信息:
H(X)表示事件X的信息熵
Pi是事件出现第i种状态的概率
在二进制的情况下,对数的底是2,此时信息熵可以作为信息的度量,称为信息量,单位是比特(bit)
1.1.3 信息的传输模型
信息是有价值的一种客观存在。信息技术主要为解决信息的采集、加工、存储、传输、处理、计算、转换、表现等问题而不断繁荣发展。信息只有流动起来,才能体现其价值,因此信息的传输技术(通常指通信、网络等)是信息技术的核心。信息的传输模型如下:
1、信源:产生信息的实体,信息产生后,由这个实体向外传播。如QQ使用者,他通过键盘录入的文字(如:你好!)是需要传播的信息。
2、信宿:信息的归宿或接收者,如使用QQ的另—方(当然这—方也是信源),他透过电脑屏幕接收QQ使用者发送的文字(如:你好!)。
3、信道:传送信息的通道’如TCP/IP网络。信道可以从逻辑上理解为抽象信道,也可以是具有物理意义的实际传送通道。TCP/IP网络是一个逻辑上的概念,这个网络的物理通道可以是光纤、铜轴电缆、双绞线,也可以是4G网络,甚至是卫星或者微波。
4、编码器:在信息论中是泛指所有变换信号的设备,实际上就是终端机的发送部分。它包括从信源到信道的所有设备’如量化器、压缩编码器、调制器等,使信源输出的信号转换成适于信道传送的信号。在QQ应用中’键盘敲击会使键盘的由不确定状态转换为某种确定状态’此时信息产生了,通过一系列的信号采集、加工、转换、编码,信息最终被封装为TCP/IP包,推入TCP/IP网络,开始传播之旅。从信息安全的角度出发,编码器还可以包括加密设备,加密设备利用密码学的知识,对编码信息进行加密再编码。
5、译码器:译码器是编码器的逆变换设备,把信道上送来的信号(原始信息与噪声的叠加)转换成信宿能接收的信号,可包括解调器、译码器、数模转换器等。在上述QQ应用中’TCP/IP包被解析’信息将显示在信宿的计算机屏幕上,发送者传送信息的不确定性消除了。
6、噪声:噪声可以理解为干扰,干扰可以来自于信息系统分层结构的任何—层,当噪声携带的信息大到—定程度的时候,在信道中传输的信息可以被噪声淹没导致传输失败。
—般情况下,信息系统的主要性能指标是它的有效性和可靠性。有效性就是在系统中传送尽可能多的信息;而可靠性是要求信宿收到的信息尽可能地与信源发出的信息—致,或者说失真尽可能小。为了提高可靠性,在信息编码时’可以增加冗余编码,犹如“重要的话说三遍”’恰当的冗余编码可以在信息受到噪声侵扰时被恢复’而过量的冗余编码将降低信道的有效性和信息传输速率。
概括起来,信息系统的基本规律应包括信息的度量、信源特性和信源编码、信道特性和信道编码、检测理论、估计理论以及密码学。
1.1.4 信息的质量属性
信息反映的是事物或者事件确定的状态,具有客观性、普遍性等特点,由于获取信息满足了人们消除不确定性的需求,因此信息具有价值,而价值的大小决定于信息的质量,这就要求信息满足一定的质量属性,包括:
1、精确性:对事物状态描述的精准程度。
2、完整性:对事物状态描述的全面程度,完整信息应包括所有重要事实。
3、可靠性:指信息的来源、采集方法、传输过程是可以信任的’符合预期。
4、及时性:指获得信息的时刻与事件发生时刻的间隔长短。昨天的天气信息不论怎样精确、完整,对指导明天的穿衣并无帮助,从这个角度出发,这个信息的价值为零。
5、经济性:指信息获取、传输带来的成本在可以接受的范围之内。
6、可验证性:指信息的主要质量属性可以被证实或者证伪的程度。
7、安全性:指在信息的生命周期中,信息可以被非授权访问的可能性,可能性越低,安全性越高。