您的位置 首页 知识

信息是什么(信息是什么呢?)

信息是什么

我常常发现我们了解某一件事情,知道一件事情,天天谈论这一件事情,但是我们往往不是真的理解这件事,比如说信息,我们总是说到信息,可是信息是什么?请问你可以给信息下个定义吗?

信息论 -香农·克劳德的“通信系统的数学原理”

去理解信息,肯定绕不开的是信息论的奠基论文,香农·克劳德的“通信系统的数学原理”。

比特(bit)

在这篇论文中他提出了信息的度量- 比特:

If the number of messages in the set is finitethenthis numberorany monotonic function of this numbercan be regarded asa measure of the informationproduced when one message is chosen from the set, all choices being equally likely.

If the base 2 is used the resulting units may be calledbinary digits, or more brieflybits, a word suggested by J.W. Tukey.

A device with two stable positions, such as a relay or a flip-flop circuit, can store one bit of information.

N such devices can store N bits,

since the total number of possible states is

and

根据这个定义一位二进制数所能存储的信息大小也就是1比特。

信息熵(entropy)

他也给出了信息熵的定义:

We have represented a discrete information source as a Markoff process. Can we define a quantity which will measure, in some sense, how much information is “produced” by such a process, or better, at what rate information is produced?

Suppose we have a set of possible events whose probabilities of occurrence are

These probabilities are known but that is all we know concerning which event will occur. Can we find a measure of how much “choice” is involved in the selection of the event or of how uncertain we are of the outcome?

Quantities of the form

play a central role in information theory as measures of information, choice and uncertainty.

以上的公式就是计算信息熵的公式。

信息熵的度量单位也是比特。

当我们将上面的公式应用于只有一位的二进制数的时候,一位的二进制数的状态只有两个,0或者1,如果这位数上0或者1的状态是完全随机的话,则这位数为0的几率为0.5,为1的几率为1-0.5=0.5,那么信息熵的值为:

则一位的二进制数的信息熵为1比特,N位的二进制数的信息熵为N比特。

关于信息熵,这里有一个故事。

An analog tothermodynamic entropyisinformation entropy. In 1948, while working atBell TelephoneLaboratories electrical engineerClaude Shannonset out to mathematically quantify the statistical nature of “lost information” in phone-line signals. To do this, Shannon developed the very general concept ofinformation entropy, a fundamental cornerstone ofinformation theory. Initially it seems that Shannon was not particularly aware of the close similarity between his new quantity and earlier work in thermodynamics. In 1949, however, when Shannon had been working on his equations for some time, he happened to visit the mathematicianJohn von Neumann, who asked him how he was getting on with his theory of missing information. Shannon replied that the theory was in excellent shape, except that he needed a good name for “missing information”. “Why don’t you call it entropy”, von Neumann suggested. “In the first place, a mathematical development very much like yours already exists in Boltzmann’s statistical mechanics, and in the second place, no one understands entropy very well, so in any discussion you will be in a position of advantage.”

(Avery, John (2003).Information Theory and Evolution. World Scientific. ISBN9812384006.)

信息的定义?

香农·克劳德在论文中并没有给出我们认知中的信息的定义,

The fundamental problem of communication is that of reproducing at one point either exactly or approximately amessageselected at another point.

Frequently themessagehave meaning: that is they refer to or are correlated according to some system with certain physical or conceptual entities.These semantic aspects of communication are irrelevant to the engineering problem.

The significant aspect is that the actualmessageis one selected from a set of possible messages. The system must be designed to operate for each possible selection, not just the one which will actually be chosen since this is unknown at the time of design.Ifthe number of messagesin the set is finitethenthis numberorany monotonic function of this numbercan be regarded asa measure of the informationproduced when one message is chosen from the set, all choices being equally likely.

We may roughly classify communication systems into three main categories:discrete,continuousandmixed.

By a discrete system we will mean one in which both themessagesand the signal area sequence of discrete symbols.A typical case is telegraphy where the message is a sequence of letters and the signal a sequence of dots, dashes and spaces.

A continuous system is one in which themessageand signal are both treated ascontinuous functions, e.g., radio or television.

A mixed system is one in which both discrete and continuous variable appear, e.g., PCM transmission of speech.

香农·克劳德的论文中的信息指的是通讯系统处理和传输的对象,香农·克劳德其实是说这篇论文中讨论的是通讯系统中的讯息(message)和信号(signal), 并不讨论这些讯息(message)和信号(signal)的意思(meaning)、意义(physical or conceptual entities)和语义(semantic aspects)。

从上下文来判断香农·克劳德的论文中的信息应该是符号序列(a sequence of discrete symbols)或者是连续函数(continuous functions)。

现在的问题是我们日常中所说的信息指的是符号序列和连续函数吗?

比方说这句话:”这段话(符号序列)有什么信息(符号序列的意义)“。又比方说:”别人给我发了一段信息(符号序列),我不太理解这段信息(符号序列)的意思。“

可见在我们的语言中,信息是个多义词,符号序列和符号序列的意义我们都用了同一个词“信息”,这使得我们用语言来解释信息时遇见了障碍,我们日常所说的信息既可能指符号序列本身,也有可能指的是符号序列的意义,我们需要通过上下文来判断。

现在可以确定的知道,在信息论的奠基论文,香农·克劳德的“通信系统的数学原理”中很明确的说了:These semantic aspects of communication are irrelevant to the engineering problem.(通讯中(信息)的语义与工程问题不相干)。也就是说“信息”这个词另一个定义,符号序列的意义,并不在这篇论文的讨论中。

但是信息本身并不仅仅是符号序列本身或者符号序列的意义,比方说这句话:“这件事情你有多少信息,要不我们来讨论一下”。你不能说成:

“这件事情你有多少符号序列,要不我们来讨论一下”

或者

“这件事情你有多少符号序列的意义,要不我们来讨论一下”。

你没有办法直接用“符号序列”或者“符号序列的意义”来代替掉这句话中的“信息”。信息的含义要更广的多,那么信息是什么呢?

信息是什么呢?

当说到信息,我们想到的是从手机和电脑中无时不在的将我们淹没的信息洪流,信息在庞大的互联网中流动,从电脑或者手机中喷薄而出,印入眼睛,钻进耳朵,进而刺激我们的脑神经,扰动着神经元上的电脉冲,影响着我们的想法。

信息可以是反应真实世界的,如温度、时间、质量和空间位置等等。信息也可以是来自我们的幻想之中,像孙悟空和哈利波特等等幻想人物从未在这世间存在过,但这并不妨碍我们谈论这些故事。

信息也可以描述我们的想法,描绘现在不存在但是将来会出现的事物的。建筑的蓝图最终会变成大厦,靠左靠右行驶的法规变成了现实中有秩序的交通。在大城市的夜空俯瞰下去的时候,我们会看到被灯光点亮的高楼大厦,我们会在在道路上看到泾渭分明的两条洪流,一个是车前灯白光的光流,一个是车尾灯红光的光流。

信息可以用各种各样的方法表达出来,如果我们对信息进行一番观察,却发现信息有着如此众多不同的形式,可以为文字,可以为图像,可以为声音,可以为气味,可以为味道,可以为触觉,可以为电波。也可以通过各种各样的方法传递出去,可以用我们的声音讲述给另一个人听,可以用笔墨写在纸张上让后人都看见,可以用键盘输入到电脑中显示在屏幕上,可以通过手机和网络传送到世界的另一端。但信息不是电脑屏幕上的像素,不是电子信号的高低电平,不是写字时所用的纸张和墨水,信息不是发送手机信号时所用的电量和射频信号,虽说信息需要物质和能量来产生,传递、存储和处理,但是信息既不是物质也不是能量,那么信息是什么?

我们可以将自己作为一个我们研究信息的研究对象,当我们听到声音的时候,其实是发生了以下的一系列事情:外界的变化,如石头掉在地上引起的撞击,产生了空气分子的振动,然后空气分子的振动引起了耳朵中的鼓膜的振动,鼓膜后的骨头将之传导到耳蜗的外壁,耳蜗外壁上的振动又引起了耳蜗中淋巴液的波动,淋巴液的波动带动了耳蜗中毛细胞上的纤毛的摇摆,而这样的摇摆让毛细胞释放了神经传递介质,导致与毛细胞突触相连的神经纤维上产生了向大脑发送的电化学反应,经过一系列大脑中的电化学反应,我们听见了声音。

在这里电化学反应就是信息载体,空气分子的振动是外界变化,耳朵是空气分子的振动转化为电化学反应的传感器,而大脑解读了电化学反应中的信息,从而让我们听见了声音,在我们脑海中具现的声音才是我们认知中的信息。

可见大脑才是信息的关键,而大脑是智能的物理实现,如果没有智能的话,信息无法被解读。

由此可见,信息是和智能紧密相连的。如果没有智能来解读信息,纸面的反射光的图样,传播的空气振动,空气中的化学物质,电路中起伏的电压,大脑中的电化学反应,一切的一切都只是无意义的物理化学现象。可以说信息是智能本身的一部分,是智能的基础部分,我们需要从智能的角度去理解信息。

那么智能是什么?尽管我们知道什么是智能,但是我认为我们现有的知识不足以给智能下定义,信息作为智能的基础也是一样,现有的知识不足以给信息下定义。

为什么会这样说?比方说水的定义,在科学没有进展到发现水的成分是一氧化二氢之前,我们该如何给水下定义呢?而现在我们就可以说水是化合物一氧化二氢的液态。

讨论到现在,我们发现我们不能用语言来给智能和信息下定义,智能和信息只可意会不可言传,但是这并不妨碍我们来理解信息的现象和作用。正如我们在无法给水下定义的时候,并不妨碍我们观察水的现象以及使用水;正如我们在不理解燃烧的本质前,并不影响我们观察火的现象和使用火。

智能、信息载体和外部信号

那么什么东西拥有智能呢?我们知道石头没有智能,水没有智能,空气没有智能,那么生物拥有智能吗?人类是拥有智能,那么其他生物呢?

生物的一个基本特性就是任何生物都有能对外界变化做出响应的机制,这种机制其实就是一种收集和处理信息的能力,也就是智能。但是这种能力有强有弱,人类的智能能够处理非常复杂的外界情况,而单细胞生物的智能仅仅能对一定的外部激励做出响应;很多生物也在利用这种对外界环境的变化做出响应的机制在同类之间交换信息,甚至有些单细胞生物也可以在同类之间交换信息从而协同合作。

单细胞生物,如细菌,可以对于环境的营养物质浓度的高低,比方说氮的浓度水平,做出响应。大肠杆菌E. coli的表面有化学感应器,当外部营养物质浓度变化后,化学感应器通过化学反应激活了细菌内部的化学信号通道,化学信号通道内的化学物质与控制细菌上的鞭毛的蛋白质作用后,会控制鞭毛的摆动,进而控制细菌的运动,从而细菌对于环境中营养物质浓度的变化做出了响应。这可以算是一种智能的表现。在这当中,营养物质浓度的变化是外界变化或者是信号,细菌内部的化学物质和化学反应是信息的载体。

还有一种细菌叫做费氏弧菌Aliivibrio fischeri,这种细菌会释放出自体诱发物的化学物质,如果在水中的,这种自体诱发物的浓度很低,当这种细菌生活在夏威夷短尾鱿的发光器官中的时候,由于夏威夷短尾鱿的发光器官给这种细菌提供食物,这种细菌的数量会增加,那么释放的自体诱发物的浓度会升高,当浓度到达一定程度时,细菌的化学感应器通过与自体诱发物这种化学物质的化学反应,打开了细菌中的化学反应形成的信号通路,化学信号通路中的化学物质激活了细菌的一部分基因表达,这部分基因表达让细菌生成了一种发光酶,从而夏威夷短尾鱿的发光器官开始发光,这种放光可以消除夏威夷短尾鱿投射到下方的阴影,捕食夏威夷短尾鱿的动物也就无法通过阴影发现夏威夷短尾鱿的存在。发光酶的产生既是一种对环境变化的响应,也是一种对于同类之间交换的信息的反应,这也是智能的表现。在这当中,自体诱发物浓度的变化是外界信号,细菌内部的化学物质和化学反应是信息的载体。

对于有神经系统的生物而言,生物神经系统收到了外部环境的影响,如自然界中的光和空气分子的振动,神经系统将光和振动转化为神经系统中的电化学反应,神经系统根据这些电化学反应进行运作,然后电化学反应直接作用于生物组织(如肌肉)从而产生不同的行为或者动作,进而对外界环境中的变化做出响应;而不同生物个体之间,会传递声音、光的图样(如人使用的文字),化学物质(如蚂蚁使用的信息素)等等不同的外界信号,这些外界信号被生物接收后经生物的传感器(如耳朵、眼睛等等)转化为神经系统中的电化学信号,这样生物之间就可以互相交换信息了;这些都是智能的表现。在这当中,自然界的光的图样、空气分子的振动以及化学物质是外界信号,生物内部的化学物质和电化学反应是信息的载体。

信息技术的产品也拥有一定智能,比方说我们使用的电脑,当我们的手指敲击键盘,键盘将这些敲击的动作转化为电脑中的电学变化,如电压电流的变化,电脑中的电路对这些电压电流进行处理,然后这些电压电流会被转换成闪存中的电荷,也有可能转换为电脑屏幕上文字的影像,这也是一种对外界变化的响应,其实也是一种智能的表现。在这当中,手指敲击键盘是外界信号,电学变化是信息的载体。

从上面的观察我们可以得知信息的载体是多样化的,化学反应、电化学反应、电学变化都可以是信息载体,没有信息载体也就没有智能,智能只能处理信息载体,外界信号首先必须被转化为信息载体之后,智能才能解读信息载体中的信息后进而对外界变化做出响应。

语言

单细胞生物通过释放能被自身化学感知器接收的化学物质的方法来传递信息和协作,如前面所说的发光的费氏弧菌。蚂蚁也通过信息素来识别敌我以及标识寻找食物的路径。蜜蜂会通过身体动作来告知蜂群食物的路径。鸟儿会通过叫声交流,狮子的吼声可以传递上十几公里,鲸鱼之间交流用的声音可以传递上上千公里。

为了更有效的收集、传递和处理信息,很多生物都发展出语言的功能,语言是智能为了更有效的利用外界变化信号和信息载体收集、传递和处理信息,而制定的用事物变化来对应信息的规则。黑猩猩、鸟类、鲸鱼都被发现拥有一定的语言功能,现有的知识表明,人类拥有自然界中最复杂的语言功能。

我们在这里观察一下人类的语言,很容易发现语言是智能制定的用事物变化来对应信息的规则。这里语言是广义的,包括我们的身体语言,手语,发出来的声音、画出来的图像,写出来的文字,拍出来的视频等等,语言经由光的图样和空气分子的振动等等物理变化,被我们感官感知之后,转化为神经系统中的电化学反应,然后大脑(智能)将电化学反应之中的信息具现出来。如文字“火”,我们会将我们看到火时的影像、使用火时的经验、甚至被火灼伤时的感受,等等这些信息,与“火“这个文字,其实是光的图样,对应起来,当我们看到”火“这个字的光的图样时,我们的大脑就会具现出与”火“相关的信息。

语言能否成功的关键之处在于:两个个体感知到,这些根据语言规则制造的事物变化之后,能够具现出同样的信息。如写在纸上,刻在石头上,显示在屏幕上的文字,这些文字,经反射光,或者直射光,或者遮蔽部分光之后,所形成的光的图样,被眼睛感知后,在两个个体的大脑中具现出来的这些文字的意思是一致的。这时候我们就可以利用事物的变化来传递信息,当事物的变化依据语言的规则而变化时,这些变化被智能接收到之后,智能中的语言功能将这些事物变化中所传递的信息解读出来。

现有所知的任何其他生物都没有像人类这样掌握如此复杂的语言,我们大脑的可塑性让复杂的语言规则成为可能。我们大脑允许我们从小学习语言的规则,并且将语言的规则嵌入到我们的大脑皮层中,成为我们智能的一部分,即大脑中的语言中枢。当每个人都学习同样的语言,并且确保每个学过同一种语言的人当收到依据语言规则产生的事物变化时,都可以具现出同样的信息,这样的话,人们就可以通过语言来传递信息了,依据语言规则产生的事物变化,如声音,光的图样,就成为人与人之间交流的外界信号。如果人们没有学过这种语言,那语言本身就是毫无意义的,正如在罗塞塔石碑被发现前的古埃及文字一样。

语言发明和发展的过程其实就是让个体之间更加准确和精确的传递信息的过程。一开始我们用语音和手势来表达信息,但是不够精确,后来人类发明了文字和图像,这里举个例子,你去问一个人姓名,如果那个人用语音回答说姓Zhang,你还要用问是弓长张还是立早章,但是如果写下来,则一目了然。

再后来我们发现文字和图像表达也不是很准确,而且人与人之间也有认知上的差别,比方说前几年大家在网上在争执图像中一条裙子的颜色,究竟是蓝黑相间还是白金相间,由于每个人视锥细胞敏感度的不同,大家各执一词,这些现象其实是我们生物神经系统的局限。

这时我们发现如果将图像分割成一个个像素点,每个像素点上的颜色就可以用红绿蓝三原色的数值来表示,而前述例子中裙子的颜色则可以通过这些红绿蓝三原色的数值大小精确判断出来。

那么我们是否可以用数字来表达信息吗?理论上是可行的,每个文字都用一个数字代替,一段文字则是一段数字的序列;一段声音可以分割为很多个时间点,每个时间点上都有声音频率、声强的数值,那么一段声音则可以用一段数字序列来代替;图像可以被分割成很多个像素,每个像素上的颜色用红绿蓝三原色的数值来表示,一个图像也就变成了数字序列。

但是当人类去识别数字序列时,由于我们生物神经系统的局限,很容易将这些数字序列混淆,我们无法具现出大规模数字序列中的信息。

如果没有以计算机为代表的信息技术出现的话,那我们人类的智能将很快到达上限。尽管信息技术发展之初的用途可能只是用于通讯、计算以及音频处理等等,但是在我看来,信息技术的发明和发展其实是一个复现和发展人类智能的伟大实验和尝试,每个人都深入其中。

冯–诺伊曼受到神经系统中动作电位现象的启发在计算机中使用了二进制语言,即用事物变化来对应0和1两个不同的信息的语言规则。

而任何数字都可以用0和1两个符号组成的符号序列来代替,二进制的代码很容易在信息技术的系统之中实现,0和1分别用电学变化来对应,如电压的高电平代表1,电压的低电平代表0,或者光信号来对应,如有光的时候代表1,没有光的时候代表0,信息技术系统很容易识别这些信号,再加上各种信息校验技术后,信息科技系统可以更准确的识别这些电学信号或者光学信号,并将之与0和1的符号相对应,从而信息技术系统成为人类处理大规模数字序列的不可或缺的工具,人类不能处理大规模数字序列的问题得以解决。

信息技术产品的一个功能就是将二进制的语言翻译成人类所能理解的语言,如文字、图像、声音和视频等等,因为在信息技术系统中,这些文字也好,图像也好,声音也好,视频也好,统统都是二进制的符号序列,而信息技术系统通过算法将这些二进制的符号序列转换成文字、图像和视频等等人类感官所能感知的事物变化,如光的图样和空气分子的振动,这些物理变化再经过我们身体的传感器,如眼睛和耳朵,再转化为我们神经系统中的电化学变化,然后我们的大脑再将其中的信息解读出来,信息技术系统这时是我们所使用的二进制语言的翻译器。

信息技术系统的使用也扩大了我们人与人之间交流的距离,当我们用图像和声音交流时,我们只能在双方听得见看得见的地方交流,而信息技术系统之间的通讯手段,如光纤、无线电等等,让即使距离半个地球的人都可以交流。

但是信息技术系统的发展不仅仅止于此。现在很多前沿科技在做的事情就是要省略掉大脑解读信息和处理信息的步骤,直接通过信息技术系统来解读和处理二进制的语言符号序列中的信息,而不是将二进制语言转化为人类的语言,再由人类的大脑来解读语言中的信息和处理信息。

如果通过大脑来解读文字、图像、声音以及视频中的信息时,由于我们大脑生理的限制,我们会误读或者错过所需的信息,并且我们解读和处理信息的速度也是极其缓慢的,而永不疲惫的信息技术系统能够更快更好的解读信息和处理信息,只要有合适的算法和高速的硬件。

如果我们仔细观察一下,其实现今在我们的社会中,使用最广泛的语言不是英语,也不是汉语,更不是其他各种人类所使用的语言,而是二进制的语言,我们的手机、电脑,各种信息技术设备无时不刻在使用着二进制的语言。二进制的语言是迄今为止最有效的语言,使用最广泛的语言,最准确和最精确的语言,以及传播速度最快的语言。

激励和感知

我们再看一下我们前面关于声音的例子,当我们听到声音的时候,其实是发生了以下的一系列事情:外界的变化,如石头掉在地上引起的撞击,产生了空气的振动,我们也可以通过控制喉咙中声带的振动,依据语言的规则产生相应的空气振动,然后空气振动引起了耳朵中的鼓膜的振动,鼓膜后的骨头将之传导到耳蜗的外壁,耳蜗外壁上的振动又引起了耳蜗中淋巴液的波动,淋巴液的波动带动了耳蜗中毛细胞上的纤毛的摇摆,而这样的摇摆让毛细胞释放了神经传递介质,导致与毛细胞突触相连的神经纤维上出现了向大脑发送的电化学反应,经过一系列大脑中的神经系统中的电化学反应,我们听见了声音。

在这里电化学反应就是信息载体,耳朵是空气分子的振动转化为电化学反应的传感器,而大脑(智能的物理实现)则让我们听见声音,在我们脑海中具现的声音才是我们认知中的信息。

这里有两个步骤:第一步,产生外界变化,如空气分子的振动;第二步,外界变化被传感器转化为智能(大脑)能够处理的信息载体(电化学反应);第三步,智能(大脑)再将信息载体(电化学反应)中的信息解读出来。第一步即为激励,第二步为感知,第三步为信息处理。

被感知的外界变化被称为激励,包括太阳的照耀带来的光线,声带振动产生的空气分子的振动,各种化学反应散发出的化学物质分子。将外界变化转化为信息载体的过程即为感知,如耳朵将空气分子的振动转化为大脑中的电化学反应,如麦克风将空气分子的振动转化为信息技术系统中的电学变化。

信息的处理

感知过程得到只是信息载体,智能依然要解读信息载体中的信息以及对这些被解读出来的信息进行更多的处理,这个过程就是信息的处理,信息处理的过程有简单有复杂。

简单的如膝跳反应,轻敲膝盖骨下方的肌腱时,引起肌肉中感应器发出电化学反应,电化学反应未经任何大脑中神经回路的处理,直接经反射弧传导到股四头肌的运动神经上,与运动神经相连的股四头肌中的效应器引起股四头肌的动作,从而产生了膝跳反应。这个过程中信息的处理其实就是简单的发送和接受。

复杂一点的如我们绕开地上水洼的过程,我们的眼睛将外界的情况转化为神经系统中的电化学反应,大脑根据这些电化学反应具现出外部的影像,在对这个影像的信息进行进一步处理的时候,我们识别出地上的水洼,大脑提取了以往的经验知道:如果直接通过水洼的话,会将身上弄脏;然后大脑做出了选择要绕过水洼,这时大脑做了一系列的处理,策划出行走的路径,然后产生了一系列指令性的电化学反应到身体各部分的肌肉中的效应器,肌肉做出相应的动作,然后绕过了水洼。这当中涉及了大量的信息的处理,对我们人类而言,感觉上很简单,但其实在工程上实现却是非常复杂的事情,这就是现今一些类人机器人依然给人一种很笨拙的感觉的原因。

信息的处理其实就是从信息载体中解读信息、通过对信息载体进行处理得到更多信息,以及包括,如有必要,发出相应的包含指令性信息的信息载体的过程。

响应

将信息经信息载体转化为对外界的影响即为响应。如神经系统中的电化学信号通过效应器被转化为诸如肌肉的收缩和舒张等等身体反应的过程。如信息技术系统中的电学变化通过促动器转化为电机的转动等等。

所以与信息和智能相关的有四个步骤,激励、感知、信息的处理、响应。

信息技术

信息技术其实就是围绕上述与信息和智能相关的方方面面展开的:

语言

由于二进制语言的准确性,信息技术系统中采用了二进制的语言;由于智能和信息的具体意义不明,在信息技术中,为了简洁方便,信息在通常情况下被认为是二进制语言的符号序列,而不是被定义为符号序列的意思、意义或者语义,那么信息的多少就可以用符号序列的多少来衡量。比方说闪存的存储空间有1GB,也就闪存可以存储10亿(或者2的30次方)字节大小或者80亿(或者8个2的30次方)比特大小的二进制语言的符号序列,其实就是80亿(或者8个2的30次方)个0或者1的二进制符号,比方说5G的传输速率为1Gbps,也就是每秒传输10亿(或者2的30次方)比特大小的二进制的符号序列,也就是每秒传输了10亿(或者2的30次方)个二进制的符号。将来更强的智能也许会制定出更精确和更准确的语言规则。

信息载体

生物体内使用的信息载体是各种化学反应以及电化学反应,这些信息载体局限了信息处理的速度和准确率,尽管人的视觉每秒可以处理1000万比特的信息,但是人类处理文字信息的速度非常缓慢,每秒只能处理50比特的信息,从日常经验中我们可以知道,我们的算术计算相对于计算机而言是非常的迟缓。

现今信息技术系统中使用的信息载体都是易于被信息技术系统高速、准确和精确识别的各种物理变化,如电学变化和光学变化等等,在此之上建立的信息处理速度将远远超过生物的信息处理速度,比方说40Gb的高速网络交换机可以处理每秒400亿(或者40个2的30次方)比特的信息。

信息技术的一个方向也许是将来我们可以找到更好的信息载体以及发展出在这之上的智能,如现在正在发展中的利用量子状态作为信息载体的量子计算,据报道说,量子计算机在处理某些特定问题的速度比传统计算机快上上万倍。

我们发明信息载体转换的技术来桥接我们的大脑和信息技术系统,从而得到一个信息处理效率更高的大脑和信息技术系统组合在一起的智能联合体。

我们使用键盘、触摸屏、显示屏来实现我们大脑与信息技术系统之间的连接,在这过程中,我们将信息从大脑中的电化学反应转为外界的物理变化,如手敲击键盘,再将外界的物理变化转为电脑中的电学变化,在这当中不得不经历外界物理变化的两次转换,从而降低了两种信息载体转换的速度。

直接将两种信息载体互换,即大脑中的电化学反应和信息技术系统中的电学变化之间的互换,也是信息技术发展的一个方向。比方说人们发明了人工耳蜗,通过麦克风我们将空气分子的振动转化为电学变化,人工耳蜗再将电学变化直接转换成大脑中的电化学反应,从而让一部分耳聋人士听见外部的声音;又比如在巴西世界杯上一位瘫痪的病人通过脑机接口将大脑中的电化学反应直接转换为信息技术系统中的电学变化,从而控制外骨骼为世界杯开球。

激励和感知

我们从激励和感知方面着手,扩大我们能够感知的范围以及我们能感知的精度,由于人类生理的局限性,我们不能感知周边世界的一切,但我们可以发明新的激励源和新的传感器让我们感知这世界中更多的东西。

以我们的视觉为例,当光强过低时,我们视锥细胞感受不到颜色,当一片黑暗时,我们什么都看不见,所以我们发明了照明灯具,如白炽灯和LED灯等等光激励源后,我们就可以在夜晚视物;当光强过强时,超出了我们眼睛的处理范围,于是我们通过墨镜或者滤光片降低光的强度,然后我们就可以观察太阳这样耀眼的物体;我们裸眼的最小视角只有0.07度,只能分辨在1米视距处大概1毫米大小的物体,所以我们发明了光学显微镜和光学望远镜,于是我们可以看见微小的微生物以及遥远的群星;我们的裸眼无法捕捉高速运动的物体,于是我们发明了高速摄像机去捕捉高速运动的细节,现在有一种每秒拍摄10万亿帧的摄像机,这种摄像机可以捕捉到光的轨迹;我们裸眼可见的光只是电磁波谱中极小的一部分,于是我们发明了红外线设备,X光设备,射电望远镜等等远远在我们裸眼可见范围之外的传感器和激励源。

响应

信息技术系统通过效应器或者促动器来作出响应。效应器或者促动器是将信息转化为对外界施加的影响的设备,如电机、电磁阀控制的气压和液压装置等等,照明灯具也是一种效应器。这些设备拓展了人类所能对世界施加影响的范围。

信息的处理

通过信息载体解读信息以及处理信息,人类一直在这方面不停向前,人工智能方面的进展在近些年已经实现了很多科幻小说中才有的场景,如物体识别,下败围棋世界冠军的人工智能等等。而且人工智能永不疲惫,计算速度远超人类,处理的数据也远远超过人脑的负荷,人工智能大大提升了智能的上限。

智能系统

信息技术另一个发展方向就是将激励、感知、信息处理和响应整合在一起做成智能系统,如现在的机器人,自动驾驶技术,智慧城市等等,这大大提高了人类对外界变化作出响应的能力。

能源

任何信息技术都要消耗能量,没有能源就无法使用任何信息科技,能源可以说是制约信息科技发展的一个要素,如果手机要接上电缆和插上电源才能使用,那么手机无法进入实用阶段,所以各种发电技术以及储能技术对于信息科技的推广起到了决定性的作用。

信息的作用

信息解决不确定性

这里并不是说只有信息才能解决不确定性,因为假信息也是信息的一种,而假信息会增大不确定性,但是信息可以被用来解决不确定性。譬如雷击事故,有树被雷劈了,有人说这是天谴,如果大家一直接受这样的信息,避雷针也不会被发明出来,被雷劈的不确定性也不会降低,可以说“雷劈是天谴”的信息是虚假信息,但是这种虚假信息依然是信息,只不过这种信息并不会降低不确定性。只有人们得到了“雷电是自然界中的放电现象”的信息时,避雷针的发明才变成了现实,从而降低了雷击事故的不确定性。所以说信息是可以被用来降低不确定性的,但是需要去仔细甄别有用的信息。

信息构筑社会

社会是个信息系统,如何通过信息来构筑社会呢?信息影响认知,认知塑造现实,现实限制行为,而这些行为又产生新的信息从而不断的改变着社会这个信息系统。就好像人在悬崖边上的道路上走路的时候,我们知道那边是悬崖,我们会主动的限制我们不从悬崖上掉下去;社会则是通过法律道德文化等等信息构筑了社会悬崖边上的道路,如果道德败坏了或者触犯法律了,就如同从社会中的悬崖边上掉落下去变成了社会性死亡,也许人的身体没有收到任何伤害,但人的信息体却受到损伤了;当然如果人的成就被社会认可了,如得到了勋章等等,身体上也许疾病缠身,但是人的信息体却得到了加成,得到了社会认可的信息光环。

通过科学获取可验证的信息

既然有虚假信息,那我们该如何得到真实的信息了,从理论上而言,我们是得不到绝对真实的信息的,但我们可以得到可验证信息,也就是可以经过事实检验的信息,那么如何得到可验证的信息呢?

我们先来看看基因进化,由于生物基因复制过程中的不完美或者生物基因受到了外部环境的影响如辐射或者化学物质污染,基因突变由此产生,生物基因上的核酸序列产生变化,不同生物个体之间,通过病毒感染的方式或者通过生物个体之间交配的方式,也在交换着各自基因上的核酸序列,包括基因突变得来的核酸序列组合,生物个体由于基因的变化通过生化反应产生不同的蛋白质,而蛋白质改变了生物的性状和行为,根据进化论中适者生存的法则,这些性状或者行为如果能够使得生物个体更加适应外部环境的话,则这样的生物个体得到更多的繁衍机会,而在其他生物个体则会逐渐消亡。这也是我们通常所说的进化论,或者说是生物的基因进化体系。

其实我们的科学体系如同信息的进化体系:如同随机偶发事件触发的基因突变,我们中的一些人偶然产生了一些奇思妙想;仿佛病毒感染了生物个体,将其他个体的信息嵌入到当前个体的基因中,我们也会从只言片语中得到一些启发;又好像生物个体之间交配时的基因互换,我们也与他人交流信息得来一些新的信息;就像新的基因产生一些与众不同的生物个体,我们也通过我们获得的信息推断出新的信息;然后如同外界环境通过适者生存的法则来筛选生物个体一样,我们将之付诸实践,实践证实或者证伪了这样的信息;也如同更适应环境的个体获得更多的机会繁衍后代一样,证实的信息会成为传授给他人和下一代的知识。所以说科学是获得可验证信息的进化体系,其实就是“实践出真知”。

在这篇文章我说到了以下内容:信息论中的信息指的是符号序列,信息技术中的信息也是信息论所指的符号序列,但是我们通常认知中的信息不光光是指符号序列,信息是智能本身,信息是智能的基础部分,尽管我们无法定义智能和信息,但是我们可以观察智能和信息的现象,智能是为了对外界变化作出响应而出现的,没有信息载体则智能无法运行,语言提高了信息的收集、传递和处理的效率,智能是激励-感知-处理-响应的系统机制,信息技术是围绕着与信息和智能相关的语言、信息载体、激励、感知、处理、响应以及能源这些方面开展的,信息主要用于解决不确定性以及构筑社会,科学是获得可验证信息的进化体系。

迄今为止写出来的三篇文章是这个公众号的开篇,在今后的文章将会是在这三篇文章的基础之上来谈论周边的世界。