近期随想：科技发展的终结

Posted on 2012-07-14 In 02 Soul Perigee Views: Disqus:

原创文章，转载请标明出处：Soul Orbit
本文链接地址：近期随想：科技发展的终结

最近看了一些视频，世界进步的真是好快。

希拉･尼伦伯格：用假体眼睛治疗失明 [Link]

Google Glass [Link]

Anthony Atala：三维细胞打印机打印肾脏 [Link]

看到这里，我不由得开始乱想，现在的科技已经发展到了现在这种程度，学科的分支已经如此的多，想学通多个分支已经相当的难。那到底什么时候才是科技发展的尽头呢？是不是很幼稚？:D，不要当真，乱想嘛。

1. 科技发展的基石：学习

人类通过学习传承自己的科技，而学习的方法受制于人类本身感知世界的方法——触觉，听觉和视觉。

1.1. 触觉

对于学习大量知识来说，触觉应该是最不直观的了，现在使用触觉来学习最常用的方式就是布莱叶盲文体系了。

首先抛开写成盲文的资料本就不多，我们先直接看看盲文本身吧。盲文的构成很容易理解，一个盲文字母使用6个点来表示，每个点有两个状态，平坦和凸点，也就是：0和1。也就是说，一个盲文字母可以表示2^6 = 64种不同的状态。这些状态用来表示基本的英文字母和数字已经基本足够。而如果再加上大小写和符号，则开始显得有些吃力了。于是还加入了专门用于切换大小写的盲文，专门用于切换英文和数字的盲文，用来增加更多的状态。在这套体系下，学习的速度就和触摸和理解的速度有关系了，但是即便一秒钟摸五个字母，我们学习的速度，也只有4Bytes/s。

啊！这速度还真是小啊。难道我们就不能改进他么？当然可以，那就是二级布莱叶盲文。任何一个盲文字母都可以表示一个缩写，如w表示will。我们现在主要的盲文出版物基本都是基于这个体系上的，这样，我们的学习速度提升到了12-20Bytes/s，但是貌似还是没有质的飞跃。那我们还能不能创造三级布莱叶盲文呢？这里有一个问题就不得不考虑了：越复杂的编码，会导致信息本身越难解码。而且二级盲文已经开始存在歧义，需要读完一个单词之后才能真正理解其含义，三级盲文，肯定歧义更大，更难理解。

1.2. 听觉

接下来是听觉，从听觉开始，信息已经不是那么的简简单单，声音不仅仅承载了基本的信息，他本身还具有四要素：音质、音长、音强和音高。所以我们只好分开来思考声音这个媒介了：信息和声音本身。

声音传递的信息量是有限的，基本就是有多少个音，就承载了多少信息。如果不考虑人对声音的接受能力，人类的语速极限是在250-300bpm左右（点此看看245bpm说话的感觉吧，1分多钟的时候开始），而语言的基础——音素，基本都是在100种以内，比如英语就只有48个音素，其中元音20个，辅音28个。如果一个音素表示一个字母数字或符号，那么，声音能传递的信息的速度大概是4-5Bytes/s，居然比盲文慢这么多，真是难以至信！难道我们就不能和盲文一样，将我们要传递的信息进行压缩么？当然可以，方法就是音节。多个音素很快的连在一起读，就成了一个音节。音节能将我们的信息压缩1-2倍，这样，信息的传输速度就被提升至了8-15Bytes/s。终于和盲文差不多了，但是这看着还是很少啊。没有关系，我们还能继续压缩：一个音素表示用多个字符。这在英语中很常见，如[i:]可以表示ee。这样又能将信息压缩1-2倍，这样，传输速度终于超过了盲文：16-45Bytes/s。

我们再来看看声音本身，如果我们需要完完整整的记录下声音本身，而不是里面的语言，比如：音乐。这样我们吸收信息的速度会是多少呢？现在我们先一起来看看要如何来表示一个声音。表示声音一般有两种方式：通过记录声音的四个要素来表示声音，或者通过记录声音完整的震动波形来记录声音。由于我们的记忆肯定记不住完整的波形，一般记下来的都是什么物体发出什么声音，所以我们这里只看前者这种表示方式。

首先看音质，音质分两种，噪音和乐音，其实指的是振动的频率是否规则。比如锣，就没有规律，他属于噪音。但是不管是哪一种类型，我们可以使用一个类型来表示不同类型的物体发出来的声音，计算机中一般大家都会使用一个4字节来表示，他能表示4294967296种不同的声音来源，这看上去应该足够了。
接下来是音长，音长比较好办，记录一个时间即可，一般计算机中使用4-8字节表示时间，我们算8个。
然后是音强，音强其实就是声音的大小，单位是分贝，由于150分贝就造成人体鼓膜破损导致耳聋，另外再考虑浮点数，那么我们使用4个字节即可表示所有的音强了。
最后是音高，音高是声音的频率，我们只考虑人能够听见的声音频率，20至20000Hz，因为只有这些对我们来说才是有意义的。那么我们可以使用2个字节来表示。最后我们发现一个声音需要由18个字节来表示。其实midi格式的音乐文件就是使用的和这个类似的表示方法。

好，现在声音的传输速度，就和我们听到的音的速度有关系了，大家可以听一听999bpm的野蜂飞舞，看看能听清楚么？我们就算1000bpm吧，这样信息的传递速度是：300Bytes/s！速度有了质的飞跃！真不错！
声音还有一个别的感官没有的特性：重叠。多种不同的旋律可以重叠在一起，每种各自作为一个单独的音轨独立存在。在钢琴中，巴赫的平均律已经算是很难理解的复调作品了，最多也就是5个声部（试一试BWV846的赋格部分，这一段是四声部的）。多数室内乐一般也就是四重奏和五重奏，极限也就是九重奏，而且这类的作品非常非常的少。我们对这种可以被认知的叠加个数取极值：9个。这样，我们传递信息的速度又有了新的突破：2.7KBytes/s。居然达到了K级别！虽然很少有人能达到这个级别的学习速度，因为这种人基本可以听一边九重奏，就可以完整的将其复述出来，这不是天才是什么！不过还是突然觉得学东西原来可以这么快！

1.3. 视觉

最后是视觉，视觉是人类最直观的接收知识的方法，我们从小的学习基本都离不开视觉，书本，黑板等等，直到现在周围有很多同事在说明一个问题的时候，都会不自主的想要画个图来表示他想表达的问题，或者是事物之间的联系。但是想要计算视觉承载的信息量，似乎就很麻烦了，因为通过视觉认知到的东西似乎有很多，比如阅读到的书本的内容或者对一些事情的记忆片段，需要表示这些不同的内容所需要的信息量也是不同的。我们这里简单的分为两种吧：文字和图像。

文字，也就是阅读，其信息的传输速度就是每个人的阅读速度。现在，人类已知的阅读速度的极限大概在150000字/分钟，也就是2500字/秒，听上去是那么的不可思议，不知道是真是假。反正既然我们大多数人都无法超越这个标准，那么我们就用这个标准做极值的计算吧。在这个阅读速度下，那么信息传递速度是12.5KBytes/s（一个字约为5个字母），轻而易举的超越了听觉！写到这，连笔者自己也很诧异！要是有这速度，《Windows核心编程》这本看的我要死的书，岂不是分分钟就看完了？所以我们还是来看看普通人吧。人类的平均阅读速度是在200-300字/分钟左右，这速度就慢很多了，在这个速度下，信息传递速度只有16-25Bytes/s。看起来似乎比听觉要差，但是实际上已经好很多了，因为这是一个平均值，每个人都可以达到。

再来看看图像，人类对于图像有着相当强悍的识别能力，人眼可以分辨出1000万种以上不同的色彩，一般我们使用RGB空间来表示色彩：他使用3个字节，每个字节表示一个颜色：红，绿，蓝，每种颜色有256种状态，一共可以表示1600多万种不同的色彩。而人眼能接收的有效的像素值也可以达到3.24亿个像素。那么要表示一副我们看到的画面，实际上我们需要926.97M的数据！现在市面上一般的视频帧率基本是在每秒25-30帧左右，也就是说，每秒钟流经人眼的数据大概有22-27G！写到这里，我不知道要说什么好了，这数据太恐怖了。我只想说人脑的处理能力真是太惊人了，另外还好我们不会真正记住那么多东西。

总的来说，视觉应该算是我们接收知识最快的途径了。

1.4. 科技发展的终点

终于，我们貌似有一些方法能很快的学习了。可是我们的大脑到底能承受多少呢？虽然我不是很清楚，但是如果人类的学习能力已经无法超越任何单独一门学科分支的内容，科技的发展就到了尽头了。

2. 终有一天，我们要如何继续

学习，最后的问题还是如何学习。如果我们不能改变自己学习的方式，我们就无法改变我们科技发展的极限。

这里有一个比较有意思的视频，通过改造大脑，通过光来对生物进行控制，不知道以后这项技术会如何发展，说不定能直接将知识灌入，那这样学习的成本就小了。

Gero Miesenboeck：改造大脑 [Link]

另外，我们能不能也让知识能遗传呢？所有的动物都有着很多本能，这些本能实际上应该就属于可遗传的知识，如果能让自己的知识遗传给下一代，那下一代学习的成本就真的小了很多：啊！为师已经将毕生80年的功力都传授与你，你可以下山了！

3. 结尾

看到这里，你应该会觉得我已经疯了。嗯，你是对的，我也觉得突然想这些东西不会正常到哪里去。