3.4 其他数据的存储

3.4.1 存储文本

文本是语言中一系列的符号。可以用位模式来表示任何一个语言符号。一种语言中,表示符号的位模式长度取决于这种语言中所使用的所有符号的数量。

编码

不同的位模式集合被设计用于表示文本符号,这些集合称之为代码。表示符号的过程被称为编码。

  • ASCII码
    使用7位表示每个符号,总计128个符号,包括英文大小写字母,数字,标点,控制字符等。

  • Unicode码
    使用32位表示每个符号,共计约42亿个符号,包括世界上不同语言的各种符号,以及一些图形和特殊符号。

ASCII编码现在是Unicode编码的一部分。 UTF-8编码采用1-6个字节的可变长度来存储Unicode编码。

3.4.2 存储音频

使用采样来存储音频信息,常见标准:MP3等

3.4.3 存储图像

采用光栅图(位图)和矢量图两种基本技术。

光栅图对图像进行扫描,描述每一个像素点的信息,颜色使用RGB三原色编码,每种色彩取值为0~255。编码标准有:JPEG,GIF等

矢量图由定义图形的绘制命令组成。

3.4.4 存储视频

视频是图像帧在时间上的表示。标准有MPEG等。