侧边栏壁纸
博主头像
星空之窗博主等级

学如逆水行舟,不进则退。

  • 累计撰写 2 篇文章
  • 累计创建 13 个标签
  • 累计收到 2 条评论

目 录CONTENT

文章目录

Base64 编码的原理与应用

星河景明
2024-07-19 / 1 评论 / 2 点赞 / 132 阅读 / 5924 字 / 正在检测是否收录...
温馨提示:
本文最后更新于 2024-07-20,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

Base64

Base64 一词出自一种特定的 MINE 内容传输编码

它是什么?

Wiki 上的一句话解释得很恰当:

Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法

这 64 个可打印字符中包括了字母 A-Za-z、数字 0-9,这里就有 62 个字符了,还剩下两个可打印字符在不同的版本中有不同的变化。

一般我们单独提到术语 Base64 指代特定算法时,通常指的是 RFC 4648 第 4 节中概述的 Base64 版本。

也就是下表这些字符:

RFC 4648 标准的 Base64 索引表

编码方式

由于 ​log_264 = 6,所以每 6 个 bit 为一组,对应上表中的某一个可打印字符。我们知道 1 个字节有 8 位,即 1 byte = 8 bit。因此我们可以找到 6 和 8 的最小公倍数 24,即每 3 个字节相当于 4 组 Base64 字符。

示例:

刚好三个字节的转换示例图

可以看到 Man 转成 Base64 编码就成了 TWFu

上面这个是刚好 3 个字节能够对应转换的,那么问题来了,如果我没有刚好 3 个字节呢,也就是说我给的输入没有 24 或其倍数的位数该怎么处理?

在上面的 索引表 中可以看到除了那 64 个可打印字符外,还有一个填充字符 =,它就是来解决这个问题的。

  1. 二进制位不足 6 个的情况在末尾补 0 至满足。
  2. 不足 4 组的,直接在结尾添填充符。
添加填充符的示例图

变种

base64 编码对应的 64 个可打印字符在一些特定的程序或协议中可能不适合使用,特别是字符表第 62 位 +、63 位 / 和填充字符 =,因此存在一些如下的变种:

Base64 编码变种图

上图源自 Wiki

Base64 优缺点

  • 优点

    1. 简化数据传输:通过将二进制数据转换为文本字符,Base64 编码使得数据在文本协议(如 HTTP、SMTP 等)中的传输更加安全和可靠。
    2. 兼容性好:编码后的数据可以在几乎所有文本处理系统中处理和存储,而不会出现乱码问题。
    3. 易于实现Base64 编码和解码算法简单,容易在各种编程语言中实现。
    4. 减少数据损坏:避免了在传输过程中由于字符编码问题导致的数据损坏。
  • 缺点

    1. 增加数据量:编码后的数据体积约为原始数据的 1.33 倍(即每 3 个字节的数据编码成 4 个字节的文本),这会增加传输和存储成本。
    2. 不适合大文件:由于编码后数据量的增加,不适合处理和传输非常大的文件。
    3. 无数据压缩Base64 编码不会对数据进行压缩,仅仅是转换,因此不会减少数据的实际存储空间。
    4. 安全性有限Base64 编码并不是加密方法,仅仅是编码方式,对敏感数据的保护作用有限,需要配合加密技术使用。

Base64 应用

  1. 数据传输:在 HTTP 协议中,表单数据通常以键值对的形式存在,这些数据在传输过程中可能会被截断或篡改。为了确保数据的完整性和安全性,可以使用 Base64 编码对表单数据进行编码后再传输。
  2. 邮件传输:SMTP 协议不支持直接传输二进制文件,因此需要将二进制文件(如附件)转换为 ASCII 格式。Base64 编码可以用于将二进制文件转换为适合在邮件中传输的格式。
  3. 数据加密:虽然 Base64 编码本身并不提供加密功能,但它可以与其他加密技术结合使用,如 AESRSA 加密。首先对数据进行加密,然后使用 Base64 编码将加密后的数据进行编码,以便在不支持二进制数据的协议中传输。
  4. 数据存储:在某些数据库或文件系统中,可能需要将二进制数据存储为文本格式。使用 Base64 编码可以将二进制数据转换为文本字符串,以便在数据库或文件系统中存储。
  5. URL 编码:URL 中的参数通常需要进行编码,以避免特殊字符(如空格、& 等)导致的问题。虽然 URL 编码和 Base64 编码是不同的概念,但有时可以将 Base64 编码的数据作为 URL 参数的一部分进行传输。
  6. 证书和 API 密钥:在处理敏感信息(如 SSL 证书、API 密钥等)时,可以使用 Base64 编码对这些信息进行编码,以保护数据的隐私和安全。但请注意,Base64 编码并不能替代加密措施,它只是一种编码方式。

总之,Base64 编码在许多场景中都有应用,主要用于将二进制数据转换为适合在文本协议中传输的格式。然而,需要注意的是,Base64 编码并不能提供加密功能,因此在处理敏感数据时,还需要结合其他加密措施来确保数据的安全。

2

评论区