Java实现ByteArray与String互转的常见转换方法

更新时间：2025年12月23日 10:13:59 作者：Jinkxs

在现代 Java 开发中,处理字节数据（byte[]）和字符串（String）之间的转换是一项常见且至关重要的任务,无论是网络通信、文件操作、加密解密还是序列化反序列化,我们都需要在 byte[] 和 String 之间进行高效、准确的转换,所以本文介绍了ByteArray与String互转方法

在现代 Java 开发中，处理字节数据（byte[]）和字符串（String）之间的转换是一项常见且至关重要的任务。无论是网络通信、文件操作、加密解密还是序列化反序列化，我们都需要在 byte[] 和 String 之间进行高效、准确的转换。然而，这个看似简单的操作背后，隐藏着一个容易被忽视但又极其关键的问题——编码（Encoding）。

什么是编码？

编码（Encoding）是指将一种数据形式（如字符）转换为另一种数据形式（如字节序列）的过程。在计算机世界里，字符（如 ‘A’、‘中’、‘🙂’）本质上是抽象的概念，而计算机只能处理二进制数据。因此，我们需要一套规则（编码标准）来规定字符如何映射到字节序列上。

常见的字符编码标准包括：

ASCII：仅支持 128 个字符（0-127），主要用于英文。
ISO-8859-1：也称 Latin-1，支持 256 个字符，覆盖了西欧语言。
UTF-8：可变长度编码，支持世界上几乎所有语言的字符，是互联网上最广泛使用的编码。
UTF-16：固定长度或可变长度（16位），常用于 Java 内部表示字符串。
GBK/GB2312：中文字符编码，主要在中国大陆使用。

为什么编码问题如此重要？

想象一下，你从一个文件中读取了一段文本数据，这段数据是以 UTF-8 编码保存的。如果你在处理这段数据时，错误地使用了 ISO-8859-1 编码去解析它，那么你得到的可能就不是原始的中文文本，而是一串乱码。这就是编码问题带来的后果。

在 Java 中，String 类内部使用的是 UTF-16 编码。当我们需要将 String 转换为 byte[] 或者反过来时，如果不指定正确的编码方式，就很容易导致转换失败或产生乱码。

常见的转换方法与陷阱

1. 直接使用getBytes()和new String(byte[])

这是最容易想到的方法，但它存在很大的风险。

// 错误示例：没有指定编码
String str = "Hello 世界 🌍"; // 包含中文和 emoji
byte[] bytes = str.getBytes(); // 默认使用平台默认编码（通常是 ISO-8859-1 或类似）
String backToStr = new String(bytes); // 默认使用平台默认编码解码

System.out.println("原字符串: " + str);
System.out.println("转换后字符串: " + backToStr); // 可能出现乱码！

这段代码的问题在于：

str.getBytes() 没有指定编码，默认使用 JVM 的默认编码（getDefaultCharset()）。在不同操作系统或 JVM 设置下，这个默认编码可能不同。
new String(bytes) 也没有指定编码，同样使用默认编码进行解码。如果编码不一致，就会产生乱码。

2. 明确指定编码

解决这个问题的关键是始终明确指定编码。

import java.nio.charset.StandardCharsets;
import java.nio.charset.Charset;
import java.util.Arrays;

public class ByteToStringExample {
    public static void main(String[] args) {
        String originalStr = "Hello 世界 🌍";

        try {
            // ✅ 正确做法：明确指定编码
            byte[] bytes = originalStr.getBytes(StandardCharsets.UTF_8); // 使用 UTF-8 编码
            String decodedStr = new String(bytes, StandardCharsets.UTF_8); // 使用 UTF-8 解码

            System.out.println("原始字符串: " + originalStr);
            System.out.println("字节数组: " + Arrays.toString(bytes));
            System.out.println("转换回字符串: " + decodedStr);
            System.out.println("是否相等: " + originalStr.equals(decodedStr));

            // 🔍 也可以使用 Charset 对象
            Charset utf8Charset = StandardCharsets.UTF_8;
            byte[] bytes2 = originalStr.getBytes(utf8Charset);
            String decodedStr2 = new String(bytes2, utf8Charset);
            System.out.println("使用 Charset 对象: " + decodedStr2);

        } catch (Exception e) {
            System.err.println("转换过程中发生错误: " + e.getMessage());
            e.printStackTrace();
        }
    }
}

输出示例:

原始字符串: Hello 世界 🌍
字节数组: [72, 101, 108, 108, 111, 32, -28, -67, -96, -27, -101, -120, 32, -25, -121, -101, -27, -101, -120]
转换回字符串: Hello 世界 🌍
是否相等: true
使用 Charset 对象: Hello 世界 🌍

3. 常用的编码常量

Java 提供了 java.nio.charset.StandardCharsets 类，其中包含了常用的编码常量，推荐优先使用这些常量，因为它们是 static final 的，性能更好，也避免了字符串硬编码的风险。

import java.nio.charset.StandardCharsets;

// 推荐使用这些常量
byte[] utf8Bytes = "Hello".getBytes(StandardCharsets.UTF_8);
byte[] asciiBytes = "Hello".getBytes(StandardCharsets.US_ASCII);
byte[] latin1Bytes = "Hello".getBytes(StandardCharsets.ISO_8859_1);
byte[] utf16Bytes = "Hello".getBytes(StandardCharsets.UTF_16);
byte[] utf16BEBytes = "Hello".getBytes(StandardCharsets.UTF_16BE);
byte[] utf16LEBytes = "Hello".getBytes(StandardCharsets.UTF_16LE);

4. 处理不支持的编码

如果指定了一个 JVM 不支持的编码，会抛出 UnsupportedEncodingException（Java 8 及以前）或 IllegalCharsetNameException（Java 9+）。

import java.nio.charset.UnsupportedCharsetException;
import java.nio.charset.IllegalCharsetNameException;

public class EncodingErrorHandling {
    public static void main(String[] args) {
        String str = "Hello";

        try {
            // ❌ 这种编码可能不存在
            byte[] bytes = str.getBytes("NON_EXISTENT_ENCODING");
        } catch (UnsupportedEncodingException | IllegalCharsetNameException e) {
            System.err.println("编码不支持: " + e.getMessage());
        }

        // ✅ 更安全的做法：先检查编码是否存在
        try {
            java.nio.charset.Charset charset = java.nio.charset.Charset.forName("UTF-8");
            byte[] bytes = str.getBytes(charset);
            System.out.println("成功使用 UTF-8 编码: " + Arrays.toString(bytes));
        } catch (Exception e) {
            System.err.println("编码错误: " + e.getMessage());
        }
    }
}

实际应用场景

1. 文件读写

当你需要将字符串写入文件或从文件读取字符串时，编码尤为重要。

import java.io.*;
import java.nio.charset.StandardCharsets;

public class FileEncodingExample {
    public static void main(String[] args) {
        String filePath = "test.txt";
        String content = "Hello 世界 🌍\nThis is a test file.";

        // ✅ 写入文件（指定编码）
        try (OutputStreamWriter writer = new OutputStreamWriter(
                new FileOutputStream(filePath), StandardCharsets.UTF_8)) {
            writer.write(content);
            System.out.println("文件写入成功。");
        } catch (IOException e) {
            System.err.println("写入文件失败: " + e.getMessage());
        }

        // ✅ 读取文件（指定编码）
        try (InputStreamReader reader = new InputStreamReader(
                new FileInputStream(filePath), StandardCharsets.UTF_8)) {
            StringBuilder sb = new StringBuilder();
            int ch;
            while ((ch = reader.read()) != -1) {
                sb.append((char) ch);
            }
            String readContent = sb.toString();
            System.out.println("读取的文件内容:\n" + readContent);
        } catch (IOException e) {
            System.err.println("读取文件失败: " + e.getMessage());
        }
    }
}

2. 网络通信

在网络传输中，数据通常以字节流的形式发送。服务器和客户端必须使用相同的编码来解析数据。

import java.net.*;
import java.io.*;
import java.nio.charset.StandardCharsets;

public class NetworkEncodingExample {
    public static void main(String[] args) {
        // 模拟发送方：将字符串转换为字节发送
        String message = "Hello Server! 你好世界 🌍";
        byte[] messageBytes = message.getBytes(StandardCharsets.UTF_8);

        // 模拟接收方：接收字节并转换回字符串
        try {
            String receivedMessage = new String(messageBytes, StandardCharsets.UTF_8);
            System.out.println("接收到的消息: " + receivedMessage);
        } catch (Exception e) {
            System.err.println("解码失败: " + e.getMessage());
        }
    }
}

3. 加密解密

在加密算法中，明文通常需要转换为字节进行加密，加密后的密文也是字节，最后可能需要将解密后的字节转换回字符串。

import javax.crypto.Cipher;
import javax.crypto.KeyGenerator;
import javax.crypto.SecretKey;
import java.nio.charset.StandardCharsets;
import java.util.Base64;

public class EncryptionDecryptionExample {
    public static void main(String[] args) throws Exception {
        String originalText = "Secret Message 世界 🌍";
        KeyGenerator keyGen = KeyGenerator.getInstance("AES");
        keyGen.init(128); // 128 位密钥
        SecretKey secretKey = keyGen.generateKey();

        // 加密
        Cipher cipher = Cipher.getInstance("AES");
        cipher.init(Cipher.ENCRYPT_MODE, secretKey);
        byte[] encryptedBytes = cipher.doFinal(originalText.getBytes(StandardCharsets.UTF_8));
        String encodedEncrypted = Base64.getEncoder().encodeToString(encryptedBytes);
        System.out.println("加密后的 Base64: " + encodedEncrypted);

        // 解密
        cipher.init(Cipher.DECRYPT_MODE, secretKey);
        byte[] decryptedBytes = cipher.doFinal(Base64.getDecoder().decode(encodedEncrypted));
        String decryptedText = new String(decryptedBytes, StandardCharsets.UTF_8);
        System.out.println("解密后的文本: " + decryptedText);
    }
}

4. HTTP 请求响应

在处理 HTTP 请求和响应时，请求体和响应体的编码也需要特别注意。

import java.net.http.*;
import java.net.URI;
import java.nio.charset.StandardCharsets;
import java.time.Duration;

public class HttpEncodingExample {
    public static void main(String[] args) {
        // 注意：这需要 Java 11+ 的 HttpClient API
        HttpClient client = HttpClient.newBuilder()
                .connectTimeout(Duration.ofSeconds(10))
                .build();

        // 发送 POST 请求
        HttpRequest request = HttpRequest.newBuilder()
                .uri(URI.create("https://httpbin.org/post"))
                .header("Content-Type", "application/json; charset=UTF-8")
                .POST(HttpRequest.BodyPublishers.ofString("{\"message\": \"Hello 世界 🌍\"}", StandardCharsets.UTF_8))
                .timeout(Duration.ofSeconds(20))
                .build();

        try {
            HttpResponse<String> response = client.send(request, HttpResponse.BodyHandlers.ofString(StandardCharsets.UTF_8));
            System.out.println("响应状态码: " + response.statusCode());
            System.out.println("响应正文: " + response.body());
        } catch (Exception e) {
            System.err.println("HTTP 请求失败: " + e.getMessage());
        }
    }
}

高级技巧与最佳实践

1. 使用java.util.Base64进行编码转换

有时候，我们需要将 byte[] 转换为可读的字符串（如 Base64），然后再转换回来。

import java.util.Base64;
import java.nio.charset.StandardCharsets;

public class Base64Example {
    public static void main(String[] args) {
        String original = "Hello 世界 🌍";

        // ✅ 将字符串编码为 Base64 字符串
        byte[] bytes = original.getBytes(StandardCharsets.UTF_8);
        String base64Encoded = Base64.getEncoder().encodeToString(bytes);
        System.out.println("Base64 编码: " + base64Encoded);

        // ✅ 将 Base64 字符串解码回原始字节
        byte[] decodedBytes = Base64.getDecoder().decode(base64Encoded);
        String decodedString = new String(decodedBytes, StandardCharsets.UTF_8);
        System.out.println("解码后: " + decodedString);
    }
}

2. 自定义工具类进行封装

为了方便在项目中使用，可以创建一个工具类来封装常用的转换方法。

import java.nio.charset.Charset;
import java.nio.charset.StandardCharsets;
import java.util.Arrays;

public class StringUtils {
    /**
     * 将字符串转换为字节数组，使用指定编码
     * @param str 待转换的字符串
     * @param charset 编码方式
     * @return 字节数组
     */
    public static byte[] stringToBytes(String str, Charset charset) {
        if (str == null || charset == null) {
            return new byte[0];
        }
        return str.getBytes(charset);
    }

    /**
     * 将字节数组转换为字符串，使用指定编码
     * @param bytes 待转换的字节数组
     * @param charset 编码方式
     * @return 字符串
     */
    public static String bytesToString(byte[] bytes, Charset charset) {
        if (bytes == null || charset == null) {
            return "";
        }
        return new String(bytes, charset);
    }

    /**
     * 将字符串转换为 UTF-8 字节数组
     * @param str 待转换的字符串
     * @return UTF-8 字节数组
     */
    public static byte[] toUtf8Bytes(String str) {
        return stringToBytes(str, StandardCharsets.UTF_8);
    }

    /**
     * 将 UTF-8 字节数组转换为字符串
     * @param bytes 待转换的字节数组
     * @return 字符串
     */
    public static String fromUtf8Bytes(byte[] bytes) {
        return bytesToString(bytes, StandardCharsets.UTF_8);
    }

    // 测试方法
    public static void main(String[] args) {
        String testStr = "Hello 世界 🌍";
        byte[] utf8Bytes = toUtf8Bytes(testStr);
        String backToStr = fromUtf8Bytes(utf8Bytes);

        System.out.println("原始: " + testStr);
        System.out.println("字节: " + Arrays.toString(utf8Bytes));
        System.out.println("还原: " + backToStr);
        System.out.println("是否相等: " + testStr.equals(backToStr));
    }
}

3. 处理特殊字符和 Emoji

现代应用中经常包含 Emoji 表情符号。这些字符通常需要使用 UTF-8 编码才能正确处理。

import java.nio.charset.StandardCharsets;
import java.util.Arrays;

public class EmojiExample {
    public static void main(String[] args) {
        String emojiStr = "Hello 👋🌍! How are you? 😊";

        // ✅ 使用 UTF-8 编码
        byte[] bytes = emojiStr.getBytes(StandardCharsets.UTF_8);
        String decodedStr = new String(bytes, StandardCharsets.UTF_8);

        System.out.println("原始字符串: " + emojiStr);
        System.out.println("字节数组 (UTF-8): " + Arrays.toString(bytes));
        System.out.println("解码后: " + decodedStr);
        System.out.println("是否相等: " + emojiStr.equals(decodedStr));
    }
}

4. 性能考量

虽然 StandardCharsets 是推荐的，但在性能敏感的场景下，可以预先获取并缓存 Charset 对象。

import java.nio.charset.Charset;
import java.nio.charset.StandardCharsets;

public class PerformanceExample {
    // 预先缓存常用编码
    private static final Charset UTF8_CHARSET = StandardCharsets.UTF_8;
    private static final Charset ASCII_CHARSET = StandardCharsets.US_ASCII;

    public static void main(String[] args) {
        String str = "Hello World!";
        long startTime, endTime;

        // 使用缓存的 Charset
        startTime = System.nanoTime();
        for (int i = 0; i < 1000000; i++) {
            byte[] bytes = str.getBytes(UTF8_CHARSET);
            String result = new String(bytes, UTF8_CHARSET);
        }
        endTime = System.nanoTime();
        System.out.println("使用预缓存 Charset 耗时: " + (endTime - startTime) / 1000000.0 + " ms");

        // 使用 StandardCharsets 直接访问
        startTime = System.nanoTime();
        for (int i = 0; i < 1000000; i++) {
            byte[] bytes = str.getBytes(StandardCharsets.UTF_8);
            String result = new String(bytes, StandardCharsets.UTF_8);
        }
        endTime = System.nanoTime();
        System.out.println("直接使用 StandardCharsets 耗时: " + (endTime - startTime) / 1000000.0 + " ms");
    }
}

常见错误与解决方案

1. 编码不匹配导致的乱码

问题：读取文件时使用了错误的编码。

解决方案：始终明确指定编码。

// ❌ 错误做法
String content = new String(fileBytes); // 使用默认编码

// ✅ 正确做法
String content = new String(fileBytes, StandardCharsets.UTF_8);

2. 混合使用不同编码

问题：在同一个应用中混合使用不同的编码。

解决方案：在整个项目中统一使用一种编码（通常是 UTF-8）。

3. 忽略异常处理

问题：未处理 UnsupportedEncodingException。

解决方案：总是进行异常处理。

try {
    byte[] bytes = str.getBytes("UTF-8");
} catch (UnsupportedEncodingException e) {
    // 记录日志或使用默认编码
    byte[] bytes = str.getBytes(StandardCharsets.UTF_8);
}

总结

在 Java 中处理 byte[] 和 String 之间的转换时，编码是一个核心且不容忽视的问题。正确的做法是始终明确指定编码方式，推荐使用 java.nio.charset.StandardCharsets 中提供的常量。通过合理的编码选择和处理，我们可以避免乱码问题，确保程序的稳定性和可靠性。记住，编码不仅仅是技术细节，更是保证数据完整性和应用健壮性的关键。

以上就是Java实现ByteArray与String互转的常见转换方法的详细内容，更多关于Java ByteArray与String互转的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

java String的深入理解
这篇文章主要介绍了java String的深入理解的相关资料,希望通过本文大家能理解String的用法，需要的朋友可以参考下
2017-09-09
Springdoc替换swagger的实现步骤分解
最近在spring看到的，spring要对api文档动手了，有些人说swagger不好用，其实也没那么不好用，有人说代码还是有点侵入性，这倒是真的，我刚试了springdoc可以说还是有侵入性但是也可以没有侵入性，这就看你对文档有什么要求了
2023-02-02
java 中序列化与readResolve()方法的实例详解
这篇文章主要介绍了java 中序列化与readResolve()方法的实例详解的相关资料,这里提供实例帮助大家理解这部分知识，需要的朋友可以参考下
2017-08-08
MyBatisPlus 查询selectOne方法实现
本文主要介绍了MyBatisPlus 查询selectOne方法实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-01-01
SpringBoot集成WebServlet出现自定义servlet请求失败的问题解决方案
SpringBoot中以Bean方式注册Servlet时遇到的问题,通过了解DispatcherServlet的原理,发现默认路径冲突是主要原因,本文介绍SpringBoot集成WebServlet出现自定义servlet请求失败的问题解决方案,感兴趣的朋友一起看看吧
2025-03-03
Java基础之删除文本文件中特定行的内容
这篇文章主要介绍了Java基础之删除文本文件中特定行的内容,文中有非常详细的代码示例,对正在学习java基础的小伙伴们有非常好的帮助,需要的朋友可以参考下
2021-04-04
Java集合系列之LinkedHashMap源码分析
这篇文章主要为大家详细介绍了Java集合系列之LinkedHashMap源码分析，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-02-02
JAVA遍历Map集合的几种方法汇总
这篇文章主要给大家介绍了关于JAVA遍历Map集合的几种方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-03-03
Java与JavaScript自动化测试Selenium使用详解
这篇文章主要介绍了Java与JavaScript自动化测试Selenium的使用,Selenium是一个用于Web应用程序测试的工具,Selenium测试直接运行在浏览器中,就像真正的用户在操作一样,需要的朋友可以参考下
2025-05-05
Java如何接收并解析HL7协议数据
文章主要介绍了HL7协议及其在医疗行业中的应用,详细描述了如何配置环境、接收和解析数据,以及与前端进行交互的实现方法,文章还分享了使用7Edit工具进行调试的经验,并记录了一个常见的解析问题及其解决方法
2024-12-12