前言

String类型真是个神奇的存在,动不动就会出现一些迷惑人的错误。今天看到一篇文中提到当String的值为null时,进行字符串相加拼接,会出现把null当做字符串拼接的现象。

比如下面这段代码:

String s = null;
s = s + "hello";
System.out.println(s + " world");

你预期的结果可能是“hello world”,但实际的结果是“nullhello world”,神奇吧。

其实这倒没什么,实践一下就可以看到结果。但当你好奇心作祟,在网上搜为什么时,你看到的答案可能是错的。

我在搜索时,看到访问量上万的文章给出的解释竟然错误的。为了排除一些误导,特意为大家分析一下原因。

错误的原因分析

如果对上述问题进行搜索,你可能看到的答案是:

s + " world" 等价于 s = String.valueOf(s)+"word";

然后附带valueOf方法:

public static String valueOf(Object obj) {
  return (obj == null) ? "null" : obj.toString();
}

你信了吗?如果信了可能真的就错了。下面我们就来分析分析为什么错了。

Java编译器的优化

我们知道,当我们写下面的代码时Java编译器会为我们做一些优化:

String a = "Hello ";
String b = "World";
System.out.println(a + b);

如何优化的?上面这段代码经过编译器优化之后,等价于:

StringBuilder sb = new StringBuilder();
sb.append("Hello ");
sb.append("World");
String result = sb.toString();
System.out.println(result);

也就是说,加号操作会被优化基于StringBuilder的操作,而并不是上面提到的String.valueOf操作。

那么,上面为null的情况也就等价于下面的操作了:

StringBuilder sb = new StringBuilder(null);
sb.append("hello");
sb.append(" world");
String result = sb.toString();
System.out.println(result);

此时,我们再看一下StringBuilder(null)这个构造方法的底层实现,最终调到它的父类AbstractStringBuilder中的append方法:

public AbstractStringBuilder append(String str) {
    if (str == null)
        return appendNull();
    int len = str.length();
    ensureCapacityInternal(count + len);
    str.getChars(0, len, value, count);
    count += len;
    return this;
}

对应的appendNull方法实现为:

private AbstractStringBuilder appendNull() {
    int c = count;
    ensureCapacityInternal(c + 4);
    final char[] value = this.value;
    value[c++] = 'n';
    value[c++] = 'u';
    value[c++] = 'l';
    value[c++] = 'l';
    count = c;
    return this;
}

在appendNull方法中就是将null当做字符串“null”来处理了。这也就是为什么会在拼接中出现null的原因。

字节码追踪

image

针对上述示例,如果你想看编译器是如何处理的,可以通过javap -c 命令来查看对应字节码:

通过字节码可以看出,基本上与上面的分析的一致。所以说,尽信书不如无书。

拓展问题

解决了上述问题,再来看看,如果我们单纯的就打印null是怎么输出的?

String s = null;
System.out.println(s);

执行上述程序,控制台打印null,这个null是哪儿来的呢?直接看println的底层实现:

public void print(String s) {
    if (s == null) {
        s = "null";
    }
    write(s);
}

最终调用到了print方法,如果为null,则打印null字符串。

支持,还没有出现最初的valueOf方法,那么valueOf方法在什么场景下会用到呢?在对象为Object类型时:

Object s = null;
String s1 = String.valueOf(s);
System.out.println(s1);

也就是说在明确调用valueOf方法时,此时s1的值直接是null字符串。

再拓展一下,针对一些基础类型的包装类,比如Integer、Double等:

Integer i = null;
System.out.println(i);

上述代码的处理又不太一样,println方法实现如下:

public void println(Object x) {
    String s = String.valueOf(x);
    synchronized (this) {
        print(s);
        newLine();
    }
}

也就是说先对对应的Object对象调用valueOf,回到上面的示例,如果Object为null,该方法返回null字符串,后续打印机直接为null。

小结

字符串拼接是很常见的问题,一不小心会出现将null给拼接上的情况。而这状况的出现又牵扯到Java编译器的优化,是不是很有意思?而且正如最开始所述,当我们在网络上搜索资料时也要辨证的去看待答案的准确性。



String拼接出现null?你看到的分析可是错的插图1

关注公众号:程序新视界,一个让你软实力、硬技术同步提升的平台

除非注明,否则均为程序新视界原创文章,转载必须以链接形式标明本文链接

本文链接:https://www.choupangxia.com/2021/05/12/string-null/