关于java代码优化一些细节

174 阅读15分钟

         最近项目组承接了公司的一个老项目,说实话阅读这个项目内心真是一万头草泥马奔驰而过,先不论代码优化的细节,我先吐槽几个实在不能忍的几个方面:其一,整个项目结构凌乱,引入的模块早已没有了实现逻辑,但是没有及时的清理;其二,由于是公司的一个核心项目,在代码上应该保证良好的可读性,但是通观整个项目除了个别方法有一些业务注释之外,大部分方法都没有注释,特别是一些十分复杂的业务逻辑;其三,业务经过多次迭代后,没有及时清理之前无用的逻辑,导致代码冗长,对后期的维护造成了极大的影响;其四,代码友好度极低,多层Lambda表达式嵌套,增加了阅读和维护的成本。

       其实造成上面几个问题有几下几个原因,第一,公司的研发不规范,同时没有形成严格的对代码review的制度,导致在代码编写上出现了极大的随意性;第二,个人编码习惯的问题,复杂的业务逻辑不写注释,盲目的追求新的编码范式,导致了代码的可维护性降低;第三,没有很好的对旧代码的整理和及时的废弃,导致新旧代码不断叠加,为后期其他人维护造成了极大的困扰。不过伴随这制度的不断完善以及新加入人员的水平提升上述问题都得到了很好的解决。

       说完问题,我们接着来聊一下文章的正题,关于java代码优化的一些细节,这里我给大家推荐一本书《java 程序性能优化》,就是下图这本书,书中先后从软件设计、软件编码、JVM调优以及程序故障排斥等方面介绍针对Java程序的优化方法。

                       

      下面介绍的一些编码方面的细节,有一些来自于日常的编码中形成的规范,有一些来源于书中提及的tips,还有一部分是网络整理,希望对大家的养成良好的编码习惯有一定的作用。

1、尽量指定类、方法的final修饰符

      带有final修饰符的类是不可派生的。在Java核心API中,有许多应用final的例子,例如java.lang.String,整个类都是 final的。为类指定final修饰符可以让类不可以被继承,为方法指定final修饰符可以让方法不可以被重写。如果指定了一个类为final,则该 类所有的方法都是final的。Java编译器会寻找机会内联所有的final方法,内联对于提升Java运行效率作用重大,具体参见Java运行期优 化。此举能够使性能平均提高50%。

2、尽量重用对象

      特别是String对象的使用,出现字符串连接时应该使StringBuilder/StringBuffer代替。由于Java 虚拟机不仅要花时间生成对象,以后可能还需要花时间对这些对象进行垃圾回收和处理,因此,生成过多的对象将会给程序的性能带来很大的影响。

3、尽量减少对变量的重复计算

       明确一个概念,对方法的调用,即使方法中只有一句语句,也是有消耗的,包括创建栈帧、调用方法时保护现场、调用方法完毕时恢复现场等。所以例如下面的操作:

for (int i = 0; i < list.size(); i++)

{...}

建议替换为:

for (int i = 0, int length = list.size(); i < length; i++)

{...}

       这样,在list.size()很大的时候,就减少了很多的消耗

4、尽量采用懒加载的策略,即在需要的时候才创建

例如:

String str = "aaa";

if (i == 1)

{

  list.add(str);

}

建议替换为:

if (i == 1)

{

  String str = "aaa";

  list.add(str);

}

5、慎用异常

        异常对性能不利。抛出异常首先要创建一个新的对象,Throwable接口的构造函数调用名为fillInStackTrace()的本地同步方 法,fillInStackTrace()方法检查堆栈,收集调用跟踪信息。只要有异常被抛出,Java虚拟机就必须调整调用堆栈,因为在处理过程中创建 了一个新的对象。异常只能用于错误处理,不应该用来控制程序流程。

6、如果能估计到待添加的内容长度,为底层以数组方式实现的集合、工具类指定初始长度

       比如ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、

HashSet等等,以StringBuilder为例:

(1)StringBuilder()      // 默认分配16个字符的空间

(2)StringBuilder(int size)  // 默认分配size个字符的空间

(3)StringBuilder(String str) // 默认分配16个字符+str.length()个字符空间

       可以通过类(这里指的不仅仅是上面的StringBuilder)的构造函数来设定它的初始化容量,这样可以明显地提升性能。比如 StringBuilder吧,length表示当前的StringBuilder能保持的字符数量。因为当StringBuilder达到最大容量的时 候,它会将自身容量增加到当前的2倍再加2,无论何时只要StringBuilder达到它的最大容量,它就不得不创建一个新的字符数组然后将旧的字符数 组内容拷贝到新字符数组中----这是十分耗费性能的一个操作。试想,如果能预估到字符数组中大概要存放5000个字符而不指定长度,最接近5000的2 次幂是4096,每次扩容加的2不管,那么:

    (1)在4096 的基础上,再申请8194个大小的字符数组,加起来相当于一次申请了12290个大小的字符数组,如果一开始能指定5000个大小的字符数组,就节省了一倍以上的空间;

    (2)把原来的4096个字符拷贝到新的的字符数组中去;

       这样,既浪费内存空间又降低代码运行效率。所以,给底层以数组实现的集合、工具类设置一个合理的初始化容量是错不了的,这会带来立竿见影的效果。但是,注 意,像HashMap这种是以数组+链表实现的集合,别把初始大小和你估计的大小设置得一样,因为一个table上只连接一个对象的可能性几乎为0。初始 大小建议设置为2的N次幂,如果能估计到有2000个元素,设置成new HashMap(128)、new HashMap(256)都可以。

7、乘法和除法使用移位操作

例如:

for (val = 0; val < 100000; val += 5)

{

  a = val * 8;

  b = val / 2;

}

       用移位操作可以极大地提高性能,因为在计算机底层,对位的操作是最方便、最快的,因此建议修改为:

for (val = 0; val < 100000; val += 5)

{

  a = val << 3;

  b = val >> 1;

}

       移位操作虽然快,但是可能会使代码不太好理解,因此最好加上相应的注释。

8、循环内不要不断创建对象引用

例如:

for (int i = 1; i <= count; i++)

{

Object obj = new Object();

}

       这种做法会导致内存中有count份Object对象引用存在,count很大的话,就耗费内存了,建议为改为:

Object obj = null;

for (int i = 0; i <= count; i++)

{

obj = new Object();

}

       这样的话,内存中只有一份Object对象引用,每次new Object()的时候,Object对象引用指向不同的Object罢了,但是内存中只有一份,这样就大大节省了内存空间了。这一点我在平时的编码当中重点强调的一点。

9、尽量使用HashMap、ArrayList、StringBuilder,除非线程安全需要,否则不推荐使用Hashtable、Vector、StringBuffer,后三者由于使用同步机制而导致了性能开销。

10、不要将数组声明为public static final

       因为这毫无意义,这样只是定义了引用为static final,数组的内容还是可以随意改变的,将数组声明为public更是一个安全漏洞,这意味着这个数组可以被外部类所改变。

11、尽量避免随意使用静态变量

       要知道,当某个对象被定义为static的变量所引用,那么gc通常是不会回收这个对象所占有的堆内存的,如:

public class A

{

private static B b = new B();

}

       此时静态变量b的生命周期与A类相同,如果A类不被卸载,那么引用B指向的B对象会常驻内存,直到程序终止。

12、及时清除不再需要的会话

       为了清除不再活动的会话,许多应用服务器都有默认的会话超时时间,一般为30分钟。当应用服务器需要保存更多的会话时,如果内存不足,那么操作系统会把部分 数据转移到磁盘,应用服务器也可能根据MRU(最近最频繁使用)算法把部分不活跃的会话转储到磁盘,甚至可能抛出内存不足的异常。

       如果会话要被转储到磁 盘,那么必须要先被序列化,在大规模集群中,对对象进行序列化的代价是很昂贵的。因此,当会话不再需要时,应当及时调用HttpSession的 invalidate()方法清除会话。

13、实现RandomAccess接口的集合比如ArrayList,应当使用最普通的for循环而不是foreach循环来遍历

        这是JDK推荐给用户的。JDK API对于RandomAccess接口的解释是:实现RandomAccess接口用来表明其支持快速随机访问,此接口的主要目的是允许一般的算法更改 其行为,从而将其应用到随机或连续访问列表时能提供良好的性能。实际经验表明,实现RandomAccess接口的类实例,假如是随机访问的,使用普通 for循环效率将高于使用foreach循环;反过来,如果是顺序访问的,则使用Iterator会效率更高。可以使用类似如下的代码作判断:

if (list instanceof RandomAccess)

{

for (int i = 0; i < list.size(); i++){}

}

else

{

Iterator<?> iterator = list.iterable();

while (iterator.hasNext()){iterator.next()}

}

        foreach循环的底层实现原理就是迭代器Iterator,参见Java语法糖1:可变长度参数以及foreach循环原理。所以后半句"反过来,如果是顺序访问的,则使用Iterator会效率更高"的意思就是顺序访问的那些类实例,使用foreach循环去遍历。

14、使用同步代码块替代同步方法

        这点在多线程模块中的synchronized锁方法块一文中已经讲得很清楚了,除非能确定一整个方法都是需要进行同步的,否则尽量使用同步代码块,避免对那些不需要进行同步的代码也进行了同步,影响了代码执行效率。

15、不要创建一些不使用的对象,不要导入一些不使用的类

        这毫无意义,如果代码中出现"The value of the local variable i is not used"、"The import java.util is never used",那么请删除这些无用的内容

16、程序运行过程中避免使用反射

         关于,请参见反射。反射是Java提供给用户一个很强大的功能,功能强大往往意味着效率不高。不建议在程序运行过程中使用尤其是频繁使用反射机制,特别是 Method的invoke方法,如果确实有必要,一种建议性的做法是将那些需要通过反射加载的类在项目启动的时候通过反射实例化出一个对象并放入内存 ----用户只关心和对端交互的时候获取最快的响应速度,并不关心对端的项目启动花多久时间。

17、使用数据库连接池和线程池

       这两个池都是用于重用对象的,前者可以避免频繁地打开和关闭连接,后者可以避免频繁地创建和销毁线程。

18、使用带缓冲的输入输出流进行IO操作

       带缓冲的输入输出流,即BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,这可以极大地提升IO效率。

19、字符串变量和字符串常量equals的时候将字符串常量写在前面

      这是一个比较常见的小技巧了,如果有以下代码:

String str = "123";

if (str.equals("123"))

{

...

}

建议修改为:

String str = "123";

if ("123".equals(str))

{

...

}

     这么做主要是可以避免空指针异常  

     补充:自己的测试,常量写在前面可以避免空指针异常

      (1)常量写在后面可能异常

Map<String,Object> map = new HashMap<String,Object>(); String xxx = (String) map.get("xxxxx");//获取不到,应该是null if(xxx.equals("xxx")){ System.out.println("xxx"); }else{ System.out.println("xxxxxxxxx"); }

结果:

Exception in thread "main" java.lang.NullPointerException

at cn.ebuy.FetchData.main(FetchData.java:19)

(2)常量写在前面避免异常:

Map<String,Object> map = new HashMap<String,Object>(); String xxx = (String) map.get("xxxxx");//获取不到,应该是null if("xxx".equals(xxx)){ System.out.println("xxx"); }else{ System.out.println("xxxxxxxxx"); }

结果:

xxxxxxxxx

查看源码发现:

public boolean equals(Object paramObject) { if (this == paramObject) return true; if (paramObject instanceof String) { String str = (String) paramObject; int i = this.value.length; if (i == str.value.length) { char[] arrayOfChar1 = this.value; char[] arrayOfChar2 = str.value; for (int j = 0; i-- != 0; ++j) if (arrayOfChar1[j] != arrayOfChar2[j]) return false; return true; } } return false; }

      常量写在后面是将常量作为参数传下来,直接调用this ==xxx就报错,

       常量写在前面是将null作为参数传下来不会报错,返回false。

20、不要对数组使用toString()方法

      看一下对数组使用toString()打印出来的是什么:

public static void main(String[] args)

{

int[] is = new int[]{1, 2, 3};

System.out.println(is.toString());

}

结果是:

[I@18a992f

        本意是想打印出数组内容,却有可能因为数组引用is为空而导致空指针异常。不过虽然对数组toString()没有意义,但是对集合toString()是 可以打印出集合里面的内容的,因为集合的父类AbstractCollections<E>重写了Object的toString()方法。

21、把一个基本数据类型转为字符串,基本数据类型.toString()是最快的方式、String.valueOf(数据)次之、数据+""最慢

         把一个基本数据类型转为一般有三种方式,我有一个Integer型数据i,可以使用i.toString()、String.valueOf(i)、i+""三种方式,三种方式的效率如何,看一个测试:

public static void main(String[] args)

{

int loopTime = 50000;

Integer i = 0;

long startTime = System.currentTimeMillis();

for (int j = 0; j < loopTime; j++)

{

String str = String.valueOf(i);

}

System.out.println("String.valueOf():" + (System.currentTimeMillis() - startTime) + "ms");

startTime = System.currentTimeMillis();

for (int j = 0; j < loopTime; j++)

{

String str = i.toString();

}

System.out.println("Integer.toString():" + (System.currentTimeMillis() - startTime) + "ms");

startTime = System.currentTimeMillis();

for (int j = 0; j < loopTime; j++)

{

String str = i + "";

}

System.out.println("i + "":" + (System.currentTimeMillis() - startTime) + "ms");

}

运行结果为:

String.valueOf():11ms

Integer.toString():5ms

i + "":25ms

        所以以后遇到把一个基本数据类型转为String的时候,优先考虑使用toString()方法。至于为什么,很简单:

1、String.valueOf()方法底层调用了Integer.toString()方法,但是会在调用前做空判断

2、Integer.toString()方法就不说了,直接调用了

3、i + ""底层使用了StringBuilder实现,先用append方法拼接,再用toString()方法获取字符串

       三者对比下来,明显是2最快、1次之、3最慢

22、使用最有效率的方式去遍历Map

         遍历Map的方式有很多,通常场景下我们需要的是遍历Map中的Key和Value,那么推荐使用的、效率最高的方式是:

public static void main(String[] args)

{

HashMap<String, String> hm = new HashMap<String, String>();

hm.put("111", "222");

Set<Map.Entry<String, String>> entrySet = hm.entrySet();

Iterator<Map.Entry<String, String>> iter = entrySet.iterator();

while (iter.hasNext())

{

Map.Entry<String, String> entry = iter.next();

System.out.println(entry.getKey() + "" + entry.getValue());

}

}

       如果你只是想遍历一下这个Map的key值,那用"Set<String> keySet = hm.keySet();"会比较合适一些。

36、对资源的close()建议分开操作

      意思是,比如我有这么一段代码:

try

{

XXX.close();

YYY.close();

}

catch (Exception e)

{

...

}

建议修改为:

try

{

XXX.close();

}

catch (Exception e)

{

...

}

try

{

YYY.close();

}

catch (Exception e)

{

...

}

        虽然有些麻烦,却能避免资源泄露。我们想,如果没有修改过的代码,万一XXX.close()抛异常了,那么就进入了catch块中 了,YYY.close()不会执行,YYY这块资源就不会回收了,一直占用着,这样的代码一多,是可能引起资源句柄泄露的。而改为下面的写法之后,就保 证了无论如何XXX和YYY都会被close掉。

       这些代码优化的细节,是我们在日常开发中都会遇到的,在平时的开发中多注意,很快就会养成很多良好的编码习惯,还有一点就是大家可以在ide中安装阿里巴巴的编程规范,开启实时扫描功能,同样你也会受益匪浅哦,最后一点要提的就是一定要写清楚注释,特别是复杂的逻辑,因为这个习惯的养成不仅仅是对我们自己有极大的好处,同时也对其他代码维护者更佳友好。