【Java基础】 -- Java遍历List四种方法的效率对比【转载】

当前位置:

首页 > 编程开发 > Java教程 >

【Java基础】 -- Java遍历List四种方法的效率对比【转载】

1.遍历方法简介

Java遍历List的方法主要有四种：

for each

for(Object o :list)
{
}

Iterator

Iterator iter = list.iterator();
while(iter.hasNext()){
    Object o = iter.next();
}

loop without size

int size = list.size();
for(int i=0;i<size;i++){
    Object o= list.get(i);
}

loop with size

for(int i=0;i<list.size();i++){
    Object o= list.get(i);
}

注：这里我们不比较while和for的形式，这对效率影响几乎是可以忽略的。

我们是否能简单的得出结论，哪个更快，哪个更慢呢？

严谨一点的方法是：基于实验与数据，才能作出判断。

1.1. ArrayList测试分析

经过编写测试代码，结果如下：（时间单位：纳秒）

Size	10	100	1000	10000	100000	1000000
Foreach	448,319	558,757	732,009	2,074,092	6,169,315	15,347,540
IteratorWay	22,169	54,603	86,215	513,186	4,786,587	14,032,553
WithoutSize	14,369	32,023	158,472	828,897	3,685,905	9,457,398
WithSize	29,149	47,213	91,963	557,936	5,148,280	10,051,462

可以看出，直接用循环的方法，get(index)来获取对象，是最快的方式。而且把i<list.size()放到循环中去判断，会影响效率。

For Each的效率最差，用迭代器的效率也没有很好。但只是相对而言，其实从时间上看最多也就差几毫秒。

然而，这并不是事实的全部真相！！！

上面的测试，我们只是用了ArrayList来做为List的实现类。所以才有上面的结论。

For each其实也是用了迭代器来实现，因此当数据量变大时，两者的效率基本一致。也因为用了迭代器，所以速度上受了影响。不如直接get(index)快。

那为何get(index)会比较快呢？

因为ArrayList是通过动态数组来实现的，支持随机访问，所以get(index)是很快的。迭代器，其实也是通过数组名+下标来获取，而且增加了逻辑，自然会比get(index)慢。

看ArrayList的迭代器的源代码就清楚了。

public boolean hasNext()
{
   return cursor != size;

}

public Object next()
{
   checkForComodification();
   int i = cursor;
   if(i >= size)
      throw new NoSuchElementException();
   Object aobj[] = elementData;
   if(i >= aobj.length)
   {
      throw new ConcurrentModificationException();
   } else
   {
       cursor = i + 1;
       return aobj[lastRet = i];
   }
}

1.2.LinkedList测试分析

接下来，我们用LinkedList试试，看看会产生什么效果：（时间单位：纳秒）

Size	10	100	1000	10000	100000	1000000
Foreach	542,745	388,379	952,063	2,257,196	9,426,607	12,141,976
IteratorWay	25,454	62,814	110,848	753,767	5,875,361	12,141,976
WithoutSize	27,096	95,248	3,343,097	51,302,568	3,720,958,713	692,276,304,569
WithSize	13,138	98,531	2,137,726	40,157,815	3,671,762,259	668,285,601,444

结果确实不简单，跟ArrayList完全不一样了。

最突出的就是get(index)的方式，随着size的增加，急剧上升。到10万数据量时，光遍历时间都要三四秒，这是很可怕的。

那为何会有这样的结果呢？还是和LinkedList的实现方式有关。

LinkedList是通过双向链表实现的，无法支持随机访问。当你要向一个链表取第index个元素时，它需要二分后从某一端开始找，一个一个地数才能找到该元素。这样一想，就能明白为何get(index)如此费时了。

public Object get(int i)
{
    checkElementIndex(i);
    return node(i).item;
}

Node node(int i)
{
    if(i < size >> 1)
    {
        Node node1 = first;
        for(int j = 0; j < i; j++){
            node1 = node1.next;
            return node1;
        }
        Node node2 = last;
        for(int k = size - 1; k > i; k--)
            node2 = node2.prev;

        return node2;
    }
}

而迭代器提供的是获取下一个的方法，时间复杂度为O(1)，所以会比较快。

public boolean hasNext()
{
    return nextIndex < size;
}

public Object next()
{
    checkForComodification();
    if(!hasNext())
    {
        throw new NoSuchElementException();
    } else
    {
        lastReturned = next;
        next = next.next;
        nextIndex++;
        return lastReturned.item;
    }
}