`

Java2容器类

    博客分类:
  • java
阅读更多
/*
Java2容器类类库的用途是“保存对象”,它分为两类: 

  Collection----一组独立的元素,通常这些元素都服从某种规则。List必须保持元素特定的顺序,而Set不能有重复元素。 

  Map----一组成对的“键值对”对象,即其元素是成对的对象,最典型的应用就是数据字典,并且还有其它广泛的应用。另外,Map可以返回其所有键组成的Set和其所有值组成的Collection,或其键值对组成的Set,并且还可以像数组一样扩展多维Map,只要让Map中键值对的每个“值”是一个Map即可。 

  1.迭代器 

  迭代器是一种设计模式,它是一个对象,它可以遍历并选择序列中的对象,而开发人员不需要了解该序列的底层结构。迭代器通常被称为“轻量级”对象,因为创建它的代价小。 

  Java中的Iterator功能比较简单,并且只能单向移动: 

  (1) 使用方法iterator()要求容器返回一个Iterator。第一次调用Iterator的next()方法时,它返回序列的第一个元素。 

  (2) 使用next()获得序列中的下一个元素。 

  (3) 使用hasNext()检查序列中是否还有元素。 

  (4) 使用remove()将迭代器新返回的元素删除。 

  Iterator是Java迭代器最简单的实现,为List设计的ListIterator具有更多的功能,它可以从两个方向遍历List,也可以从List中插入和删除元素。 

  2.List的功能方法 

  List(interface): 次序是List最重要的特点;它确保维护元素特定的顺序。List为Collection添加了许多方法,使得能够向List中间插入与移除元素(只推荐LinkedList使用)。一个List可以生成ListIterator,使用它可以从两个方向遍历List,也可以从List中间插入和删除元素。 


  ArrayList: 由数组实现的List。它允许对元素进行快速随机访问,但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历ArrayList,而不是用来插入和删除元素,因为这比LinkedList开销要大很多。 

  LinkedList: 对顺序访问进行了优化,向List中间插入与删除得开销不大,随机访问则相对较慢(可用ArrayList代替)。它具有方法addFirst()、addLast()、getFirst()、getLast()、removeFirst()、removeLast(),这些方法(没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。 

  3.Set的功能方法 

  Set(interface): 存入Set的每个元素必须是唯一的,因为Set不保存重复元素。加入Set的Object必须定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。 

  HashSet: 为快速查找而设计的Set。存入HashSet的对象必须定义hashCode()。 

  TreeSet: 保持次序的Set,底层为树结构。使用它可以从Set中提取有序的序列。 

  LinkedHashSet: 具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。 

  HashSet采用散列函数对元素进行排序,这是专门为快速查询而设计的;TreeSet采用红黑树的数据结构进行排序元素;LinkedHashSet内部使用散列以加快查询速度,同时使用链表维护元素的次序,使得看起来元素是以插入的顺序保存的。需要注意的是,生成自己的类时,Set需要维护元素的存储顺序,因此要实现Comparable接口并定义compareTo()方法。 

ArrayList
  ArrayList是一个可变数组实现,实现了List接口的所有方法,并允许存取null值.ArrayList基本上等同与Vector,但它只对writeObject()和readObject()进行了同步.
  1.序列化
  ArrayList使用一个Object的数组存储元素.
 private transient E[] elementData;
ArrayList实现了java.io.Serializable接口,这里的transient标示这个属性不需自动序列化.这是因为elementData数组中存储的"元素"其实只是对这些元素的一个引用,并不是真正的对象,序列化没有意义.因为序列化是为了反序列化,当你反序列化时,这些对象的引用已经不可能指向原来的对象了.所以要手工对ArrayList的元素进行序列化操作,这就是writeObject()的作用.*/
 private void writeObject(java.io.ObjectOutputStream s)
                throws java.io.IOException{
 // Write out element count, and any hidden stuff
 s.defaultWriteObject();

        // Write out array length
        s.writeInt(elementData.length);

 // Write out all elements in the proper order.
 for (int i=0; i<size; i++)
            s.writeObject(elementData[i]);
    }
对应的readObject()为:
 private void readObject(java.io.ObjectInputStream s)
         throws java.io.IOException, ClassNotFoundException {
 // Read in size, and any hidden stuff
 s.defaultReadObject();

        // Read in array length and allocate array
        int arrayLength = s.readInt();
        Object[] a = elementData = (E[])new Object[arrayLength];

 // Read in all elements in the proper order.
 for (int i=0; i<size; i++)
            a[i] = s.readObject();
    }
  /*2.自动变长机制
   在每一个add() 方法中,都首先调用一个ensureCapacity(int miniCapacity)方法,这个方法保证elementData数组的长度不小于miniCapacity,ArrayList的自动变长机制就是在这个方法中实现的.*/
   public void ensureCapacity(int minCapacity) {
       modCount++;
       int oldCapacity = elementData.length;
       if (minCapacity > oldCapacity) {
            Object oldData[] = elementData;
           int newCapacity = (oldCapacity * 3)/2 + 1;
           if (newCapacity < minCapacity)
                 newCapacity = minCapacity;
           elementData = (E[])new Object[newCapacity];
           System.arraycopy(oldData, 0, elementData, 0, size);
        }
     }
从这个方法可以看出ArrayList每次扩容都扩大到原来的1.5倍.
每种add()方法的实现都大同小异,下面给出add(Object)的实现:
    public boolean add(E o) {
       ensureCapacity(size + 1);  // Increments modCount!!
       elementData[size++] = o;
       return true;
    }

   remove()方法

public E remove(int index) {
  RangeCheck(index);

 modCount++;
 E oldValue = elementData[index];

 int numMoved = size - index - 1;
 if (numMoved > 0)
     System.arraycopy(elementData, index+1, elementData, index,
        numMoved);
 elementData[--size] = null; // Let gc do its work

 return oldValue;
    }
/*
RangeCheck()的作用是进行边界检查.出于ArrayList采用一个对象数组元素存储元素,所以删除一个元素时需要把后面的元素前移.删除一个元素时只是把该元素在elementData数组中的引用置为null.
 modCount的作用将在下面的"interator()中的同步"中说明.
注:在前移时使用了System.arrayCopy(),这个方法是native方法,如是对同一个数组进行操作,会首先从中标位置.
    3.快速失败迭代器
  在父类AbstractList中定义了一个int型的属性:modCount,记录了ArrayList结构性变化的次数.
 protected transient int modCount = 0;
在ArrayList的所有涉及结构变化的方法中都增加modCount的值,包括:add(),remove(),addAll(),removeRange()及clear()方法.这些方法每调用一次,modCount的值就会加1.
   注:add()及addAll()方法的modCount的值是在其中调用的ensureCapacity()方法中增加的.
AbstractList中的iterator()方法(ArrayList直接继承了这个方法)使用了一个私有内部成员类Itr,生成一个Itr对象(Iterator接口),返回:
    public Iterator<E> iterator() {
        return listIterator();
    }
Itr实现了Iterator()接口,其中也定义了一个int型的属性:expectedModCount,这个属性在Itr类初始化时被赋予ArrayList对象的modCount属性的值.
注:内部成员类Itr也是ArrayList类的一个成员,它可以访问所有的AbstractList的属性和方法.
   在Itr.next()方法中,Itr也调用了定义在AbstractList中的get(int)方法,返回当前光标的元素:*/
public E next() {
    checkForComodification();
    try {
        E next = get(cursor);
        lastRet = cursor++;
        return next;
     } catch(IndexOutOfBoundsException e) {
        checkForComodification();
       throw new NoSuchElementException();
     }
 }
注意,在next()方法中调用了checkForComodification()方法,进行对修改的同步检查:
final void checkForComodification() {
       if (modCount != expectedModCount)
               throw new ConcurrentModificationException();
   }
现在对modCount和expectedModCount的作用应该非常清楚了.在对一个元素集合对象进行迭代操作时,并不是限制对集合对象元素进行操作,这些操作包括一些可能引起迭代错误的add()或remove()等危险操作.在AbstractList中,使用了一个简单的机制来规避这些风险.这就是modCount和expectedModCount的作用所在.


分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics