前言:在网上浏览资料看到的比较有实用价值的文章,推荐大家多次阅读,避免出现类似的低级错误
知识点:
- 集合判空
- 集合转Map
- 基本遍历
- 集合去重
- 集合转数组
- 数组转集合
其中,数组转集合、集合转数组比较容易出现错误。
- 集合判空
《阿里巴巴开发手册》的描述如下:
判断所有集合内部的元素是否为空,使用isEmpty()方法,而不是size==0的方式
这是因为isEmpty()方法的可读性更好,并且时间复杂度为O(1).
绝大部分的集合size()方法的时间复杂度也是O(1),不过,也有很多复杂度不是O(1)的,比如 java.util.concurrent包下的某些集合(ConcurrentLikedQueue、ConcurrentHashMap ......).
下面是ConcurrentHashMap的size()方法和isEmpty()方法的源码
/**
* {@inheritDoc}
*/
public int size() {
long n = sumCount();
return ((n < 0L) ? 0 :
(n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
(int)n);
}
/**
* {@inheritDoc}
*/
public boolean isEmpty() {
return sumCount() <= 0L; // ignore transient negative values
}
- 集合转Map
《阿里巴巴开发手册》的描述如下:
在使用java.util.stream.Collectors类的toMap()方法转为Map集合时,一定要注意当value值为null时会抛出NPE异常
class Person{
private String name;
private String phoneNumber
//getters and setters
}
List<Person> bookList = new ArrayList<>();
bookList.add(new Person("zhangshan","118181239"));
bookList.add(new Person("lisi",null));
//空指针异常
bookList.stream().collectors(Collectors.toMap(Person::getName,Person::getphoneNumber));
我们来解释一下原因
首先,我们来看java.util.stearm.Collectors类的toMap()方法,可以看到内部调用了Map接口的merge()方法
public static <T, K, U, M extends Map<K, U>>
Collector<T, ?, M> toMap(Function<? super T, ? extends K> keyMapper,
Function<? super T, ? extends U> valueMapper,
BinaryOperator<U> mergeFunction,
Supplier<M> mapSupplier) {
BiConsumer<M, T> accumulator
= (map, element) -> map.merge(keyMapper.apply(element),
valueMapper.apply(element), mergeFunction);
return new CollectorImpl<>(mapSupplier, accumulator, mapMerger(mergeFunction), CH_ID);
}
Map接口的merge()方法如下,这个方法是接口中的默认实现,merge()方法先调用Objects.requireNonNull()方法判断value是否为空
default V merge(K key, V value,
BiFunction<? super V, ? super V, ? extends V> remappingFunction) {
Objects.requireNonNull(remappingFunction);
Objects.requireNonNull(value);
V oldValue = get(key);
V newValue = (oldValue == null) ? value :
remappingFunction.apply(oldValue, value);
if(newValue == null) {
remove(key);
} else {
put(key, newValue);
}
return newValue;
}
- 集合遍历
《阿里巴巴Java开发手册》的描述如下:
不要在foreach循环里进行元素的remove/add操作。remove元素请使用Iterator方式。如果并发操作,需要对Iterator对象加锁
通过反编译你会发现foreach语法底层其实还是依赖Iterator,不过,remove/add操作直接调用的是集合自己的方法,而不是Iterator的remove/add方法
这就导致Interator莫名其妙地发现自己的元素被remove/add,然后,它就会抛出ConcurrentModificationException来提示用户发生看并发修改异常。这就是单线程状态下产生的fail-fast机制
Java8开始,可以使用Collection#removeIf()方法删除满足特定条件的元素
List<Integer> list = new ArrayList<>();
for(int i=1; i <=10; i++){
list.add(i);
}
list.removeIf(filter -> filter % 2==0); //删除List中的所有偶数
System.out.println(list); //{1,3,5,7,9}
除了上面介绍的直接使用Iterator进行遍历操作之外,你还可以:
1.使用普通的for循环使用fail-safe的集合类
2.java.util包下面的所有集合类都是fail-fast的,而java.util.concurrent包下面的所有的类都是fail-safe的
- 集合去重
《阿里巴巴开发手册》的描述如下:
可以利用Set元素唯一的特性,可以快速对一个集合进行去重操作,避免使用List的contains()进行遍历去重或者判断包含操作
我们以HashSet和ArrayList为例说明
// Set 去重代码示例
public static <T> Set<T> removeDuplicateBySet(List<T> data) {
if (CollectionUtils.isEmpty(data)) {
return new HashSet<>();
}
return new HashSet<>(data);
}
// List 去重代码示例
public static <T> List<T> removeDuplicateByList(List<T> data) {
if (CollectionUtils.isEmpty(data)) {
return new ArrayList<>();
}
List<T> result = new ArrayList<>(data.size());
for (T current : data) {
if (!result.contains(current)) {
result.add(current);
}
}
return result;
两者的核心区别在contails()方法的实现
HashSet的contains()方法依赖的HashMap的containsKey()方法,时间复杂度接近于O(1),(没有出现哈希冲突的时候为O(1))
private transient HashMap<E,Object> map;
public boolean contains(Object o) {
return map.containsKey(o);
}
我们有N个元素插入进Set中,那时间复杂度就接近O(n)
ArrayList()的contains()方法是通过遍历所有的方法来做的,时间复杂度接近0(n)
public boolean contains(Object o) {
return indexOf(o) >= 0;
}
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
我们的List有N个元素,那时间复杂度就接近是O(n^2)
- 集合转数组
《阿里巴巴开发手册》的描述如下:
使用集合转数组的方法必须使用集合的toArray(T[] array),传入的是类型完全一致、长度为0的空指针
String [] s = new String[] {
"dog", "lazy", "a", "over", "jumps", "fox", "brown", "quick", "A"
};
List<String> list = Arrays.asList(s);
Collections.reverse(list);
//没有指定类型的话就会报错
s=list.toArray(new String[0]);
由于 JVM 优化,new String[0]
作为Collection.toArray()
方法的参数现在使用更好,new String[0]
就是起一个模板的作用,指定了返回数组的类型,0 是为了节省空间,因为它只是为了说明返回的类型。详见:https://shipilev.net/blog/2016/arrays-wisdom-ancients/
- 数组转集合
《阿里巴巴Java开发手册》的描述如下:
使用工具类Arrays.asList()把数组转换成集合时,不能使用其修改集合相关的方法,它的add/remove/clear方法会抛出UnsupportedOperationException异常
Arrays.asList()在平时开发中还是比较常见的,我们可以使用它将一个数组转换为一个List集合
String[] myArray = {"Apple","Banana","Orange"};
List<String> myList = ArrayList.asList(myArray);
//合并成一个为
List<String> myList = Array.asList("Apple","Banana","Orange");
总结一下注意事项
1.ArrayList.asList()是泛型方法,传递的数组必须是对象数组,而不是基本类型
int[] myArray = {1,2,3};
List myList = Arrays.asList(myArray);
System.out.println(myList.size);//1
System.out.println(myList.get(0));//数组地址值
System.out.println(myList.get(1));//报错:ArrayIndexOutOfBoundsException
int [] array = (int[] myList.get(0));
System.out.println(array[0])//1
当传入一个原生数据类型数组时,Arrays.asList()的真正得到的参数就不是数组中的元素,而是数组对象本身!此时List的唯一元素就是这个数组。
我们可以使用包装类型数组就可以解决这个问题
Integer [] myArray = {1,2,3};
2.使用集合的修改方法:add(),remove(),clear()会抛出异常
List myList = Arrays.asList(1,2,3);
myList.add(2);//运行时报错:UnsupportedOperationException
myList.remove(1);//运行时报错:UnsupportedOperationException
myList.clear();//运行时报错:UnsupportedOperationException
Arrays.asList()方法返回的并不是java,util.ArrayList,而是java.util.Arrays的内部类,这个内部类并没有实现集合的修改方法或者说并没有重写这些方法
List myList = Arrays.asLIST(1,2,3);
System.out.println(myList,.getClass());//class java.util.Arrays$ArrayList
下面的是java.util.Arrays$ArrayList的简易源码,我们可以看到这个类重写的方法有哪些
private static class ArrayList<E> extends AbstractList<E>
implements RandomAccess, java.io.Serializable
{
...
@Override
public E get(int index) {
...
}
@Override
public E set(int index, E element) {
...
}
@Override
public int indexOf(Object o) {
...
}
@Override
public boolean contains(Object o) {
...
}
@Override
public void forEach(Consumer<? super E> action) {
...
}
@Override
public void replaceAll(UnaryOperator<E> operator) {
...
}
@Override
public void sort(Comparator<? super E> c) {
...
}
}
我们再看一下java.util.AbstractList的add/remove/clear方法就可以知道为什么会抛出UnsupportedOperationException
public E remove(int index) {
throw new UnsupportedOperationException();
}
public boolean add(E e) {
add(size(), e);
return true;
}
public void add(int index, E element) {
throw new UnsupportedOperationException();
}
public void clear() {
removeRange(0, size());
}
protected void removeRange(int fromIndex, int toIndex) {
ListIterator<E> it = listIterator(fromIndex);
for (int i=0, n=toIndex-fromIndex; i<n; i++) {
it.next();
it.remove();
}
}
那我们该如何正确的将数组转换为ArrayList?
1.手动实现工具类
static <T> List<T> arryaToList(final T[] array) {
final List<T> l = new ArrayList<T> (array.length)
for(final T s : array){
l.add(s);
}
return l;
}
Integer [] myArray = {1, 2, 3};
System.out.println(arrayToList(myArray).getClass());//class java.util.ArrayList
2.最简便的方法
List list = new ArrayList<>(Arrays.asList("1","2","3"));
3.使用Java8的Stream(推荐)
Integer [] myArray = {1,2,3};
List list = Arrays.stream(myArray).collect(Collectors.toList());
//基本类型也可以实现转换,(依赖boxed的装箱操作)
int [] myArray2 = {1,2,3};
List myList = Arrays.stream(myArray2.boxed.collect(Collectors.toList());
4.使用Guava
对于不可变集合,你可以使用ImmutableList类及其与copyOf工厂方法:(参数不能为空)
List<String> il = ImmutableList.of("string", "elements"); // from varargs
List<String> il = ImmutableList.copyOf(aStringArray); // from array
对于可变集合,你可以使用Lists类及其newArrayList()工厂方法
List<String> l1 = Lists.newArrayList(anotherListOrCollection); // from collection
List<String> l2 = Lists.newArrayList(aStringArray); // from array
List<String> l3 = Lists.newArrayList("or", "string", "elements"); // from varargs
5.使用Apache Commons Collections
List<String> list = new ArrayList<String>();
CollectionUtils.addAll(list, str);
6.使用Java9的List.of()方法
```java
Integer[] array = {1, 2, 3};
List[HTML_REMOVED] list = List.of(array);