阅读 1780

【带着问题学】关于Java与Kotlin泛型你应该知道的知识点

前言

带着问题学习可以让我们在学习的过程中更加有目的性与条理。
例如在读源码的过程中,我们如果从头开始读,往往千头万绪,抓不住要领。
而如果在开始读之前先带着几个问题,则可以让我们在读源码的过程中有一个主线。
最后也可以通过判断自己的问题是否得到解决了,来判断自己是否真的读懂了,不然面对成千上万行的代码,很容易有白读了的感觉。

阅读本文前,下面先列出几个问题
1.为什么我们需要泛型?
2.如何定义泛型类?如何定义泛型方法?
3.怎么限定类型变量?
4.泛型有什么局限性?
5.泛型类型的继承规则是怎样的?
6.什么是泛型的通配符?什么是PECS原则?
7.虚拟机如何实现泛型?什么是泛型擦除?
8.kotlin中的泛型与Java泛型有什么区别?

为什么我们需要泛型?

首先举两个例子

1.求和函数

实际开发中,经常有数值类型求和的需求,例如实现int类型的加法, 有时候还需要实现long类型的求和 如果还需要double类型的求和,又需要重新在重载一个输入是double类型的add方法。

public int addInt(int x,int y){
	return x+y;
}

public float addFloat(float x,float y){
	return x+y;
}
复制代码

这种情况就会写很多重复代码

2.List中添加元素

List list = new ArrayList();
list.add("mark");
list.add("OK");
list.add(100);

for (int i = 0; i < list.size(); i++) {
        String name = list.get(i); // 1
        System.out.println("name:" + name);
    }
复制代码

定义了一个List类型的集合,先向其中加入了两个字符串类型的值,随后加入一个Integer类型的值。这是完全允许的,因为此时list默认的类型为Object类型

在之后的循环中,由于忘记了之前在list中也加入了Integer类型的值或其他编码原因,容易引发类型转换错误.
因为编译阶段正常,因此,导致此类错误编码过程中不易发现。

在如上的编码过程中,我们发现主要存在两个问题:
1.当我们将一个对象放入集合中,集合不会记住此对象的类型,当再次从集合中取出此对象时,改对象的编译类型变成了Object类型,但其运行时类型任然为其本身类型。
2.因此,从List取出集合元素时需要人为的强制类型转化到具体的目标类型,且很容易出现“java.lang.ClassCastException”异常。

所以泛型的好处就是:
1.适用于多种数据类型执行相同的代码
2.泛型中的类型在使用时指定,不需要强制类型转换

如何定义泛型类与泛型方法?

泛型,即“参数化类型”。一提到参数,最熟悉的就是定义方法时有形参,然后调用此方法时传递实参。那么参数化类型怎么理解呢?
顾名思义,就是将类型由原来的具体的类型参数化,类似于方法中的变量参数,此时类型也定义成参数形式(可以称之为类型形参),然后在使用/调用时传入具体的类型(类型实参)。
泛型的本质是为了参数化类型(在不创建新的类型的情况下,通过泛型指定的不同类型来控制形参具体限制的类型)。
也就是说在泛型使用过程中,操作的数据类型被指定为一个参数,这种参数类型可以用在类、接口和方法中,分别被称为泛型类、泛型接口、泛型方法。

泛型类与泛型接口的定义

引入一个类型变量T(其他大写字母都可以,不过常用的就是T,E,K,V等等),并且用<>括起来,并放在类名的后面。泛型类是允许有多个类型变量的。

public interface Genertor<T> {
    public T next();
}

public class ImplGenertor<T> implements Genertor<T> {
    @Override
    public T next() {
        return null;
    }
}
复制代码

泛型方法的定义

泛型方法,是在调用方法的时候指明泛型的具体类型 ,泛型方法可以在任何地方和任何场景中使用,包括普通类和泛型类。
注意泛型类中定义的普通方法和泛型方法的区别。

1.public <T> T genericMethod(T...a){
        return a[a.length/2];
    }

2.public T genericMethod(T...a){
        return a[a.length/2];
    }    
复制代码

如上所示,第2种虽然在方法中使用了泛型,却不是一个泛型方法。
这只是类中的一个普通的成员方法,只不过他的返回值是泛型类中已经声明了的泛型。

怎么限定类型变量?

有时候,我们需要对类型变量加以约束,比如计算两个变量的最小,最大值。
请问,如果确保传入的两个变量一定有compareTo方法?那么解决这个问题的方案就是将T限制为实现了接口Comparable的类

   public static <T extends Comparable> T min(T a,T b){
       if(a.comapareTo(b)>0) return a; else return b;
   }
复制代码

同时extends左右都允许有多个,如 T,V extends Comparable & Serializable
这种类的限定既可以用在泛型方法上也可以用在泛型类上。

泛型有什么局限性?

因为Java中的泛型是利用泛型擦除实现的,目前还有以下局限性
1.不能用基本类型实例化类型参数
2.运行时类型查询只适用于原始类型
3.泛型类的静态上下文中类型变量失效
4.不能创建参数化类型的数组
5.不能实例化类型变量
6.不能捕获泛型类的实例

不能在静态域或方法中引用类型变量。因为泛型是要在对象创建的时候才知道是什么类型的,而对象创建的代码执行先后顺序是static的部分,然后才是构造函数等等。所以在对象初始化之前static的部分已经执行了,如果你在静态部分引用的泛型,那么毫无疑问虚拟机根本不知道是什么东西,因为这个时候类还没有初始化。

泛型类型的继承规则是怎样的?

现在我们有一个类和子类

public class Emplyee{}

public class Worker extends Emplyee{}
复制代码

有一个泛型类

public class Pair<T>{}
复制代码

请问Pair和Pair是继承关系吗?
答案:不是,他们之间没有什么关系
但是泛型类可以继承或者扩展其他泛型类,比如List和ArrayList

通配符与PECS

正是因为前面所述的,Pair和Pair没有任何关系,而我们有时候需要用到类之前的继承关系
为解决这个问题,于是提出了一个通配符类型 ?
有两种使用方式:
? extends X 表示类型的上界,类型参数是X的子类
? super X 表示类型的下界,类型参数是X的超类
这两种 方式从名字上来看,特别是super,很有迷惑性,下面我们来仔细辨析这两种方法。

? extends X

表示传递给方法的参数,必须是X的子类(包括X本身)

public static void print2(GenericType<? extends Fruit> p){
	System.out.println(p.getData().getColor());
}

public static void use2(){
	GenericType<Fruit> a = new GenericType<>();
	print2(a);
	GenericType<Orange> b = new GenericType<>();
	print2(b);
}
复制代码

但是对泛型类GenericType来说,如果其中提供了get和set类型参数变量的方法的话,set方法是不允许被调用的,会出现编译错误

GenericType<? extends Fruit> c =  new GenericType<>();

Apple apple =  new Apple();
Fruit fruit = new Fruit();
        //set会报错
        //c.setData(apple);
        //c.setData(fruit);
        //get是可以的
Fruit x = c.getData();
复制代码

get方法则没问题,会返回一个Fruit类型的值。
为何?
道理很简单,?extends X 表示类型的上界,类型参数是X的子类,那么可以肯定的说,get方法返回的一定是个X(不管是X或者X的子类)编译器是可以确定知道的。但是set方法只知道传入的是个X,至于具体是X的那个子类,不知道。

总结:主要用于安全地访问数据,可以访问X及其子类型,并且不能写入非null的数据。

? super X

表示传递给方法的参数,必须是X的超类(包括X本身)

public static void printSuper(GenericType<? super Apple> p){
	System.out.println(p.getData());
}

public static void useSuper(){
	GenericType<Fruit> fruitGenericType = new GenericType<>();
	GenericType<Apple> appleGenericType = new GenericType<>();
	GenericType<HongFuShi> hongFuShiGenericType = new GenericType<>();
	GenericType<Orange> orangeGenericType = new GenericType<>();
	printSuper(fruitGenericType);
	printSuper(appleGenericType);
	printSuper(hongFuShiGenericType);
	printSuper(orangeGenericType);
}
复制代码

但是对泛型类GenericType来说,如果其中提供了get和set类型参数变量的方法的话,set方法可以被调用的,且能传入的参数只能是X或者X的子类

//表示GenericType的类型参数的下界是Apple
GenericType<? super Apple> x = new GenericType<>();
x.setData(new Apple());
x.setData(new HongFuShi());
        //x.setData(new Fruit());
Object data = x.getData();
复制代码

get方法只会返回一个Object类型的值。
为何?
?super X 表示类型的下界,类型参数是X的超类(包括X本身),那么可以肯定的说,get方法返回的一定是个X的超类,那么到底是哪个超类?不知道,但是可以肯定的说,Object一定是它的超类,所以get方法返回Object。编译器是可以确定知道的。对于set方法来说,编译器不知道它需要的确切类型,但是X和X的子类可以安全的转型为X。

总结:主要用于安全地写入数据,可以写入X及其子类型

无限定的通配符 ?

表示对类型没有什么限制,可以把?看成所有类型的父类,如Pair< ?>;
比如:
ArrayList al=new ArrayList(); 指定集合元素只能是T类型
ArrayList al=new ArrayList();集合元素可以是任意类型,这种没有意义,一般是方法中,只是为了说明用法。
在使用上:
? getFirst() : 返回值只能赋给 Object,;
void setFirst(?) : setFirst 方法不能被调用, 甚至不能用 Object 调用;

PECS原则

上面讲解的extend与super的使用,其实可以用PECS原则来总结
PECS指“Producer Extends,Consumer Super”。换句话说,如果参数化类型表示一个生产者,就使用<? extends T>;如果它表示一个消费者,就使用<? super T>

总结 ? extends 和 the ? super 通配符的特征,我们可以得出以下结论

  • 如果你想从一个数据类型里获取数据,使用 ? extends 通配符
  • 如果你想把对象写入一个数据结构里,使用 ? super 通配符
  • 如果你既想存,又想取,那就别用通配符。

虚拟机是如何实现泛型的?什么是泛型擦除?

泛型思想早在C++语言的模板(Template)中就开始生根发芽,在Java语言处于还没有出现泛型的版本时,只能通过Object是所有类型的父类和类型强制转换两个特点的配合来实现类型泛化。,由于Java语言里面所有的类型都继承于java.lang.Object,所以Object转型成任何对象都是有可能的。但是也因为有无限的可能性,就只有程序员和运行期的虚拟机才知道这个Object到底是个什么类型的对象。在编译期间,编译器无法检查这个Object的强制转型是否成功,如果仅仅依赖程序员去保障这项操作的正确性,许多ClassCastException的风险就会转嫁到程序运行期之中。

泛型技术在C#和Java之中的使用方式看似相同,但实现上却有着根本性的分歧,C#里面泛型无论在程序源码中、编译后的IL中(Intermediate Language,中间语言,这时候泛型是一个占位符),或是运行期的CLR中,都是切实存在的,List<int>与List<String>就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和类型数据,这种实现称为类型膨胀,基于这种方法实现的泛型称为真实泛型。

Java语言中的泛型则不一样,它只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型(Raw Type,也称为裸类型)了,并且在相应的地方插入了强制转型代码,因此,对于运行期的Java语言来说,ArrayList<int>与ArrayList<String>就是同一个类,所以泛型技术实际上是Java语言的一颗语法糖,Java语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型。

将一段Java代码编译成Class文件,然后再用字节码反编译工具进行反编译后,将会发现泛型都不见了,程序又变回了Java泛型出现之前的写法,泛型类型都变回了原生类型

public static String method(List<String> stringList){
	System.out.println("List");
	return "OK";
}

public static Integer method(List<Integer> stringList){
	System.out.println("List");
	return 1;
}
复制代码

上面这段代码是不能被编译的,因为参数List<Integer>和List<String>编译之后都被擦除了,变成了一样的原生类型List<E>,擦除动作导致这两种方法的特征签名变得一模一样。

为什么泛型擦除后get不需要类型转换?

因为类型擦除的问题,所以所有的泛型类型变量最后都会被替换为原始类型。这样就引起了一个问题,既然都被替换为原始类型,那么为什么我们在获取的时候,不需要进行强制类型转换呢?看下ArrayList和get方法:

public E get(int index) {
	RangeCheck(index);
	return (E) elementData[index];
}
复制代码

看以看到,在return之前,会根据泛型变量进行强转。 写了个简单的测试代码:

public class Test {
	public static void main(String[] args) {
		ArrayList<Date> list=new ArrayList<Date>();
		list.add(new Date());
		Date myDate=list.get(0);
	}
复制代码

然后反编了下字节码,如下

public static void main(java.lang.String[]);
Code:
0: new #16 // class java/util/ArrayList
3: dup
4: invokespecial #18 // Method java/util/ArrayList."<init
:()V
7: astore_1
8: aload_1
9: new #19 // class java/util/Date
12: dup
13: invokespecial #21 // Method java/util/Date."<init>":()
 
16: invokevirtual #22 // Method java/util/ArrayList.add:(L
va/lang/Object;)Z
19: pop
20: aload_1
21: iconst_0
22: invokevirtual #26 // Method java/util/ArrayList.get:(I
java/lang/Object;
25: checkcast #19 // class java/util/Date
28: astore_2
29: return
复制代码

看第22 ,它调用的是ArrayList.get()方法,方法返回值是Object,说明类型擦除了。然后第25,它做了一个checkcast操作,即检查类型#19, 在在上面找#19引用的类型,他是 9: new #19 // class java/util/Date 是一个Date类型,即做Date类型的强转。 所以不是在get方法里强转的,是在你调用的地方强转的

kotlin泛型

kotlin泛型中引入了in和out

Out (协变)

如果你的类是将泛型作为内部方法的返回,那么可以用 out:

interface Production<out T> {
    fun produce(): T
}
复制代码

可以称其为 production class/interface,因为其主要是产生(produce)指定泛型对象。因此,可以这样来记:produce = output = out。
相当于Java中的? extends T

In(逆变)

如果你的类是将泛型对象作为函数的参数,那么可以用 in:

interface Consumer<in T> {
    fun consume(item: T)
}
复制代码

可以称其为 consumer class/interface,因为其主要是消费指定泛型对象。因此,可以这样来记:consume = input = in。
相当于Java中的? super T

Invariant(不变)

如果既将泛型作为函数参数,又将泛型作为函数的输出,那就既不用 in 或 out。

interface ProductionConsumer<T> {
    fun produce(): T
    fun consume(item: T)
}
复制代码

"父类泛型对象可以赋值给子类泛型对象,用 in;
子类泛型对象可以赋值给父类泛型对象,用 out。"

关于In out使用的例子,可见:Kotlin 泛型中的 in 和 out

参考资料

PECS法则与extends和super关键字
什么是泛型擦除
由Kotlin 中关键字out和in和Java中的泛型的比较学习
Kotlin 泛型中的 in 和 out

文章分类
Android
文章标签