JNI系列入门之C语言中文字符串乱码问题

1,786 阅读2分钟

JNI系列文章:

  1. JNI系列之入门Hello JNI C(一)
  2. JNI系列之入门Hello JNI C(二)
  3. JNI系列入门之C语言与Java的双向通信(一)
  4. JNI系列入门之C语言与Java的双向通信(二)
  5. JNI系列入门之C语言中文字符串乱码问题

解决方案

思路: 我们在写java代码的时候,可以通过new String(byte[], String chasetname)来指定字符集加载,避免乱码问题。同样我们可以利用JNI的特性,在C层使用java的String构造方法,实例化一个jstring对象返回给Java使用,这样C层的中文字符串就不会乱码了。

实现:

// 解决C返回给java的字符串中文乱码问题
JNIEXPORT jstring JNICALL Java_com_jerry_jnitest_JniTest_resolveMessyCode
(JNIEnv *env, jobject jobj, jstring jstr_in) {
	
	char *c_str = "我是来自于C语言的中文字符串,我乱码的毛病被治好了,当然有些生僻字可能还是会乱码,那就需要换成其它的字符集。";

	// 通过调用java的String的构造方法String(byte bytes[], String charsetName)
	// 给charsetName设置为GB2312就没问题了
	// 要执行new String(xxx)构造方法
	// 1. 先获取String的jclass
	jclass cls_string = (*env)->FindClass(env, "java/lang/String");
	// 2. 获取构造函数的jmethodID
	jmethodID mid_constructor = (*env)->GetMethodID(env, cls_string, "<init>",
		"([BLjava/lang/String;)V"); 
	// 3. new一个String对象
	// 创建一个jbyteArray变量
	// 字节数组里是一个个的字节byte即jbyte,
	// jbyte又是signed char的别名,说明jbyte其实就是char字符
	// 那么char* 字符串就是char字符的集合,即jbyte的集合,就是jbyteArray
	jbyteArray bytes = (*env)->NewByteArray(env, strlen(c_str));
	(*env)->SetByteArrayRegion(env, bytes, 0, strlen(c_str), c_str);

	jstring jstr_charset = (*env)->NewStringUTF(env, "GB2312");
	return (*env)->NewObject(env, cls_string, mid_constructor,
		bytes, jstr_charset);
}

JNI系列文章:

  1. JNI系列之入门Hello JNI C(一)
  2. JNI系列之入门Hello JNI C(二)
  3. JNI系列入门之C语言与Java的双向通信(一)
  4. JNI系列入门之C语言与Java的双向通信(二)
  5. JNI系列入门之C语言中文字符串乱码问题