下面一段话是我转载自csdn论坛里的
经验总结--字符串与编码: 首先应该把字节数组看成是String的载体。 dot Net使用的字符串String是Unicode编码的;它也是以Unicode编码的形式显示字符串。 以下是用自己语言对几个常用函数的说明: (自己总结的,反正看不明MSDN) bytes=System.Text.Encoding.Unicode.GetBytes(str) 作用:把str的载体作Unicode-> Unicode的编码转换--也就是没有对载体作任何的转换。因些使用此函数可以得代表该String载体的字节数组。 str=System.Text.Encoding.Unicode.GetString(bytes) 作用:对字节数组作Unicode-> Unicode的编码转换--即没有转换,把经过转换后的字节数组作为str的载体。 bytes=System.Text.Encoding.Utf8.GetBytes(str) 作用:把str的载体作Utf8-> Unicode的编码转换。返回的是经过转换后的字符数组 str=System.Text.Encoding.Utf8.GetString(bytes) 作用:对字节数组作Gb2312-> Unicode的编码转换,把经过转换后的字节数组作为str的载体。 bytes=System.Text.Encoding.GetEncoding( "GB2312 ").GetBytes(str) 作用:把str的载体作Gb2312-> Unicode的编码转换。返回的是经过转换后的字符数组 str=System.Text.Encoding.GetEncoding( "GB2312 ").GetString(bytes) 作用:对字节数组作Gb2312-> Unicode的编码转换,把经过转换后的字节数组作为str的载体。 如此类推 bytes=System.Text.Encoding.GetEncoding( "XXX ").GetBytes(str) 作用:把str的载体作XXX-> Unicode的编码转换。返回的是经过转换后的字符数组 str=System.Text.Encoding.GetEncoding( "XXX ").GetString(bytes) 作用:对字节数组作XXX-> Unicode的编码转换,把经过转换后的字节数组作为str的载体。
下面是我将这些做对比的一个例子
从上面结果我们可以看出无论是英文或中文字符,Unicode编码都是用两个字节来存储一个字符
UTF8编码则是一个字节储存一个英文字符,三个字节来存储一个中文字符
ASCII编码则不能用于中文编码
例子的完整代码如下:
using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using System.Drawing;using System.Linq;using System.Text;using System.Windows.Forms;
namespace 字符串跟字节数组的互相转换{ public partial class Form1 : Form{ public Form1(){ InitializeComponent();}
private void button1_Click(object sender, EventArgs e){ string str = textBox1.Text;
//编码的GetBytes方法是将字符串编码成字节数组byte[] ascii = Encoding.ASCII.GetBytes(str);//编码的GetCharCount方法是字节数组的字符长度char[] asciiChar = new char[Encoding.ASCII .GetCharCount (ascii,0,ascii .Length )];//编码的GetChars方法(5个参数的)是获取字节数组的字符并把它赋给另一个字符数组Encoding.ASCII.GetChars(ascii,0,ascii .Length ,asciiChar ,0);//字符数组编程字符串string asciiStr = new string(asciiChar);textBox2.Text = ascii.Length + " " + asciiStr;textBox3.Text = Encoding.ASCII.GetString(ascii );
byte[] unicode = System.Text.Encoding.Unicode.GetBytes(str);char [] unicodeChar=new char[System .Text .Encoding .Unicode.GetCharCount(unicode ,0,unicode.Length )];Encoding.Unicode.GetChars(unicode ,0,unicode .Length ,unicodeChar ,0);string unicodeStr = new string(unicodeChar);textBox4.Text = unicode.Length + " " + unicodeStr;textBox5.Text = System.Text.Encoding.Unicode.GetString(unicode );
byte[] utf8 = System.Text.Encoding.UTF8.GetBytes(str);char[] utf8Char=new char[Encoding .UTF8 .GetCharCount (utf8 ,0,utf8.Length )];Encoding.UTF8.GetChars(utf8 ,0,utf8 .Length ,utf8Char ,0);string utf8Str = new string(utf8Char );textBox6.Text = utf8.Length + " " + utf8Str;textBox7.Text = Encoding.UTF8.GetString(utf8 );
}}}
http://blog.163.com/tianjunqiang666@126/blog/static/872591192012101511303449/