asp 文件编码 utf 8必须为utf8是什么意思

查看: 2349|回复: 7
精易模块v3.4中“编码_Utf8到Ansi”和“到文本”有啥区别?
阅读权限70
签到天数:3 天结帖率: (9/11)
v3.4中“编码_Utf8到Ansi”和“到文本”有啥区别?“编码_Ansi到Unicode”和“到字节集”有啥区别?求使用精易模块v3.4的大神解释。
易语言支持的就是GBK,ansi和GBK差不多,UTF8和Unicode 差不多
这些,是一些编码类型,有的DLL,需要传入的参数,是UTF8格式或者Unicode格式
因为后面两者,支持更多的汉字和特殊符号,比如一些生僻的汉字,还有韩语,日语等等
所以,他们的区别,就是编码的区别呀。。。。
回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至
可获得加分喔。友情提醒:本版被采纳的主题可在
帖子申请荣誉值,获得 1点 荣誉值,荣誉值可兑换终身vip用户组哦。快捷通道: →
阅读权限150
结帖率: (11/11)
易语言支持的就是GBK,ansi和GBK差不多,UTF8和Unicode 差不多
这些,是一些编码类型,有的DLL,需要传入的参数,是UTF8格式或者Unicode格式
因为后面两者,支持更多的汉字和特殊符号,比如一些生僻的汉字,还有韩语,日语等等
所以,他们的区别,就是编码的区别呀。。。。
热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!
您可以选择打赏方式支持他
阅读权限165
签到天数: 15 天结帖率: (51/63)
编码_Utf8到Ansi编码_Ansi到Unicode是转码啊
到文本,到字节集是把内容转成文本和字节集格式
您可以选择打赏方式支持他
阅读权限165
结帖率: (5/5)
编码什么的你拿精易助手的编码试试就知道的& & 到文本()&&是将非文本型数据转化为文本型数据&&到字节集() 也一样
您可以选择打赏方式支持他
阅读权限228
签到天数: 4 天结帖率: (2/2)
一个返回字节集 一个返回 文本& &文本就是你看的懂 字节集就是都是数字
您可以选择打赏方式支持他
阅读权限70
结帖率: (5/5)
(128.84 KB, 下载次数: 61)
21:59 上传
点击文件名下载附件
输出以下就好了啊,都是文字格式&&编码&&数据类型的问题!
您可以选择打赏方式支持他
阅读权限160
签到天数: 2 天结帖率: (4/4)
编码_utf8到xxx&&可以对utf8编码进行解码哇。。你用到文本的话就会显示乱码了。。
您可以选择打赏方式支持他
阅读权限70
签到天数: 3 天结帖率: (9/11)
易语言支持的就是GBK,ansi和GBK差不多,UTF8和Unicode 差不多
这些,是一些编码类型,有的DLL,需要传入 ...
要的就是这样的解释
您可以选择打赏方式支持他
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
揭阳精易科技有限公司申明:我公司所有的培训课程版权归精易所有,任何人以任何方式翻录、盗版、破解本站培训课程,我们必将通过法律途径解决!
公司简介:揭阳市揭东区精易科技有限公司致力于易语言教学培训/易语言学习交流社区的建设与软件开发,多年来为中小企业编写过许许多多各式软件,并把多年积累的开发经验逐步录制成视频课程供学员学习,让学员全面系统化学习易语言编程,少走弯路,减少对相关技术的研究与摸索时间,从而加快了学习进度!
防范网络诈骗,远离网络犯罪
违法和不良信息举报电话,企业QQ: ,邮箱:@
Powered by
粤公网安备 25c++处理utf8与ansi编码文件
在内存中,wstring每个是16位的,只能存储unicode(就unicode原字符,非其任何一种实现方式,即非utf-8,也非utf-16)编码的字符串(即前面加L).1.采用ifstream,并用MultiByteToWideChar解码Ifstream就是把文件当成字节流,一个一个字节读,并不管文件的是utf-8还是ansi编码。所读的文件的是什么编码就按照其编码顺序逐个byte读入。&&&&&& ifstream iFile(htmlTempFile);&&&& size_t readedB&&& do{&&&&&&& iFile.read(buf,BUF_SIZE);&&&&&&& readedBytes=iFile.gcount();&&&&&&& html.append(buf,readedBytes);&&& }while(readedBytes==BUF_SIZE);&&& iFile.close();&html中存储的便是读入文件二进制码原封不动的拷贝。&所以,读入utf-8文件用ifstream便可以,先存入string,再用MultiByteToWideChar进行转码(codepage为CP_UTF8)成unicode,存入wchar_t *(即PWSTR)就可以了。假设读入到html的文件的编码是utf-8的:&int nLenOfWcharStr=MultiByteToWideChar(CP_UTF8,0, html.c_str(),-1,NULL,0); //得到转换成unicode需要的character(不是byte)数目。PWSTR pWideCharStr=(PWSTR)malloc(nLenOfWcharStr*sizeof(wchar_t));if(pWideCharStr!=NULL)MultiByteToWideChar(CP_UTF8,0, html.c_str(),-1,pWideCharStr,nLenOfWcharStr);&若读入html的文件是ANSI(即本地编码,与设置的locale有关)编码的,则用CP_ACP(CodePage ANSI Code Page)代码页。&int nLenOfWcharStr=MultiByteToWideChar(CP_ACP,0, html.c_str(),-1,NULL,0); //得到转换成unicode需要的character(不是byte)数目。PWSTR pWideCharStr=(PWSTR)malloc(nLenOfWcharStr*sizeof(wchar_t));if(pWideCharStr!=NULL)MultiByteToWideChar(CP_ACP,0, html.c_str(),-1,pWideCharStr,nLenOfWcharStr);//pWideCharStr便指向存储以unicode编码的文件中的字符串2.采用wifstream与wstring,设置相应的locole,读入的时候就自动转换为unicode存储在wstring中(utf-8编码的文件不知用哪个locale,故此方法目前只对ansi编码适用)&wchar_t buf[100];&&wifstream iFile("n:/xx.txt");&&std::locale loc=std::locale("chs"); //采用ansi的中文文件用chs,utf-8编码的文件还未找到用哪个locale&&iFile.imbue(loc);&int readedB&do{
分享这篇日志的人也喜欢
如果你有心事,请过来
努力补时长
热门日志推荐
人人最热标签
北京千橡网景科技发展有限公司:
文网文[号··京公网安备号·甲测资字
文化部监督电子邮箱:wlwh@··
文明办网文明上网举报电话: 举报邮箱:&&&&&&&&&&&&
请输入手机号,完成注册
请输入验证码
密码必须由6-20个字符组成
下载人人客户端
品评校花校草,体验校园广场UTF-8签名(UTF-8 signature)也叫做BOM(Byte order Mark),是UTF编码方案里用于标识编码的标准标记。如果多个文件设置了签名,在二进制流中就会包含多个UTF-8签名,而IE是无法识别多个UTF-8签名的,所以用一个空行来代替,在某些程序处理中还会出现一个类似“诺"的字符。 BOM(Byte Order Mark),是UTF编码方案里用于标识编码的标准标记,在UTF-16里本来是FF FE,变成UTF-8就成了EF BB BF(239 187 191)。这个标记是可选的,因为UTF-8字节没有顺序,所以它可以被用来检测一个字节流是否是UTF-8编码的。微软做这种检测,但有些软件不做这种检测,而把它当作正常字符处理。 微软在自己的UTF-8格式的文本文件之前加上了EF BB BF三个字节, windows上面的notepad等程序就是根据这三个字节来确定一个文本文件是ASCII的还是UTF-8的, 然而这个只是微软暗自作的标记, 其它平台上并没有对UTF-8文本文件做个这样的标记。 区分UTF-8文件是否含有BOM方法:1,用UltraEdit-32打开文件,切换到十六进制编辑模式,察看文件头部是否有EF BB BF;2,用Dreamweaver打开,察看页面属性,看“包括Unicode签名BOM"前面是否有个勾;3,用Windows的记事本打开,选择 “另存为",看文件的默认编码是UTF-8还是ANSI,如果是ANSI则不带BOM。 去掉文件中UTF-8格式BOM方法:使用UlterEdit打开, 切换到十六进制编辑模式,把最前面三个字节(就是那该死的 EF BB BF)替换为20(空格ASCII码值),保存(注意关闭保存时自动备份的功能),再切换到默认编辑模式,把最前面的三个空格去掉就可以了。 注意:1. 如果模板采用包含的方法包含多个UTF-8文件时,则模板需要选择UTF-8无BOM格式保存格式;2. 用mb_convert_encoding / iconv 把gb2312文件转换成UTF-8文件时,默认设置是不带BOM的。不带BOM可能出现上述乱码问题,但是带 BOM,对于PHP的include文件要小心,会在PHP字节流前面多出EF BB BF,提前输出到显示器有可能会带来程序错误。一个解决方案是凡是被include的文件都保存为ANSI,主文件可以是UTF-8。3. 如果中文页面在html head标记中将title标记放在&meta http-equiv="content-type" content="text/ charset=UTF-8″ /&前面会导致页面空白。所以UTF-8页面应该使用标准顺序为:&&& &meta http-equiv="content-type" content="text/ charset=UTF-8" /&&&& &meta http-equiv="content-language" content="zh-CN" /&&&& &meta content="index,follow" /&&&& &meta content="" /&&&& &meta content="" /&&&& &meta content="general" /&&&& &meta content="" /&&&& &meta content="" /&&&& &meta content="" /&&&& &title&&/title& 编码小知识:所谓的unicode保存的文件实际上是UTF-16,只不过恰好跟unicode的码相同而已,但在概念上unicode与UTF是两回事,unicode是内存编码表示方案,而UTF是如何保存和传输unicode的方案。UTF-16还分高位在前 (LE)和高位在后(BE)两种。官方的UTF编码还有UTF-32,也分LE和BE。非unicode官方的UTF编码还有UTF-7,主要用于邮件传输。UTF-8的单字节部分是和iso-8859-1兼容的,这主要是一些旧的系统和库函数不能正确处理UTF-16而被迫出来的,而且对英语字符来说,也节省保存的文件空间(以非英语字符浪费空间为代价)。在iso-8859-1的时候,UTF-8和iso-8859-1都是用一个字节表示的,当表示其它字符的时候,UTF-8会使用两个或三个字节。
阅读(...) 评论()2007年6月 总版技术专家分月排行榜第三
2007年6月 VC/MFC大版内专家分月排行榜第一
2008年2月 VB大版内专家分月排行榜第一2003年4月 VC/MFC大版内专家分月排行榜第一2002年11月 VC/MFC大版内专家分月排行榜第一
2011年11月 VC/MFC大版内专家分月排行榜第二2008年3月 VB大版内专家分月排行榜第二2008年3月 硬件/嵌入开发大版内专家分月排行榜第二2003年4月 其他开发语言大版内专家分月排行榜第二2003年4月 VB大版内专家分月排行榜第二2003年3月 VB大版内专家分月排行榜第二
2012年10月 其他开发语言大版内专家分月排行榜第二2011年7月 其他开发语言大版内专家分月排行榜第二2010年3月 其他开发语言大版内专家分月排行榜第二2007年10月 其他开发语言大版内专家分月排行榜第二2007年9月 其他开发语言大版内专家分月排行榜第二2005年3月 Windows专区大版内专家分月排行榜第二2005年2月 Windows专区大版内专家分月排行榜第二2005年6月 扩充话题大版内专家分月排行榜第二2006年9月 其他开发语言大版内专家分月排行榜第二2006年5月 其他开发语言大版内专家分月排行榜第二2006年3月 其他开发语言大版内专家分月排行榜第二2006年2月 其他开发语言大版内专家分月排行榜第二2005年12月 其他开发语言大版内专家分月排行榜第二2005年4月 其他开发语言大版内专家分月排行榜第二2004年11月 其他开发语言大版内专家分月排行榜第二2005年3月 硬件使用大版内专家分月排行榜第二
2011年11月 其他开发语言大版内专家分月排行榜第三2011年8月 其他开发语言大版内专家分月排行榜第三2008年10月 其他开发语言大版内专家分月排行榜第三2004年9月 硬件/嵌入开发大版内专家分月排行榜第三
本帖子已过去太久远了,不再提供回复功能。}

我要回帖

更多关于 asp 文件编码 utf 8 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信