明经CAD社区

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
楼主: tryhi

[函数] 字符串UTF-8编码互转

  [复制链接]
发表于 2024-7-6 20:17:00 | 显示全部楼层
希望你写个LISP程序例子,就是,支持,简体,繁体,英文,还有其他编码的。一直疑惑,uif-8编码是不是支持不同地区呢?如果是,那么,简体写的lisp,如何都转换为 UTF-8?
 楼主| 发表于 2024-7-7 00:20:13 | 显示全部楼层
本帖最后由 tryhi 于 2024-7-7 00:24 编辑
尘缘一生 发表于 2024-7-6 20:17
希望你写个LISP程序例子,就是,支持,简体,繁体,英文,还有其他编码的。一直疑惑,uif-8编码是不是支持 ...

简繁跟UTF-8没有一点关系,所以你这个问题问得很奇怪,例子不是写得很清楚吗?
发表于 2024-7-7 06:24:43 | 显示全部楼层
dcl1214 发表于 2024-7-6 15:57
非常不错,我之前研究sqlite的exe的时候,lisp调用官方的exe,返回来的是UTF-8字串,我一直没搞定,看了你 ...

怎么调用呢
发表于 2024-7-9 16:46:05 | 显示全部楼层
海大师,有什么办法能转GKB吗?

点评

同样的办法就可以,charset参数可以用unicode;utf-8;ascii;gb2312;big5;gbk  发表于 2024-7-9 17:45
发表于 2024-7-9 17:11:14 | 显示全部楼层
尘缘一生 发表于 2024-7-6 20:17
希望你写个LISP程序例子,就是,支持,简体,繁体,英文,还有其他编码的。一直疑惑,uif-8编码是不是支持 ...

你要知道utf8无敌就行了,繁体地区big5码也需要转为utf8让全球看到,大陆地区简体GB2312或者GB18030也转为utf8,文件也小巧了.
但是注意GB18030编码范围其实大过utf8的
 楼主| 发表于 2024-7-9 17:43:07 | 显示全部楼层
flowerson 发表于 2024-7-9 16:46
海大师,有什么办法能转GKB吗?

同样的办法就可以,charset参数可以用unicode;utf-8;ascii;gb2312;big5;gbk
发表于 2024-7-9 19:06:12 | 显示全部楼层
tryhi 发表于 2024-7-9 17:43
同样的办法就可以,charset参数可以用unicode;utf-8;ascii;gb2312;big5;gbk

(defun try-str2gbk (str / file_list fileget stream)
  (if (setq stream (vlax-create-object "Adodb.Stream"))
    (progn
      (vlax-put-property stream 'Type 2) ; 1二进制读取 2文本模式读取
      (vlax-put-property stream 'Mode 3) ; 1-读,2-写,3-读写
      (vlax-put-property stream 'Charset "GBK") ; 设置编码为GBK
      (vlax-invoke stream 'Open)
      (vlax-invoke stream 'WriteText str)
      (vlax-put-property stream 'Position 0) ; 将位置重置为起始位置
      (vlax-put-property stream 'Type 1) ; 1二进制读取 2文本模式读取
      (setq FileGet(Vlax-Invoke-Method stream 'Read nil))
      (setq File_list (vlax-safearray->list (vlax-variant-value FileGet)))
      (vlax-release-object stream)
      (cdddr File_list);去除BOM
    )
    (princ"\n无法创建'Adodb.Stream'对象")
  )
)

测试:(try-str2gbk "编码") ;-->(235) 不对的,知道哪里没有改对呢?

点评

GBK没有BOM这3个字节,(cdddr File_list);去除BOM,这句改成File_list  发表于 2024-7-9 21:21
 楼主| 发表于 2024-7-9 20:58:52 | 显示全部楼层
flowerson 发表于 2024-7-9 19:06
(defun try-str2gbk (str / file_list fileget stream)
  (if (setq stream (vlax-create-object "Adodb ...

GBK没有BOM这3个字节
发表于 2024-7-10 11:01:32 | 显示全部楼层
本帖最后由 flowerson 于 2024-7-10 11:02 编辑
tryhi 发表于 2024-7-9 20:58
GBK没有BOM这3个字节

感谢,海大师。我一行行试,能理解你说的了。“GBK没有BOM这3个字节” 但是这些知识是怎样积累到的呢?
 楼主| 发表于 2024-7-11 09:49:18 | 显示全部楼层
本帖最后由 tryhi 于 2024-7-11 09:51 编辑
flowerson 发表于 2024-7-10 11:01
感谢,海大师。我一行行试,能理解你说的了。“GBK没有BOM这3个字节” 但是这些知识是怎样积累到的 ...

其实是因为我在写UTF-8的时候发现总是多出来3个字节,那么百度UTF-8后发现那叫BOM,那去掉3个字节就解决,那其他编码不存在这个问题,就不需要去了

那么你在改GBK的时候同样道理,你直接套用我的函数就会发现总是少了3个字节,代码总共才十来行,那大概看一下就会发现最后一句cdddr,你删了去掉不就解决了,这是逻辑思考问题,不是知识积累
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|CAD论坛|CAD教程|CAD下载|联系我们|关于明经|明经通道 ( 粤ICP备05003914号 )  
©2000-2023 明经通道 版权所有 本站代码,在未取得本站及作者授权的情况下,不得用于商业用途

GMT+8, 2024-9-17 04:33 , Processed in 0.186381 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表