明经CAD社区

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 3761|回复: 11

炸碎文字还原挑战

[复制链接]
发表于 2016-6-12 09:04:35 | 显示全部楼层 |阅读模式
pdf文件转换为cad后所有文字被炸碎了,现在需要将52个字母和20个数字做还原,其他任何文字不用处理

希望感兴趣的人士来挑战,挑战有奖

发表于 2020-9-23 10:40:39 | 显示全部楼层
sgwsssxm 发表于 2020-9-22 23:23
和上午那个识别碎文字的有关吗?类似这样的?

刚看到这个挑战,这个程序是怎么做到的呢?
发表于 2020-9-22 22:09:23 | 显示全部楼层
这个可以换个思路,把需要变成文字的图形截图,然后用专业的ocr去识别。没必要自己用lisp去做,lisp效率太低
发表于 2020-9-22 23:23:35 | 显示全部楼层
和上午那个识别碎文字的有关吗?类似这样的?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
发表于 2016-6-12 09:25:37 | 显示全部楼层
即使行,也是要用OCR软件的。哪来的52/20?
发表于 2016-6-12 11:46:09 | 显示全部楼层
支持楼主设题挑战,估计文字识别很难
 楼主| 发表于 2016-6-12 12:39:28 | 显示全部楼层
mikewolf2k 发表于 2016-6-12 09:25
即使行,也是要用OCR软件的。哪来的52/20?

全半角文字
发表于 2016-6-12 15:44:14 | 显示全部楼层
dcl1214 发表于 2016-6-12 12:39
全半角文字

全半角字母数字有什么区别???楼主这要求比OCR软件还高,还要不要考虑字体的区别???看起来一根竖线,是一段竖线还是l还是I还是1?一个圈,是圆还是大O还是小o还是0?别说挑战了,高额悬赏都没人做得出来。那么多做矢量化的专业公司都没弄出来,指望有个人天才能搞出来???
发表于 2016-6-12 22:24:58 | 显示全部楼层
记得坛子里有人搞过
发表于 2016-6-13 21:14:24 | 显示全部楼层
这个思路很好,但是难度很大。
发表于 2016-6-17 09:57:16 | 显示全部楼层
英文的shx,如果有ocr库可供调用的话会容易些,否则很麻烦。
稍微泄一点点,官方正在做这个,期待下一版acad会提供此功能。

中文shx的就短期内不要指望了,难度高出很多。
 楼主| 发表于 2016-6-17 13:50:27 | 显示全部楼层
无法识别全半角也没事,可以在关键地方提示用户确认一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|CAD论坛|CAD教程|CAD下载|联系我们|关于明经|明经通道 ( 粤ICP备05003914号 )  
©2000-2023 明经通道 版权所有 本站代码,在未取得本站及作者授权的情况下,不得用于商业用途

GMT+8, 2025-4-17 22:49 , Processed in 0.228447 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表