dcl1214 发表于 2016-6-12 09:04:35

炸碎文字还原挑战

pdf文件转换为cad后所有文字被炸碎了,现在需要将52个字母和20个数字做还原,其他任何文字不用处理

希望感兴趣的人士来挑战,挑战有奖

执骨哟 发表于 2020-9-23 10:40:39

sgwsssxm 发表于 2020-9-22 23:23
和上午那个识别碎文字的有关吗?类似这样的?

刚看到这个挑战,这个程序是怎么做到的呢?

baitang36 发表于 2020-9-22 22:09:23

这个可以换个思路,把需要变成文字的图形截图,然后用专业的ocr去识别。没必要自己用lisp去做,lisp效率太低

sgwsssxm 发表于 2020-9-22 23:23:35

和上午那个识别碎文字的有关吗?类似这样的?

mikewolf2k 发表于 2016-6-12 09:25:37

即使行,也是要用OCR软件的。哪来的52/20?

USER2128 发表于 2016-6-12 11:46:09

支持楼主设题挑战,估计文字识别很难

dcl1214 发表于 2016-6-12 12:39:28

mikewolf2k 发表于 2016-6-12 09:25 static/image/common/back.gif
即使行,也是要用OCR软件的。哪来的52/20?

全半角文字

mikewolf2k 发表于 2016-6-12 15:44:14

dcl1214 发表于 2016-6-12 12:39 static/image/common/back.gif
全半角文字

全半角字母数字有什么区别???楼主这要求比OCR软件还高,还要不要考虑字体的区别???看起来一根竖线,是一段竖线还是l还是I还是1?一个圈,是圆还是大O还是小o还是0?别说挑战了,高额悬赏都没人做得出来。那么多做矢量化的专业公司都没弄出来,指望有个人天才能搞出来???

zzyong00 发表于 2016-6-12 22:24:58

记得坛子里有人搞过

flyhorse 发表于 2016-6-13 21:14:24

这个思路很好,但是难度很大。

e2002 发表于 2016-6-17 09:57:16

英文的shx,如果有ocr库可供调用的话会容易些,否则很麻烦。
稍微泄一点点,官方正在做这个,期待下一版acad会提供此功能。

中文shx的就短期内不要指望了,难度高出很多。

dcl1214 发表于 2016-6-17 13:50:27

无法识别全半角也没事,可以在关键地方提示用户确认一下
页: [1] 2
查看完整版本: 炸碎文字还原挑战