炸碎文字还原挑战
pdf文件转换为cad后所有文字被炸碎了,现在需要将52个字母和20个数字做还原,其他任何文字不用处理希望感兴趣的人士来挑战,挑战有奖
sgwsssxm 发表于 2020-9-22 23:23
和上午那个识别碎文字的有关吗?类似这样的?
刚看到这个挑战,这个程序是怎么做到的呢? 这个可以换个思路,把需要变成文字的图形截图,然后用专业的ocr去识别。没必要自己用lisp去做,lisp效率太低 和上午那个识别碎文字的有关吗?类似这样的?
即使行,也是要用OCR软件的。哪来的52/20? 支持楼主设题挑战,估计文字识别很难 mikewolf2k 发表于 2016-6-12 09:25 static/image/common/back.gif
即使行,也是要用OCR软件的。哪来的52/20?
全半角文字 dcl1214 发表于 2016-6-12 12:39 static/image/common/back.gif
全半角文字
全半角字母数字有什么区别???楼主这要求比OCR软件还高,还要不要考虑字体的区别???看起来一根竖线,是一段竖线还是l还是I还是1?一个圈,是圆还是大O还是小o还是0?别说挑战了,高额悬赏都没人做得出来。那么多做矢量化的专业公司都没弄出来,指望有个人天才能搞出来??? 记得坛子里有人搞过 这个思路很好,但是难度很大。 英文的shx,如果有ocr库可供调用的话会容易些,否则很麻烦。
稍微泄一点点,官方正在做这个,期待下一版acad会提供此功能。
中文shx的就短期内不要指望了,难度高出很多。 无法识别全半角也没事,可以在关键地方提示用户确认一下
页:
[1]
2