首先要保证你的PDF文件要特别清楚,如果有褶皱,或者字体不清楚,识别率就不高,不过这种转化有乱码是正常的!!
我用的也是这样,识别率大概90%以上,不可能100%。错误是不可避免的。我那个pdf还全部是文字的
楼上说的对,只能采用OCR进行识别。鉴于识别率问题,随后再校核。
扫描后的文件为图片格式,不能直接转为word,要用OCR识别软件来识别,有的软件识别率高,有的低。
首先要保证你的PDF文件要特别清楚,如果有褶皱,或者字体不清楚,识别率就不高,不过这种转化有乱码是正常的,必须进行修订。。
用CNKI的阅读器吧,识别率还可以