https://www.tahr.org.tw/content/1687
现在只有繁体竖排pdf版本,非常不便于阅读和传播。我打算整理成简体网页版,如果谁能直接联系到台湾人权促进会,拿到非pdf版本,就能大大加快工作进度。
当然,如果拿不到的话,只能靠手打了。
https://www.tahr.org.tw/content/1687
现在只有繁体竖排pdf版本,非常不便于阅读和传播。我打算整理成简体网页版,如果谁能直接联系到台湾人权促进会,拿到非pdf版本,就能大大加快工作进度。
当然,如果拿不到的话,只能靠手打了。
https://pdftotext.com/
试试这个
突然搞这个做什么 肺炎的事都没搞完
用 OCR 吧,Google Vision 对竖排文本的效果不错
Google Vision 支持直接识别 PDF
https://cloud.google.com/vision/docs/pdf