SCI文献的全文翻译一直是个技术难题,因为:
(1)PDF是非编辑文档格式,在PDF中没有段落的概念,也没有语句的概念,所有文字、图片、表格一切都是打印对象(Object);所以在源文档转成PDF的时候,段落和语句已经消失了,甚至于一个单词都被拆成两个对象。然而翻译引擎需要按段落或者按语句才能准确翻译;如果按打印对象进行翻译,必然是支零破碎、不知所云。因此,我们需要从PDF中“还原段落”,这个逆向运算是很复杂的。
(2)SCI文献一般都是双栏排版,甚至三栏排版,而且文字和图片、表格交织,这也给段落还原算法带来了更大挑战。
下面看两篇论文的示例:
1
肺癌大剂量放疗
原文:前言部分
某歌文档翻译:内容不连贯
深容SCITranslate全文翻译,内容和排版都更好
原文:方法部分,请注意断裂的单词(腺癌、断层放疗、可检测的)
某歌翻译:译文难懂,三个断裂单词译错两个
深容SCITranslate:译文准确,断裂单词也完全正确
原文:讨论部分
某歌翻译:译文难懂,格式也不美观
深容SCITranslate:内容准确,排版整洁
2
COVID-19突变
原文:前言部分
某歌翻译:内容不连贯,难以理解
深容SCITranslate:译文接近人工翻译
原文:方法部分,请注意断裂词(系统,文库富集)
某歌翻译:内容不可读,两个断裂词翻译都不准确
深容SCITranslate:译文很地道,断裂单词翻译正确
原文:方法部分
某歌翻译,跨页啦
深容SCITranslate:翻译准确
原文:讨论部分
某歌翻译:译文不流畅,格式很乱
深容SCITranslate:译文准确,格式整洁
通过两种全文翻译的比较很容易发现,深容SCITranslate 20.0 版已经较好的解决了全文翻译的难题,这对于文献泛读非常有用。同时我们必须声明:这项技术只是在某歌工作基础上的一点点改进,我们是站在某歌巨人肩膀上,感谢某歌强大的翻译引擎。
SCItranslate20 软件下载地址:
(请用Windows电脑下载使用)
http://www.mdtserver.com/s20.htm
老用户不需要下载,请进入原软件目录,运行一下更新程序,快速升级!
如果杀毒软件误杀怎么办?
由于自动升级功能涉及exe文件的下载,部分杀毒软件误报病毒,深容担保绝对没有病毒或木马。解决方法如下:先建一个专用文件夹,在Windows安全中心,把这个文件夹设为排除项,然后把压缩包下载到该文件夹,解压即可。其它杀毒软件请自己搜索一下如何设置安全目录。
联系客服