1.修改火车头的PHP环境 将最前面的分号“;”删除并保存即可,这样火车头数据采集器就可以正常运行这个PHP翻译插件了。 这个插件是基于百度翻译开放平台的,所以必须要先到百度翻译开放平台申请到appID和密钥之后,插件才能正常使用。 申请百度开放平台的帐户很简单,只要填写姓名、Email、手机就可以了,审核也很快。最主要的是百度翻译开放平台审核也很宽泛,基本上只要你填的信息是真实的就会通过。 3.修改代码设置插件 14、15行分别为你采集的语言和需要翻译成什么语言,例如插件默认的是采集的中文,用“zh”表示、需要翻译为英文,用“en”表示,你可以根据你的具体情况修改,所有语言的标识码查看下面的表格。 需要特别说的是翻译方式有两种,一种是不保存采集的内容直接翻译,另一只是保存采集的内容再翻译;插件上默认的“标题”就是不保存采集的内容,软件会直接保存翻译后的内容,“内容”标签就是保存了采集的内容,同时也保存了翻译后的内容。对比一下两行代码前后标签名的区别,应该就能看出规律。 ↑上图可以看到,我采集了标题、关键词、内容三个标签,并且将这三个标签都翻译成了英文。但是翻译后的显示有区别,“标题”这个标签是直接显示了翻译后的英文内容,没有采集的中文,而关键词和内容两个标签都保留了采集的中文原文,同时另外用一个标签来保存了翻译后的英文。设置方法需要修改插件的“BaiduTranslateApi.php”文件,见下图。
代码如下(注意修改引号内的内容为你火车头的实际标签名): $LabelArray['翻译后的标签名'] = translate($query = $LabelArray['采集标签名']);如果你的火车头采集工具能正常采集到内容,但是不显示翻译的内容,那肯定是你的插件设置不对,请仔细阅读插件代码末尾的注释说明,按说明和事例的规则进行设置。如果翻译的内容报错,请看下面的错误代码,根据提示检查。 插件内置了大部分的错误,只要插件设置不正确的话火车头的采集结果就会显示错误内容,基本上设置不正确的话看采集结果就能知道怎么解决,下面是更详细的错误和解决方法。 错误码 | 含义 | 解决方法 | 52000 | 成功 | | 52001 | 请求超时 | 重试,或将插件代码第1行的“30”改大一点试试。 | 52002 | 系统错误 | 重试 | 52003 | 未授权用户 | 检查您的APPID设置是否正确 | 54000 | 必填参数为空 | 检查插件的采集规则,看看是否没有采集到内容 | 54001 | 签名错误 | 请检查您的密钥是否填写正确 | 54003 | 访问频率受限 | 采集的频率太高,过段时间或调整下采集间隔试试 | 54004 | 账户余额不足 | 余额不足,您的免费字符已用完或余额不足 | 54005 | 长query请求频繁 | 3s后再试,或调整采集时间间隔,或调整采集的文章长度试试 | 58000 | 客户端IP非法 | 检查个人资料里填写的IP地址是否正确
可前往管理控制平台修改
IP限制,IP可留空 | 58001 | 译文语言方向不支持 | 译文语言方向错误,请检查您设置的目标语言标识码是否正确。 |
百度翻译API支持28种语言互译,各语言标识码如下: 语言标识码 | 名称 | auto | 自动检测 | zh | 中文 | en | 英语 | yue | 粤语 | wyw | 文言文 | jp | 日语 | kor | 韩语 | fra | 法语 | spa | 西班牙语 | th | 泰语 | ARa | 阿拉伯语 | ru | 俄语 | pt | 葡萄牙语 | de | 德语 | it | 意大利语 | el | 希腊语 | nl | 荷兰语 | pl | 波兰语 | bul | 保加利亚语 | est | 爱沙尼亚语 | dan | 丹麦语 | fin | 芬兰语 | cs | 捷克语 | rom | 罗马尼亚语 | slo | 斯洛文尼亚语 | swe | 瑞典语 | hu | 匈牙利语 | cht | 繁体中文 | vie | 越南语 |
免费版火车头数据采集软件不能使用本插件,因为免费版的火车头采集器禁止了插件功能,其实免费版火车头采集软件也不能用任何插件。 我测试了下,字符的规则为:汉字、英文字母、阿拉伯数字、标点(含中英文)、空格均计算为1个字符,回车计算为4个字符。 下载地址
|