重磅更新!猩际 RL 算法 V2.0

2020 年 11 月 24 日APEUni
BREAKING NEWS 重磅更新!猩际 RL 算法 V2.0

猩际 RL 算法 V2.0 更新了什么?

更多发音特征

在新版 RL 算法中,我们共采集了 5400 多个考生答案音频作为样本进行深度分析。耗时 3 个月,最终提取出 207 种不同的发音特征嵌入到新算法中,在 207 种发音特征的基础上建立起更可靠的评测模型,因此新算法下的评分也更加接近培生官方评分!


答案特征识别准确率提升 70%

我们的工程师仔细分析了 207 种不同的发音特征,在发音准确度、平调、蹦词、重弱读、流利度 5 个方面精益求精,仔细打磨,解决了旧版评分算法分数可能会出现特别高或特别低的极端问题,所以新版本下的评分算法会更准确。部分同学可能会觉得新算法下的 RL 分数和旧版 RL 分数有比较大的差别,但新版 RL 算法会更接近真实考试分数。


评分更加精准,误差 ±10 以内

我们更新算法的目标在于无限接近培生官方的评分,所以与 RA V2.0 算法一样,猩际 v2.0 算法与培生官方评分误差在 ±10 内,因此更具有参考价值。假设同学追求考试中 79 分,在猩际 v2.0 算法下,应该追求大部分 RL 题目的分数在 70 分以上。


怎样升级到 V2.0 算法?

目前猩际 App 和 Web 的 RL 的评分系统已全面自动升级为 v2.0。因为 v2.0 算法是专门针对华人学生的答案进行的调优,所以只有在 APP 和 Web 的中文环境下才会是新算法。如果将语言调整成英文,RL 评分算法仍然为 v1.0。 (大家可以在 RL 的内容评分建议中看到版本号。)

apeuni pte

V2.0 算法下的练习目标

因为题与题的难度不一样,所以评分的严苛程度也会不一样。大家不用过多纠结某一个题目的分数,PTE 口语考试也不是只通过某一道题型来确定得分的。对于大部分答案来说,当前的评分分数会是考试分数的 ±10 左右。所以追求 79 分的话,分数在 70 - 85 分的样子就差不多了。

目标成绩与练习成绩对照表

目标分数 练习时应争取达到分数
79分 70-85分
65分 60-70分
50分 50-60分


V2.0 算法评测

我们来给猩际 RL V2.0新算法做一个简单评测。我们让几位同学进行了尝试同一道 RL 题目,直接录同样的答案内容,最后让猩际教研老师 Steven 也来尝试下。我们来看下分数上的变化。


#249 RL

apeuni pte

参考答案:

The speaker mainly talks about the formation of clouds.
This lecture provides a lot of useful information.
According to the speaker, the speaker mentions that sea salt is very effective.
According to the speaker, the speaker mentions that pollution comes from different sources.
According to the speaker, the speaker mentions that the clouds are important for climate change.
According to the speaker, the speaker mentions that they also play a role in regional weather.
According to the speaker, the speaker mentions that shifts affect weather patterns.
In conclusion, this lecture is very informative.



这位同学,单纯追求语速,忽略发音的清晰度,分数不高(总分55)



测评音频:


查看评分详情 >
apeuni pte

这位同学发音、连贯性良好,不过还是有多处迟疑的地方(总分54分)



测评音频:


查看评分详情 >
apeuni pte

这位同学蹦单词、连贯性低、发音错误和迟疑卡顿比较多(总分32)



测评音频:


查看评分详情 >
apeuni pte

这位同学的发音、流利度各方面都做的很好(总分88)



测评音频:


查看评分详情 >
apeuni pte

最后是猩际教研老师 Steven 的录音 (总分:90)



测评音频:


查看评分详情 >
apeuni pte

评测结论

猩际 RL 新算法版本 2.0 比较之前的算法,对发音准确度的判断更加灵敏,对平调、蹦词、重弱读、流利度等问题的评审也更加严格。但不同题目的难易程度不一样,所以评分的严苛程度也不一样,总体而言,大家看到的分数会是考试真实分数的 ±10 的水平。比如追求考试 79+ 的同学,猩际 RL V2.0 的评分尽量追求在 70 以上。