重磅更新!猩际 DI 算法 V2.0

September 11, 2020APEUni
BREAKING NEWS 重磅更新!猩际 DI 算法 V2.0

猩际 DI 算法 V2.0 更新了什么?

嵌入 113 种不同发音特征

猩际教研组的老师们和开发部的工程师们为了新算法能更灵敏的评测音频质量,采集了 3700 多个考生答案音频作为样本进行深度分析。耗时 7 个月,最终提取出 113 种不同的发音特征嵌入到新算法中,因此新算法下的评分也更加接近培生官方评分。


监测灵敏度提升 80%

由于嵌入了 113 个不同的发音特征,新算法对发音准确度、平调、蹦词、重弱读、流利度等问题的评审更加灵敏。旧版评分算法下遇到发音不准、平调、蹦词等问题时评分可能偏高,而在新算法中得到优化,评分更加准确。因此部分同学会感觉到新算法下的 DI 评分更加严格,但也是更加接近真实考试的分数。


评分更加精准,误差 ±10 以内

我们更新算法的目标在于无限接近培生官方的评分,所以与 RA V2.0 算法一样,猩际 v2.0 算法与培生官方评分误差在 ±10 内,因此更具有参考价值。假设同学追求考试中 79 分,在猩际 v2.0 算法下,应该追求大部分 DI 题目的分数在 70 分以上。


怎样升级到 V2.0 算法?

目前猩际 App 和 Web 的 DI 的评分系统已全面自动升级为 v2.0。因为 v2.0 算法是专门针对华人学生的答案进行的调优,所以只有在 APP 和 Web 的中文环境下才会是新算法。如果将语言调整成英文,DI 评分算法仍然为 v1.0。 (大家可以在 DI 的内容评分建议中看到版本号。)

apeuni pte

V2.0 算法下的练习目标

因为题与题的难度不一样,所以评分的严苛程度也会不一样。大家不用过多纠结某一个题目的分数,PTE 口语考试也不是只通过某一道题型来确定得分的。对于大部分答案来说,当前的评分分数会是考试分数的 ±10 左右。所以追求 79 分的话,分数在 70 - 85 分的样子就差不多了。

目标成绩与练习成绩对照表

目标分数 练习时应争取达到分数
79分 70-85分
65分 60-70分
50分 50-60分


V2.0 算法评测

我们来给猩际 DI V2.0新算法做一个简单评测。我们让几位同学进行了尝试同一道 DI 题目,直接录同样的答案内容,最后让猩际教研主任 Amy 老师也来尝试下。我们来看下分数上的变化。


#181 DI

apeuni pte

参考答案:

The following graph gives information about internet population. The items include Germany, UK and France. You can see from this graph that the value of US is around 160 millions. You can see from this graph that the value of Japan is around 60 millions, which is lower. You can see from this graph that the value of China is around 180 millions, which is the highest. You can see from this graph that the value of Netherlands is around 10 millions, which is the lowest. In conclusion, this graph is very informative.



这位同学读得很流畅,但发音不标准,最终得分不高(总分49)



测评音频:


查看评分详情 >
apeuni pte

这位同学蹦词严重,最终得分很低(总分43分)



测评音频:


查看评分详情 >
apeuni pte

这位同学有明显的平调情况,重弱不明显(总分43)



测评音频:


查看评分详情 >
apeuni pte

这位同学有重弱读,发音标准, 各方面都很好(总分89)



测评音频:


查看评分详情 >
apeuni pte

最后是猩际教研主任 Amy 老师的录音 (总分: 90)



测评音频:


查看评分详情 >
apeuni pte

评测结论

猩际 DI 新算法版本 2.0 比较之前的算法,对发音准确度的判断更加灵敏,对平调、蹦词、重弱读、流利度等问题的评审也更加严格。但不同题目的难易程度不一样,所以评分的严苛程度也不一样,总体而言,大家看到的分数会是考试真实分数的 ±10 的水平。比如追求考试 79+ 的同学,猩际 DI V2.0 的评分尽量追求在 70 以上。