Big Scale Analytics 2021 Tesla:特斯拉集团(Tesla Group)的课程项目2021年大规模分析 源码
大型分析2021-特斯拉 文本分析:预测法语句子的CEFR水平 特斯拉集团的课程项目“ 2021年大规模分析”的存储库(洛桑大学) 该项目旨在基于机器学习技术预测外语(此处为法语)的句子的CEFR水平。 想法(项目描述) :scroll: 为了提高人们使用新外语的技能,阅读该外语文本非常重要。 这些文本必须是读者的语言级别。 但是,很难找到与某人的知识水平(A1至C2)接近的文本。 这个想法是为英语使用者建立一个模型,该模型可以预测法语文字的难度。 然后可以在例如推荐系统中使用它来推荐适合某人的语言水平的文本(例如,最新新闻)。 如果某人的法语水平为A1,则不能以B2的水平显示文本,因为她无法理解。 理想情况下,文本应具有许多已知的单词,并可能包含一些未知的单词,以便该人可以提高自己的水平。 里程碑和目标 :bullseye: 该项目分为三个主要里程碑: 思考如何对问题进行建模并收集数据(法语文本,句子,新闻文
下载地址
用户评论