- 采用装饰器catch_error来对数据库操作函数进行装饰
- 采用javascript不定长参数对函数统一封装
- 梳理flask目录结构特点
- ajax异步请求更新进度条
对字段进行编码之后大概有9000+差,4000+中,1200+良,675个优,可以看出数据分布是非常不平均的,在这种情况下生成的规则是极其不均匀的,只能得到课程差评之间的规则,如下图所示
解决方案
- 采用抽样的方式来生成规则,考虑到apriori算法的特殊性,它是无监督学习,因此不能简单使用上采样或下采样的方式进行优化。比较可行的方案是对于不同的成绩等级(优良中差)分别生成规则,这样使得每一类在它所包含的数据集中都比较均衡,且能生成不同级别的规则,既能充分利用数据,又解决不平衡问题
- 为了提高计算效率,将课程出现频度小于100的课程过滤掉,减少运算时间,同时有助于生成更加有效的规则