Skip to content

Latest commit

 

History

History
66 lines (51 loc) · 1.38 KB

Problem.md

File metadata and controls

66 lines (51 loc) · 1.38 KB
  • A. 计量学视角

    • a. 建立计量标准及计量单位
    • b. 测量方法
    • c. 误差理论
    • d. 测量检定
    • e. 基本常数测量
    • f. 理论模型
    • g. 计量法制与计量管理
  • B. 数据科学视角

    • a. 任务类型

        1. 聚类分析
        1. 结点分类
        1. 链接预测
        1. 关联分析与推荐系统
        1. 时序模式
        1. 偏差分析与异常检测
    • b. 数据集构建

        1. 数据获取
        • 数据源
        • 数据采集方法
        • 数据存储
          • 物理模型
          • 逻辑模型(数据结构:如图网络)
        1. 特征理解
        • 特征描述
          • 结构性
          • 数据字段的类型
        • 特征定义及格式化
        • 针对特征的统计分析
          • 数值计量
          • 分布
          • 估计参数
          • 数据可视化
        1. 数据清洗
        • 数据筛选
        • 不平衡数据处理及数据采样
        • 数据修正(缺失、错误、不一致)
    • c. 特征工程

        1. 特征编码和特征缩放
        • 缺失值填充
        • 特征编码及模式编码
        • 缩放变换
        1. 特征关联性验证
        1. 增维降维和特征提取
        1. 特征选择及特征转换
    • d. 数据分析

        1. 模型构建
        1. 风险评估策略(经验风险与结构风险)
        1. 算法
  • C. 实证研究视角