结构化数据
结构化数据
以《淋巴癌的生存率预测》数据为例,进行结构化数据的介绍。其数据的典型特点为:
1.结构化数据的处理方法。
1)如何快速读取结构化数据。
2)使用pandas对数据快速进行统计学分析。
3)传统机器学习算法对问题进行建模。
2.基于scikit-learn中的算法,例如LR、SVM、RF、GBDT等常见的监督算法。
1)基于XGBoost的建模方法。tree_method、max_depth等重要参数的介绍。
2)基于LightGBM的建模方法。eta、objective等重要参数介绍。
3.案例上手练习:基于DNN的深度学习建模方法。
1)DNN模型在Tensorflow如何搭建。tensorflow中的一些主要API的参数以及用法介绍。
2)Tensorflow训练DNN的基本流程。model、train、loss function等相关技术的串联。
3)如何对模型进行部署测试。对于训练好的模型,使用测试集对模型的性能进行测试。
上一篇:聊天机器人和人工智能将影响呼叫中心行业吗?
下一篇:涉及自然语言的数据