机器学习算法
一个关于糖尿病患者的数据集 diabets.csv 一个Kaggle中Titanic数据集 train.csv,test.csv
根据糖尿病的数据集获取训练集和测试集
实现了预剪枝和后剪枝
SVM
Logistic
使用决策树基学习器
实现了k近邻算法
dataProcess.py
用于处理数据集的函数
包括:归一化,one-hot化,抽取特征边界
loadDatas.py
用于加载数据
包含加载糖尿病数据集和Titanic数据的函数
optim.py
各种优化函数
包括:各种loss函数
各种激活函数
各种梯度下降的优化方法
normalization
dropout
Model.py
包含各种模型
有:决策树模型
线性模型
ModelTest.ipynb
对模型的测试