Python分割训练集和测试集的方法示例
数据集介绍
使用数据集Wine,来自UCI 。包括178条样本,13个特征。
importpandasaspd importnumpyasnp df_wine=pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data',header=None) df_wine.columns=['Classlabel','Alcohol', 'Malicacid','Ash', 'Alcalinityofash','Magnesium', 'Totalphenols','Flavanoids', 'Nonflavanoidphenols', 'Proanthocyanins', 'Colorintensity','Hue', 'OD280/OD315ofdilutedwines', 'Proline']
分割训练集和测试集
随机分割
分为训练集和测试集
方法:使用scikit-learn中model_selection子模块的train_test_split函数
fromsklearn.model_selectionimporttrain_test_split X,y=df_wine.ix[:,1:].values,df_wine.ix[:,0].values X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.25,random_state=0)#随机选择25%作为测试集,剩余作为训练集
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。