VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > temp > 简明python教程 >
  • 初识人工智能(二):机器学习(三):sklearn数据集

1. sklearn数据集

1.1 数据集划分

机器学习一般的数据集会划分为两个部分:
训练数据:用于训练,构建模型
测试数据:在模型检验时使用,用于评估模型是否有效

sklearn数据集划分API:sklearn.model_selection.train_test_split

1.2 sklearn数据集接口介绍

scikit-learn数据集API介绍:

sklearn.datasets

  • 加载获取流行数据集
  • datasets.load_*()
    •   获取小规模数据集,数据包含在datasets里
  • datasets.fetch_*(data_home=None)
    •   获取大规模数据集,需要从网络上下载,函数的第一个参数是data_home,表示数据集
    •   下载的目录,默认是 ~/scikit_learn_data/

获取数据集返回的类型:

load*和fetch*返回的数据类型datasets.base.Bunch(字典格式)

  • data:特征数据数组,是[n_samples * n_features]的二维numpy.ndarray数组
  • target:标签数组,是n_samples的一维numpy.ndarray数组
  • DESCR:数据描述
  • feature_names:特征名,新闻数据,手写数字、回归数据集没有
  • target_names:标签名,回归数据集没有

1.3 sklearn分类数据集

sklearn.datasets.load_iris():加载并返回鸢尾花数据集。

 sklearn.datasets.load_digits():加载并返回数字数据集。


	
  1. from sklearn.datasets import load_iris
  2.  
  3. li = load_iris()
  4.  
  5. print("获取特征值")
  6. print(li.data)
  7. print("目标值")
  8. print(li.target)
  9. print(li.DESCR)

运行结果:


	
  1. 获取特征值
  2. [[5.1 3.5 1.4 0.2]
  3. [4.9 3. 1.4 0.2]
  4. [4.7 3.2 1.3 0.2]
  5. [4.6 3.1 1.5 0.2]
  6. [5. 3.6 1.4 0.2]
  7. [5.4 3.9 1.7 0.4]
  8. [4.6 3.4 1.4 0.3]
  9. [5. 3.4 1.5 0.2]
  10. [4.4 2.9 1.4 0.2]
  11. [4.9 3.1 1.5 0.1]
  12. [5.4 3.7 1.5 0.2]
  13. [4.8 3.4 1.6 0.2]
  14. [4.8 3. 1.4 0.1]
  15. [4.3 3. 1.1 0.1]
  16. [5.8 4. 1.2 0.2]
  17. [5.7 4.4 1.5 0.4]
  18. [5.4 3.9 1.3 0.4]
  19. [5.1 3.5 1.4 0.3]
  20. [5.7 3.8 1.7 0.3]
  21. [5.1 3.8 1.5 0.3]
  22. [5.4 3.4 1.7 0.2]
  23. [5.1 3.7 1.5 0.4]
  24. [4.6 3.6 1. 0.2]
  25. [5.1 3.3 1.7 0.5]
  26. [4.8 3.4 1.9 0.2]
  27. [5. 3. 1.6 0.2]
  28. [5. 3.4 1.6 0.4]
  29. [5.2 3.5 1.5 0.2]
  30. [5.2 3.4 1.4 0.2]
  31. [4.7 3.2 1.6 0.2]
  32. [4.8 3.1 1.6 0.2]
  33. [5.4 3.4 1.5 0.4]
  34. [5.2 4.1 1.5 0.1]
  35. [5.5 4.2 1.4 0.2]
  36. [4.9 3.1 1.5 0.2]
  37. [5. 3.2 1.2 0.2]
  38. [5.5 3.5 1.3 0.2]
  39. [4.9 3.6 1.4 0.1]
  40. [4.4 3. 1.3 0.2]
  41. [5.1 3.4 1.5 0.2]
  42. [5. 3.5 1.3 0.3]
  43. [4.5 2.3 1.3 0.3]
  44. [4.4 3.2 1.3 0.2]
  45. [5. 3.5 1.6 0.6]
  46. [5.1 3.8 1.9 0.4]
  47. [4.8 3. 1.4 0.3]
  48. [5.1 3.8 1.6 0.2]
  49. [4.6 3.2 1.4 0.2]
  50. [5.3 3.7 1.5

相关教程