Python机器学习入门教程_使用Python构建第一个模型

舞夢輝影 2026-01-07 00:00:00 次阅读

Python因语法简洁、生态成熟（如scikit-learn、pandas、matplotlib）成为机器学习入门首选；推荐Anaconda一键配置环境；用iris数据集完成加载、划分、训练（如DecisionTreeClassifier）、评估全流程；后续可换模型、读CSV数据、可视化与标准化。

Python语法简洁、生态成熟，scikit-learn、pandas、matplotlib等库让数据加载、预处理、建模和评估一气呵成。初学者不用纠结底层实现，能快速看到模型效果，建立信心。

推荐用Anaconda一键安装——它自带Python、Jupyter Notebook和常用科学计算库。

下载并安装Anaconda（选Python 3.9+版本）
打开Anaconda Navigator，启动Jupyter Notebook
新建Notebook，在第一个代码格中运行：
import sklearn, pandas, numpy, matplotlib —— 不报错就说明环境就绪

scikit-learn内置的iris数据集小而经典：150条样本、4个特征（花萼/花瓣长宽）、3类鸢尾花。适合练手全流程。

加载数据：用 from sklearn.datasets import load_iris 获取特征矩阵X和标签y
划分训练/测试集：用 from sklearn.model_selection import train_test_split，按7:3或8:2切分，避免用全部数据训练后“自我表扬”
选模型并训练：从简单开始，比如决策树 from sklearn.tree import DecisionTreeClassifier，调用 fit(X_train, y_train)
评估效果：用 model.score(X_test, y_test) 看准确率，再用 classification_report 查看每类的精确率、召回率