1. 安装基础开发环境
在Ubuntu中开展C++机器学习开发前,需先配置核心工具链。打开终端,执行以下命令安装GCC编译器、CMake构建工具及Git版本控制:
sudo apt update
sudo apt install build-essential cmake git
这些工具是编译C++代码、管理项目依赖及版本控制的基础。
2. 选择并安装C++机器学习库
Ubuntu环境下,可选择以下成熟的C++机器学习库(覆盖传统机器学习、深度学习等场景):
sudo apt install libdlib-dev
sudo apt install libmlpack-dev
sudo apt install libshark-dev
sudo apt install libopencv-dev
3. 配置CMake项目
CMake是C++项目的常用构建工具,需创建CMakeLists.txt文件管理项目依赖。以Dlib为例,项目结构如下:
my_ml_project/
├── CMakeLists.txt
└── main.cpp
CMakeLists.txt内容示例:
cmake_minimum_required(VERSION 3.10)
project(MyMLProject)
set(CMAKE_CXX_STANDARD 11) # 或14/17,根据库要求调整
find_package(Dlib REQUIRED) # 查找Dlib库
add_executable(MyMLProject main.cpp) # 添加可执行文件
target_link_libraries(MyMLProject Dlib::Dlib) # 链接Dlib库
若使用Flashlight,需添加find_package(Flashlight REQUIRED)并链接对应库。
4. 编写C++机器学习代码
以Dlib实现的线性回归为例,代码示例如下:
#include <dlib/svm.h>
#include <dlib/data_io.h>
#include <iostream>
using namespace dlib;
int main() {
try {
// 定义线性回归模型(使用线性核)
typedef matrix<double, 2, 1> sample_type;
typedef radial_basis_kernel<sample_type> kernel_type;
svm_c_trainer<kernel_type> trainer;
// 设置模型参数(如C值)
trainer.set_kernel(kernel_type(0.1));
trainer.set_c(10);
// 准备训练数据(示例:二维特征与标签)
std::vector<sample_type> samples;
std::vector<double> labels;
samples.push_back({1.0, 2.0});
samples.push_back({2.0, 3.0});
samples.push_back({3.0, 4.0});
labels.push_back(3.0);
labels.push_back(5.0);
labels.push_back(7.0);
// 训练模型
decision_function<kernel_type> df = trainer.train(samples, labels);
// 预测新样本
sample_type test_sample = {4.0, 5.0};
double prediction = df(test_sample);
std::cout << "Prediction for [4.0, 5.0]: " << prediction << std::endl;
} catch (std::exception& e) {
std::cerr << "Error: " << e.what() << std::endl;
return 1;
}
return 0;
}
该代码实现了简单的线性回归模型训练与预测。
5. 编译与运行项目
在项目目录下,执行以下命令编译代码:
mkdir build && cd build
cmake .. # 生成Makefile
make # 编译代码
编译成功后,运行可执行文件:
./MyMLProject
输出结果示例:Prediction for [4.0, 5.0]: 9.0(具体值取决于训练数据)。
注意事项