PyTorch二分类详解

一、基本概念

PyTorch是一个使用动态计算图的开源机器学习库，而二分类问题是机器学习中最基本、最常见的问题。在PyTorch中，二分类问题最常用的算法是逻辑回归(Logistic Regression)。

二、数据准备

在二分类问题中，我们通常需要准备好两个类别的数据，同时将数据集分为训练集和测试集。具体实现方式如下：

import torch
from torch.utils.data import Dataset, DataLoader

# 定义数据集
class MyDataset(Dataset):
    def __init__(self, data, labels):
        self.data = data.float()
        self.labels = labels
    
    def __len__(self):
        return len(self.data)
    
    def __getitem__(self, index):
        x = self.data[index]
        y = self.labels[index]
        return x, y

# 准备数据
train_data = torch.tensor([[0.12, 0.23], [0.03, 0.45], [0.67, 0.39], [0.13, 0.52], [0.55, 0.69]])
train_labels = torch.tensor([0, 1, 1, 0, 1])
train_dataset = MyDataset(train_data, train_labels)

test_data = torch.tensor([[0.19, 0.66], [0.44, 0.83], [0.87, 0.29], [0.76, 0.09]])
test_labels = torch.tensor([1, 0, 1, 0])
test_dataset = MyDataset(test_data, test_labels)

# 加载数据
train_loader = DataLoader(train_dataset, batch_size=2, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=2, shuffle=False)

三、模型构建

逻辑回归模型可以通过定义一个类来实现。在类中，需要定义模型的结构以及前向传播的过程。在二分类问题中，通常使用sigmoid函数作为输出层的激活函数。

import torch.nn as nn

# 定义模型
class LogisticRegression(nn.Module):
    def __init__(self):
        super(LogisticRegression, self).__init__()
        self.linear = nn.Linear(2, 1)
        self.sigmoid = nn.Sigmoid()
    
    def forward(self, x):
        out = self.linear(x)
        out = self.sigmoid(out)
        return out

model = LogisticRegression()

四、损失函数和优化器

在二分类问题中，通常使用二元交叉熵损失函数(Binary Cross Entropy Loss)作为损失函数，使用随机梯度下降(SGD)或Adam优化器。

criterion = nn.BCELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

五、模型训练

在进行模型训练时，通常需要通过多次迭代训练模型，并在每一次迭代后计算模型在验证集上的准确率和损失值。

num_epochs = 100
for epoch in range(num_epochs):
    for i, (inputs, labels) in enumerate(train_loader):
        # 前向传播
        outputs = model(inputs)
        loss = criterion(outputs, labels.float().view(-1, 1))
        
        # 后向传播及优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        # 每100次迭代输出一次信息
        if (i + 1) % 100 == 0:
            print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, i+1, len(train_loader), loss.item()))

    # 计算在训练集和验证集上的准确率及损失值
    with torch.no_grad():
        train_correct = 0
        train_total = 0
        train_loss = 0.0
        for inputs, labels in train_loader:
            outputs = model(inputs)
            predicted = (outputs >= 0.5).float()
            train_correct += (predicted == labels.float().view(-1, 1)).sum().item()
            train_total += len(labels)
            train_loss += criterion(outputs, labels.float().view(-1, 1)).item() * len(labels)

        test_correct = 0
        test_total = 0
        test_loss = 0.0
        for inputs, labels in test_loader:
            outputs = model(inputs)
            predicted = (outputs >= 0.5).float()
            test_correct += (predicted == labels.float().view(-1, 1)).sum().item()
            test_total += len(labels)
            test_loss += criterion(outputs, labels.float().view(-1, 1)).item() * len(labels)

        train_acc = train_correct / train_total
        train_loss /= train_total
        test_acc = test_correct / test_total
        test_loss /= test_total

        print('Epoch [{}/{}], Train Loss: {:.4f}, Train Acc: {:.2f}%, Test Loss: {:.4f}, Test Acc: {:.2f}%'.format(epoch+1, num_epochs, train_loss, train_acc*100, test_loss, test_acc*100))

六、模型评估

在模型训练完成后，可以使用测试集来评估模型的性能。

with torch.no_grad():
    correct = 0
    total = 0
    for inputs, labels in test_loader:
        outputs = model(inputs)
        predicted = (outputs >= 0.5).float()
        correct += (predicted == labels.float().view(-1, 1)).sum().item()
        total += len(labels)
    accuracy = correct / total
    print('Test Accuracy: {:.2f}%'.format(accuracy*100))

七、总结

通过本文，我们详细介绍了使用PyTorch进行二分类的基本流程，包括数据准备、模型构建、损失函数和优化器的设置、模型训练和模型评估。在实践中，我们可以通过修改模型结构、损失函数和优化器的设置来进一步提高模型性能。

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

PyTorch二分类详解

一、基本概念

二、数据准备

三、模型构建

四、损失函数和优化器

五、模型训练

六、模型评估

七、总结

PyTorch二分类详解

java方法整理笔记（java总结）

印象笔记记录java学习（Java成长笔记）

发篇java复习笔记（java课程笔记）

python的用法笔记本（笔记本学python）

python笔记二（2python）

java学习笔记（java初学笔记）

java客户端学习笔记（java开发笔记）

python基础学习整理笔记,Python课堂笔记

java笔记,尚硅谷java笔记

java笔记,大学java笔记

java包笔记,Java语言包

重学java笔记,java笔记总结

java基础知识学习笔记一,Java基础笔记

python常用函数学习笔记（python中常用的函数）

Torchdtype: PyTorch中的数据类型详解

python学习之笔记（python的笔记）

我的python笔记06（Python）

数据库的笔记mysql,数据库管理系统笔记

为知笔记私有化部署

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

PyTorch二分类详解

一、基本概念

二、数据准备

三、模型构建

四、损失函数和优化器

五、模型训练

六、模型评估

七、总结

PyTorch二分类详解

java方法整理笔记（java总结）

印象笔记记录java学习（Java成长笔记）

发篇java复习笔记（java课程笔记）

python的用法笔记本（笔记本学python）

python笔记二（2python）

java学习笔记（java初学笔记）

java客户端学习笔记（java开发笔记）

python基础学习整理笔记,Python课堂笔记

java笔记,尚硅谷java笔记

java笔记,大学java笔记

java包笔记,Java语言包

重学java笔记,java笔记总结

java基础知识学习笔记一,Java基础笔记

python常用函数学习笔记（python中常用的函数）

Torchdtype: PyTorch中的数据类型详解

python学习之笔记（python的笔记）

我的python笔记06（Python）

数据库的笔记mysql,数据库管理系统笔记

为知笔记私有化部署

人机检测，请谅解