1. 环境配置
1.1 训练环境和onnx(电脑端执行)
#使用conda创建一个python环境
conda create -n torch python=3.9
#激活环境
conda activate torch
#安装yolov8
pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple
#onnx安装
pip i[......]
1. 环境配置
1.1 训练环境和onnx(电脑端执行)
#使用conda创建一个python环境
conda create -n torch python=3.9
#激活环境
conda activate torch
#安装yolov8
pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple
#onnx安装
pip i[......]
原文转载自《rk3588对npu的再探索,yolov5使用rknn模型推理教程》
🍉零、引言
本文完成于2022-07-02 22:22:27。 博主刚开始在瑞芯微ITX-3588J-8K的开发板上跑了官方的yolov5目标检测算法,检测了ip相机rtsp视频流,但是每帧处理需要833ms左右,和放PPT一样。本来想使用tensorrt进行加速推理,但前提需要cuda,rk的板子上都是arm的手机gpu,没有nvidia的cuda,所以不能这样适配。那么转过来,使用开发板自带的NPU进行加速[......]
转载自:《rk3588使用npu进行模型转换和推理,加速AI应用落地》
🍉零、引言
博主在瑞芯微RK3588的开发板上跑了deepsort跟踪算法,从IP相机中的server拉取rtsp视频流,但是fps只有1.2,和放PPT一样卡顿,无法投入实际应用。本来想使用tensorrt进行加速推理,但是前提需要cuda,rk的板子上都是Arm的手机gpu,没有Nvidia的cuda,所以这条路行不通。那么转过来,使用开发板自带的NPU进行加速推理,岂不是更加可行,而且它本身就是深度学习嵌入式板子,[......]
在YoloV5-Lite目标检测之“安装推理”中,我们完成了安装和预训练权重的推理,下面介绍自定义训练数据、模型转换(ncnn)
1 训练数据准备
.
├── train
│ ├── 000000000049.jpg
│ ├── 000000000049.txt
......
│ ├── 000000581880.txt
│ ├── 000000581900.jpg
│ └── 000000581900.txt
└── val
├── 00000[......]