原文:“目标检测” “视觉理解”实现对输入图像的理解及翻译(附源代码)