7.4 视频理解中的场景识别