Multi-stream Support for Virtual Machine Executor

Date: 12/16/2021 3:40 pm
Track:

Lightning Talks

Organization: University of Toronto
Speakers: Yaoyao Ding
Download Slides

Besides intra-operator parallelism, another important optimization is to utlize the inter-operator parallelism within in multi-branch models (e.g., inception v3). One way to support inter-operator parallelism for DNN execution on CUDA platform is to utilize the CUDA stream. This talk introduce our support for multi-stream execution in the virtual machine of meta project.

Event Details

Multi-stream Support for Virtual Machine Executor

Register for TVMCon 2021