Fix bindings for CUDA Provider

2021-01-22 13:45:06 +04:00 · 2021-01-22 13:45:06 +04:00 · 8041b81588
commit 8041b81588
parent 25785a1ada
4 changed files with 21 additions and 156 deletions
--- a/build.rs
+++ b/build.rs
@ -28,8 +28,6 @@ fn main() {
        .parse_callbacks(Box::new(bindgen::CargoCallbacks))
        .whitelist_function("OrtGetApiBase")
        .whitelist_function("OrtSessionOptionsAppendExecutionProvider_CPU")
        .whitelist_function("OrtSessionOptionsAppendExecutionProvider_OpenVINO")
        .whitelist_function("OrtSessionOptionsAppendExecutionProvider_CUDA")
        .whitelist_function("OrtSessionOptionsAppendExecutionProvider_Tensorrt")
        .whitelist_var("ORT_.*")
        .whitelist_recursively(true)
--- a/cbits/ort.h
+++ b/cbits/ort.h
@ -1,6 +1,4 @@
 #include <onnxruntime/core/session/onnxruntime_c_api.h>
 ORT_API_STATUS(OrtSessionOptionsAppendExecutionProvider_CPU, _In_ OrtSessionOptions* options, int use_arena) ORT_ALL_ARGS_NONNULL;
 ORT_API_STATUS(OrtSessionOptionsAppendExecutionProvider_CUDA, _In_ OrtSessionOptions* options, int device_id);
 ORT_API_STATUS(OrtSessionOptionsAppendExecutionProvider_Tensorrt, _In_ OrtSessionOptions* options, int device_id);
 ORT_API_STATUS(OrtSessionOptionsAppendExecutionProvider_OpenVINO, _In_ OrtSessionOptions* options, const char* device_id);
--- a/examples/yolo.rs
+++ b/examples/yolo.rs
@ -30,147 +30,6 @@ struct Opt {
    runs: usize,
 }
 // #[derive(Debug, Clone)]
 // struct ModelInfo {
 //     pub path: PathBuf,
 //     pub name: String,
 //     pub description: String,
 //     pub version: i64,
 //     pub input_shape: Vec<i64>,
 //     pub output_shape: Vec<i64>,
 //     pub input_name: String,
 //     pub output_name: String,
 // }
 // struct OnnxModelConfig {
 //     pub model_path: PathBuf,
 //     pub parallel: bool,
 //     pub use_cuda: bool,
 //     pub use_cpu: bool,
 //     pub use_tensorrt: bool,
 //     pub cpu_use_arena:bool,
 //     pub tensorrt_device_index: i32,
 //     pub cuda_device_index: i32,
 //     pub logging_level: LoggingLevel,
 //     pub logging_id: String,
 // }
 // struct OnnxModel {
 //     info: Arc<ModelInfo>,
 //     env: Env,
 //     options: SessionOptions,
 //     session: Session,
 // }
 // impl OnnxModel {
 //     pub fn new(config: OnnxModelConfig) -> Result<Self, Error> {
 //         let env = Env::new(config.logging_level, &config.logging_id)?;
 //         let mut options = SessionOptions::new()?;
 //         if config.parallel {
 //             options.set_execution_mode(ExecutionMode::Parallel)?;
 //         }
 //         if config.use_cpu {
 //             options.add_cpu(config.cpu_use_arena);
 //         }
 //         if config.use_cuda {
 //             options.add_cuda(config.cuda_device_index);
 //         }
 //         if config.use_tensorrt {
 //             options.add_tensorrt(config.tensorrt_device_index);
 //         }
 //         let session = Session::new(&env, config.model_path.to_str().unwrap(), &options)?;
 //         let metadata = session.metadata();
 //         let inputs = session.inputs();
 //         let outputs = session.outputs();
 //         if inputs.len() != 1 {
 //             return Err(Error::ModelWrongInputsCount);
 //         }
 //         if outputs.len() != 1 {
 //             return Err(Error::ModelWrongOutputsCount);
 //         }
 //         let input = session.input(0);
 //         let input_info = input
 //             .tensor_info()
 //             .or_else(|| Error::ModelWrongInputType)?;
 //         let input_name = input.name().to_string();
 //         let input_shape: Vec<i64> = input_info
 //             .symbolic_dims()
 //             .map(|d| match d {
 //                 SymbolicDim::Symbolic(_) => -1i64,
 //                 SymbolicDim::Fixed(x) => x as i64,
 //             })
 //             .collect();
 //         let output = session.output(0);
 //         let output_info = output
 //             .tensor_info()
 //             .or_else(|| Error::ModelWrongInputType)?;
 //         let output_name = output.name().to_string();
 //         let output_shape: Vec<i64> = output_info
 //             .symbolic_dims()
 //             .map(|d| match d {
 //                 SymbolicDim::Symbolic(_) => -1i64,
 //                 SymbolicDim::Fixed(x) => x as i64,
 //             })
 //             .collect();
 //         let info = ModelInfo {
 //             path: path.into(),
 //             name: format!("{} exported by {}", metadata.graph_name(),  metadata.producer_name()),
 //             description: metadata.description().to_string(),
 //             version: metadata.version(),
 //             input_name,
 //             input_shape,
 //             output_name,
 //             output_shape,
 //         };
 //         Ok(OnnxModel {
 //             info: Arc::new(info),
 //             env,
 //             options,
 //             session,
 //         })
 //     }
 // }
 // pub enum ModelCommand {
 //     AddOnnxModel(usize, OnnxModelConfig),
 //     Inference(usize, )
 // }
 // struct ModelPool {
 //     counter: usize,
 //     sender: Sender<ModelCommand>,
 // }
 // impl ModelPool {
 //     pub fn add(&mut self, name: &str, file: Path) -> Result<&AsyncModel, Error> {
 //     }
 //     pub fn get_model(&self, name: &str) -> Option<&AsyncModel> {
 //     }
 // }
 // struct AsyncModel {
 // }
 use std::collections::HashMap;
 fn key_val_parse(str: &str) -> HashMap<String, usize> {
@ -251,7 +110,7 @@ fn tensor_with_size(
    println!("{:?} {} {:?}", ty, name, dims);
    match ty {
        Float => match name {
-            "input" => Box::new(Tensor::<f32>::new(&dims, load_image("/home/andrey/Images/me.jpg", dims[2], dims[3])).unwrap()),
+            "input" => Box::new(Tensor::<f32>::new(&dims, load_image("/data/andrey_/Images/me.jpg", dims[2], dims[3])).unwrap()),
            _ => Box::new(Tensor::<f32>::init(&dims, 0.0).unwrap()),
        },
        Int64 => Box::new(Tensor::<i64>::init(&dims, 0).unwrap()),
@ -268,7 +127,7 @@ fn main() -> Result<()> {
    // so.set_execution_mode(ExecutionMode::Parallel)?;
    // so.add_tensorrt(0);
-    // so.add_cuda(0);
+    so.add_cuda(0);
    // so.add_cpu(true);
    let mut map = if let Some(dims) = &opt.dims {
--- a/src/lib.rs
+++ b/src/lib.rs
@ -8,7 +8,7 @@ pub mod sys;
 // Re-export enums
 pub use sys::{
    AllocatorType, ErrorCode, ExecutionMode, GraphOptimizationLevel, LoggingLevel, MemType,
-    OnnxTensorElementDataType, OnnxType, 
+    OnnxTensorElementDataType, OnnxType, CUDAProviderOptions, CudnnConvAlgoSearch, OpenVINOProviderOptions
 };
 #[macro_use]
@ -173,19 +173,29 @@ impl SessionOptions {
    }
    pub fn add_cuda(&self, device_id: i32) {
-        
+        let cuda_options = CUDAProviderOptions {
-        let so = self.raw;
+            device_id,
-        let status = unsafe {
+            cudnn_conv_algo_search: CudnnConvAlgoSearch::Default,
-            crate::sys::SessionOptionsAppendExecutionProvider_CUDA(so, device_id)
+            cuda_mem_limit: u64::MAX,
            arena_extend_strategy: 0,
            do_copy_in_default_stream: 1,
        };
-        if !status.is_null() {
+        call!(@unsafe @expect SessionOptionsAppendExecutionProvider_CUDA, self.raw, &cuda_options);
-            panic!("!!!");
+    }
-        }
+
    pub fn add_open_vino(&self, device_type: &CStr, device_id: &CStr) {
        let openvino_options = OpenVINOProviderOptions {
            device_type: device_type.as_ptr(),
            enable_vpu_fast_compile: 0,
            device_id: device_id.as_ptr(),
            num_of_threads: 0,
        };
        call!(@unsafe @expect SessionOptionsAppendExecutionProvider_OpenVINO, self.raw, &openvino_options);
    }
    pub fn add_tensorrt(&self, device_id: i32) {
        let so = self.raw;
        let status = unsafe {
            crate::sys::SessionOptionsAppendExecutionProvider_Tensorrt(so, device_id)